文档章节

第1个HttpClient 例子

诺岚
 诺岚
发布于 2017/08/29 10:05
字数 1729
阅读 36
收藏 0

 学习HttpClient 的第一个例子,可以成功获取到网页内容

POM.xml

<dependencies>
    <dependency>
        <groupId>org.apache.httpcomponents</groupId>
        <artifactId>httpclient</artifactId>
        <version>4.5.2</version>
    </dependency>
</dependencies>
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;



public class HelloWorld {
    public static void main(String[] args) throws Exception {
        //创建httpClient实例
        CloseableHttpClient httpclient = HttpClients.createDefault();
        //创建httpget实例
        HttpGet httpGet = new HttpGet("http://www.qq.com/");
        CloseableHttpResponse response=null;

            //执行http get请求
            response=httpclient.execute(httpGet);
            //// 获取返回实体
        HttpEntity entity = response.getEntity();
        System.out.println("网页内容:"+ EntityUtils.toString(entity,"utf-8"));


        response.close();//response 关闭
        httpclient.close();//httpClient 关闭

    }
}

-----------------------------以下是官方文档说明

准备好

您需要做的第一件事是获取HttpClient及其 依赖项的副本。本教程是针对HttpClient 3.0 编写的。您还需要JDK 1.3或更高版本。

一旦您下载了HttpClient和依赖关系,您将需要将它们放在您的类路径上。对于HTTPS连接,JSSE还有一个可选的依赖关系; 这不是本教程所必需的。

概念

使用HttpClient的一般过程包括若干步骤:

  1. 创建一个实例HttpClient
  2. 创建一个方法的实例(在这种情况下为GetMethod)。要连接的URL被传递给方法构造函数。
  3. 告诉HttpClient执行该方法。
  4. 阅读回应。
  5. 释放连接。
  6. 处理响应。

我们将介绍如何执行以下每个步骤。请注意,无论服务器是否返回错误,我们都会执行整个过程。这很重要,因为HTTP 1.1允许多个请求通过简单地一个接一个地发送请求来使用相同的连接。显然,如果我们没有读取对第一个请求的整个响应,剩下的数据就会阻碍第二个响应。 HttpClient尝试处理这个但是为了避免问题,始终释放连接很重要。

在连接释放后,HttpClient将尽力确保连接可重用。

实例化HttpClient

无参数构造函数为HttpClient大多数情况提供了一套很好的默认值,这就是我们将要使用的。

//创建httpClient实例
  CloseableHttpClient httpclient = HttpClients.createDefault();

创建方法

HTTP规范定义的各种方法对应于实现HttpMethod接口的HttpClient中的各种类。这些类都在包中找到 org.apache.commons.httpclient.methods

我们将使用Get方法,这是一个简单的方法,只需要一个URL并获取URL指向的文档。

//创建httpget实例
HttpGet httpGet = new HttpGet("http://www.qq.com/");

执行方法

该方法的实际执行是通过调用 executeMethod客户端并传递方法来执行的。由于网络连接不可靠,因此我们还需要处理发生的任何错误。

有两种类型的异常,可以通过executeMethod被抛出,HttpExceptionIOException

另一个有用的信息是服务器返回的状态码。该代码由executeMethod作为int返回,可用于确定请求是否成功,有时可以指示客户端需要进一步的操作,例如提供验证凭据。

HttpException

HttpException表示逻辑错误,并且在请求无法发送或由于HTTP规范的致命违反而无法处理响应时抛出。通常这种异常无法从中恢复。有关协议异常的详细讨论,请参考 HttpClient异常处理指南。请注意,HttpException实际上扩展了IOException,因此如果应用程序不区分协议和传输错误,您可以忽略它并捕获IOException。

IOException异常

一个简单的IOException(它不是HttpException的子类)表示一个传输错误,并且当出现可能是一次性I / O问题的错误时抛出。通常,请求在第二次尝试中有很好的成功机会,所以默认情况下,HttpClient将尝试自动恢复请求。有关传输异常的详细讨论,请参考 HttpClient异常处理指南

方法恢复

默认情况下,HttpClient将自动尝试从非致命错误中恢复,即抛出一个普通的IOException异常。HttpClient将重试该方法三次,前提是该请求从未完全传输到目标服务器。有关HTTP方法恢复的详细讨论,请参考HttpClient异常处理指南

// set per default
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, 
  new DefaultHttpMethodRetryHandler());

默认恢复过程可以用自定义恢复过程替换。可以增加自动重试次数。即使请求可能已经被服务器处理并且在接收到响应时发生了I / O异常,也可以指示HttpClient重试该方法。启用自动重试时请小心。仅当方法知道是幂等时才使用它,也就是说,已知可以安全地重试多次,而不会导致数据损坏或数据不一致。

经验法则是GET方法通常是安全的,除非另有说明,除非另有说明,实体封闭方法(如POST和PUT)通常是不安全的。

DefaultMethodRetryHandler retryhandler = new DefaultMethodRetryHandler(10, true);
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, retryhandler);

阅读回应

无论服务器返回的状态如何,响应体总是被读取至关重要。有三种方法可以做到这一点:

  • Call method.getResponseBody(). 这将返回包含响应正文中的数据的字节数组。
  • Call method.getResponseBodyAsString().。这将返回一个包含响应体的String。请注意,尽管使用默认的编码方式,从字节到字符串的转换已经完成,因此该方法可能无法在所有平台上移植。
  • Call method.getResponseBodyAsStream() 并读取流的所有内容,然后调用stream.close()。如果可以接收大量数据,那么这种方法是最好的,因为它可以缓冲到文件中或在读取时被处理。确保始终读取整个数据,并在流上呼叫close。

对于本教程,我们将使用getResponseBody()简单。

byte[] responseBody = method.getResponseBody();

释放连接

这是保持事态发展的关键一步。我们必须告诉 HttpClient我们完成了连接,现在可以重用。没有这样做,HttpClient将无限期地等待连接释放,以便可以重用。

method.releaseConnection();

处理Repsonse

我们现在已经完成了与HttpClient的交互,可以专注于做我们需要做的数据。在我们的例子中,我们将它打印出来到控制台。

值得注意的是,如果您将响应作为流检索并在读取时进行处理,则此步骤实际上与读取连接相结合,并且在完成处理所有数据后,您将关闭输入流和释放连接。

注意:我们应该注意这里的字符编码,而不是仅使用系统默认值。

System.out.println(new String(responseBody));

最终源代码

当我们把所有这一切加上一点胶水代码,我们得到下面的程序。

import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;



public class HelloWorld {
    public static void main(String[] args) throws Exception {
        //创建httpClient实例
        CloseableHttpClient httpclient = HttpClients.createDefault();
        //创建httpget实例
        HttpGet httpGet = new HttpGet("http://www.qq.com/");
        CloseableHttpResponse response=null;

            //执行http get请求
            response=httpclient.execute(httpGet);
            //// 获取返回实体
        HttpEntity entity = response.getEntity();
        System.out.println("网页内容:"+ EntityUtils.toString(entity,"utf-8"));


        response.close();//response 关闭
        httpclient.close();//httpClient 关闭

    }
}

 

© 著作权归作者所有

共有 人打赏支持
诺岚
粉丝 0
博文 103
码字总数 178262
作品 0
广州
程序员
私信 提问
HttpClient4.x:Get和Post提交数据

HttpClient是一款用Java写的非常好用的基于Http协议的客户端编程工具包。具体举例来讲,用它可以模拟form表单提交数据动作,可以模拟访问网页动作及得到网页源码内容等等,这两点或许是我们在...

liangtee
2012/12/02
0
0
HTTP协议和HttpClient的入门

HTTP协议的发展史没有了解,是给予请求与响应模式的、无连接、无状态的应用层的协议。 HTTP协议 HTTP协议的URL HTTP URL(URL是一种特殊类型的URI,包含了勇于查找某个资源的足够的信息)的格式...

凹凸口天
2013/07/15
0
0
apache HttpClient学习系列--1

这两天开始准备做一个自己的网络爬虫,所以就各种找资料,找到了一个资料,讲的挺好的,用的就是HttpClient来写的,就在apache上下了jar包,准备自己编写,但是硬是找不到对应的类。上了apa...

无情小白龙
2014/03/15
0
0
研究支付时碰到了 httpclient 围观

HttpClient最重要的功能是执行HTTP方法。一个HTTP方法的执行包含一个或多个HTTP请求/HTTP响应交换,通常由HttpClient的内部来处理。而期望用户提供一个要执行的请求对象,而HttpClient期望传...

JAVA码猿
2017/11/07
0
0
httpClient4.2官方文档研究

前言 超文本传输协议(HTTP)也许是最常用的在互联网上使用的协议。 Web服务,支持网络设备和网络计算的增长继续扩大用户驱动的Web浏览器的HTTP协议之外的作用,同时增加了一些应用程序需要H...

harries
2015/08/24
0
0

没有更多内容

加载失败,请刷新页面

加载更多

linux-scp 远程拷贝报错原因

刚拿到一台重装后的服务器,远程ssh都正常,但是一scp拷贝东西就报错: 本地确定是有scp命令的,而且如果是本地没有scp不会报后面那句lost connection,因此就是远程没有scp这个命令。因此在...

linuxprobe16
6分钟前
0
0
OSChina 周六乱弹 —— 谁小时候没当过熊孩子呀

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @小小编辑:推荐歌曲《行尸走肉》- amazarashi 《行尸走肉》- amazarashi 手机党少年们想听歌,请使劲儿戳(这里) @神话 :周五了,周末干啥...

小小编辑
31分钟前
18
1
docker部署springboot项目

安装docker 菜鸟教程 springboot项目 maven依赖 <?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001......

yimingkeji
今天
14
0
1: Cordova 配置WebView可以打开外部链接

一、问题:在使用Cordova生成的Android App中默认情况下WebView中的超链接,如果不是相对链接,会默认使用浏览器打开。 如果想用默认webview打开 解决方案:修改config.xml文件添加链接配置节...

wecloudnet
今天
1
0
Beetl介绍以及集成SpringBoot2.0 ---《Beetl视频课程》(1)

目的:引导阅读官方文档 目标:实现一个自己的博客 一、Beetl介绍 Beetl目前版本是2.9.3,相对于其他java模板引擎,具有功能齐全,语法直观,性能超高,以及编写的模板容易维护等特点。使得开发...

Gavin-King
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部