文档章节

第1个HttpClient 例子

诺岚
 诺岚
发布于 2017/08/29 10:05
字数 1729
阅读 38
收藏 0

 学习HttpClient 的第一个例子,可以成功获取到网页内容

POM.xml

<dependencies>
    <dependency>
        <groupId>org.apache.httpcomponents</groupId>
        <artifactId>httpclient</artifactId>
        <version>4.5.2</version>
    </dependency>
</dependencies>
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;



public class HelloWorld {
    public static void main(String[] args) throws Exception {
        //创建httpClient实例
        CloseableHttpClient httpclient = HttpClients.createDefault();
        //创建httpget实例
        HttpGet httpGet = new HttpGet("http://www.qq.com/");
        CloseableHttpResponse response=null;

            //执行http get请求
            response=httpclient.execute(httpGet);
            //// 获取返回实体
        HttpEntity entity = response.getEntity();
        System.out.println("网页内容:"+ EntityUtils.toString(entity,"utf-8"));


        response.close();//response 关闭
        httpclient.close();//httpClient 关闭

    }
}

-----------------------------以下是官方文档说明

准备好

您需要做的第一件事是获取HttpClient及其 依赖项的副本。本教程是针对HttpClient 3.0 编写的。您还需要JDK 1.3或更高版本。

一旦您下载了HttpClient和依赖关系,您将需要将它们放在您的类路径上。对于HTTPS连接,JSSE还有一个可选的依赖关系; 这不是本教程所必需的。

概念

使用HttpClient的一般过程包括若干步骤:

  1. 创建一个实例HttpClient
  2. 创建一个方法的实例(在这种情况下为GetMethod)。要连接的URL被传递给方法构造函数。
  3. 告诉HttpClient执行该方法。
  4. 阅读回应。
  5. 释放连接。
  6. 处理响应。

我们将介绍如何执行以下每个步骤。请注意,无论服务器是否返回错误,我们都会执行整个过程。这很重要,因为HTTP 1.1允许多个请求通过简单地一个接一个地发送请求来使用相同的连接。显然,如果我们没有读取对第一个请求的整个响应,剩下的数据就会阻碍第二个响应。 HttpClient尝试处理这个但是为了避免问题,始终释放连接很重要。

在连接释放后,HttpClient将尽力确保连接可重用。

实例化HttpClient

无参数构造函数为HttpClient大多数情况提供了一套很好的默认值,这就是我们将要使用的。

//创建httpClient实例
  CloseableHttpClient httpclient = HttpClients.createDefault();

创建方法

HTTP规范定义的各种方法对应于实现HttpMethod接口的HttpClient中的各种类。这些类都在包中找到 org.apache.commons.httpclient.methods

我们将使用Get方法,这是一个简单的方法,只需要一个URL并获取URL指向的文档。

//创建httpget实例
HttpGet httpGet = new HttpGet("http://www.qq.com/");

执行方法

该方法的实际执行是通过调用 executeMethod客户端并传递方法来执行的。由于网络连接不可靠,因此我们还需要处理发生的任何错误。

有两种类型的异常,可以通过executeMethod被抛出,HttpExceptionIOException

另一个有用的信息是服务器返回的状态码。该代码由executeMethod作为int返回,可用于确定请求是否成功,有时可以指示客户端需要进一步的操作,例如提供验证凭据。

HttpException

HttpException表示逻辑错误,并且在请求无法发送或由于HTTP规范的致命违反而无法处理响应时抛出。通常这种异常无法从中恢复。有关协议异常的详细讨论,请参考 HttpClient异常处理指南。请注意,HttpException实际上扩展了IOException,因此如果应用程序不区分协议和传输错误,您可以忽略它并捕获IOException。

IOException异常

一个简单的IOException(它不是HttpException的子类)表示一个传输错误,并且当出现可能是一次性I / O问题的错误时抛出。通常,请求在第二次尝试中有很好的成功机会,所以默认情况下,HttpClient将尝试自动恢复请求。有关传输异常的详细讨论,请参考 HttpClient异常处理指南

方法恢复

默认情况下,HttpClient将自动尝试从非致命错误中恢复,即抛出一个普通的IOException异常。HttpClient将重试该方法三次,前提是该请求从未完全传输到目标服务器。有关HTTP方法恢复的详细讨论,请参考HttpClient异常处理指南

// set per default
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, 
  new DefaultHttpMethodRetryHandler());

默认恢复过程可以用自定义恢复过程替换。可以增加自动重试次数。即使请求可能已经被服务器处理并且在接收到响应时发生了I / O异常,也可以指示HttpClient重试该方法。启用自动重试时请小心。仅当方法知道是幂等时才使用它,也就是说,已知可以安全地重试多次,而不会导致数据损坏或数据不一致。

经验法则是GET方法通常是安全的,除非另有说明,除非另有说明,实体封闭方法(如POST和PUT)通常是不安全的。

DefaultMethodRetryHandler retryhandler = new DefaultMethodRetryHandler(10, true);
client.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, retryhandler);

阅读回应

无论服务器返回的状态如何,响应体总是被读取至关重要。有三种方法可以做到这一点:

  • Call method.getResponseBody(). 这将返回包含响应正文中的数据的字节数组。
  • Call method.getResponseBodyAsString().。这将返回一个包含响应体的String。请注意,尽管使用默认的编码方式,从字节到字符串的转换已经完成,因此该方法可能无法在所有平台上移植。
  • Call method.getResponseBodyAsStream() 并读取流的所有内容,然后调用stream.close()。如果可以接收大量数据,那么这种方法是最好的,因为它可以缓冲到文件中或在读取时被处理。确保始终读取整个数据,并在流上呼叫close。

对于本教程,我们将使用getResponseBody()简单。

byte[] responseBody = method.getResponseBody();

释放连接

这是保持事态发展的关键一步。我们必须告诉 HttpClient我们完成了连接,现在可以重用。没有这样做,HttpClient将无限期地等待连接释放,以便可以重用。

method.releaseConnection();

处理Repsonse

我们现在已经完成了与HttpClient的交互,可以专注于做我们需要做的数据。在我们的例子中,我们将它打印出来到控制台。

值得注意的是,如果您将响应作为流检索并在读取时进行处理,则此步骤实际上与读取连接相结合,并且在完成处理所有数据后,您将关闭输入流和释放连接。

注意:我们应该注意这里的字符编码,而不是仅使用系统默认值。

System.out.println(new String(responseBody));

最终源代码

当我们把所有这一切加上一点胶水代码,我们得到下面的程序。

import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;



public class HelloWorld {
    public static void main(String[] args) throws Exception {
        //创建httpClient实例
        CloseableHttpClient httpclient = HttpClients.createDefault();
        //创建httpget实例
        HttpGet httpGet = new HttpGet("http://www.qq.com/");
        CloseableHttpResponse response=null;

            //执行http get请求
            response=httpclient.execute(httpGet);
            //// 获取返回实体
        HttpEntity entity = response.getEntity();
        System.out.println("网页内容:"+ EntityUtils.toString(entity,"utf-8"));


        response.close();//response 关闭
        httpclient.close();//httpClient 关闭

    }
}

 

© 著作权归作者所有

共有 人打赏支持
诺岚
粉丝 0
博文 108
码字总数 187791
作品 0
广州
程序员
私信 提问
HttpClient及有关jar包详解

1.HttpClient简介 HttpClient 是 Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。本...

长平狐
2012/11/12
12.3K
2
HttpClient4.x:Get和Post提交数据

HttpClient是一款用Java写的非常好用的基于Http协议的客户端编程工具包。具体举例来讲,用它可以模拟form表单提交数据动作,可以模拟访问网页动作及得到网页源码内容等等,这两点或许是我们在...

liangtee
2012/12/02
0
0
一个c#的与web服务器交互的HttpClient类

.Net类库里提供了HttpWebRequest等类,方便我们编程与Web服务器进行交互. 但是实际使用中我们经常会遇到以下需求, 基础类里没有直接提供相应的功能 (WebClient类包含这些功能,只是用起来稍微麻...

鉴客
2011/12/16
3.1K
1
HTTP协议和HttpClient的入门

HTTP协议的发展史没有了解,是给予请求与响应模式的、无连接、无状态的应用层的协议。 HTTP协议 HTTP协议的URL HTTP URL(URL是一种特殊类型的URI,包含了勇于查找某个资源的足够的信息)的格式...

凹凸口天
2013/07/15
0
0
apache HttpClient学习系列--1

这两天开始准备做一个自己的网络爬虫,所以就各种找资料,找到了一个资料,讲的挺好的,用的就是HttpClient来写的,就在apache上下了jar包,准备自己编写,但是硬是找不到对应的类。上了apa...

无情小白龙
2014/03/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周三乱弹 —— 风扇写着先生请自爱

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @蚂蚁哈哈哈 :分享陈奕迅的单曲《落花流水》 《落花流水》- 陈奕迅 手机党少年们想听歌,请使劲儿戳(这里) @车谷 :我发现每天上班都好困 ...

小小编辑
今天
399
6
centos7重置密码、单用户模式、救援模式、ls命令、chmod命令

在工作当中如果我们错误的配置了文件使服务器不能正常启动或者忘记密码不能登录系统,如何解决这些问题呢?重装系统是可以实现的,但是往往不能轻易重装系统的,下面用忘记密码作为例子讲解如...

李超小牛子
今天
4
0
Python如何开发桌面应用程序?Python基础教程,第十三讲,图形界面

当使用桌面应用程序的时候,有没有那么一瞬间,想学习一下桌面应用程序开发?行业内专业的桌面应用程序开发一般是C++,C#来做,Java开发的也有,但是比较少。本节课会介绍Python的GUI(图形用...

程序员补给栈
今天
13
0
kafka在的使用

一、基本概念 介绍 Kafka是一个分布式的、可分区的、可复制的消息系统。它提供了普通消息系统的功能,但具有自己独特的设计。 这个独特的设计是什么样的呢? 首先让我们看几个基本的消息系统...

狼王黄师傅
今天
3
0
Android JNI总结

0x01 JNI介绍 JNI是Java Native Interface的缩写,JNI不是Android专有的东西,它是从Java继承而来,但是在Android中,JNI的作用和重要性大大增强。 JNI在Android中起着连接Java和C/C++层的作...

天王盖地虎626
昨天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部