文档章节

爬网页获取电话号码

o
 osc_4nmshwhm
发布于 2018/08/06 23:30
字数 245
阅读 7
收藏 0

明天补充

 1 import java.io.BufferedReader;
 2 import java.io.IOException;
 3 import java.io.InputStream;
 4 import java.io.InputStreamReader;
 5 import java.net.URL;
 6 import java.net.URLConnection;
 7 import java.util.regex.Matcher;
 8 import java.util.regex.Pattern;
 9 
10 public class URLTest {
11 
12     private URLConnection connection = null;
13     
14     public String getDoucument(String url) throws IOException {
15         
16         URL newUrl = new URL(url);
17         connection = newUrl.openConnection();
18         InputStream is = connection.getInputStream();
19         InputStreamReader isr = new InputStreamReader(is);
20         BufferedReader br = new BufferedReader(isr);
21         
22         String line = "";
23         StringBuffer sb = new StringBuffer();
24         
25         while( (line =  br.readLine()) != null) {
26             sb.append(line +"\n");
27         }
28         
29         return sb.toString();
30         
31     }
32     
33     public String MyFilter( String string ) {//内容过滤器-获取网页上的电话,没有去重
34         
35         String regex = "18[\\d]{9}";
36         Pattern pattern = Pattern.compile(regex);
37         Matcher matcher = pattern.matcher(string);
38         
39         String result = "";
40         while(matcher.find()) {
41             result += matcher.group()+"\n";
42         }
43         
44         return result;
45     }
46     
47     public static void main(String[] args) throws IOException {
48         
49         URLTest test = new URLTest();
50         String page = test.getDoucument("https://power.baidu.com/question/1511959129473915060.html?qbl=relate_question_1");
51         String result = test.MyFilter(page);
52 //        System.out.println(page);
53         
54         if ( result != null ) {
55             System.out.println("从该网页上找到的号码:\n"+result);
56         }
57         else {
58             System.out.println("该网页上没有电话号码");
59         }
60         
61     }
62 }

 

程序效果

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。

暂无文章

Java 获取资源文件路径

1 问题描述 通过源码运行时,一般使用如下方式读取资源文件: String str = "1.jpg"; 资源文件与源码文件放在同一目录下,或者拥有同一父级目录: String str = "a/b/1.jpg"; 这样直接编译...

氷泠
34分钟前
6
0
Linux程序移植到Android上

序言: 由于本人还是比较偏重于先说明原理在说明实际操作步骤,要知其然更要知其所以然,如下图所示: 传统的linux系统中的程序基本都依赖于glibc(至于什么是glibc可以百度去),而右边AOS...

shzwork
46分钟前
22
0
git 为项目设置用户名/邮箱/密码

1.找到项目所在目录下的 .git,进入.git文件夹,然后执行如下命令分别设置用户名和邮箱 git config user.name "Affandi" git config user.email "123333333@qq.com" 然后执行命令查看con......

有时很滑稽
今天
0
0
如何从int转换为String? - How do I convert from int to String?

问题: I'm working on a project where all conversions from int to String are done like this: 我正在一个项目中,所有从int到String转换都是这样完成的: int i = 5;String strI = "" ......

javail
今天
19
0
Vue+Spring Data JPA+MySQL 增查改删

视频讲解: https://www.bilibili.com/video/BV16i4y1G7i2/ 工程概述: 前后端分离,进行简单增查改删(CRUD) 前端使用VUE 后端使用Spring Data JPA 数据库使用MySQL #EmployeeController.jav...

潘文海
今天
13
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部