爬虫入门urlib,urlib2的基本使用和进阶

2018/04/25 20:11
阅读数 9

python2中的urlib和urlib2

1.分分钟扒一个网页下来

怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存在于HTML中的,下面我们就写个例子来扒一个网页下来。

import urllib2
 
response = urllib2.urlopen("http://www.baidu.com")
print response.read()

2.分析扒网页的方法

那么我们来分析这两行代码,第一行

 response = urllib2.urlopen("http://www.baidu.com")

  

 

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
在线直播报名
返回顶部
顶部