利用python抓取网站图片
利用python抓取网站图片
逐个世纪 发表于4年前
利用python抓取网站图片
  • 发表于 4年前
  • 阅读 52
  • 收藏 0
  • 点赞 0
  • 评论 0

腾讯云 技术升级10大核心产品年终让利>>>   

摘要: 看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下。 本人是初学者,表达上不当的地方还请见谅

代码如下

#coding utf-8

import re

import urllib

import urllib2


def getHtml(url):

    page = urllib.urlopen(url)

    html = page.read()

    return html


def getImg(html):

    reg = r'src=".+?\.jpg"'

    imgre = re.compile(reg)

    imglist = imgre.findall(html)

    x = 0

    for imgurl in imglist:

        urllib.urlretrieve("http://www.hnzzzx.gov.cn/"+imgurl,'%s.jpg' % x)

        x = x + 1        

   

html = getHtml("http://www.hnzzzx.gov.cn/showzxwy.asp?lx=%D5%FE%D0%AD%CE%AF%D4%B1&js=8%B5%DA%B0%CB%BD%EC&classname=%D5%FE%D0%AD%CE%AF%D4%B1&jb=01&pageno=1")

getImg(html)



标签: python
共有 人打赏支持
粉丝 0
博文 1
码字总数 193
×
逐个世纪
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: