文档章节

七日Python之路--第三天

明天以后
 明天以后
发布于 2014/07/23 18:37
字数 595
阅读 290
收藏 2

    之前由于看基础看的觉着没意思,才去提前看一下Django的。现在突然不知到该干啥了。

    不管什么语言,官方文档是必须的。so...........

    莫名浮躁,实在看不下去........   待会研究 re 吧。虽然之前研究过,但许久不使用,忘的差不多了....Orz.

                                                                          --2014.7.23 18:37


正则表达式:

    1.掌握正则表达式的规则

        正则表达式是一种小型,高度专业化的编程语言,内嵌Python中,通过re模块实现。

        正则表达式模式被编译成一系列字节码,由用C编写的匹配引擎执行。

        字符匹配:普通字符,元字符

        [] : 常用来指定一个字符集:[abc],[a-z]。补集匹配不在区间范围内的字符:[^5]

        ^ : 匹配行首。除非设置MULTILINE

        $ : 匹配行尾,行尾被定义为字符串尾,或者一个换行字符后面的任何位置。


小程序:自动下载百度贴吧的图片

    由于观看网易云课堂,遂转向了Win。win下面控制台编码为ascii,中文偶尔乱码。所以全部换成英文。

#输入百度贴吧地址,及当期目录将要新建的文件夹名称。即可下载并存入新建文件夹中。
#算是自己这几天来写的第一个小程序吧。不过程序还存在几个bug
#比如:url地址不合法,同名的文件夹已经存在等问题没有处理
#其中只有:url地址匹配用到了一点re的内容。
#说实话,Python真是简单,你所想要的功能基本都有了!!!
#还小有成就感呢,(*^__^*) 嘻嘻……

#coding:utf-8

import urllib
import re
import os

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(http://imgsrc.baidu.com.*?\.jpg)"'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    return imglist

def main():
    url = r'http://tieba.baidu.com/p/3179623479/'
    url = str(raw_input('input the url : '))
    forder = r'test'
    forder = str(raw_input('input the forder name : '))
    os.mkdir(forder)
    html = getHtml(url)
    count = 0
    for imgurl in getImg(html):
        count += 1
        print imgurl
        urllib.urlretrieve(imgurl,'%s/%s.jpg' % (forder,count))
    print 'total saved : %s pictures to : %s ' % (forder,count)

if __name__ == '__main__':
    main()

    言归正传,下面接着讲正则表达式的内容...

                                                                                    --2014.7.24 1:43


        IBM上一个Django简要内容:http://www.ibm.com/developerworks/cn/linux/l-django/

© 著作权归作者所有

明天以后

明天以后

粉丝 76
博文 130
码字总数 87367
作品 0
昌平
程序员
私信 提问
加载中

评论(0)

七日Python之路--第一天

网上的资源是丰富的。但难免有些过时的信息,比如我现在使用的是去年下载的python3.3,而网上多数都是Python2.7。 差别比较大的就是:①读取用户输入raw_input()已经不能使用,只能使用input...

明天以后
2014/07/21
1.9K
0
七日Python之路--第三天(之初试Django 2-1)

#意外情况出现,以为电脑硬盘真的坏掉了。原来是忘记插电源 @。@ ~ 前些时间玩游戏,电脑无故突然断电关机,再开机一闪便又突然断电关机。最终找到原因,电脑过热,保护性关机。然后将光驱拆...

明天以后
2014/07/23
273
0
七日Python之路--第三天(之不安分 wxPython)

Python有好多个GUI框架,wxPython比较流行,so just do it..... Win下各种不爽,又换Ubuntu 跟着教程做个记事本。视频地址:http://www.pythoner.cn/course/topic/wxPython-gui/ (一)wxpyt...

明天以后
2014/07/24
3.5K
5
七日Python之路--第二天

由于之前使用过一段Ubuntu,所以基本命令啥的都还可以。装差利器Vim也是使用过一段时间的。 Ubuntu快速打开终端Alt+Ctrl+T,这样才显得犀利一些嘛。说实话,终端编辑文件啥的,确实比Win下面...

明天以后
2014/07/22
521
0
七日Python之路--第十天

(一)PyCharm 试用一下,目前VIM只是当做记事本来用,还有好多命令不熟悉,基本就把VIN浪费了。由于之前Java使用Eclipse,这个IDE貌似跟那个差不多,试试吧。官网下载地址:http://www.jetb...

明天以后
2014/07/31
243
0

没有更多内容

加载失败,请刷新页面

加载更多

Spring基础

主要用于service层; 轻量级java开发框架; 各层 web层:struts,spring-MVC service层:spring dao层:hibernate,mybatis , jdbcTemplate --> spring-data Spring核心:控制反转IOC 切面编...

七宝1
27分钟前
30
0
解决overflow+border-radius+transform圆角问题

网上还有其他版本,但是对我来说都不好使,下面是我在Chrome上的代码。overflow:hidden依然是不能正常使用,换成unset就可以,读者如果有更好的解决方案,请留言,谢谢。 <figure> <img...

hi懒喵
32分钟前
53
0
《C语言》—— 数组

书籍使我变成了一个幸福的人,使我的生活变成轻松而舒适的诗。——高尔基 本文已经收录至我的GitHub,欢迎大家踊跃star 和 issues。 https://github.com/midou-tech/articles 点关注,不迷路!...

龙跃十二
45分钟前
84
0
Java小案例: 1000以内的水仙花数

要求在控制台分别展示1000以内的水仙花数。 如下:↓ 水仙花数规则: 水仙花数至少是一个3位数 每位数字的立方数的累加和,正好等于该数字本身。 例如:153就是一个水仙花数。每位数字分别...

漫路h
昨天
66
0
centos 防火墙端口设置

查看开放的端口号 firewall-cmd --lists-all 设置开放的端口号 firewall-cmd --add-service=http --permanent 1. //--permanent表示永久生效,不加这个参数的话只会针对本次执行完命令生效,重...

ACE_LCX
昨天
25
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部