加载中
Python 进行 URL 跳转

示例 #!/usr/bin/env python -- coding=utf-8 -- import BaseHTTPServer import urlparse class RequestHandler(BaseHTTPServer.BaseHTTPRequestHandler): # 页面模板 Page = '''<html><...

2019/02/27 21:46
410
封装 Python logging 日志系统

服务器端需要记录脚本的执行行为和结果,一个好的日志系统尤为重要。封装 Python 自带的 logging 日志,让它更优雅好用。 logging 介绍 Python的logging模块提供了通用的日志系统,可以方便第...

2016/12/02 10:53
2.8K
Scrapy 安装

安装 1.安装 Python2.7,使用安装包 [Windows x86-64 MSI installer]((https://www.python.org/downloads/release/python-2711/) 2.安装 pywin32 64 位版本并确认是 64 位版。 pywin32 3.安装...

2016/11/02 09:35
15
Python 中使用 MongoDB 存储爬虫数据

现在在做一个简单的搜索引擎,使用今日头条的新闻数据作为数据源。这些数据都是非结构性的,比较适合用 MongoDB 来进行存储。 以下为简单使用的示例。 #!/usr/bin/python # -*- coding:utf-8...

2016/01/08 15:31
1.6K
正则表达式获取 xsrf token

最近想用爬虫爬一下知乎的数据,需要获取网页里的防止 xsrf 的标记。 (?<=pattern) “(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“W...

2015/12/09 19:40
1K
如何写一个daemon程序

在实际的服务器后台程序开发时,有时需要将某个服务 daemon 化来完成一些定时任务,比如往 KV 系统中刷新数据。 有两个问题需要提前弄清楚: daemon 程序中的 pid file 有什么作用? 为什么要二...

2015/09/20 16:38
593
Django学习笔记(4)

首先提一个问题:在Django中如何处理CRSF(Cross-site request forgery)? 先看一下CSRF原理。 其实就是恶意网站利用正常网站的cookie去非法请求。 ##Java处理方式## 一般做法需要后台和前端配...

2015/09/10 16:03
118
Django学习笔记(3)

Django是典型的MVC框架,它的View需要templates来支持。用一句话可以总结出Django开发: Getting data from the database according to a parameter passed in the URL, loading a template a...

2015/09/05 21:51
212
Django学习笔记(2)

Django官方文档里有一个投票Web应用的例子。建立好的目录如下: mysite是project的名字,polls是这个应用。 . ├── db.sqlite3 ├── manage.py ├── mysite │   ├── __init__.p...

2015/09/05 17:26
76
Django学习笔记(1)

虽然现阶段在用C++做后台开发,熟悉一个成熟的web框架很有必要。 整个系列的源码保存在https://github.com/Huangtuzhi/Polls。 创建项目和应用 创建项目djangoStudy1 mkdir djangoStudy1 cd ...

2015/08/25 21:11
91
linux下使用memcached

##Memcached介绍 Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站...

2015/08/19 17:30
82
Reddit的Upvote功能简单实现

在Reddit和Stackoverflow或者知乎上都可以看见有一个Upvote功能,这种功能让用户去维护信息流动。它可以用Redis数据库实现。 ##构造数据库 我们用一个zset(由权重+值两部分组成)来存储每篇...

2015/04/27 15:55
521
把mysql表结构映射到python对象上

为了做一个书签收藏网站,放在github中。看了相关的教程。 ##ORM## mysql的表结构是二维表,用python的数据结构表示出来就是一个列表,每一个记录是一个tuple。如下所示: [('1', ''huangyi...

2015/03/07 22:07
1.2K
多线程网络连接

客户端用多线程接受来自多用户的请求,且永不退出。 ##服务器端## #!/usr/bin/env python #-*- coding:utf-8 -*- import socket import threading, time s = socket.socket(socket.AF_INET...

2015/03/07 16:28
373
利用PyQuery获取HTML指定标签内容

##安装## sudo pip install pyquery ##例子## from pyquery import PyQuery import urllib2 page = urllib2.urlopen("http://www.lzu.edu.cn") text = unicode(page.read(), "utf-8") doc =...

2015/03/07 11:36
5.9K
hashlib模拟用户登陆

设计一个验证用户登录的函数,根据用户输入的口令是否正确,返回True或False。数据库对用户明文密码进行了md5加密。 #!/usr/bin/env python import hashlib import sys db = { 'huangyi'...

2015/03/06 20:47
114
OrderedDict实现FIFO

OrderedDict可以实现一个FIFO(先进先出)的dict,当容量超出限制时,先删除最早添加的Key: #!/usr/bin/env python #-*- coding: utf8 -*- from collections import OrderedDict cl...

2015/03/06 16:09
856
python分布式进程

多任务可以用一个进程作为Master分配任务,其它进程作为Worker执行任务来实现。 这样可以把Master放在一台电脑上,Workers放在其他电脑上实现分布式进程。 #taskmanager.py #!/usr/bin/env ...

2015/03/05 15:58
6.7K
python进程池

如果要启动大量的子进程,可以用进程池的方式批量创建子进程: #!/usr/bin/env python from multiprocessing import Pool import os, time, random def long_time_task(name):   ...

2015/03/05 11:02
812
在目录下查找包含字符串的文件

编写一个search(s)的函数,能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出完整路径: #!/usr/bin/env python import os, os.path import sys def s...

2015/03/05 10:02
1.3K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部