加载中
Python验证码识别:利用pytesser识别简单图形验证码

一、探讨 识别图形验证码可以说是做爬虫的必修课,涉及到计算机图形学,机器学习,机器视觉,人工智能等等高深领域…… 简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形...

Python图片验证码降噪 — 8邻域降噪

简介 图片验证码识别的可以分为几个步骤,一般用 Pillow 库或 OpenCV 来实现,这几个过程是: 1.灰度处理&二值化 2.降噪 3.字符分割 4.标准化 5.识别 所谓降噪就是把不需要的信息通通去除,比...

2019/02/01 14:51
2.3K
Python异步Web编程

异步编程适用于那些频繁读写文件和频繁与服务器交互数据的任务,异步程序以非阻塞的方式执行I/O操作。这样意味着程序可以在等待客户机返回数据的同时执行其他任务,而不是无所事事的等待,浪...

Python爬虫:模拟登录带验证码网站

python爬虫:模拟登录带验证码网站 拿学校教务系统练手……

Docker容器化部署Python应用

简介 Docker是目前主流IT公司广泛接受和使用的,用于构建、管理和保护它们应用程序的工具。 容器,例如Docker允许开发人员在单个操作系统上隔离和运行多个应用程序,而不是为服务器上的每个应...

2019/06/28 18:25
847
Python计算大文件行数方法及性能比较

如何使用Python快速高效地统计出大文件的总行数, 下面是一些实现方法和性能的比较。 1.readline读所有行 使用readlines方法读取所有行: def readline_count(file_name): return len(open(fi...

2020/08/12 09:44
106
Python标准库笔记(11) — Operator模块

Operator——标准功能性操作符接口. 代码中使用迭代器时,有时必须要为一个简单表达式创建函数。有些情况这些函数可以用一个lambda函数实现,但是对于某些操作,根本没必要去写一个新的函数。...

2018/12/18 11:05
128
Python标准库笔记(10) — itertools模块

itertools 用于更高效地创建迭代器的函数工具。 Python版本 3.x itertools 提供的功能受Clojure,Haskell,APL和SML等函数式编程语言的类似功能的启发。它们的目的是快速有效地使用内存,并且...

2018/06/14 15:27
732
Python标准库笔记(9) — functools模块

functools 作用于函数的函数 functools 模块提供用于调整或扩展函数和其他可调用对象的工具,而无需完全重写它们。 装饰器 partial 类是 functools 模块提供的主要工具, 它可以用来“包装”一...

Python标准库笔记(8) — pprint模块

struct模块提供了用于在字节字符串和Python原生数据类型之间转换函数,比如数字和字符串。   该模块作用是完成Python数值和C语言结构体的Python字符串形式间的转换。 这可以用于处理存储在...

2018/04/19 11:03
794
Python Webdriver 重新使用已经打开的浏览器实例

因为Webdriver每次实例化都会新开一个全新的浏览器会话,在有些情况下需要复用之前打开未关闭的会话。比如爬虫,希望结束脚本时,让浏览器处于空闲状态。当脚本重新运行时,它将继续使用这个...

Python标准库笔记(7) — copy模块

copy-对象拷贝模块;提供了浅拷贝和深拷贝复制对象的功能, 分别对应模块中的两个函数 copy() 和 deepcopy()。 1.浅拷贝(Shallow Copies) copy() 创建的 浅拷贝 是一个新的容器,它包含了对原...

2018/03/27 13:14
149
Python算法:快速排序

快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用。 该方法的基本思想是: 1.先从数列中取出一个数作为基准数。 2.分区过程,将比这个数大的数全放到它的右边...

Python爬虫:一些常用的爬虫技巧总结

用python也差不多一年多了,python应用最多的场景还是web快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。 爬虫在开发过程中也有很...

2016/03/25 15:02
6.7W
Python爬虫代理池

爬虫代理IP池 在公司做分布式深网爬虫,搭建了一套稳定的代理池服务,为上千个爬虫提供有效的代理,保证各个爬虫拿到的都是对应网站有效的代理IP,从而保证爬虫快速稳定的运行,当然在公司做...

Python报错解决方法总结

记录在使用Python过程中出错及解决错误的方法,欢迎各位多提意见。

2016/01/26 13:55
212
Python:生产者消费者模型

利用队列实现简单的生产者消费者模型,生产者产生时间放入队列,消费者取出时间打印

Python读写ini配置文件

在用Python做开发的时候经常会用到数据库或者其他需要动态配置的东西,硬编码在里面每次去改会很麻烦。Python自带有读取配置文件的模块ConfigParser

2016/01/29 13:49
995
python日志模块封装

通过调用getLoger()方法,返回一个日志对象,每次的日志输出都会在屏幕上打印的同时写入以对象名命名的文件。

2016/05/03 09:53
1K
在Python应用中使用MongoDB

Python是开发社区中用于许多不同类型应用的强大编程语言。很多人都知道它是可以处理几乎任何任务的灵活语言。因此,在Python应用中需要一个什么样的与语言本身一样灵活的数据库呢?那就是NoS...

2016/12/26 14:08
2.3K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部