文档章节

python 模拟登陆51job企业中心,翻页取出所有简历

专业写BUG的程序员
 专业写BUG的程序员
发布于 2015/09/07 09:17
字数 209
阅读 84
收藏 1

#!/usr/bin/python
#coding=utf8
import urllib
import urllib2
import cookielib
import base64
import re
import json
import hashlib
import rsa  
import binascii
import sys
import time


cj = cookielib.LWPCookieJar()
cookie_support = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler)
urllib2.install_opener(opener)

result = urllib2.urlopen("http://ehire.51job.com/MainLogin.aspx").read()
p = re.compile('<input type="hidden" name="hidAccessKey" id="hidAccessKey" value="(.*?)"')
hidAccessKey= p.search(result).group(1)
#print(hidAccessKey)
p = re.compile('<input type="hidden" name="fksc" id="fksc" value="(.*?)"')
fksc= p.search(result).group(1)
#print(fksc)
p = re.compile('<input type="hidden" name="hidEhireGuid" id="hidEhireGuid" value="(.*?)"')
hidEhireGuid= p.search(result).group(1)
#print(hidEhireGuid)

postdata = {
    'ctmName': 'xxxxxx',
    'userName': 'xxxxxx',
    'password':'xxxxx',
    'checkCode': '',
    'ec': hidEhireGuid,
    'isRememberMe': 'true',
    'langtype': 'Lang=&Flag=1',
    'oldAccessKey': hidAccessKey,   
    'returl':'',
    'sc':fksc
}

postdata = urllib.urlencode(postdata)
headers = {
    'User-Agent':'Mozilla/5.0 (X11; Linux i686; rv:8.0) Gecko/20100101 Firefox/8.0',
    'Content-Type':    'application/x-www-form-urlencoded',
    'Referer':'http://ehire.51job.com/MainLogin.aspx',
    'Connection': 'keep-alive'
}
 
url='https://ehirelogin.51job.com/Member/UserLogin.aspx'

req = urllib2.Request(
    url = url,
        data = postdata,
        headers = headers
)
result = urllib2.urlopen(req)
#print(result.headers)
text = result.read()
#print(text);


© 著作权归作者所有

共有 人打赏支持
专业写BUG的程序员
粉丝 8
博文 110
码字总数 22635
作品 0
海淀
私信 提问
加载中

评论(2)

专业写BUG的程序员
专业写BUG的程序员

引用来自“l_g1990”的评论

后面还有么,全部的代码。。
取出简历再处理呀
l
l_g1990
后面还有么,全部的代码。。
模拟登录51job企业中心全套代码能发我下?

@leizi_java 你好,想跟你请教个问题: 模拟登录51job企业中心全套代码能发我下? 82186759@QQ.COM

larry_xiang
2015/08/17
213
2
这里有一张9000元的优惠券,请查收!

人工智能人才缺口500万 从语音识别到智能音箱, 从无人驾驶到人机对战, 近年来, 人工智能给人类社会带来了一次又一次惊喜。 大家都知道, 中国人工智能行业正处于一个创新发展时期, 对人才...

micf435p6d221ssdld2
2018/04/18
0
0
医学教育网批量资源下载程序之——登陆

首先申明 To www.med66.com网站设计师:我只是想批量下载已花钱购买的资源罢了,没有恶意。 12-18 今晚接到老姐的电话,说她已在“医学教育网”订购了不少视频,要我帮她将所有的视频都下载...

临峰不畏
2014/12/18
0
19
小简历一份有意思的看看

简 历 基 本 信 息 姓 名 蒋宁 性 别 男 政治面貌 团员 出生日期 1991.11.20 院校专业 计算机网络技术 地 址 北京海淀区菊园东站 电子邮件 591508750@qq.com 联系电话 18211103203 求 职 意 ...

宁宁123韩
2013/10/16
5K
37
python 淘宝系列(一):模拟登陆

前言 想实现python登录淘宝,大概有两种思路:1. 使用淘宝开放API接口; 2.使用模拟登陆发送post 数据登录。 两种方式各有优缺点。使用淘宝API,首先得装API库,比较大,有200多M,对小程序而...

艾柯
2014/01/07
0
8

没有更多内容

加载失败,请刷新页面

加载更多

table边框样式

table{ border:0.5px solid #000; border-collapse:collapse; //去除边框间空隙}th,td{ border:0.5px solid #000;}...

学霸猫
10分钟前
1
0
分布式消息通讯Kafka原理分析(二)

本章重点: 1.消息的存储原理2.Partition的副本机制原理3.副本数据同步原理 消息的文件存储机制 通过如 下命令找到对应partition下的日志内容 [root@localhost ~]# ls /tmp/kafka-logs/f...

须臾之余
15分钟前
0
0
Vue Element表单绑定(四)常用操作整理

一、启用回车提交报单操作 在登录页面,使用回车提交表单操作一般是必要的一个操作。在 Element中如何使用呢,示例如下: 来个注意点: 1.button按钮的native-type设置为submit,而不是绑定c...

tianma3798
19分钟前
1
0
《大话数据结构》读后总结(七)

常见的时间复杂度 执行次数 函数阶 非正式术语 12 O(1) 常数阶 2n+3 O(n) 线性阶 3n^2+2n+1 O(n2) 平方阶 5log2n+20 O(logn) 对数阶 2n+3nlog2n+19 O(nlogn) nlogn阶 6n^3+2n^2+3n+4 O(n3) 立...

徐曙辉
21分钟前
0
0
three.js 事件交互

点击查看交互效果 在three.js中,展示的一切内容都是在canvas中绘制的,所以点击事件点击到物体上是无法获取点击对象的,要获取点击的对象要使用RayCaster,用于在三维空间中进行鼠标拾取,原...

tianyawhl
21分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部