文档章节

python 爬虫 抓取shadowsocks vpn 地址

zhailibao
 zhailibao
发布于 2015/11/10 15:24
字数 198
阅读 607
收藏 3
点赞 0
评论 0
#encoding=utf8
__author__ = 'zhailb'
'''
auto get vpn host from http://www.ishadowsocks.com/ ,write json config file
20160115 密码为空情况: (?P<password>.*?)  '''
import json
import urllib
import re
gui_config = "E:\\tools\Shadowsocks-win-2.3.1\gui-config.json"
def write_config(cfg_file, vpns):
    fp = file(cfg_file)
    cfg = json.load(fp)
    fp.close()
    del cfg['configs'][:]
    for vpn in vpns:
        vpn_dict={}
        vpn_dict['server']=vpn['server']
        vpn_dict['server_port']=vpn['server_port']
        vpn_dict['password']=vpn['password']
        vpn_dict['method']=vpn['method']
        vpn_dict['remarks']=u''
        cfg['configs'].append(vpn_dict)
    with open(cfg_file,'w') as f:
        json.dump(cfg,f)

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getvpn(html):
    vpns = []
    reg = r"<h4>.+?服务器地址:(?P<server>.+?)</h4>.+?<h4>端口:(?P<server_port>.+?)</h4>.+?<h4>.+?密码:(?P<password>.*?)</h4>.+?<h4>加密方式:(?P<method>.+?)</h4>.+?<h4>状态:(?P<status>.+?)</h4>"
    vpn_arr =  [m.groupdict() for m in re.finditer(reg, html,re.S)]
    for vpn in vpn_arr:
        if vpn.has_key("status"):
            if re.search('green',vpn['status']):
               vpns.append(vpn)
    return vpns

if __name__ == '__main__':
    html = getHtml("http://www.ishadowsocks.com/")
    vpns = getvpn(html)
    write_config(gui_config, vpns)

© 著作权归作者所有

共有 人打赏支持
zhailibao
粉丝 3
博文 36
码字总数 11831
作品 0
东城
系统管理员
Linux上配置shadowsocks

Linux上配置shadowsocks 设置shadowsocks用浏览器翻墙 安装python的包管理器 用pip安装shadowsocks 配置shadowsocks JSON{"server":服务器地址,"server_port":端口号,"local_address":"127.0...

Jason_typ ⋅ 05/04 ⋅ 0

Centos下安装Shadowsocks代理服务

背景: 朋友的服务器在美国,操作系统是centos6.7。为了实现进入外网的需求,希望把这台服务器当作代理服务器。而这台服务器上有ipv6地址,又希望通过ipv6实现代理服务。 1:python环境准备。...

余二五 ⋅ 2017/11/15 ⋅ 0

通过VPS使用VPN或ShadowSocks访问Google或Google Schoolar出现验证码等的解决方法

景 似乎出现这种问题的很大一部分是因为用的DigitalOcean的VPS... 这里只针对IPv4和IPv6双栈VPS给出可能的解决方法 问题描述 我用的是架设在DigitalOcean上的Shadowsocks,有时访问Google会被...

JungleKing ⋅ 06/05 ⋅ 0

轻松搭建翻墙神器Shadowsocks

导语: 世界上有些东西,你可以看不到,也摸不着,但不能否定其存在。当想你想下载苹果的一个操作系统时,当你想看一篇关于叙利亚的文章时,当你想用google搜索“温”时候,你发现你打不开网...

先生我不会 ⋅ 05/12 ⋅ 0

基于随机森林的Shadowsocks流量检测

基于随机森林的Shadowsocks流量检测 译者:fengsehng 翻译前言 随着机器学习技术的火热,国内不少实验室一窝蜂的将机器学习纳入自己的科研课题研究之中,这样可以更好的找到发论文的结合点。...

apachecn_飞龙 ⋅ 2017/10/13 ⋅ 0

新手向一键脚本搭建SS/SSR服务并开启BBR加速

自己写的一键搭建shadowsocks/shadowsocksR的脚本,一键脚本适用Vultr上的和搬瓦工所有机型(CentOS、Ubuntu、Debian),搭建ss服务器支持所有客户端类型,本机你是iOS,Android,Windows,M...

flyzy2005 ⋅ 06/10 ⋅ 0

CentOS 7.0 安装部署Shadowsocks服务器。 搭建自己的VPN

一、环境介绍:   1、服务器:     CentOS7.0x8664   2、Windows客户端     Windows 10 二、安装部署: 1、安装Shadowsocks服务端: # yum update # yum install python-setupt...

Kefy ⋅ 06/13 ⋅ 0

Ubuntu使用Shadowsocks-qt5科学上网

由于大多数朋友都问我在Ubuntu上面怎么科学上网,为了防止以后忘记,故此记录。 本教程使用的配置 Ubuntu 16.10 Shadowsocks-qt5 一个可用的ss账号 一根能够通向www的网线 说明 是ubuntu上一...

Airship ⋅ 05/14 ⋅ 0

6月4日云栖精选夜读丨加拿大AI有多强?一年投入60亿,吸引Hinton、Bengio等大神

中国和美国的人工智能似乎成为了主角,实际上,正在全球人工智能地图上留下自己的印记。加拿大政府投入了数十亿美元用于人工智能研究和开发,形成一个极其丰富的人工智能生态系统,包括60多个...

yq传送门 ⋅ 06/04 ⋅ 0

vps搭建shadowsock和open***

shadowsock客户端下载: 安卓 https://github.com/shadowsocksr/shadowsocksr-android/releases。 windows: https://github.com/shadowsocks/shadowsocks-windows/releases mac: https://gi......

天道酬勤VIP ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

HiSDP —— 高效的C++软件开发平台

目前阿里集团每天有近1000PB的数据是通过LogAgent采集的,为了让LogAgent做到资源占用节省和高效采集,背后是基于HiSDP去构建的。 缘由 当决定采用C++编程语言去开发一个软件时,紧接着所面临...

阿里云云栖社区 ⋅ 4分钟前 ⋅ 0

zookeeper-3.4.12 下载与安装教程

一、zookeeper下载地址 http://mirrors.hust.edu.cn/apache/zookeeper/ 二、启动教程 把压缩包放在指定目录下 第三: 进入 conf文件夹底下 zoo_sample.cfg 文件名改成 zoo.cfg 第四步: 进入b...

泉天下 ⋅ 5分钟前 ⋅ 0

Oracle 中文日期转换

SELECT TO_date('2011年11月11日', 'yy"年"mm"月"dd"日"') FROM DUAL; 1. Oracle无法识别中文格式,所以添加双引号。 2. 后面的格式是指字符串在转换前的格式,而不是指转换后的格式。...

名侦探柯南 ⋅ 6分钟前 ⋅ 0

MySell:API Spring Boot

起步 类目 商品 订单

BeanHo ⋅ 9分钟前 ⋅ 0

Spring方法拦截器MethodInterceptor

参考资料 1、Spring方法拦截器MethodInterceptor 2、Sharding JDBC源码分析-JdbcMethodInvocation类的作用

哎小艾 ⋅ 12分钟前 ⋅ 0

正则表达式

元字符 元字符,又叫字符集,就是用一些特殊符号表示特定种类的字符或位置。 匹配字符 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 匹配...

wangchen1999 ⋅ 12分钟前 ⋅ 0

数据库数据导入Elasticsearch案例分享

基于bboss持久层和bboss elasticsearch客户端实现数据库数据导入es案例分享(支持各种数据库和各种es版本) 1.案例对应的源码 https://gitee.com/bboss/bboss-elastic/blob/master/bboss-el...

bboss ⋅ 13分钟前 ⋅ 0

动手---sbt(2)

参考 https://blog.csdn.net/leishangwen/article/details/46225587 建立一个chisel_max目录,文件内容如后面所述,现在开始执行命令: joe@joe-Aspire-Z3730:/media/sdb4/download/scala$ c......

whoisliang ⋅ 20分钟前 ⋅ 0

纯js实现最简单的文件上传(后台使用MultipartFile)

<!DOCTYPE html><html><head> <meta charset="UTF-8"> <title>XMLHttpRequest上传文件</title> <script type="text/javascript"> //图片上传 var xhr......

孟飞阳 ⋅ 25分钟前 ⋅ 0

iOS宇宙大战游戏、调试工具、各种动画、AR相册、相机图片编辑等源码

iOS精选源码 日期时间选择器,swift Space Battle 宇宙大战 SpriteKit游戏源码 LLDebugTool - 便捷的IOS调试工具(新增截屏功能) 相机扫描or长按识别二维码、FMDB、键盘动态高度、定位等 动画...

sunnyaigd ⋅ 25分钟前 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部