开源中国

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
xtuhcy的个人空间 - 开源中国社区
技能积分 71
活跃积分 31
粉丝 98
加入于 2015/03/27 最近登录:01/06 12:32
最新博客 全部 (16)
Docker入门
2017/10/10 发布
91 0
xtuhcy 3个月前
更新了动态
java语言中难得的简单易用爬虫框架 #GECCO#
1人点赞
0 1 查看
xtuhcy 3个月前
发表了博客 Docker入门
# windows安装docker ## win10企业版 对于win10企业版直接下载,https://www.docker.com/docker-windows ## win7/win10家庭版 安装docker-tollbox,https://www.docker.com/products/docker-toolbox ## 启动 点击...
0 查看
xtuhcy 1年前
# 基于netty实现的socks5代理协议 ## socks5协议 ### 简介 socks5协议是一个标准的代理协议,工作在网络的四层,理论上可以代理任意应用层协议。协议标准RFC1928,用户/密码鉴权标准RFC1929。协议的中文版本可以参...
0 查看
xtuhcy 1年前
已经更新:)
@xtuhcy
Gecco 1.2.5 发布了,DynamicGecco 实现了爬虫规则的热部署,是首个支持动态加载的java爬虫框架。 更新内容: @Gecco注解支持多个matchUrl,一个spiderbean可以同时匹配多种形式的url jd地址全部升级为https,jd ...
xtuhcy 1年前
#一、从浏览器说起 无头浏览器即headless browser,是一种没有界面的浏览器。既然是浏览器那么浏览器该有的东西它都应该有,只是看不到界面而已。 ##浏览器内核 - Webkit:目前最主流的浏览器内核,webkit是苹果公...
0 查看
xtuhcy 1年前
Gecco 1.2.4 发布了,DynamicGecco 实现了爬虫规则的热部署,是首个支持动态加载的java爬虫框架。 DynamicGecco 的目的是在不定义 SpiderBean 的情况下实现爬取规则的运行时配置。其实现原理是采用字节码编程,动...
5 查看
xtuhcy 2年前
##关于gecco爬虫框架 如果对gecco还没有了解可以参看一下gecco的[github首页](https://github.com/xtuhcy/gecco)。gecco爬虫十分的简单易用。之前有一篇文章《[教您使用java爬虫gecco抓取JD商品信息](http://www....
0 查看
xtuhcy 2年前
不会啊,maven都能正常下载啊。jmxutils的官网,https://github.com/martint/jmxutils
@xtuhcy
#教您使用java爬虫gecco抓取JD全部商品信息(一) ##gecco爬虫 如果对gecco还没有了解可以参看一下gecco的github首页。gecco爬虫十分的简单易用,JD全部商品信息的抓取9个类就能搞定。 ##JD网站的分析 要抓取JD网...
xtuhcy 2年前
在博客: Gecco爬虫框架的线程和队列模型 发表评论:
想用多线程提高效率就想办法放入初始请求队列。初始队列不一定是静态的,爬虫也可以用来爬取初始队列。
@xtuhcy
##简述 爬虫在抓取一个页面后一般有两个任务,一个是解析页面内容,一个是将需要继续抓取的url放入队列继续抓取。因此,当爬取的网页很多的情况下,待抓取url的管理也是爬虫框架需要解决的问题。本文主要说的是g...
xtuhcy 2年前
http://www.geccocrawler.com/
@xtuhcy
Gecco 1.2.0 发布了,该版本改进内容包括: 1.HttpClientDownloader保证inputstream能重复使用,@shangjian提供修改思路 2.支持一个Before/AfterDownloader对应多个SpiderBean 3.Gecco的动态编程是新版本的核心功...
顶部
×
动弹一下 还可以输入5
单图/多图
网络图片
上传图片
9 张,还能上传 9
  • +
发布
×
设置备注名:
保存
用户尚未登录,点击这里登录