加载中
爬虫 全国建筑市场监管服务平台小程序 数据抓取与采集

原来发了几遍文章关于 全国建筑市场监管公共服务平台(四库一平台)平台的网站数据采集和抓取: 建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)入门篇 建筑资质爬虫抓取-全国建筑市场监管...

成都工商企业数据爬取解读

如今大数据盛行的年代,数据以及开始引导政策的抉择,城市经济的发展主要有企业引导;因此,企业数据,和企业经济数据已经成为数据分析的一部分。 下面我讲讲述如果取得企业的数据。 1、政府...

2019/08/31 16:11
1K
网络爬虫记录《企业工商注册信息》第一篇目标抓取平台

网络爬虫记录《企业工商注册信息》 国家企业信用信息公示系统(http://www.gsxt.gov.cn)是企业信息公示系统,里面有全国的企业信息,年报等;是了解一家企业最为权威的网站。由于通过大数据...

2019/02/26 14:07
2.8K
重庆市企业数据名录爬取采集—信用中国(重庆)

信用中国(重庆) 一、平台介绍 网址:http://www.creditsc.gov.cn 该网站主要收集了重庆市企业名录库,当前总计151万 条结果,2020年重庆市公布的市场主体已经有280万市场主体。该重庆新用户...

amp
05/19 22:10
271
上海市企业数据名录爬取采集与收集

2019年全年上海市新设立各类市场主体43.15万户。其中,新设企业36.76万户;新设个体工商户6.35万户;新设农民专业合作社349户。日均新设企业1476户。至年末,上海市共有各类市场主体270.43万...

amp
05/13 20:54
354
北京市企业(市场主体)数据爬取采集

现在数据越来越重要,我一直研究这企业工商数据采集,今天分享一下北京市企业数据采集。 北京市市场主体(企业+个体)数据源 1、国家企业信用公示系统(北京) http://bj.gsxt.gov.cn/index....

amp
05/05 11:41
176
新版建筑市场(四库一平台)抓取最新信息(爬虫)

全国建筑市场(四库一平台)http://jzsc.mohurd.gov.cn 在2019年7月左右发布了新版本,同时在2020年初关闭的老板。新版本在防止爬虫方面做了很多工作,比如在我以前博客中提到的: 1、新版的...

03/22 20:50
649
国家高新技术企业认定数据库分析(2017年-2019年)

高新技术企业认定每年都有公布,高新技术企业认定工作网(http://www.innocom.gov.cn/)。是由科技部火炬高技术产业开发中心主办的平台。聚集了北京市、天津市、河北省、山西省、等31个省数据...

03/09 15:44
567
建筑市场数据(四库一平台)API接口开放

全国建筑市场监管平台(四库一平台)【http://jzsc.mohurd.gov.cn】已经关闭的老板,现在对数据采集的要求原来越高。经过自己的学习和整理发布的一个建筑市场数据(四库一平台)API接口开放 ...

03/08 16:25
754
中国土地市场网爬虫——字体woff解密还原

通过我上篇博客;中国土地市场网爬虫——浏览器Cookie验证(简单) 和中国土地市场爬虫——浏览器cookie验证(图片验证码)讲述了中国土地市场网(www.landchina.com)的两种访问限制策略,也...

01/15 14:48
109
中国土地市场爬虫——浏览器cookie验证(图片验证码)

通过我上篇博客;中国土地市场网爬虫——浏览器Cookie验证(简单) 讲述了中国土地市场网(www.landchina.com)的三种验证方式。 该网站的三种防止爬虫策略 1、通过cookie验证,三次跳转,两...

01/15 14:47
405
中国土地市场网爬虫——访问Cookie认证验证(简单)

很久以前研究过中国土地市场网(www.landchina.com),当时只抓取了一个城市的数据2万多条的数据,当时只是觉得服务器经常宕机,还没有发现有怎么反爬虫的限制。最近空闲准备把所以的数据抓取...

01/15 14:46
2.1K
高新技术企业数据爬取与整理-高新技术企业认定工作网

高新技术企业认定每年都有公布,高新技术企业认定工作网(http://www.innocom.gov.cn/)。是由科技部火炬高技术产业开发中心主办的平台。聚集了北京市、天津市、河北省、山西省、内蒙古自治区...

2019/12/24 20:13
101
建筑资质爬虫抓取-全国建筑市场监管公共服务平台(二)-接口篇

上一篇《建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)》提到如果解密全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn/)JSON密码解密的问题。 该篇博文主要分析网站的接口:...

2019/12/03 20:44
1.6K
爬虫 全国建筑市场监管公共服务平台(四库一平台) 平台数据抓取

经过几天的全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn)平台的研究,终于完成数据的完全抓取。陆陆续续差不多花费一周的时间进行软件开发和设计,然后爬取时间才不多20天时间...

2019/12/03 20:29
7.6K
纳税信用A级纳税人名单爬虫抓取

2018年总共有75375家企业纳税信用A级纳税人名单,其中江苏(167614家),广东(151675家),浙江(135774家)最多;主要城市北京(60272家),上海(103490家); 纳税信用A级纳税人名单公布...

2019/11/21 15:51
977
天狗云平台正式更名为甘三数据平台

经过研究绝对原来的天狗云在2019年11月11日正式更名为 甘三数据平台 为了更好的推广平台,平台使用了新的名称,同时保留域名 tngou.net ; 天狗云,天狗数据,天狗网,陆续会使用甘三数据,甘...

2019/11/11 21:33
244
建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)

最近在关注全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn);主要是想抓取全国具有建筑资质证书的企业,和个人。 主要网址: 1、http://jzsc.mohurd.gov.cn/data/company 企业数...

2019/10/30 21:11
1.4K
基于APICloud开发和天狗云开放平台数据开发的天狗美阅

GIT源码地址:http://git.oschina.net/397713572/tnfsApp 简介 采用APICloud开发的APP应用,同时基于天狗云开放平台的接口开发http://www.tngou.net/doc 天狗美阅是基于天狗云开放API开放平台...

2016/01/09 19:57
485
热点热词 新闻热点 最新新闻数据API接口-天狗热点热词开放平台

天狗实时事件,是天狗(tngou.net)旗下开发的热点热词,新闻热点 由于所以的数据都来源与网络,所以天狗也想对应的免费开放相关的数据,为移动开发者使用。

2016/01/08 16:53
802

没有更多内容

加载失败,请刷新页面

返回顶部
顶部