加载中
爬虫 全国建筑市场监管服务平台小程序 数据抓取与采集

原来发了几遍文章关于 全国建筑市场监管公共服务平台(四库一平台)平台的网站数据采集和抓取: 建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)入门篇 建筑资质爬虫抓取-全国建筑市场监管...

成都工商企业数据爬取解读

如今大数据盛行的年代,数据以及开始引导政策的抉择,城市经济的发展主要有企业引导;因此,企业数据,和企业经济数据已经成为数据分析的一部分。 下面我讲讲述如果取得企业的数据。 1、政府...

2019/08/31 16:11
2K
网络爬虫记录《企业工商注册信息》第一篇目标抓取平台

网络爬虫记录《企业工商注册信息》 国家企业信用信息公示系统(http://www.gsxt.gov.cn)是企业信息公示系统,里面有全国的企业信息,年报等;是了解一家企业最为权威的网站。由于通过大数据...

2019/02/26 14:07
4.9K
2023年全国建筑市场监管平台(四库一平台)—接口加密AES数据解密

2023年中旬,全国建筑市场监管公共服务平台(四库一平台)做了一次密码调整,通过网页采集返回的结果加密的秘钥key发生了变化。 1、旧版加密解密 在更新最新秘钥key加密数据返回的数据都是9...

11/23 16:07
19
2020年全国高新企业认证名单统计

2020年全国高新注册企业总计112789,比2019年认证的87417多2万多家企业,也是第一次突破10万家认证企业。 最近四年企业认证情况。 年份 数量(家) 2020年 112789 2019年 87417 2018年 7574...

2021/02/21 09:55
260
重庆市企业数据名录爬取采集—信用中国(重庆)

信用中国(重庆) 一、平台介绍 网址:http://www.creditsc.gov.cn 该网站主要收集了重庆市企业名录库,当前总计151万 条结果,2020年重庆市公布的市场主体已经有280万市场主体。该重庆新用户...

amp
2020/05/19 22:10
1.2K
上海市企业数据名录爬取采集与收集

2019年全年上海市新设立各类市场主体43.15万户。其中,新设企业36.76万户;新设个体工商户6.35万户;新设农民专业合作社349户。日均新设企业1476户。至年末,上海市共有各类市场主体270.43万...

amp
2020/05/13 20:54
1.5K
北京市企业(市场主体)数据爬取采集

现在数据越来越重要,我一直研究这企业工商数据采集,今天分享一下北京市企业数据采集。 北京市市场主体(企业+个体)数据源 1、国家企业信用公示系统(北京) http://bj.gsxt.gov.cn/index....

amp
2020/05/05 11:41
732
新版建筑市场(四库一平台)抓取最新信息(爬虫)

全国建筑市场(四库一平台)http://jzsc.mohurd.gov.cn 在2019年7月左右发布了新版本,同时在2020年初关闭的老板。新版本在防止爬虫方面做了很多工作,比如在我以前博客中提到的: 1、新版的...

2020/03/22 20:50
2.3K
国家高新技术企业认定数据库分析(2017年-2019年)

高新技术企业认定每年都有公布,高新技术企业认定工作网(http://www.innocom.gov.cn/)。是由科技部火炬高技术产业开发中心主办的平台。聚集了北京市、天津市、河北省、山西省、等31个省数据...

2020/03/09 15:44
1.9K
建筑市场数据(四库一平台)API接口开放

全国建筑市场监管平台(四库一平台)【http://jzsc.mohurd.gov.cn】已经关闭的老板,现在对数据采集的要求原来越高。经过自己的学习和整理发布的一个建筑市场数据(四库一平台)API接口开放 ...

2020/03/08 16:25
1.9K
中国土地市场网爬虫——字体woff解密还原

通过我上篇博客;中国土地市场网爬虫——浏览器Cookie验证(简单) 和中国土地市场爬虫——浏览器cookie验证(图片验证码)讲述了中国土地市场网(www.landchina.com)的两种访问限制策略,也...

2020/01/15 14:48
2.7K
中国土地市场爬虫——浏览器cookie验证(图片验证码)

通过我上篇博客;中国土地市场网爬虫——浏览器Cookie验证(简单) 讲述了中国土地市场网(www.landchina.com)的三种验证方式。 该网站的三种防止爬虫策略 1、通过cookie验证,三次跳转,两...

2020/01/15 14:47
743
中国土地市场网爬虫——访问Cookie认证验证(简单)

很久以前研究过中国土地市场网(www.landchina.com),当时只抓取了一个城市的数据2万多条的数据,当时只是觉得服务器经常宕机,还没有发现有怎么反爬虫的限制。最近空闲准备把所以的数据抓取...

2020/01/15 14:46
3.2K
高新技术企业数据爬取与整理-高新技术企业认定工作网

高新技术企业认定每年都有公布,高新技术企业认定工作网(http://www.innocom.gov.cn/)。是由科技部火炬高技术产业开发中心主办的平台。聚集了北京市、天津市、河北省、山西省、内蒙古自治区...

2019/12/24 20:13
626
建筑资质爬虫抓取-全国建筑市场监管公共服务平台(二)-接口篇

上一篇《建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)》提到如果解密全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn/)JSON密码解密的问题。 该篇博文主要分析网站的接口:...

2019/12/03 20:44
3.8K
爬虫 全国建筑市场监管公共服务平台(四库一平台) 平台数据抓取

经过几天的全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn)平台的研究,终于完成数据的完全抓取。陆陆续续差不多花费一周的时间进行软件开发和设计,然后爬取时间才不多20天时间...

2019/12/03 20:29
1.5W
纳税信用A级纳税人名单爬虫抓取

2018年总共有75375家企业纳税信用A级纳税人名单,其中江苏(167614家),广东(151675家),浙江(135774家)最多;主要城市北京(60272家),上海(103490家); 纳税信用A级纳税人名单公布...

2019/11/21 15:51
2.7K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部