加载中
爬虫 全国建筑市场监管服务平台小程序 数据抓取与采集

原来发了几遍文章关于 全国建筑市场监管公共服务平台(四库一平台)平台的网站数据采集和抓取: 建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)入门篇 建筑资质爬虫抓取-全国建筑市场监管...

成都工商企业数据爬取解读

如今大数据盛行的年代,数据以及开始引导政策的抉择,城市经济的发展主要有企业引导;因此,企业数据,和企业经济数据已经成为数据分析的一部分。 下面我讲讲述如果取得企业的数据。 1、政府...

网络爬虫记录《企业工商注册信息》第一篇目标抓取平台

网络爬虫记录《企业工商注册信息》 国家企业信用信息公示系统(http://www.gsxt.gov.cn)是企业信息公示系统,里面有全国的企业信息,年报等;是了解一家企业最为权威的网站。由于通过大数据...

浙江省建筑市场监管公共服务系统—数据爬虫采集

浙江省建筑市场监管公共服务系统(https://jzsc.jst.zj.gov.cn)数据包括企业(省内企业、省外企业、进浙企业备案、 企业代表、工程业绩)、人员(省内人员、省外人员 、未入库注册人员、在建...

2023年全国建筑市场监管平台(四库一平台)—接口加密AES数据解密

2023年中旬,全国建筑市场监管公共服务平台(四库一平台)做了一次密码调整,通过网页采集返回的结果加密的秘钥key发生了变化。 1、旧版加密解密 在更新最新秘钥key加密数据返回的数据都是9...

全国建筑市场企业名录—建筑企业库(2023年)

数据通过《全国建筑市场监管公共服务平台(四库一平台)》(https://jzsc.mohurd.gov.cn/data/company )整理收集。 当前采集库企业98万家企业,其中包括企业名称、信用代码、法人、城市、电话...

2020年全国高新企业认证名单统计

2020年全国高新注册企业总计112789,比2019年认证的87417多2万多家企业,也是第一次突破10万家认证企业。 最近四年企业认证情况。 年份 数量(家) 2020年 112789 2019年 87417 2018年 7574...

2021/02/21 09:55
294
重庆市企业数据名录爬取采集—信用中国(重庆)

信用中国(重庆) 一、平台介绍 网址:http://www.creditsc.gov.cn 该网站主要收集了重庆市企业名录库,当前总计151万 条结果,2020年重庆市公布的市场主体已经有280万市场主体。该重庆新用户...

上海市企业数据名录爬取采集与收集

2019年全年上海市新设立各类市场主体43.15万户。其中,新设企业36.76万户;新设个体工商户6.35万户;新设农民专业合作社349户。日均新设企业1476户。至年末,上海市共有各类市场主体270.43万...

北京市企业(市场主体)数据爬取采集

现在数据越来越重要,我一直研究这企业工商数据采集,今天分享一下北京市企业数据采集。 北京市市场主体(企业+个体)数据源 1、国家企业信用公示系统(北京) http://bj.gsxt.gov.cn/index....

新版建筑市场(四库一平台)抓取最新信息(爬虫)

全国建筑市场(四库一平台)http://jzsc.mohurd.gov.cn 在2019年7月左右发布了新版本,同时在2020年初关闭的老板。新版本在防止爬虫方面做了很多工作,比如在我以前博客中提到的: 1、新版的...

国家高新技术企业认定数据库分析(2017年-2019年)

高新技术企业认定每年都有公布,高新技术企业认定工作网(http://www.innocom.gov.cn/)。是由科技部火炬高技术产业开发中心主办的平台。聚集了北京市、天津市、河北省、山西省、等31个省数据...

2020/03/09 15:44
1.9K
建筑市场数据(四库一平台)API接口开放

全国建筑市场监管平台(四库一平台)【http://jzsc.mohurd.gov.cn】已经关闭的老板,现在对数据采集的要求原来越高。经过自己的学习和整理发布的一个建筑市场数据(四库一平台)API接口开放 ...

中国土地市场网爬虫——字体woff解密还原

通过我上篇博客;中国土地市场网爬虫——浏览器Cookie验证(简单) 和中国土地市场爬虫——浏览器cookie验证(图片验证码)讲述了中国土地市场网(www.landchina.com)的两种访问限制策略,也...

中国土地市场爬虫——浏览器cookie验证(图片验证码)

通过我上篇博客;中国土地市场网爬虫——浏览器Cookie验证(简单) 讲述了中国土地市场网(www.landchina.com)的三种验证方式。 该网站的三种防止爬虫策略 1、通过cookie验证,三次跳转,两...

中国土地市场网爬虫——访问Cookie认证验证(简单)

很久以前研究过中国土地市场网(www.landchina.com),当时只抓取了一个城市的数据2万多条的数据,当时只是觉得服务器经常宕机,还没有发现有怎么反爬虫的限制。最近空闲准备把所以的数据抓取...

高新技术企业数据爬取与整理-高新技术企业认定工作网

高新技术企业认定每年都有公布,高新技术企业认定工作网(http://www.innocom.gov.cn/)。是由科技部火炬高技术产业开发中心主办的平台。聚集了北京市、天津市、河北省、山西省、内蒙古自治区...

建筑资质爬虫抓取-全国建筑市场监管公共服务平台(二)-接口篇

上一篇《建筑资质爬虫抓取-全国建筑市场监管公共服务平台(一)》提到如果解密全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn/)JSON密码解密的问题。 该篇博文主要分析网站的接口:...

爬虫 全国建筑市场监管公共服务平台(四库一平台) 平台数据抓取

经过几天的全国建筑市场监管公共服务平台(http://jzsc.mohurd.gov.cn)平台的研究,终于完成数据的完全抓取。陆陆续续差不多花费一周的时间进行软件开发和设计,然后爬取时间才不多20天时间...

2019/12/03 20:29
1.6W
纳税信用A级纳税人名单爬虫抓取

2018年总共有75375家企业纳税信用A级纳税人名单,其中江苏(167614家),广东(151675家),浙江(135774家)最多;主要城市北京(60272家),上海(103490家); 纳税信用A级纳税人名单公布...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部