文档章节

采集百度百科城市介绍

sunny5156
 sunny5156
发布于 2013/03/15 10:54
字数 141
阅读 68
收藏 1
隐藏行号 复制代码 这是一段程序代码。
  1. include_once  'Snoopy.class.php';
  2. $word = '北京';
  3. $word = iconv('utf-8', 'gbk', $word);
  4. $url = "http://baike.baidu.com/search/word?word=".urlencode($word)."&pic=1&sug=1&enc=GBK";
  5. $url = iconv('utf-8', 'gbk', $url);
  6. $snoopy = new Snoopy();
  7. $arr = array();
  8. $snoopy->agent = "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.97 Safari/537.11";
  9. $snoopy->setcookies('bk.doubt.tipbubble=1; undefined=show%3Dtrue; BAIDUID=3C8DBE160B442A473F00B534F2DC28EA:FG=1; bdshare_firstime=1362030797753; MAP_NEWDATA=V0; MAP_NEWDATA1=V1; BDREFER=%7Burl%3A%22http%3A//auto.baidu.com/%22%2Cword%3A%22%22%7D; BAIDULXBCB=19F69332B7BD0E7F6E5832BB5BC4B7F1AC3A33914F54038F85568856D663B7582917455BD3E27FBDB6923B0DA510DF1B201504AE9FBA9761ABE3C70DA6D3CC317663FBC33943D8527D7BD106461A334B; SSUDB=Ec4NWtsYlF5c045Q2hFTmxOVnNyanFJSlVhc1F2S29kSkVleFZpcUVFbnlOR1ZSQVFBQUFBJCQAAAAAAAAAAAEAAADF6f0MeXVoYW44MjM5Mjg4AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAPKnPVHypz1RO; PMS_Cache=1363068035843; BDUSS=Ec4NWtsYlF5c045Q2hFTmxOVnNyanFJSlVhc1F2S29kSkVleFZpcUVFbnlOR1ZSQVFBQUFBJCQAAAAAAAAAAAEAAADF6f0MeXVoYW44MjM5Mjg4AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAPKnPVHypz1RO; BDUT=4z5d3C8DBE160B442A473F00B534F2DC28EA13d1ecf54a30; MCITY=-2912%3A; IM_old=0|he9hpobl; H_PS_PSSID=1895_1444_1945_1788; Hm_lvt_55b574651fcae74b0a9f1cf9c8d7c93a=1363236133,1363236485,1363239512,1363239701; Hm_lpvt_55b574651fcae74b0a9f1cf9c8d7c93a=1363239701');
  10. $snoopy->fetch($url);
  11. echo $snoopy->results;

© 著作权归作者所有

sunny5156

sunny5156

粉丝 17
博文 10
码字总数 10176
作品 3
西安
后端工程师
私信 提问
最近的工作,采集一个分类信息网站的信息

使用技术: 环境:php7+mysql5.5+apache thinkphp5+queryList+CurlMulti 流程: 1.采集出所有的城市列表,字段有城市名,城市二级域名,等等 共374条信息 2.采集出所有的一级/二级栏目名称和url 共...

老bia同学
05/16
11
0
spring计算方圆300km内其它城市(附完整代码)

最近工作需要,页面展示某个城市附近300km范围内所有的其它城市。找了半天也没有合适的方法,这里给出一种解决方法,如果有更好的,请不吝赐教。 一、准备工作 问题抽象:求城市300km范围内所...

lkee6760
2017/11/27
0
0
五一出行,定哪家酒店?大数据告诉你,性价比最高的酒店是它

“五一”假期就要到啦,春夏交接,气候适宜,最是出游好时节,很多人都在为小长假出游做准备。为避免出游遇到突发状况,22日,消费者网与北京阳光消费大数据研究院遍联合发布了《在线旅游消费...

forespider
04/28
7
1
揭秘AI加持的考试现场:平安科技人脸识别如何赋能智慧教育?

雷锋网报道,2018年全国研究生考试近期举行,深圳研究生考试人脸识别项目也最终成功落地。这次深圳研究生考试在报名采集照片和考生入场时都使用了平安科技的人脸识别技术,是国考级别的考试中...

AI掘金志
2018/01/04
0
0
DEDE采集功能的使用 DEDE采集规则的导入与导出的方法

我们都知道,DEDECMS开发的默认系统后台自带有采集功能,本篇教程演示教你如何使用DEDE采集功能. 采集的定义: 回到重点:DEDE采集规则的导入方法  Dede教程-598080707.NET 1.登录DEDE后台...

asqq8
2018/07/18
0
0

没有更多内容

加载失败,请刷新页面

加载更多

作为一个(IT)程序员!聊天没有话题?试试这十二种技巧

首先呢?我是一名程序员,经常性和同事没话题。 因为每天都会有自己的任务要做,程序员对于其他行业来说;是相对来说比较忙的。你会经常看到程序员在发呆、调试密密麻麻代码、红色报错发呆;...

小英子wep
55分钟前
10
0
【SpringBoot】产生背景及简介

一、SpringBoot介绍 Spring Boot 是由 Pivotal 团队提供的全新框架,其设计目的是用来简化新 Spring 应用的初始搭建以及开发过程,该框架使用了特定的方式来进行配置,从而使开发人员不再需要...

zw965
今天
4
0
简述并发编程分为三个核心问题:分工、同步、互斥。

总的来说,并发编程可以总结为三个核心问题:分工、同步、互斥。 所谓分工指的是如何高效地拆解任务并分配给线程,而同步指的是线程之间如何协作,互斥则是保证同一时刻只允许一个线程访问共...

dust8080
今天
6
0
OSChina 周四乱弹 —— 当你简历注水但还是找到了工作

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @花间小酌 :#今日歌曲推荐# 分享成龙的单曲《男儿当自强》。 《男儿当自强》- 成龙 手机党少年们想听歌,请使劲儿戳(这里) @hxg2016 :刚在...

小小编辑
今天
3.2K
22
靠写代码赚钱的一些门路

作者 @mezod 译者 @josephchang10 如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。 今天给大家分享一个精彩的 GitHub 库,这个库整理...

高级农民工
昨天
9
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部