php采集实现

原创
2012/12/13 18:17
阅读数 556

用PHP实现采集

第一步,当然是如何去抓取对方网页的源代码

很多人第一反应可能就是用fread file_get_contents 来抓取,我这里是推荐使用curl来采集网页,原因有2:

1.curl功能强大,可以发送GET,POST请求,可以模拟头信息,cookie实现登陆对方站点,还可以设置代理模式,隐蔽自己的IP。

2.curl速度快,未测试。


curl的简单教程:http://my.oschina.net/cxz001/blog/95554


第二步:

截取指定区域的代码,用正则取出自己想要的内容,此处省略……


--完--

展开阅读全文
打赏
0
3 收藏
分享
加载中
更多评论
打赏
0 评论
3 收藏
0
分享
返回顶部
顶部