用PHP实现采集
第一步,当然是如何去抓取对方网页的源代码
很多人第一反应可能就是用fread file_get_contents 来抓取,我这里是推荐使用curl来采集网页,原因有2:
1.curl功能强大,可以发送GET,POST请求,可以模拟头信息,cookie实现登陆对方站点,还可以设置代理模式,隐蔽自己的IP。
2.curl速度快,未测试。
curl的简单教程:http://my.oschina.net/cxz001/blog/95554
第二步:
截取指定区域的代码,用正则取出自己想要的内容,此处省略……
--完--