文档章节

php 抓取图片

一切_放空
 一切_放空
发布于 2015/02/09 17:18
字数 181
阅读 199
收藏 9
<?php
/**
 * Created by PhpStorm.
 * Date: 15-2-9
 * Time: 下午3:10
 */

for($i=0;$i<1000;$i++){
    $getData['page'] =  $i+1;
    getImg($getData);
}


function getImg($getData)
{
    $path = "D:/NFS/img/";
    $opts = array(
        'http'=>array(
            'method'=>"GET",
            'timeout'=>3,//设置3秒等待
        ),
    );
    if(is_array($getData) && !empty($getData))
    {
        $ser = http_build_query($getData, '', '&');
    }
    $cnt=0;
   //如果请求失败 继续请求3次
    while($cnt<3 && ($file=file_get_contents("http://sexy.faceks.com/?{$ser}", false, stream_context_create($opts)))===FALSE) $cnt++;
    preg_match_all("/\<img.*?src\=\"(.*?)\"[^>]*>/i", $file, $matches);
    if(empty($matches[0]) || empty($matches[1]))
    {
        echo "not img...";die;
    }

    $imgs=array_unique($matches[1]);
    foreach($imgs as $k=>$img)
    {

        $filename = $path.time().$k.".jpg";
        getImage($img,$filename);
    }

}

/**
 * @param string $url
 * @param string $fileName
 * 保存图片
 */
function getImage($url = '', $fileName = '')
{
    var_dump($fileName);
    $ch = curl_init();
    $fp = fopen($fileName, 'wb');

    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FILE, $fp);
    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
    curl_setopt($ch, CURLOPT_TIMEOUT, 60);

    curl_exec($ch);
    curl_close($ch);
    fclose($fp);
}


© 著作权归作者所有

共有 人打赏支持
一切_放空
粉丝 1
博文 16
码字总数 6368
作品 0
杨浦
程序员
私信 提问
微信图文抓取

mysql数据库(data表)保存了微信公众号文章的地址(url列)。1、定时扫描数据库,抓取所有文章,再保存到这张表里面,标题(title),正文(content),发布时间(createtime);2、下载所有...

芥末花生
2017/03/06
5
4
PHP爬虫:百万级别知乎用户数据爬取与分析

这次抓取了110万的用户数据,数据分析结果如下: 开发前的准备 安装Linux系统(Ubuntu14.04),在VMWare虚拟机下安装一个Ubuntu; 安装PHP5.6或以上版本; 安装MySQL5.5或以上版本; 安装cur...

snowing1990
2016/04/06
92
0
PHP模拟登录并获取数据

cURL 是一个功能强大的PHP库,使用PHP的cURL库可以简单和有效地抓取网页并采集内容,设置cookie完成模拟登录网页,curl提供了丰富的函数, 开发者可以从PHP手册中获取更多关于cURL信息。本文...

Louis_88
2015/09/19
99
0
又一编辑神器-百度编辑器-Ueditor

又一编辑神器-百度编辑器-Ueditor (Liondenhsdlionden@gmail.com 转载说明)     前段时间发表过一篇关于“KindEditor在JSP中使用”的博文。这几天在沈阳东软进行JavaWeb方面的实习工作...

KavenSu
2014/06/26
0
0
《CURL技术知识教程》系列分享专栏

《CURL技术知识教程》已整理成PDF文档,点击可直接下载至本地查阅 https://www.webfalse.com/read/201737.html 文章 PHP采集相关教程之一 CURL函数库 php中通过curl模拟登陆discuz论坛的实现...

开元中国2015
11/06
0
0

没有更多内容

加载失败,请刷新页面

加载更多

CockroachDB

百度云上的CockroachDB 云数据库 帮助文档 > 产品文档 > CockroachDB 云数据库 > 产品描述 开源NewSQL – CockroachDB在百度内部的应用与实践 嘉宾演讲视频及PPT回顾:http://suo.im/5bnORh ...

miaojiangmin
19分钟前
0
0
I2C EEPROM驱动实例分析

上篇分析了Linux Kernel中的I2C驱动框架,本篇举一个具体的I2C设备驱动(eeprom)来对I2C设备驱动有个实际的认识。 s3c24xx系列集成了一个基于I2C的eeprom设备at24cxx系列。at24cxx系列芯片包...

yepanl
21分钟前
1
0
spring mvc拦截器,实现统计http请求的后台运行时间

使用两种方式,实现拦截http请求的后台运行时间。 废话不多说直接上代码 /** * Http请求时间统计 * 拦截所有请求 */public class HttpRquestTimeInterceptor extends HandlerIntercepto...

兜兜毛毛
39分钟前
2
0
设计模式之工厂模式

本篇博文主要翻译这篇文章: https://www.journaldev.com/1392/factory-design-pattern-in-java 由于翻译水平有限,自认为许多地方翻译不恰当,欢迎各位给出宝贵的建议,建议大家去阅读原文。...

firepation
54分钟前
4
0

中国龙-扬科
57分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部