文档章节

开源Nodejs项目推荐:抓取网站截图

i5ting
 i5ting
发布于 2016/04/19 10:09
字数 350
阅读 5.2K
收藏 67

精选30+云产品,助力企业轻松上云!>>>

抓取网站截图

很多网页特别长,直接的电脑截图非常麻烦,用ps等工具也非常麻烦,所以很多人都问我有木有自动抓出截图的软件

Node.js里是有的

推荐pageres

首先全局安装

$ PHANTOMJS_CDNURL=https://npm.taobao.org/dist/phantomjs npm install phantomjs --registry=https://registry.npm.taobao.org --no-proxy
$ npm install --global pageres-cli

执行

screenshot.png

效果如下

screenshot-output.png

说明:此模块依赖PhantomJS,请备好梯子或者用文中的国内镜像

嵌入代码中

通过shell是可以做,这是给其他语言调用的,对于Node.js,你可以使用对应模块就好了

https://github.com/sindresorhus/pageres

$ npm install --save pageres

PhantomJS, which is used for generating the screenshots, is installed automagically, but in some rare cases it might fail to and you'll get an Error: spawn EACCES error. Download PhantomJS manually and reinstall pageres if that happens.

用法

const Pageres = require('pageres');

const pageres = new Pageres({delay: 2})
    .src('yeoman.io', ['480x320', '1024x768', 'iphone 5s'], {crop: true})
    .src('todomvc.com', ['1280x1024', '1920x1080'])
    .dest(__dirname)
    .run()
    .then(() => console.log('done'));

原理

其实就是利用无头浏览器PhantomJS来实现的截图

剩下的就自己玩去吧

全文完

欢迎关注我的公众号【node全栈】

node全栈.png

i5ting

i5ting

粉丝 201
博文 68
码字总数 98509
作品 3
东城
私信 提问
加载中
此博客有 7 条评论,请先登录后再查看。
教你nodejs爬虫制作知乎专栏RSS抓取程序

现在这个社会是信息爆炸的社会,各个网站、app上铺天盖地的都是各种新闻和信息。 为了获取信息,我们每天都要进行各种麻烦的操作,打开各种网站或者手机app,操作显得低效,后来发现了一个神器...

osc_lhwd57ou
05/24
23
0
教你nodejs爬虫制作知乎专栏RSS抓取程序

现在这个社会是信息爆炸的社会,各个网站、app上铺天盖地的都是各种新闻和信息。 为了获取信息,我们每天都要进行各种麻烦的操作,打开各种网站或者手机app,操作显得低效,后来发现了一个神器...

前端-发际线还在
05/23
0
0
实例:使用puppeteer headless方式抓取JS网页

puppeteer google chrome团队出品的puppeteer 是依赖nodejs和chromium的自动化测试库,它的最大优点就是可以处理网页中的动态内容,如JavaScript,能够更好的模拟用户。 有些网站的反爬虫手段...

caiyongji
2018/05/09
0
0
实例:使用puppeteer headless方式抓取JS网页

puppeteer google chrome团队出品的puppeteer 是依赖nodejs和chromium的自动化测试库,它的最大优点就是可以处理网页中的动态内容,如JavaScript,能够更好的模拟用户。 有些网站的反爬虫手段...

caiyongji
2018/05/09
0
0
实例:使用puppeteer headless方式抓取JS网页

puppeteer google chrome团队出品的puppeteer 是依赖nodejs和chromium的自动化测试库,它的最大优点就是可以处理网页中的动态内容,如JavaScript,能够更好的模拟用户。 有些网站的反爬虫手段...

caiyongji
2018/05/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

BuildRun低代码开发教程八节 | 图表和仪表盘展示

课程说明 ▍ 1.1 课程实现功能 本课程为物联网应用平台设计一个仪表盘首页,包括以下内容: 卡片展示设备总数; 卡片展示网关总数; 卡片展示产品总数; 卡片展示产品分组总数; 图表展示各运...

BuildRun团队
29分钟前
11
0
JavaSE第03篇:Java基础语法之运算符和流程控制

本章将会延续JavaSE第02篇,详细讲解Java基础语法中的运算符和流程控制中的顺序结构、分支结构。 第一章:运算符 运算符,简而言之就是运算的符号。 我们通常所理解的运算一般和数学有关系,...

雷哒哒
31分钟前
3
0
jenkins更换清华源

[root@localhost ~]# find / -name "default.json" /var/lib/jenkins/updates/default.json[root@localhost ~]# sed -i 's/http:\/\/updates.jenkins-ci.org\/download/https:\/\/mirro......

MadDragon
44分钟前
25
0
springboot 学习

1、搭建环境 helloworld http://c.biancheng.net/view/5316.html 或者懂了直接上这个网站建: https://start.spring.io/ 2、整合jdbc...

深夜里写着琴弹着代码
51分钟前
16
0
如何检查Android上的互联网访问? InetAddress永远不会超时

问题: I got a AsyncTask that is supposed to check the network access to a host name. 我有一个AsyncTask应该检查网络访问主机名。 But the doInBackground() is never timed out. 但是......

技术盛宴
53分钟前
18
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部