文档章节

ghost.py简介

樂天
 樂天
发布于 2014/06/01 15:42
字数 262
阅读 327
收藏 1
ghost.py是一个使用python编写的封装了webkit的网络工具。官网是:http://jeanphix.me/Ghost.py。

1、安装:

首先需要安装PyQt或者PySide,然后使用`pip`安装ghost.py:
pip install Ghost.py



2、官网的几个示例:


2.1、获取网页内容已经相应的css、js、图片等资源:

from ghost import Ghost 
ghost = Ghost()
page, resources = ghost.open('http://my.web.page')
该方法以元组的形式返回网页的主要资源(网页内容)和该网页需要加载的资源(比如CSS、js、图片等文件)。这些资源都被存储到HttpResource对象中。

目前,Httpresource对象提供了下面三个属性:
  • url: 资源的地址
  • http_status: HTPP响应的状态码
  • headers: 字典(dict)形式的响应头


2.2、执行js:

result, resources = ghost.evaluate( "document.getElementById('my-input').getAttribute('value');")

result是javascript的执行结果,resources是加载的资源。

2.3、在表单的某个文本输入框中设值:

result, resources = ghost.set_field_value("input[name=username]", "jeanphix")

2.4、将网页渲染成图片:

ghost.capture_to('www.png'")

当前目录下会生成图片www.png。


更多内容,请移步官网。


© 著作权归作者所有

共有 人打赏支持
樂天
粉丝 136
博文 673
码字总数 147433
作品 3
深圳
程序员
Web 自动化测试与智能爬虫利器:PhantomJS 简介与实战

估计部分同学没听过这个工具,那先简单介绍下它的背景与作用。 1、PhantomJS 是什么? PhantomJS是一个基于WebKit的服务器端JavaScript API,它无需浏览器的支持即可实现对Web的支持,且原生...

大数据之路
2015/04/28
0
2
使用ghost.py(webkit)来爬取网页

再次更新:ubuntu下安装pyside sudo apt-get install python-pyside sudo apt-get install python3-pyside update:ubuntu pyside 安装 http://pyside.readthedocs.io/en/latest/building/li......

flyking
2015/05/07
0
0
WIN7 PYTHON2.7 GHOST.PY怎么安装呢

WIN7环境下,用的是PYTHON2.7, GHOST.PY怎么安装呢

comeluder
2014/06/27
1K
7
QT: QFont::setPixelSize: Pixel size <= 0 (0)

python版本2.7 pyqt版本 PyQt4-4.11.4-gpl-Py2.7-Qt4.8.7-x64 用ghost.py 读取一个网页,发送错误如下错误 QT: QFont::setPixelSize: Pixel size <= 0 (0) python崩溃,google了一圈,没找到解......

maudo
2016/10/18
479
1
ghost.py load_cookies函数,加载完成后,访问 renren.com 导致python异常

1:目的: 先用urllib urllib2 cookiejar 先用cookielib创建一个LWPCookiejar,存储到本地。然后通过urllib2 登录renren,并且将取得的cookie保存到本地,证明已经登录成功。 然后用ghost.py 的...

三小寿
2015/10/12
151
1

没有更多内容

加载失败,请刷新页面

加载更多

一切都靠大数据:滴滴已封禁4.3万人员、车辆

这段时间以来,滴滴出行相继出炉了各种整改措施,包括自身安全建设和外部社会共建,昨日就刚刚宣布正在筹备建立安全监督顾问委员会。 据媒体最新报道,9月30日,上海市交通委员会执法总队、上...

linuxCool
45分钟前
4
0
awk命令用法介绍

10月18日任务 9.6/9.7 awk 1.awk(上)(下) 1.awk 分段操作功能 指定分隔符,并把第一段打印出来,不会改动文件内容 将所有内容打印出来 awk 没有指定分隔符号,则会默认用空格或者空白字符...

hhpuppy
今天
4
0
Spring Cloud Eureka Server高可用之:在线扩容

本文共 1591字,阅读大约需要 6分钟 ! 概述 业务微服务化以后,我们要求服务高可用,于是我们可以部署多个相同的服务实例,并引入负载均衡机制。而微服务注册中心作为微服务化系统的重要单元...

CodeSheep
今天
3
0
内网esxi主机上安装CoreOS虚拟机

CoreOS是一个为专门运行容器而设计的轻量级linux发行版,旨在通过轻量的系统架构和灵活的应用程序部署能力简化数据中心的维护成本和复杂度。它没有包管理工具,运行容器化应用以提供服务;默...

hiwill
今天
2
0
20181018 上课截图

![](https://oscimg.oschina.net/oscnet/49f66c08ab8c59a21a3b98889d961672f30.jpg) ![](https://oscimg.oschina.net/oscnet/a61bc2d618b403650dbd4bf68a671fabecb.jpg)......

小丑鱼00
今天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部