selenium

原创
2017/07/16 14:44
阅读数 7

Centos,Python

PhantomJS是无界面的浏览器

selenium(python提供的库)是模拟人来对浏览器进行操作,比如打开浏览器,点击,输入,提交,都可以通过代码来实现

1.安装selenium

pip install selenium

2.要用selenium要有一个浏览器(Firefox)

3.浏览器Firefox的驱动文件,浏览器驱动下载地址,把驱动解压放到环境变量里(/usr/bin 或 /usr/local/bin)

4.安装虚拟的显示器

yum install Xvfb libXfont xorg-x11-fonts*
pip3 install  pyvirtualdisplay

运行下面代码会自动打开火狐浏览器,访问百度

from selenium import webdriver

browser = webdriver.Firefox()
browser.get('http://baidu.com')

下面代码,模拟寻找网页元素,输入,模拟点击回车

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

browser = webdriver.Firefox()
browser.get('http://www.python.org')
print browser.title
assert "Python" in browser.title    #assert断言,判断后面语句是否为真,异常
elem = browser.find_element_by_name("q")
elem.send_keys("pycon")
elem.send_keys(Keys.RETURN)
print browser.page_source

driver.get 方法会打开请求的URL,WebDriver 会等待页面完全加载完成之后才会返回,即程序会等待页面的所有内容加载完成,JS渲染完毕之后才继续往下执行。注意:如果这里用到了特别多的 Ajax 的话,程序可能不知道是否已经完全加载完毕。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部