文档章节

XPath编写规则学习总结

孟飞阳
 孟飞阳
发布于 2016/06/26 10:21
字数 749
阅读 56
收藏 0

XPath编写规则学习

辅助工具:firefox安装findbugs,view Xpath

firefox :Xpath验证方式:$x("xpath"); 粘贴xpath语句回车即可

定位:

1、依靠自己属性,文本定位:

   //td[text()='test']

   //div[contains(@class ,'test')]

   //input[@type='radio' and @value='1']

   //span[@name='bruce' and text()='bruce2'] 或 //span[@name='bruce'][ text()='bruce2'] --and关键字

   //span[@name='bruce' or text()='bruce2'] --or关键字

2、依靠父节点定位:

  //div[@class='test mytest']/div

  //div[@id='test']/div

3、依靠子节点定位

  //div[div[@id='test']] --寻找含有id=test的div的div

  //div[div[@name='test']]

  //div[p[@id='test']]

4、混合型定位

  //div[div[@name='test']]/img

  //td[a//font[contains(text(),'test')]]//input[@type='checkbox']

5、高级方法 

  (1)following-sibling ---寻找紧跟定位到的元素的下一个元素

   例子://input[@id='1234']/following-sibling=input --定位紧跟id=1234的下一个的input元素,同级有效

             //input[@id='1234']/following-sibling::input ,input后可再跟条件

   (2)preceding-sibling ---寻找紧跟定位到的元素的上一个元素

   例子://input[@id='123']/preceding-sibling=span --定位紧跟id=123的上一个span元素

             //input[@id='1234']/preceding-sibling::input ,input后可再跟条件

     (3)starts-with --判断是否以某关键字开头

      例子://input[starts-with(@id,'test')]

     (4)contains -- 是否包含某关键字

       例子: //td[a//font[contains(text(),'test')]]//input[@type='checkbox']

     (5)not ---不包含某关键字

        例子://input[not(@id='1234')]

                  //span[not(contaions(text(),'xpath'))]

6、索引关键字,position,last

    (1)position()=2

             position()>3

             position()<5    

      例子://div[@id='test']/span[2]或

                //div[@id='test']/span[position()=2] --正数第2个span

      (2)last()-1

       例子://div[@id='test']/span[last()-2] --倒数第2个span元素

7、根据属性定位

  //div[@class] --查找含有class属性的div

  //div[@class='test'] --查找含有class属性且class属性值为test的的div元素

8、不常用关键字

     (1)substring,语法:substring(str,start_postion,length) ,从1开始计算

           例子://div[@id='test']/span[substring(@name,3,5)='bruce'] --找name的第三位开始总共5位字母为bruce的span

     (2)substring-before ,语法:substring-before(str,substr)

           例子://div[@id='test']/span[substring-before(@class,'-')='spanclass'] --查找分割关键字前面的字符为spanclass的span

     (3)substring-after,语法:substring-after(str,substr)

            例子://div[@id='substring']/span[substring-after(@class,'-')='spanclass'] --查找分割关键字后面的字符为spanclass的span

9、通配符:*

      //span[@*='bruce']

      //*[@*='bruce']

      //*[@name='bruce']

10、axes 轴

   (1)parent 父节点

          例子://div[span[text()='+++test']]/parent::div[contaions(text(),'test')] --查找含有span的text为+++test的的div的父节点

                    //div[span[text()='+++test']]/parent::div/span[contaions(text(),'test')]

   (2)ancestor 祖先节点

          例子://div[span[text()='+++test']]/ancestor::div    

   (3)descendant 孙子节点

           例子://div[span[text()='+++test']]/descendant::div --会将该节点下的所有div打印出来

                      //div[span[text()='+++test']]/descendant::div/span[contaions(text(),'test')]

   (4)following 将当前节点下后面所有的指定节点取出

            例子://div[text()='current NodeA']/following::div --会将current NodeA后面的所有的div取出来,后续的div可再加条件判断       

   (5)preceding 将当前节点下前面所有的指定节点取出

            例子://div[text()='current NodeA']/preceding::div --会将current NodeA前面的所有的div取出来,后续的div可再加条件判断

© 著作权归作者所有

共有 人打赏支持
孟飞阳
粉丝 206
博文 971
码字总数 544422
作品 5
朝阳
个人站长
私信 提问
Python实现电影排行榜自动网盘下载(1)Scrapy爬虫框架

本人学习参考的是博主崔庆才的系列教程 cuiqingcai.com/912.html cuiqingcai.com/3472.html 当然是比我写的详细的多啦,下面是我自己总结的学习过程 简介 我们来看看要获取的电影信息的网址 ...

Seeker_zz
2017/08/02
0
0
使用Scrapy构建一个网络爬虫

记得n年前项目需要一个灵活的爬虫工具,就组织了一个小团队用Java实现了一个爬虫框架,可以根据目标网站的结构、地址和需要的内容,做简单的配置开发,即可实现特定网站的爬虫功能。因为要考...

铁扇公主1
2017/05/04
48
0
元素定位XPath 简单操作分享

XPath 简单实用 学习Selenium2 为了学习元素定位开始学习xpath,现在把学习心得记录下,给大家参考下。 什么是 XPath? XPath 使用路径表达式在 XML 文档中进行导航 XPath 包含一个标准函数库...

余二五
2017/11/15
0
0
Java 语言的 XPath 学习 API

简介: XPath 表达式比繁琐的文档对象模型(DOM)导航代码要容易编写得多。如果需要从 XML 文档中提取信息,最快捷、最简单的办法就是在 Java™ 程序中嵌入 XPath 表达式。Java 5 推出了 ja...

挨踢人生
2012/03/30
0
0
Scrapy爬取猫眼电影并存入MongoDB数据库

之前入门了Scrapy,用Scrapy框架爬取了豆瓣电影TOP250,最近打算学习下scrapy-redis分布式爬虫,学习之前再重新温故下Scrapy,这个总结我缩写了很多内容,很多介绍可以看下我之前写的豆瓣mov...

Treehl
2017/12/21
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Vue.js 3.0 新特性预览

Evan You(尤雨溪)(2018年11月16日)前几日的早上在 Vue Toronto 的主题演讲中预演了 Vue 3 。 利用现代浏览器支持的新功能,Vue 3 将成为我们已经了解和喜爱的 Vue.js 强大的的改进版本。...

我的卡
11分钟前
1
0
Mybatis自带连接池阅读

1、数据源初始化,初始化入口由SqlSessionFactoryBuilder.build(InputStream inputStream, String environment, Properties properties)方法提供 public SqlSessionFactory build(InputStre......

jcc_codingBoy
17分钟前
1
0
Oracle 数据库勒索病毒 RushQL 处理办法

Oracle 数据库勒索病毒 RushQL 处理办法 办法来自Oracle 官方: https://blogs.oracle.com/cnsupport_news/%E5%AF%B9%E6%95%B0%E6%8D%AE%E5%BA%93%E7%9A%84%E2%80%9C%E6%AF%94%E7%89%B9%E5%......

rootliu
18分钟前
2
0
聊聊flink LocalEnvironment的execute方法

序 本文主要研究一下flink LocalEnvironment的execute方法 实例 final ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment(); DataSet<RecordDto>......

go4it
21分钟前
1
0
Spring Boot中对自然语言处理工具包hanlp的调用详解

概 述 HanLP 是基于 Java开发的 NLP工具包,由一系列模型与算法组成,目标是普及自然语言处理在生产环境中的应用。而且 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点,...

左手的倒影
27分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部