文档章节

正则表达式元字符介绍

Travler
 Travler
发布于 2016/08/09 11:40
字数 1066
阅读 6
收藏 0
1 基本元字符
.                  匹配单个任意字符,也可以理解为匹配任意字符的字符组的简写.   
[...]              字符组,匹配其中的任意一个字符,但只能是一个.如果匹配"]"本身则需要放在字符集中的第一位.
[^...]             排除型字符组,匹配未列出的任意字符,但是它必须匹配一个字符.^置于字符组中其他位置则表示其本身.
[.-.]              连字符,表示范围;如[0-9];[a-z]等;但置于字符集中第一位则表示其本身.注意,只有在字符组内部连字符才(可能)属于元字符-----否则它就是一个普通的连字符号.
|                  多选分支,匹配分隔两边的任意一个子表达式.例如'a|b|c'.
(...)              限定一个子表达式或者表达式分组,没有排除的功能(即不支持(^...)的写法),
\                  转义字符,只用来屏蔽一个元字符的特殊含义,\\可以屏蔽其本身.

2.标准量词(特性:匹配优先.也有人称之为贪婪匹配)
?                 匹配零个或一个先前的字符或者字符集或者子表达式.
+                  匹配一个或多个先前的字符或者字符集或者子表达式.
*                  匹配零个或多个先前的字符或者字符集或者子表达式.

3 表示重复次数量词(也属于匹配优先量词):区间
pattern{n}         只用来匹配前面pattern出现次数.n为次数
pattern{n,}        含义同上,但次数最少为n
pattern{n,m}       含义同上,但pattern出现次数在n与m之间

4 忽略优先量词(作用与标准量词相同,只不过是忽略优先的,或者说是非贪婪匹配)
*?
+?
??
{num,num}?

5 占有优先量词(作用与标准量词相同,不过一旦匹配,则不会回溯.暂时不做过多讨论)
*+
++
?+
{num,num}+

6 字符类
一些常用的字符合集可以用一些特殊的元字符代替,这些元字符用来匹配某一类别的字符,术语称之为字符类;
\d                 匹配数字,等价于[0-9]
\D                 匹配非数字,等价于[^0-9]或者[^\d]

\w                 匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[a-zA-Z0-9_]
\W                 \w取反,不匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[^a-zA-Z0-9_]或者[^\w]

\s                 匹配任意一个空白字符,等价于[\f\n\r\t\v]
\S                 \s取反,匹配任意一个非空白字符,等价于[^\f\n\r\t\v]或者[^\s]
  
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反

7 表示空白的元字符: 
注: 用来匹配退格字符的[\b]是一个特例;它不再类元字符\s和\S的覆盖范围内
[\b]               回退(并删除)一个字符(Backspace键)
\f                 换页符
\n                 换行符
\r                 回车符
\t                 制表符(Tab键)
\v                 垂直制表符

8 位置匹配(锚定符)
^                  行(需要搜索文本)的起始位置
$                  行的结束位置(整个字符串和换行符之前的位置),或者说一般不能匹配\n
\<                 单词的起始位置(某些版本的egrep或者perl、python不支持;awk和sed支持)
>\                 单词的结束位置(某些版本的egrep或者 perl、python不支持;awk和sed支持 )
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b;字符组中无效
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反; 字符组中无效.

9 捕获组与非捕获组
捕获组 (...)       后引用,匹配成功后,可以使用\1,\2,\3...引用实际匹配的数据;
非捕获组(?:...)    只分组不捕获,不会影响捕获组的计数,当然后面也无法引用;

© 著作权归作者所有

共有 人打赏支持
Travler
粉丝 0
博文 12
码字总数 8055
作品 0
朝阳
程序员
私信 提问
2017-12-9Linux基础知识(16)文本处理工具

我们简述一下上一章的内容,主要讲的是bash编程的基础,介绍了其编程类型,以及介绍了编程语言的类型什么是过程式编程和对象式编程,然后我们编写了第一个脚本程序以及如何运行的方式有那些,...

刘祥宇
2017/12/11
0
0
PHP学习历程之——正则表达式

首先搞清楚3个问题: 为什么要用正则表达式? 什么是正则表达式? 如何使用正则表达式? 正则表达式的适用场合: 正则表达式最初起源数学领域的一些研究,1956年数学家Stephen Kleene在论文《...

CoderAndy
2014/04/08
0
0
grep用法简介之二

上一篇文章总结了一些grep基本用法。在这次的内容里介绍grep和正则表达式结合使用的方法。 首先介绍下正则表达式,正则表达式非基本和扩展两种。 名词释义:正则表达式:正则表达式其实就是描...

bluezombiecn
2014/05/13
0
0
JavaScript 正则表达式上——基本语法

定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%>','g'); 2. 字面量 var reg=/<%[^%>]%>/g; g: global,全文搜......

豆花饭烧土豆
2016/07/21
20
0
pyqt学习基础 -插曲- python 正则表达式学习

python 正则表达式学习 资源来自 学习资源来自ubuntu wiki 正则表达式介绍 正则表达式,各种语言都有相关的库。就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言 简单模...

Cosven
2014/08/24
0
0

没有更多内容

加载失败,请刷新页面

加载更多

BitMap的JAVA实现

相关概念 基础类型 在java中: byte -> 8 bits -->1字节char -> 16 bit -->2字节short -> 16 bits -->2字节int -> 32 bits -->4字节float -> 32 bits -->4字节long ->......

freeli
7分钟前
0
0
如何实现前端微服务化

摘要: fundebug-cli是Fudnebug的命令行工具,可以用于批量上传Source Map文件。 Fundebug支持使用Source Map还原真正的错误位置。这样的话,开发者能够迅速定位出错的源代码。另外,Fundebu...

Fundebug
19分钟前
0
0
spring boot jdbc

TODO

zzx10
21分钟前
1
0
var 是 Java 开发的好朋友啊!

简评:Java var != JavaScript var。 Java 10 中引入了新的语法用于局部变量类型推断,很多开发者有所疑惑,希望这篇文章能帮到你。 什么是类型推断 其实在 Java 中类型推断早就存在了,看下...

极光推送
25分钟前
0
0
进阶的Redis之Sentinel原理及实战

Redis作为一款高效的内存数据库,可作用于方方面面,相信如今项目的开发都离不开它。大家可能都知道Redis是高可用的,但很少知道具体高可用是利用什么去实现的。 抛两个问题: 只部署一个Red...

公众号_Zack说码
30分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部