正则表达式元字符介绍
博客专区 > Travler 的博客 > 博客详情
正则表达式元字符介绍
Travler 发表于1年前
正则表达式元字符介绍
  • 发表于 1年前
  • 阅读 6
  • 收藏 0
  • 点赞 0
  • 评论 0

标题:腾讯云 新注册用户域名抢购1元起>>>   

1 基本元字符
.                  匹配单个任意字符,也可以理解为匹配任意字符的字符组的简写.   
[...]              字符组,匹配其中的任意一个字符,但只能是一个.如果匹配"]"本身则需要放在字符集中的第一位.
[^...]             排除型字符组,匹配未列出的任意字符,但是它必须匹配一个字符.^置于字符组中其他位置则表示其本身.
[.-.]              连字符,表示范围;如[0-9];[a-z]等;但置于字符集中第一位则表示其本身.注意,只有在字符组内部连字符才(可能)属于元字符-----否则它就是一个普通的连字符号.
|                  多选分支,匹配分隔两边的任意一个子表达式.例如'a|b|c'.
(...)              限定一个子表达式或者表达式分组,没有排除的功能(即不支持(^...)的写法),
\                  转义字符,只用来屏蔽一个元字符的特殊含义,\\可以屏蔽其本身.

2.标准量词(特性:匹配优先.也有人称之为贪婪匹配)
?                 匹配零个或一个先前的字符或者字符集或者子表达式.
+                  匹配一个或多个先前的字符或者字符集或者子表达式.
*                  匹配零个或多个先前的字符或者字符集或者子表达式.

3 表示重复次数量词(也属于匹配优先量词):区间
pattern{n}         只用来匹配前面pattern出现次数.n为次数
pattern{n,}        含义同上,但次数最少为n
pattern{n,m}       含义同上,但pattern出现次数在n与m之间

4 忽略优先量词(作用与标准量词相同,只不过是忽略优先的,或者说是非贪婪匹配)
*?
+?
??
{num,num}?

5 占有优先量词(作用与标准量词相同,不过一旦匹配,则不会回溯.暂时不做过多讨论)
*+
++
?+
{num,num}+

6 字符类
一些常用的字符合集可以用一些特殊的元字符代替,这些元字符用来匹配某一类别的字符,术语称之为字符类;
\d                 匹配数字,等价于[0-9]
\D                 匹配非数字,等价于[^0-9]或者[^\d]

\w                 匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[a-zA-Z0-9_]
\W                 \w取反,不匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[^a-zA-Z0-9_]或者[^\w]

\s                 匹配任意一个空白字符,等价于[\f\n\r\t\v]
\S                 \s取反,匹配任意一个非空白字符,等价于[^\f\n\r\t\v]或者[^\s]
  
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反

7 表示空白的元字符: 
注: 用来匹配退格字符的[\b]是一个特例;它不再类元字符\s和\S的覆盖范围内
[\b]               回退(并删除)一个字符(Backspace键)
\f                 换页符
\n                 换行符
\r                 回车符
\t                 制表符(Tab键)
\v                 垂直制表符

8 位置匹配(锚定符)
^                  行(需要搜索文本)的起始位置
$                  行的结束位置(整个字符串和换行符之前的位置),或者说一般不能匹配\n
\<                 单词的起始位置(某些版本的egrep或者perl、python不支持;awk和sed支持)
>\                 单词的结束位置(某些版本的egrep或者 perl、python不支持;awk和sed支持 )
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b;字符组中无效
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反; 字符组中无效.

9 捕获组与非捕获组
捕获组 (...)       后引用,匹配成功后,可以使用\1,\2,\3...引用实际匹配的数据;
非捕获组(?:...)    只分组不捕获,不会影响捕获组的计数,当然后面也无法引用;
标签: RegExr
共有 人打赏支持
粉丝 0
博文 12
码字总数 8055
×
Travler
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: