文档章节

正则表达式元字符介绍

Travler
 Travler
发布于 2016/08/09 11:40
字数 1066
阅读 6
收藏 0
1 基本元字符
.                  匹配单个任意字符,也可以理解为匹配任意字符的字符组的简写.   
[...]              字符组,匹配其中的任意一个字符,但只能是一个.如果匹配"]"本身则需要放在字符集中的第一位.
[^...]             排除型字符组,匹配未列出的任意字符,但是它必须匹配一个字符.^置于字符组中其他位置则表示其本身.
[.-.]              连字符,表示范围;如[0-9];[a-z]等;但置于字符集中第一位则表示其本身.注意,只有在字符组内部连字符才(可能)属于元字符-----否则它就是一个普通的连字符号.
|                  多选分支,匹配分隔两边的任意一个子表达式.例如'a|b|c'.
(...)              限定一个子表达式或者表达式分组,没有排除的功能(即不支持(^...)的写法),
\                  转义字符,只用来屏蔽一个元字符的特殊含义,\\可以屏蔽其本身.

2.标准量词(特性:匹配优先.也有人称之为贪婪匹配)
?                 匹配零个或一个先前的字符或者字符集或者子表达式.
+                  匹配一个或多个先前的字符或者字符集或者子表达式.
*                  匹配零个或多个先前的字符或者字符集或者子表达式.

3 表示重复次数量词(也属于匹配优先量词):区间
pattern{n}         只用来匹配前面pattern出现次数.n为次数
pattern{n,}        含义同上,但次数最少为n
pattern{n,m}       含义同上,但pattern出现次数在n与m之间

4 忽略优先量词(作用与标准量词相同,只不过是忽略优先的,或者说是非贪婪匹配)
*?
+?
??
{num,num}?

5 占有优先量词(作用与标准量词相同,不过一旦匹配,则不会回溯.暂时不做过多讨论)
*+
++
?+
{num,num}+

6 字符类
一些常用的字符合集可以用一些特殊的元字符代替,这些元字符用来匹配某一类别的字符,术语称之为字符类;
\d                 匹配数字,等价于[0-9]
\D                 匹配非数字,等价于[^0-9]或者[^\d]

\w                 匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[a-zA-Z0-9_]
\W                 \w取反,不匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[^a-zA-Z0-9_]或者[^\w]

\s                 匹配任意一个空白字符,等价于[\f\n\r\t\v]
\S                 \s取反,匹配任意一个非空白字符,等价于[^\f\n\r\t\v]或者[^\s]
  
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反

7 表示空白的元字符: 
注: 用来匹配退格字符的[\b]是一个特例;它不再类元字符\s和\S的覆盖范围内
[\b]               回退(并删除)一个字符(Backspace键)
\f                 换页符
\n                 换行符
\r                 回车符
\t                 制表符(Tab键)
\v                 垂直制表符

8 位置匹配(锚定符)
^                  行(需要搜索文本)的起始位置
$                  行的结束位置(整个字符串和换行符之前的位置),或者说一般不能匹配\n
\<                 单词的起始位置(某些版本的egrep或者perl、python不支持;awk和sed支持)
>\                 单词的结束位置(某些版本的egrep或者 perl、python不支持;awk和sed支持 )
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b;字符组中无效
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反; 字符组中无效.

9 捕获组与非捕获组
捕获组 (...)       后引用,匹配成功后,可以使用\1,\2,\3...引用实际匹配的数据;
非捕获组(?:...)    只分组不捕获,不会影响捕获组的计数,当然后面也无法引用;

© 著作权归作者所有

共有 人打赏支持
Travler
粉丝 0
博文 12
码字总数 8055
作品 0
朝阳
程序员
2017-12-9Linux基础知识(16)文本处理工具

我们简述一下上一章的内容,主要讲的是bash编程的基础,介绍了其编程类型,以及介绍了编程语言的类型什么是过程式编程和对象式编程,然后我们编写了第一个脚本程序以及如何运行的方式有那些,...

刘祥宇
2017/12/11
0
0
grep用法简介之二

上一篇文章总结了一些grep基本用法。在这次的内容里介绍grep和正则表达式结合使用的方法。 首先介绍下正则表达式,正则表达式非基本和扩展两种。 名词释义:正则表达式:正则表达式其实就是描...

bluezombiecn
2014/05/13
0
0
PHP学习历程之——正则表达式

首先搞清楚3个问题: 为什么要用正则表达式? 什么是正则表达式? 如何使用正则表达式? 正则表达式的适用场合: 正则表达式最初起源数学领域的一些研究,1956年数学家Stephen Kleene在论文《...

CoderAndy
2014/04/08
0
0
javaScript的正则表达式 (一)

本篇文章我们就来介绍javaScript的正则表达式 RegExp对象也称正则表达式 一.什么是正则表达式? 正则表达式是一个描述字符模式的对象。可以处理复杂的字符串,正则表达式用于对字符串模式匹配...

博为峰教研组
2016/11/08
18
0
JavaScript 正则表达式上——基本语法

定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%>','g'); 2. 字面量 var reg=/<%[^%>]%>/g; g: global,全文搜......

豆花饭烧土豆
2016/06/07
5
0

没有更多内容

加载失败,请刷新页面

加载更多

聊聊redisson的DelayedQueue

序 本文主要研究一下redisson的DelayedQueue maven <dependency><groupId>org.redisson</groupId><artifactId>redisson</artifactId><version>3.8.1</version></dependenc......

go4it
15分钟前
1
0
一张图看懂JVM

JVM结构示意图 JVM总体概述 JVM总体上是由类装载子系统(ClassLoader)、运行时数据区、执行引擎、内存回收这四个部分组成。其中我们最为关注的运行时数据区,也就是JVM的内存部分则是由方法...

小致dad
16分钟前
0
0
安全管理标准

安全生产严重等级分类: 故障频次: 风险等级矩阵:

乔老哥
47分钟前
2
0
数据结构“树”的相关微视频

今天在腾讯视频上闲逛,然後发现一个叫“岚人”的用户上传了几段小视频,基本上都在5分钟以内,讲解了关于树的一些结构和算法。零代码,非常适合初学者入门。不过,对于老鸟来说,这也是非常...

Iridium
59分钟前
1
0
10-利用思维导图梳理JavaSE-Java 集合

10-利用思维导图梳理JavaSE-Java 集合 主要内容 1.Collection接口 2.Set接口 2.1.Set接口概述 2.2.HashSet类 2.3.TreeSet类 2.4.SortedSet接口 3.List接口 3.1.List接口概述 3.2.ArrayList类...

飞鱼说编程
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部