文档章节

正则表达式元字符介绍

Travler
 Travler
发布于 2016/08/09 11:40
字数 1066
阅读 6
收藏 0
点赞 0
评论 0
1 基本元字符
.                  匹配单个任意字符,也可以理解为匹配任意字符的字符组的简写.   
[...]              字符组,匹配其中的任意一个字符,但只能是一个.如果匹配"]"本身则需要放在字符集中的第一位.
[^...]             排除型字符组,匹配未列出的任意字符,但是它必须匹配一个字符.^置于字符组中其他位置则表示其本身.
[.-.]              连字符,表示范围;如[0-9];[a-z]等;但置于字符集中第一位则表示其本身.注意,只有在字符组内部连字符才(可能)属于元字符-----否则它就是一个普通的连字符号.
|                  多选分支,匹配分隔两边的任意一个子表达式.例如'a|b|c'.
(...)              限定一个子表达式或者表达式分组,没有排除的功能(即不支持(^...)的写法),
\                  转义字符,只用来屏蔽一个元字符的特殊含义,\\可以屏蔽其本身.

2.标准量词(特性:匹配优先.也有人称之为贪婪匹配)
?                 匹配零个或一个先前的字符或者字符集或者子表达式.
+                  匹配一个或多个先前的字符或者字符集或者子表达式.
*                  匹配零个或多个先前的字符或者字符集或者子表达式.

3 表示重复次数量词(也属于匹配优先量词):区间
pattern{n}         只用来匹配前面pattern出现次数.n为次数
pattern{n,}        含义同上,但次数最少为n
pattern{n,m}       含义同上,但pattern出现次数在n与m之间

4 忽略优先量词(作用与标准量词相同,只不过是忽略优先的,或者说是非贪婪匹配)
*?
+?
??
{num,num}?

5 占有优先量词(作用与标准量词相同,不过一旦匹配,则不会回溯.暂时不做过多讨论)
*+
++
?+
{num,num}+

6 字符类
一些常用的字符合集可以用一些特殊的元字符代替,这些元字符用来匹配某一类别的字符,术语称之为字符类;
\d                 匹配数字,等价于[0-9]
\D                 匹配非数字,等价于[^0-9]或者[^\d]

\w                 匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[a-zA-Z0-9_]
\W                 \w取反,不匹配任意一个字母(不区分大小写)和数字以及下划线“_”,等价于[^a-zA-Z0-9_]或者[^\w]

\s                 匹配任意一个空白字符,等价于[\f\n\r\t\v]
\S                 \s取反,匹配任意一个非空白字符,等价于[^\f\n\r\t\v]或者[^\s]
  
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反

7 表示空白的元字符: 
注: 用来匹配退格字符的[\b]是一个特例;它不再类元字符\s和\S的覆盖范围内
[\b]               回退(并删除)一个字符(Backspace键)
\f                 换页符
\n                 换行符
\r                 回车符
\t                 制表符(Tab键)
\v                 垂直制表符

8 位置匹配(锚定符)
^                  行(需要搜索文本)的起始位置
$                  行的结束位置(整个字符串和换行符之前的位置),或者说一般不能匹配\n
\<                 单词的起始位置(某些版本的egrep或者perl、python不支持;awk和sed支持)
>\                 单词的结束位置(某些版本的egrep或者 perl、python不支持;awk和sed支持 )
\b                 匹配一个单词(数字或者字母或者_组成,也就是\w匹配的字符)的边界,开始或者结束,如匹配单词cat需要\bcat\b;字符组中无效
\B                 匹配一个非单词的边界,如\B?\Bb;与\b正好相反; 字符组中无效.

9 捕获组与非捕获组
捕获组 (...)       后引用,匹配成功后,可以使用\1,\2,\3...引用实际匹配的数据;
非捕获组(?:...)    只分组不捕获,不会影响捕获组的计数,当然后面也无法引用;

© 著作权归作者所有

共有 人打赏支持
Travler
粉丝 0
博文 12
码字总数 8055
作品 0
朝阳
程序员
2017-12-9Linux基础知识(16)文本处理工具

我们简述一下上一章的内容,主要讲的是bash编程的基础,介绍了其编程类型,以及介绍了编程语言的类型什么是过程式编程和对象式编程,然后我们编写了第一个脚本程序以及如何运行的方式有那些,...

刘祥宇 ⋅ 2017/12/11 ⋅ 0

grep用法简介之二

上一篇文章总结了一些grep基本用法。在这次的内容里介绍grep和正则表达式结合使用的方法。 首先介绍下正则表达式,正则表达式非基本和扩展两种。 名词释义:正则表达式:正则表达式其实就是描...

bluezombiecn ⋅ 2014/05/13 ⋅ 0

PHP学习历程之——正则表达式

首先搞清楚3个问题: 为什么要用正则表达式? 什么是正则表达式? 如何使用正则表达式? 正则表达式的适用场合: 正则表达式最初起源数学领域的一些研究,1956年数学家Stephen Kleene在论文《...

CoderAndy ⋅ 2014/04/08 ⋅ 0

javaScript的正则表达式 (一)

本篇文章我们就来介绍javaScript的正则表达式 RegExp对象也称正则表达式 一.什么是正则表达式? 正则表达式是一个描述字符模式的对象。可以处理复杂的字符串,正则表达式用于对字符串模式匹配...

博为峰教研组 ⋅ 2016/11/08 ⋅ 0

JavaScript 正则表达式上——基本语法

定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%>','g'); 2. 字面量 var reg=/<%[^%>]%>/g; g: global,全文搜......

豆花饭烧土豆 ⋅ 2016/06/07 ⋅ 0

JavaScript 正则表达式上——基本语法

定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%>','g'); 2. 字面量 var reg=/<%[^%>]%>/g; g: global,全文搜......

豆花饭烧土豆 ⋅ 2016/07/21 ⋅ 0

文本搜索之grep、fgrep、egrep以及正则表达式

一、grep、egrep、fgrep命令 说明:本文在CentOS 6.6 X86_64系统下grep、egrep、fgrep命令和正则表达式的基本参数和使用格式、方法。 1.1、基本定义: grep(Global search Regular Express...

mastters ⋅ 2014/11/16 ⋅ 0

grep系的介绍及正则表达式详解

文本处理工具: 全屏编辑器:vim,nano 行编辑器: 文本处理三剑客:grep系列,sed,awk grep系列:grep,egrep,fgrep;统称为文件搜索工具;基于PATTERN(模式)对于给定的文本文件进行模糊搜...

花花很漂漂 ⋅ 2017/11/16 ⋅ 0

浅谈我对grep跟egrep的简单认识

㈠首先我们要明白grep和egrep的干什么用的 grep:global search regular RE ) and print out the line,全面搜索正则表达式并把行打印出来,是一种强大的文本搜索工具,它只能用基本的正则表达...

chinahaike ⋅ 2014/02/24 ⋅ 0

Linux/Unix工具与正则表达式的POSIX规范

对正则表达式有基本了解的读者,一定不会陌生『d』、『[a-z]+』之类的表达式,前者匹配一个数字字符,后者匹配一个以上的小写英文字母。但是如果你用过vi、grep、awk、sed之类Linux/Unix下的...

skypeGNU1 ⋅ 2016/03/12 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

容器之重命名镜像

使用docker tag命令来重命名镜像名称,先执行help,查看如何使用如下 mjduan@mjduandeMacBook-Pro:~/Docker % docker tag --helpUsage:docker tag SOURCE_IMAGE[:TAG] TARGET_IMAGE[:TA...

汉斯-冯-拉特 ⋅ 15分钟前 ⋅ 0

with 的高级用法

那么 上下文管理器 又是什么呢? 上下文管理器协议包含 __enter__ 和 __exit__ 两个方法。with 语句开始运行时,会在上下文管理器对象上调用 __enter__ 方法。with 语句运行结束后,会在上下...

阿豪boy ⋅ 34分钟前 ⋅ 0

使用 jsoup 模拟登录 urp 教务系统

需要的 jsoup 相关 jar包:https://www.lanzous.com/i1abckj 1、首先打开教务系统的登录页面,F12 开启浏览器调试,注意一下 Request Headers 一栏的 Cookie 选项,我们一会需要拿这个 Cook...

大灰狼时间 ⋅ 34分钟前 ⋅ 0

关于线程的创建

转自自己的笔记: http://note.youdao.com/noteshare?id=87584d4874acdeaf4aa027bdc9cb7324&sub=B49E8956E145476191C3FD1E4AB40DFA 1.创建线程的方法 Java使用Thread类代表线程,所有的线程对......

MarinJ_Shao ⋅ 46分钟前 ⋅ 0

工厂模式学习

1. 参考资料 工厂模式-伯乐在线 三种工厂-思否 深入理解工厂模式 2. 知识点理解 2.1 java三种工厂 简单工厂 工厂模式 抽象工厂 2.2 异同点 逐级复杂 简单工厂通过构造时传入的标识来生产产品...

liuyan_lc ⋅ 58分钟前 ⋅ 0

Java NIO

1.目录 Java IO的历史 Java NIO之Channel Java NIO之Buffer Java NIO之Selector Java NIO之文件处理 Java NIO之Charset Java 可扩展IO 2.简介 “IO的历史”讲述了Java IO API从开始到现在的发...

士别三日 ⋅ 今天 ⋅ 0

[Err] ORA-24344: success with compilation error

从txt文本复制出创建function的脚本,直接执行,然后报错:[Err] ORA-24344: success with compilation error。 突然发现脚本的关键字,居然不是高亮显示。 然后我把脚本前面的空格去掉,执行...

wenzhizhon ⋅ 今天 ⋅ 0

Spring Security授权过程

前言 本文是接上一章Spring Security认证过程进一步分析Spring Security用户名密码登录授权是如何实现得; 类图 调试过程 使用debug方式启动https://github.com/longfeizheng/logback该项目,...

hutaishi ⋅ 今天 ⋅ 0

HAProxy基于KeepAlived实现Web高可用及动静分离

前言 软件负载均衡一般通过两种方式来实现: 基于操作系统的软负载实现 基于第三方应用的软负载实现 LVS是基于Linux操作系统实现的一种软负载,而HAProxy则是基于第三方应用实现的软负载。 ...

寰宇01 ⋅ 今天 ⋅ 0

微软自研处理器的小动作:已经开始移植其他平台的工具链

微软将 Windows 10 、Linux 以及工具链如 C/C++ 和 .NET Core 运行时库、Visual C++ 2017 命令行工具、RyuJIT 编辑器等移植到其自主研发的处理器架构 E2。微软还移植了广泛使用的 LLVM C/C++...

linux-tao ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部