JS中正则表达式
JS中正则表达式
王潭不是王雨潭 发表于3个月前
JS中正则表达式
  • 发表于 3个月前
  • 阅读 0
  • 收藏 0
  • 点赞 0
  • 评论 0

腾讯云 技术升级10大核心产品年终让利>>>   

摘要: 前端开发过程中经常遇到写正则表达式的问题,今天系统性讲一讲正则表达式。

正则表达式的定义

js中的正则表达式使用RegExp对象表示,两种创建正则表达式对象的方法

直接量定义

将表达式包含在斜杠之间

var pattern = /js/;

构造函数定义:

使用RegExp()构造函数定义

var pattern = new RegExp('js');

正则表达式中的字符

特殊字符需要转译:使用反斜杠\进行转移

字符类

下为几种常见的字符类

  • [...]在方括号的任意字符
  • [^...]不在方括号内的任意字符
  • . 换行符及其他行终止符之外的任意字符

重复

  • {n,m} 匹配前一项至少n次,最多m次
  • {n,} 匹配前一项n次或者多次
  • {n} 匹配前一项n次
  • ? 匹配前一项0或1次,既前一项可选,既{0,1}
  • + 匹配前一次一次或多次
  • * 匹配前一次0或多次 eg:/[^(]*/匹配非左括号0或多个

非贪婪匹配

尽可能少的匹配,在待匹配的字符后面加?

var p1 = /[a]+/;
var p2 = /[a]+?/;
var str = 'aaaaaaasss';
str.match(p1);  /*["aaaaaaa", index: 0, input: "aaaaaaasss"]*/
str.match(p2); /*["a", index: 0, input: "aaaaaaasss"] 尽可能少的匹配*/

分组和引用

圆括号的作用

  • 把单独的组合合成子表达式
var p = /java(script)?/ 
//表示可以有script也可以没有,script为一个子表达式
  • 在完整的模式中定义子模式
var p1 = /[a-z]+\d+/;
var p2 = /[a-z]+(\d+)/;
var str = 'abc123456aaa';
str.match(p1); 
//["abc123456", index: 0, input: "abc123456aaa"] 可以匹配出字符串abc123456
str.match(p2);
/* ["abc123456", "123456", index: 0, input: "abc123456aaa"] 可以把子模式(\d+)单独匹配出来*/
  • 允许在同一正则表达式后面引用前面的子表达式
var p1 = /['"][^'"]*['"]/; //匹配引号之中的文本,不能保证左右匹配
var p2 = /(['"])[^'"]*\1/; //用\n表示第n个圆括号中的子表达式,计数以右边括号的位置为准,\1表示模式匹配的文本的引用,而不是对子表达式的引用,可以保证引号匹配。
var a = '\'aaaa\'123';
var b = '\'aaaa\"123';
a.match(p1); ["'aaaa'", index: 0, input: "'aaaa'123"]//正常匹配
a.match(p2); ["'aaaa'", "\'", index: 0, input: "'aaaa'123"] //可以匹配出子表达式['"]中对应的字符 '  (\为自己加的转译符)
b.match(p1); ["'aaaa"", index: 0, input: "'aaaa"123"]//["'aaaa"", index: 0, input: "'aaaa"123"] 正常匹配
b.match(p2);//null ,因为\1表示第一个组匹配到的文本的引用,既 ' 而不是 "

***不能在字符类中使用这种引用,例如

/['"][^\1]*\1/

这种写法是非法的 ***如果只想分组,但不想分组被编号,可以使用(?: )来进行分组,例如:

var p = /([Jj]ava(?:script)?)\sis\s(fun\w*)/ 
//(?: )中的字符可以被作为分组匹配,但不会进行编号,则\2表示与(fun\w*)匹配的文本

指定位置匹配

  • \b表示单词的边界;\B表示非单词的边界
  • ^表示字符串的开始;$表示字符串的结尾
  • 先行断言,定义在(?= )之间
var p = /[Jj]ava(script)?(?=\:)/;
var str1 = 'Javascript:aaa';
var str2 = 'Javascript aaa';
str1.match(p); //["Javascript", "script", index: 0, input: "Javascript:aaa"],匹配成功,但是匹配结果中不包含:
str2.match(p); //null,不能匹配,因为先行断言不满足
  • 负向先行断言,定义在(?! )之间,表示字符不匹配XXX
var p = /[Jj]ava(?!script)[A-Z]\w*/; 
//表示java后面可以跟大写字母和任意多的ASCII单词,但是不能包含script
var str1 = 'javaBean';
var str2 = 'javascript';
var str3 = 'javascripter';
str1.match(p);/*["javaBean", index: 0, input: "javaBean"] 匹配成功*/
str2.match(p); //null
str3.match(p); //null

修饰符

  • i 不区分大小写
  • g 全局匹配
  • m 多行数据中执行匹配

字符串中的正则方法

  • search() 返回第一个与之匹配的字串的位置,如果找不到匹配的字串则返回-1,不支持全局检索,会忽略修饰符g
  • replace() 用于检索与替换,第一个参数为正则表达式,第二个参数为要替换的字符串。 replace() 可用$n表示第n个子表达式,进行匹配替换。
var p = /"([^"]*)"/g;
text = '1,"2,3","5",4';
text.replace(p, 'A$1A');//1,A2,3A,A5A,4,匹配出所有p相匹配的部分,$1代表([^"]*)中匹配的结果,并将所有"替换为A
标签: 正则表达式
共有 人打赏支持
粉丝 3
博文 13
码字总数 11679
×
王潭不是王雨潭
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: