文档章节

JAVA正则&正则

wrean2013
 wrean2013
发布于 2013/07/30 18:19
字数 1630
阅读 85
收藏 1
点赞 0
评论 0

\b 开始和结尾
.任意字符
*循环多次,任意数量
.*那就表示很多个任意字符
\d一个数字,同[0-9]意思一样
{i}表示循环i次 \d{5}表示5个连在一起的数字\d{2,6}大于2个小于6个的几个数字,\d{2,}表示大于2个的那些数字
|或者,匹配电话号码 (\d{3}|\d{4})-\d{8}
\w在\d上的扩展,包括数字和字母,找以a开头的单词 \ba\w*\b,找6个字母的单词\b\w{6}\b
\s空白符号 空格 制表符 回车等
+作用和*基本相同,+必须匹配>0 *>=0
^字符串的开始
$字符串的结尾 同\b不同,\b只是个分隔符,^$是精确匹配,检查QQ是否为5-12位的数字 ^/d{5,12}$
字符转义同JAVA的相同,都是用\,表示纯粹意义上的特殊字符,表示*,\.表示.
\w*宇\w+区别?不同?
表示重复的除了*,+,{}还有?,表示重复0次或1次
[]表示[]中的值中的任意一个,\d同[0-9],\w同[a-zA-Z0-9],
匹配029-1111111或0491111111或(051)11111111或023 22222222的电话号码\(?0\d{2}[)- ]?\d{8}
(也表示特殊的东西
|两边的一个满足就可以,但这里有次序问题,匹配09876或09876-9876写成\d{5}|\d{5}-\d{4}就可以,写成\d{5}|(\d{5}-\d{4})就不行,当然这个情况比较特殊,匹配是从左到右,如果左边满足右边就不去管了,匹配09876或0987-9876写成\d{5}|(\d{4}-\d{4})或写成(\d{5}-\d{4})|\d{5}都可以.

如果想对多个在一起循环,就要加(),比如简单IP地址匹配,(\d{1,3}\.){3}\{1,3},写法:([0-255]\.){3}\[0-255]也不对,0-255按分段来,([0-1]?\d\d?|2[0-2]\d|25[0-5]\.){3}([0-1]?\d\d?|2[0-2]\d|25[0-5]),0-255可由0-199,200-249\250-255组成.
\W,\S,\D,\B都是反义字符,匹配非数字或字母的字符,匹配非空白符的字符,匹配非数字,匹配不是单词开头或结尾的位置...
[^x]匹配除了x外的任意字符,[^aoeio]匹配除了aoeiu外的任意字符,如要匹配不含空白符的字符串,\S+,匹配用尖括号括起来的以a开头的字符串,<a[^>]+>
后向引用,用小括号括起来的可以取个别名,或系统默认给了名字,以后使用可以直接使用,如匹配重复的单词,\b(\w+)\b\s+\1\b

java在jdk1.4引入正则,Pattern,Matcher:
p表达式,m匹配,

String str = "href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮";
Pattern pattern = Pattern.compile("\\?(id=)(\\d+)&page=(\\d{0,4})",Pattern.CASE_INSENSITIVE);
Matcher matcher = pattern.matcher(str);

m匹配之后主要操作有查找,替换
1.查找

while(m.find()){
	System.out.println(m.group());
	System.out.println(m.start(0));//返回匹配的开始位置
	System.out.println(m.end(0));//返回匹配的结束位置
}
找到之后的操作,m的find之后紧接着的group,start,end都是一体的,java的正则都是基于正则里有组的,group就是组,默认是group(0),group1是(id=),group2是(\\d),group3是(\\d{0,4})匹配上就是group(0),可对匹配上的组里的元素进行操作。start(group),end(group)表示匹配上的元素的定位开始结束位置,
看p里组的个数,正则表达式,感觉很少用:
System.out.println(m.groupCount());
System.out.println(m.pattern());
还有两个方法m.matches() ,m.lookingAt(),matches()是p编译的正则与字符串str完全匹配返回true,lookingAt()是字符串str的开始部分与p编译的正则匹配就返回true:

System.out.println(m.matches());//false
System.out.println(m.lookingAt());//false
m.reset("?id=27239&page=1");
System.out.println(m.matches());//true
System.out.println(m.lookingAt());//true
m.reset("?id=27239&page=1d");
System.out.println(m.matches());//false
System.out.println(m.lookingAt());//true


m.reset(str)重置要匹配的字符序列,reset的是要匹配的字符序列。
2.替换
替换有替换全部但替换部分replacement不可变的replaceAll(replacement),和替换第一个但替换部分replacement不可变的replaceFirst(replacement),都返回一个替换后的字符串。另外有替换内容是动态可变的替换m.appendReplacement(StringBuffer sb, String replacement)和m.appendTail(StringBuffer sb),appendReplacement当find()为ture的时候,它把上一次替换到本次匹配字符串被替换之间的字符赋给sb并返回。appendTail是当appendReplacement替换后把剩余的部分存放在sb并返回,所以动态替换这部分由appendReplacement和appendTail构成。

m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮");
System.out.println(m.replaceAll("hello"));//href="hello"李三href="hello"李广亮
System.out.println(m.replaceFirst("hello"));//href="hello"李三href="?id=27531&page=2"李广亮
m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮");
StringBuffer appendSb = new StringBuffer();
StringBuffer appendSb2 = new StringBuffer();
int i=1;
while(m.find()){
	m.appendReplacement(appendSb, "变"+i);//href="变0"李三href="变1
	m.appendTail(appendSb2);
	System.out.println("第"+i+"次"+appendSb);
	System.out.println("第"+i+"次"+appendSb2);
	i++;
}
System.out.println(appendSb.toString()); 
System.out.println(appendSb2.toString());
//输出:
//第1次href="变1
//第1次"李三href="?id=27531&page=2"李广亮
//第2次href="变1"李三href="变2
//第2次"李三href="?id=27531&page=2"李广亮"李广亮
//href="变1"李三href="变2"李广亮
//"李三href="?id=27531&page=2"李广亮"李广亮
如果输出动态替换后完整的:
m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮");
StringBuffer appendSb = new StringBuffer();
int i=1;
while(m.find()){
	m.appendReplacement(appendSb, "变"+i);
	i++;
}
m.appendTail(appendSb);
System.out.println(appendSb.toString()); //href="变1"李三href="变2"李广亮
再说说p,p的split(CharSequence input)方法也常用,分离字符串数组。


---------------------------------------------------------------------------------------------------------------------------------------
package kpw;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class AA {
	/**
	 * @param args
	 */
	public static void main(String[] args) {
		String str = "href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮";
		Pattern p = Pattern.compile("\\?(id=)(\\d+)&page=(\\d{0,4})",Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher(str);
		while(m.find()){
			System.out.println(m.group());
			System.out.println(m.start(0));//返回匹配的开始位置
			System.out.println(m.end(0));//返回匹配的结束位置
		}
		System.out.println(m.groupCount());
		System.out.println(m.pattern());
		
		System.out.println(m.matches());//false
		System.out.println(m.lookingAt());//false
		m.reset("?id=27239&page=1");
		System.out.println(m.matches());//true
		System.out.println(m.lookingAt());//true
		m.reset("?id=27239&page=1d");
		System.out.println(m.matches());//false
		System.out.println(m.lookingAt());//true		
		
		m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮");
		System.out.println(m.replaceAll("hello"));//href="hello"李三href="hello"李广亮
		System.out.println(m.replaceFirst("hello"));//href="hello"李三href="?id=27531&page=2"李广亮
		
		m.reset("href=\"?id=27239&page=1\"李三href=\"?id=27531&page=2\"李广亮");
		StringBuffer appendSb = new StringBuffer();
		int i=1;
		while(m.find()){
			m.appendReplacement(appendSb, "变"+i);
			i++;
		}
		m.appendTail(appendSb);
		System.out.println(appendSb.toString()); 
		//第1次href="变1
		//第1次"李三href="?id=27531&page=2"李广亮
		//第2次href="变1"李三href="变2
		//第2次"李三href="?id=27531&page=2"李广亮"李广亮
		//href="变1"李三href="变2"李广亮
		//"李三href="?id=27531&page=2"李广亮"李广亮
		p.split("");
		
		String strhhh="fdsjdlfksaj<!--dfsjkjlfds-->jldjfljkdflsadf";
		System.out.println(strhhh.indexOf("<!--")); 
		System.out.println(strhhh.indexOf("-->")); 

	}
}

© 著作权归作者所有

共有 人打赏支持
wrean2013
粉丝 34
博文 180
码字总数 105556
作品 0
深圳
架构师
java正则表达式对字符串的操作

学习java正则表达式的都知道,它的重要性;但同时也了解它的难度和复杂性。所以为了加深我们对它的了解。我举了几个例子: 例子1、 查找以Java开头,任意结尾的字符串 Pattern pattern = Patt...

goqin
2012/06/29
0
0
js和java中正则表达式的易混淆点

js中正则表达式的使用 对表单中的值进行正则表达式匹配一般有两种方法: var reg = new RegExp(regStr); reg.test(value); 如下: var reg = new RegExp(“\d{3}”); reg.test(“abc123def”...

绝影jy
2014/07/30
0
0
Java 正则表达式功能及应用

正则表达式,就是用某种模式去匹配一类字符串的一个公式,正则表达式由一些普通字符和一些元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义,不管是...

浮躁的码农
2015/07/29
0
0
java.util.regex Pattern 正则

/**String 中 replaceAll(),matches(),split() 等方法,都是调用Pattern中的方法。学习了,瞬间觉得Pattern强大了 public String replaceAll(String regex, String replacement) {return Pat......

happycode
2014/04/02
0
1
Flume 1.3.1 启动时出错解决方案

版本:Flume 1.3.1 启动时出错信息: ./bin/flume-ng: line 81: syntax error in conditional expression: unexpected token ^java.library.path=(.' ./bin/flume-ng: line 81: `if [[ $line......

Hello陈翔
2013/01/09
0
0
Java 正则表达式 StackOverflowError 问题及其优化

正则可以看做一门 DSL,但它却应用极其广泛,可以轻松解决很多场景下的字符串匹配、筛选问题。同时呢有句老话: “ 如果你有一个问题,用正则表达式解决,那么你现在就有两个问题了。” Some...

大数据之路
2015/08/02
0
0
关于java中split的使用

之前在http://shukuiyan.iteye.com/blog/507915文中已经叙述过这个问题,但是最近一次笔试中居然有碰到了这个知识点,而且还做错了,囧!学艺不精啊。题目大概是这样的: Java代码 String s...

墨梅
2014/04/28
0
0
Java中应该注意的一些特殊字符

replace ,replaceAll 两者都是由正则表达式类库实现的,但是 replace 采用的是字符串原有的意思来替换,而replaceAll 则是按照正则表达式的字符串来替换,正则表达式中有 15 个元字符,是有特...

天天顺利
2015/05/05
0
0
Hutool之正则表达式工具类——ReUtil

前言 在文本处理中,正则表达式几乎是全能的,但是Java的正则表达式有时候处理一些事情还是有些繁琐,所以我封装了部分常用功能。就比如说我要匹配一段文本中的某些部分,我们需要这样做: ...

路小磊
2014/09/10
0
1
JavaScript正则表达式(JavaScript:The Definitive Guide笔记)

//1.0 字符类 [...] 方括号内的任意字符 [^...] 不再方括号里面的任意字符 . 除换行符和其他Unicode行终止符之外的任意字符 w 任何ASCII字符组成的单词,等价于[a-zA-Z0-9_] W 任何不适ASCII...

chungwoo.J
2012/09/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

arts-week1

Algorithm 594. Longest Harmonious Subsequence - LeetCode 274. H-Index - LeetCode 219. Contains Duplicate II - LeetCode 217. Contains Duplicate - LeetCode 438. Find All Anagrams ......

yysue
29分钟前
0
0
NNS拍卖合约

前言 关于NNS的介绍,这里就不多做描述,相关的信息可以查看NNS的白皮书http://doc.neons.name/zh_CN/latest/nns_background.html。 首先nns中使用的竞价货币是sgas,关于sgas介绍可以戳htt...

红烧飞鱼
今天
0
0
Java IO类库之管道流PipeInputStream与PipeOutputStream

一、java管道流介绍 在java多线程通信中管道通信是一种重要的通信方式,在java中我们通过配套使用管道输出流PipedOutputStream和管道输入流PipedInputStream完成线程间通信。多线程管道通信的...

老韭菜
今天
0
0
用Python绘制红楼梦词云图,竟然发现了这个!

Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦,绘制小...

猫咪编程
今天
1
0
Java中 发出请求获取别人的数据(阿里云 查询IP归属地)

1.效果 调用阿里云的接口 去定位IP地址 2. 代码 /** * 1. Java中远程调用方法 * http://localhost:8080/mavenssm20180519/invokingUrl.action * @Title: invokingUrl * @Description: * @ret......

Lucky_Me
今天
1
0
protobuf学习笔记

相关文档 Protocol buffers(protobuf)入门简介及性能分析 Protobuf学习 - 入门

OSC_fly
昨天
0
0
Mybaties入门介绍

Mybaties和Hibernate是我们在Java开发中应用的比较多的两个ORM框架。当然,目前Mybaties正在慢慢取代Hibernate,这是因为相比较Hibernate而言Mybaties性能更好,响应更快,更加灵活。我们在开...

王子城
昨天
2
0
编程学习笔记之python深入之装饰器案例及说明文档[图]

编程学习笔记之python深入之装饰器案例及说明文档[图] 装饰器即在不对一个函数体进行任何修改,以及不改变整体的原本意思的情况下,增加函数功能的新函数,因为这个新函数对旧函数进行了装饰...

原创小博客
昨天
1
0
流利阅读笔记33-20180722待学习

黑暗中的生物:利用奇技淫巧快活生存 Daniel 2018-07-22 1.今日导读 如果让你在伸手不见五指的黑暗当中生存,你能熬过几天呢?而大千世界,无奇不有。在很多你不知道的角落,有些生物在完全黑...

aibinxiao
昨天
6
0
Hystrix降级逻辑中如何获取触发的异常

通过之前Spring Cloud系列教程中的《Spring Cloud构建微服务架构:服务容错保护(Hystrix服务降级)》一文,我们已经知道如何通过Hystrix来保护自己的服务不被外部依赖方拖垮的情况。但是实际...

程序猿DD
昨天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部