文档章节

Java正则表达式字符串匹配示例

xiaobo137
 xiaobo137
发布于 2016/07/13 13:03
字数 830
阅读 26
收藏 0

一位以前的同事在群里面突然发了个需求,要通过正则表达式来取值。给我发过来一张图,

从图中可以出,需求是,通过下面的正则表达式,取出红色框所标示的内容

开始理解错误,我以为是要取出中间的那些内容,不包括"[标题BEGIN]"和“[标题END]”,于是写了下面的代码:

	private static void getStr(){
		String str="[标题BEGIN]<#list>[@cms_chanel id=70]<li class=\"current\"></li>[/@cms_chanel]</#list>[标题END]";
		 Pattern p =Pattern.compile("\\[标题BEGIN\\](.*)\\[标题END\\]");
		 Matcher m =p.matcher(str);
		 
		 
		ArrayList<String> matches= new ArrayList<String>();
		while(m.find())
		{
			matches.add(m.group(1));
		}
		
		for(String s: matches)
		{
			System.out.println("匹配结果:"+s);
		} 
	}

回过头来一看需求,发现不对,于是再修改,主要是针对pattern进行修改

过程如下(按顺序);

1.  Pattern p =Pattern.compile("(\\[标题BEGIN\\](.*)\\[标题END\\])*");

     输出结果:

      匹配结果:[标题BEGIN]<#list>[@cms_chanel id=70]<li class="current"></li>  [/@cms_chanel]</#list>[标题END]
匹配结果:null

      第一个内容是我们想要的结果,但是产生了两个结果,而且第二个是null,显然是不对的。

      当时猜想是(.*)匹配不到。于是有了下面的修改

2. Pattern p =Pattern.compile("(\\[标题BEGIN\\].*\\[标题END\\])*");

     输出结果:

     匹配结果:[标题BEGIN]<#list>[@cms_chanel id=70]<li class="current"></li>[/@cms_chanel]</#list>[标题END]
匹配结果:null

      这次注意到,最后面那个*没法匹配,null是这个*匹配出来的。于是修改如下

3. Pattern p =Pattern.compile("(\\[标题BEGIN\\].*\\[标题END\\])");

    输出结果:

匹配结果:[标题BEGIN]<#list>[@cms_chanel id=70]<li class="current"></li>[/@cms_chanel]</#list>[标题END]
 这就对了,是我们所需要的结果。

  也可以换成

  Pattern p =Pattern.compile("(\\[标题BEGIN\\](.*)\\[标题END\\])");

  效果是一样的。

 后来还发现一个问题,这样的话,如果包含回车换行的话(\n\r等),没法匹配到,于是查了点资料。

这个问题有两个解决办法:

1.设置pattern的模式为DOTALL

2.使用正则表达式对字符串进行全部替换,表达式为: String reg = "(?s)'.*'";

 这里我们改写一下代码

 Pattern p =Pattern.compile("(\\[标题BEGIN\\](.*)\\[标题END\\])",Pattern.DOTALL);

回车换行也能匹配了。

解决了一个问题,学到了java的正则表达式使用方法,这可能只是java关于正则的冰山一角,也许还有其他更好用得方法,如果今后有发现,再补充进来。

也许你对正则表达式还不是那么熟悉,那么我建议你先学好一些基础再来看本文。推荐看一看微软javascript的说明文档(chm格式),里面对正则表达式的概念说的非常详细。

如果你对正则表达式比较熟悉的话,那么恭喜你,本文对你来说没有任何难度了。 

感谢所有曾经一起玩耍的小伙伴,是你们让我有了成长,让我一次次的进步,谢谢你们!

© 著作权归作者所有

共有 人打赏支持
xiaobo137
粉丝 35
博文 64
码字总数 33309
作品 0
长沙
项目经理
私信 提问
java.util.regex Pattern 正则

/**String 中 replaceAll(),matches(),split() 等方法,都是调用Pattern中的方法。学习了,瞬间觉得Pattern强大了 public String replaceAll(String regex, String replacement) {return Pat......

happycode
2014/04/02
0
1
js和java中正则表达式的易混淆点

js中正则表达式的使用 对表单中的值进行正则表达式匹配一般有两种方法: var reg = new RegExp(regStr); reg.test(value); 如下: var reg = new RegExp(“\d{3}”); reg.test(“abc123def”...

绝影jy
2014/07/30
0
0
Java 正则表达式功能及应用

正则表达式,就是用某种模式去匹配一类字符串的一个公式,正则表达式由一些普通字符和一些元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义,不管是...

浮躁的码农
2015/07/29
0
0
关于java中split的使用

之前在http://shukuiyan.iteye.com/blog/507915文中已经叙述过这个问题,但是最近一次笔试中居然有碰到了这个知识点,而且还做错了,囧!学艺不精啊。题目大概是这样的: Java代码 String s...

墨梅
2014/04/28
0
0
Java利器——正则表达式详解!

  小编提示:此篇文章阅读时间为15分钟左右,可先收藏后阅读。   前言   正则表达式是用来处理字符串的一把利器,它是一个专门匹配n个字符串的字符串模板,本质是查找和替换。许多语言...

恒生开发者社区
2017/03/14
0
0

没有更多内容

加载失败,请刷新页面

加载更多

浅谈“李氏代换”——从纪念金庸和斯坦李说起

李氏代换(LSP)简介 李氏代换是软件设计的一个原则,又名依赖倒转原则或依赖倒置原则,其衍生原则有接口分离原则等。该原则由Barbara Liskov于1988年提出。 该原则指出,程序中高级别的元素...

SamYjy
8分钟前
5
0
JavaScript实现在线websocket WSS测试工具 -toolfk程序员工具网

本文要推荐的[ToolFk]是一款程序员经常使用的线上免费测试工具箱,ToolFk 特色是专注于程序员日常的开发工具,不用安装任何软件,只要把内容贴上按一个执行按钮,就能获取到想要的内容结果。T...

toolfk
27分钟前
0
0
linux-scp 远程拷贝报错原因

刚拿到一台重装后的服务器,远程ssh都正常,但是一scp拷贝东西就报错: 本地确定是有scp命令的,而且如果是本地没有scp不会报后面那句lost connection,因此就是远程没有scp这个命令。因此在...

linuxprobe16
40分钟前
1
0
OSChina 周六乱弹 —— 谁小时候没当过熊孩子呀

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @小小编辑:推荐歌曲《行尸走肉》- amazarashi 《行尸走肉》- amazarashi 手机党少年们想听歌,请使劲儿戳(这里) @神话 :周五了,周末干啥...

小小编辑
今天
78
2
docker部署springboot项目

安装docker 菜鸟教程 springboot项目 maven依赖 <?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001......

yimingkeji
今天
14
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部