文档章节

正则表达式简单使用说明

 轻轻的往前走
发布于 01/19 11:52
字数 310
阅读 11
收藏 0

在Python3里确实简单明了,测试样例如下


# 正则

content = 'Hello 1234567 World_This is a Regex Demo'

# 贪婪匹配 尽可能多的匹配

result = re.match('^He.*(\d+).*Demo$', content)

print(result)

print(result.group(1), '\n')

# 非贪婪匹配 如果后面匹配公式符合条件,则不匹配

result = re.match('^He.*?(\d+).*Demo$', content)

print(result)

print(result.group(1), '\n')

# 匹配换行 这个re.S 在网页匹配中经常用到。因为HTML 节点经常会有换行,加上它,就可以匹配节点与节点之间的换行

content = '''Hello 1234567 World_This

is a Regex dddddd 5553 Demo'''

result = re.match('^He.*?(\d+).*Demo$', content, re.S)

print(result)

print(result.group(1), '\n')

# 查询第一个符合条件

print('查询第一个符合条件')

result = re.search(r'\d+\.?\d*', content)

print(result)

print(result.group(0), '\n')



# 抓取所有数字

print('抓取所有数字')

result = re.findall(r'\d+\.?\d*', content)

print(result)

print(result[0])

print(result[1], '\n')



# 替换字符串

print('替换字符串')

result = re.sub('\d+', '', content)

print(result, '\n')



# 封装正则表达式对象

print('封装正则表达式对象')

zzobj = re.compile('\d+')

result = re.sub(zzobj, '', content)

print(result)

 

© 著作权归作者所有

共有 人打赏支持
上一篇: 第一次写爬虫
下一篇: VScode 环境 配置
粉丝 1
博文 41
码字总数 17792
作品 0
西安
高级程序员
私信 提问
正则表达式简单使用说明

本文简单介绍正则表达式使用说明,并给出常用正则表达式语句。 *、+和?限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。 参考:http...

Arthur126
2016/07/20
16
0
正则文本替换器--RegexReplacer

说明:本软件是一款桌面工具,使用java swing编写,运行需要jre环境。 软件主界面: 功能介绍:该工具是在java的正则表达式上,引入了替换表达式特性(可穿插使用替换函数),可以实现极为复...

trytocatch
2015/02/09
1K
0
WebMagic使用说明-基本的爬虫

本文是WebMagic文档的一部分。系列文章写完后,会整合到WebMagic新版文档中。 3. 基本的爬虫 3.1 实现PageProcessor 在WebMagic里,实现一个基本的爬虫只需要编写一个类,实现接口即可。这个...

黄亿华
2014/04/04
0
3
Common Gui Tools 1.0,Java GUI实用小工具集

Common Gui Tools 是用java编写,GUI界面的实用小工具集,1.0版暂有6个小工具: 1,编码转换:Character Converter 2,加密解密:Encrypt And Decrypt 3,正则表达式验证:Regex Tester 4,执...

bs2004
2013/03/20
1K
18
jmeter 正则获取多个返回token至本地文件,并跨线程组调用

1、打开jmeter,创建setup Thread Group 对于setup Thread Group和tearDown Thread Group来说,从字面意思上来看就是安装线程组和卸载线程组,所以可以理解为对于线程组的初始化和完成时处理...

xiaoshushu1991
2018/08/06
0
0

没有更多内容

加载失败,请刷新页面

加载更多

【Mysql技术内幕】第2章 InnoDB存储引擎

2.6 InnoDB关键特性 插入缓冲 两次写 自适应哈希索引 异步IO 刷新邻接页 2.6.1 插入缓冲 通常应用程序中行记录的插入顺序是按照主键的递增顺序进行插入的,因此插入聚集索引(Primary Key)一...

HOT_POT
今天
2
0
Java8 如何正确使用 Optional

原文链接:https://blog.kaaass.net/archives/764 Optional是Java8提供的为了解决null安全问题的一个API。善用Optional可以使我们代码中很多繁琐、丑陋的设计变得十分优雅。这篇文章是建立在...

大灰狼时间
今天
4
0
富兰克林的人生信条

春节假期期间读了富兰克林自传,这位饱经风霜的老人出身贫寒,只读过两年书,但是通过刻苦自学和不懈奋斗还是取得了令人难以置信的成就,他的一生可以作为我们普通人的励志典范。 富兰克林 ...

春哥大魔王的博客
今天
1
0
不用中间变量交换 a ,b(三种方法)

1、加减法:该方法可以交换整型和浮点型数值的变量,但在处理浮点型的时候有可能出现精度的损失。 a = a + b; b = a - b; a = a - b; 2、异或法:可以完成对整型变量的交换,对于浮点型变量它...

robslove
今天
6
0
一文了解 OutOfMemory 及解决方案

1. Java 堆空间 发生频率 5颗星 造成原因 无法在 Java 堆中分配对象 吞吐量增加 应用程序无意中保存了对象引用,对象无法被 GC 回收 应用程序过度使用 finalizer。finalizer 对象不能被 GC 立...

java菜分享
今天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部