文档章节

Python3正则表达式

ZeroBit
 ZeroBit
发布于 07/21 23:20
字数 1053
阅读 13
收藏 0

在Python中使用正则表达式

Python语言通过标准库中的 re模块 (import re)支持正则表达式。

使用 match 方法匹配字符串

  • 匹配字符串也就是设定一个文本模式,然后判断另外一个字符串是否符合这个文本模式。
import re
# 第1个参数表示文本模式,第2个参数表示待匹配的字符串
m = re.match('hello', 'hello world')
if m is not None:
	print(m.group()) # hello

使用search方法在一个字符串中查找模式

import re
# 第1个参数表示文本模式,第2个参数表示待查找的字符串
m = re.search('abc','xabcy')
print(m.group()) # abc

匹配多个字符串

  • 如果想要搜索多个字符串,最简单的方法是在文本模式字符串中使用 择一匹配符号(|)。择一匹配符号只要满足任何一个,就算匹配成功。
import re
s = 'bike|car|truck'
m = re.match(s, 'bike')
print(m.group()) # bike
m = re.match(s, 'truck')
print(m.group()) # truck

匹配任何单个字符(.)

  • 点(.),这个符号可以匹配任意一个单个字符。
m  = re.match('bin.', 'bind') # 匹配成功

其中 . 可以表示任意一个字符,例如:"bind"、"binx"、"bin4"都可以和文本模式匹配成功。

使用字符集匹配([])

  • 如果待匹配的字符串中,某些字符可以有多个选择,就需要使用字符集([])。如 [abc] 表示在a、b、c三个字符中取其中任何一个。

重复、可选和特殊字符(*、+、?、\w、\d、{N})

  • *:表示字符串出现0到n次,'a*' 表示字符a出现0到n次
  • +:表示字符串出现1到n次,'a+' 表示字符a出现1到n次
  • ?:表示可选符号,a? 表示a可有可无
  • \w:表示任意一个字母或数字
  • \d:表示任意一个数字
  • {N}:表示前面修饰的部分重复N次,(abc){3} 表示字符串'abc'重复3次

分组

  • 如果一个模式字符串中有用一对 圆括号 括起来,那么这部分就会作为一组。
m = re.match('(\d\d\d)-(\d\d)', '123-45') # 匹配

匹配字符串的起始和结尾以及单词边界(^、$、\b)

  • ^:表示匹配字符串的开始,如:^the,表示以 the 开始
  • $:表示匹配字符串的结束,如:the$,表示以 the 结束
  • \b:表示单词的边界,如:\bthis,则 what's this? 匹配,what's sthiss? 不匹配

使用findall和finditer查找每一次出现的位置

  • findall函数用于查询字符串中某个正则表达式模式全部的非重复出现情况,如果搜索到结果,则返回包含结果的列表,否则返回一个空列表
import re
result = re.findall('bike', 'This is a bike. This is my bike.')
print(result) # ['bike', 'bike']
  • finditer与findall函数类似,区别是findall会返回一个列表,而finditer函数返回一个迭代器

用sub和subn搜索与替换

  • 这两个函数都是将字符串中所有匹配正则表达式的部分替换成其他字符串。sub 函数 返回替换后的结果subn 函数 返回一个元组,元组的第1个元素是替换后的结果,第2个元素是替换的总数
import re
# sub函数第1个参数是正表达式,第2个参数是要替换的字符串,第3个参数是被替换的字符串
result = re.sub('Bill', 'Mike', 'Bill is my son')
print(result) # Mike is my son

result = re.subn('Bill', 'Mike', 'Bill is my son')
print(result) # ('Mike is my son', 1)

使用split分隔字符串

  • split函数用于根据正则表达式分隔字符串
import re
result = re.split(';', 'Bill;Mike;John')
print(result) # ['Bill', 'Mike', 'John']

result = re.split('[a-z]{3}-[0-9]{2}', 'testabc-4312productxyz-43abill')
print(result) # ['test', '12product', 'abill']

一些常用的正则表达式

  • Email:'[0-9a-zA-z]+@[0-9a-zA-z]+.[0-9a-zA-z]{2,3}'
  • IP地址:'\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}'
  • Web地址:'https?:/{2}\w.+'

© 著作权归作者所有

上一篇: Python3常用模块
下一篇: Python3字典详解
ZeroBit

ZeroBit

粉丝 1
博文 58
码字总数 49861
作品 0
南宁
私信 提问
python测试开发自动化测试数据分析人工智能自学每周一练-2018-07

python每周一练 每周五发布python需求,所有需求都来自实际企业。下周五发布参考答案。 python测试开发自动化测试数据分析人工智能自学每周一练-2018-06 2018-07-06 使用python3 smtplib通过...

Python测试开发人工智能
2018/07/06
0
0
Python 正则表达式(字符)详解

Python正则表达式 — 简介  其实正则表达式这种技术,源于一个很简单的问题:    如何通过变成使得计算机具有在文本中检索某种模式的能力?   而正则表达式为通过编程实现高级的文本模式...

jamesjoshuasss
2017/03/01
0
0
超详细Python正则表达式操作指南(re使用),一

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。Python 1.5之前版本则是通过 regex 模块提供 Emecs 风格的模式。Emacs 风格模式可读性稍差些,而且功能也不强,因此编...

Python雁横
2018/05/26
0
0
python 进程和线程之正则表达式

python学习笔记,特做记录,分享给大家,希望对大家有所帮助。 正则表达式 字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的...

展菲
07/22
0
0
Python爬虫入门,如何使用正则表达式

按照之前的课程安排,此次课程应该讲python基础第十六讲爬虫,但是如果正则一笔带过大家可能还是没办法写出自己想要实现的结果,所以把正则匹配详解提前学习一下,此次课程的学习路线会翻译官...

程序员补给栈
01/28
18
0

没有更多内容

加载失败,请刷新页面

加载更多

作为一个(IT)程序员!聊天没有话题?试试这十二种技巧

首先呢?我是一名程序员,经常性和同事没话题。 因为每天都会有自己的任务要做,程序员对于其他行业来说;是相对来说比较忙的。你会经常看到程序员在发呆、调试密密麻麻代码、红色报错发呆;...

小英子wep
今天
13
0
【SpringBoot】产生背景及简介

一、SpringBoot介绍 Spring Boot 是由 Pivotal 团队提供的全新框架,其设计目的是用来简化新 Spring 应用的初始搭建以及开发过程,该框架使用了特定的方式来进行配置,从而使开发人员不再需要...

zw965
今天
4
0
简述并发编程分为三个核心问题:分工、同步、互斥。

总的来说,并发编程可以总结为三个核心问题:分工、同步、互斥。 所谓分工指的是如何高效地拆解任务并分配给线程,而同步指的是线程之间如何协作,互斥则是保证同一时刻只允许一个线程访问共...

dust8080
今天
6
0
OSChina 周四乱弹 —— 当你简历注水但还是找到了工作

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @花间小酌 :#今日歌曲推荐# 分享成龙的单曲《男儿当自强》。 《男儿当自强》- 成龙 手机党少年们想听歌,请使劲儿戳(这里) @hxg2016 :刚在...

小小编辑
今天
3.3K
22
靠写代码赚钱的一些门路

作者 @mezod 译者 @josephchang10 如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。 今天给大家分享一个精彩的 GitHub 库,这个库整理...

高级农民工
昨天
10
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部