首页 » 编程 » 正文

正则表达式的常用操作符及Re库主要功能函数

2021-10-24
编程
暂无评论
396 次阅读

操作符	说明	实例
.	表示任何单个字符
[]	字符集，对单个字符给出取值范围	[abc]表示a、b、c，[a-z]表示a到z单个字符
[^ ]	非字符集，对单个字符给出排除范围	[^abc]表示非a或b或c的单个字符
*	前一个字符0次或无限次扩展	abc*表示 ab、abc、abcc、abccc等
+	前一个字符1次或无限次扩展	abc+ 表示 abc、abcc、abccc等
?	前一个字符0次或1次扩展	abc? 表示 ab、abc
\|	左右表达式任意一个	abc\|def 表示 abc、def
{m}	扩展前一个字符m次	ab{2}c表示abbc
{m,n}	扩展前一个字符m至n次（含n）	ab{1,2}c表示abc、abbc
^	匹配字符串开头	^abc表示abc且在一个字符串的开头
$	匹配字符串结尾	abc$表示abc且在一个字符串的结尾
( )	分组标记，内部只能使用\|操作符	(abc)表示abc，(abc\|def)表示abc、def
\d	数字，等价于[0-9]
\w	单词字符，等价于[A-Za-z0-9_]

Re库主要功能函数

函数	说明
re.search()	在一个字符串搜索匹配正则表达式的第一个位置，返回match对象
re.match()	从一个字符串的开始位置起匹配正则表达式，返回match对象
re.findall()	搜索字符串，以列表类型返回全部能匹配的子串
re.split()	将一个字符串按照正则表达式匹配结果进行分割，返回列表类型
re.finditer()	搜索字符串，返回一个匹配结果的迭代类型，每个迭代元素是match对象
re.sub()	在一个字符串中替换所有匹配正则表达式的子串，返回替换后的字符串

正则表达式可以包含一些可选标志修饰符来控制匹配的模式，修饰符被指定为一个可选的标志，多个标志可以通过按位 OR(|)它们来指定，如 re.I | re.M 被设置成 I 和 M 标志。

修饰符	描述
re.l	使匹配对大小写不敏感
re.L	做本地化识别(local-aware)匹配
re.M	多行匹配，影响^ 和 $
re.S	使用 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响\w,\W,\b,\B
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易理解

打赏: 微信收款二维码微信, 支付宝收款二维码支付宝

标签: python

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。

添加新评论

上一篇: Python之进程与线程
下一篇: Windows下使用Notepad++修改二进制文件，exe可执行文件