Python正则表达式小结--688IT编程网

一、python 正则式概述及常用字符

1.元字符：

. 它匹配除了换行字符外的任何字符，在 alternate 模式（re.DOTALL）下它甚至可以匹配换行

^ 匹配行首。除非设置 MULTILINE 标志，它只是匹配字符串的开始。

$ 匹配行尾，行尾被定义为要么是字符串尾，要么是一个换行字符后面的任何位置。

* 重复0或N次

+ 重复1或N次

? 重复0或1次

{m,n} 该限定符的意思是至少有 m 个重复，至多到 n 个重复

[] 它们常用来指定一个字符类别，所谓字符类别就是你想匹配的一个字符集

\ 反斜杠后面可以加不同的字符以表示不同特殊意义。它也可以用于取消所有的元字符，这样你就可以在模式中匹配它们了

| 可选项，或者 "or" 操作符。

() 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值

2.[akm$]将匹配字符"a", "k", "m", 或 "$" 中的任意一个；"$"通常用作元字符，但在字符类别里，其特性被除去，恢复成普通字符。

3.用 "\" 开始的特殊字符所表示的预定义字符集

\d 匹配任何十进制数；它相当于类 [0-9]。

\D 匹配任何非数字字符；它相当于类 [^0-9]。

\s 匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。

\S 匹配任何非空白字符；它相当于类 [^\t\n\r\f\v]。

\w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。

\W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]。

python可以做什么游戏

\A 只匹配字符串首。当不在 MULTILINE 模式，\A 和 ^ 实际上是一样的。然而，在 MULTILINE 模式里它们是不同的；\A 只是匹配字符串首，而 ^ 还可以匹配在换行符之后字符串的任何位置。

\Z 只匹配字符串尾。

\b 单词边界。这是个零宽界定符（zero-width assertions）只用以匹配单词的词首和词尾。单词被定义为一个字母数字序列，因此词尾就是用空白符或非字母数字符来标示的。

\B 另一个零宽界定符（zero-width assertions），它正好同 \b 相反，只在当前位置不在单词边界时匹配。

4.重复元字符

* 重复0或N次

+ 重复1或N次

? 重复0或1次

{m,n}，其中 m 和 n 是十进制整数。该限定符的意思是至少有 m 个重复，至多到 n 个重复

5.RegexObject(re)对象常用方法

match() 决定 RE 是否在字符串刚开始的位置匹配

search() 扫描字符串，到这个 RE 匹配的位置

findall() 到 RE 匹配的所有子串，并把它们作为一个列表返回

finditer() 到 RE 匹配的所有子串，并把它们作为一个迭代器返回

6.MatchObject对象的常用方法

group() 返回被 RE 匹配的字符串

start() 返回匹配开始的位置

end() 返回匹配结束的位置

span() 返回一个元组包含匹配 (开始，结束) 的位置

7.编译标志

DOTALL, S 使 . 匹配包括换行在内的

所有字符

IGNORECASE, I 使匹配对大小写不敏感

LOCALE, L 做本地化识别（locale-aware）匹配

MULTILINE, M 多行匹配，影响 ^ 和 $

VERBOSE, X 能够使用 REs 的 verbose 状态，使之被组织得更清晰易懂

二、python 正则式使用心得

1.match() 从开始位置开始匹配

2.search() 任意位置匹配，如果有多个匹配，只返回第一个

3.finditer() 返回所有匹配

4.findall() 每次匹配，都是尽量最大匹配。例如：

>>> m = repile('abc[bcd]*b')

>>> m.findall('abcbcbcb')

['abcbcbcb']

其实abcbcb也是匹配的abc[bcd]*b的，不过只返回一个最大的匹配值。

5.split()方法

a.根据正则式划分字符串，可指定最大的划分数

>>> p = repile(r'\W+')

>>> p.split('This is a test, short and sweet, of split().')

['This', 'is', 'a', 'test', 'short', 'and', 'sweet', 'of', 'split', '']

b.有时，你不仅对定界符之间的文本感兴趣，也需要知道定界符是什么。

如果捕获括号在 RE 中使用，那么它们的值也会当作列表的一部分返回。比较下面的调用：

>>> p2 = repile(r'(\W+)')

['This', '... ', 'is', ' ', 'a', ' ', 'test', '.', '']

688IT编程网

Python正则表达式小结

发表评论

推荐文章

emo是什么意思

东风化雨是什么意思

英语作文20年后的我有汉语意思女生版

英语文学导论诗歌意象

英语中各种词性的意义及用法

热门文章

leaf的意思用法大全

论文发表参考文献的大写字母代表含义

美国五十州地名意思

春晓的意思是什么

wlan是什么意思-wlan和wifi的区别是什么

别出心裁的裁什么意思

小学低段英语教学,趣味先行!

春夏秋冬_春夏秋冬的意思_成语词典

blouse的中文意思

常见英文人名大全_英文人名含义

英语人名的含义

bluespring是什么意思

论文参考文献的各种字母的含义及写法

红在东西方中不同的含义象征

?春事阑珊什么意思?有什么典故?

metoo是什么意思

英语单词normal是什么意思-详尽释义用法搭配及例句

save的用法和短语例句是什么意思

巧用发音规则记单词

【弦】_弦字的读音弦的意思

最新文章

emo是什么意思

英语文学导论诗歌意象

英语中各种词性的意义及用法

pale的意思用法总结

作文遇见春暖花开600字

[转载]【译心译意】Early

标签列表