Python正则表达式的使用技巧，都在这里了-轻识

导读：今天就来跟大家一起介绍下正则表达式的使用技巧。

作者：極光

来源：Python 技术（ID: pythonall）

01 小括号，大作用

当获取了小括号里的内容后，我们也可以反向引用 ()里的内容，每一个小括号里的内容，只要没有使用 ?: ，就会被分配一个组号，从左到右从1开始递增。

在使用中，可以使用 \i 引用前面 () 里获取的内容。

除了上面使用索引的方式反向引用外，还可以使用组名的方式引用。

也就是通过左括号 ( 后面跟一个字串 ?P<组名> 的方式，来为这个组起一个别名，后面就可以通过 (?P=组名) 来引用这个组获取的内容了。例如想要匹配重复数字，可以使用 (?P<key>\d+)\s+(?P=key)。

在实际使用中，我们需要对正则表达式使用断言，来对文本进行部分约束，但断言不会匹配任何文本。

另外还有些特殊的，如正前瞻、负前瞻、正回顾、负回顾：

例如我们想查找一个字串 python，而这个字串后面必须要跟着 data 字串，那我们就可以使用 (python)\s+(?=data)。

这样即使字串中有 python，但我们限定了只匹配这种情况，可以大大提高了准确率。

相信大家在平时开发过程中会经常用到三目运算符，比如 data == 1 ? 'Y' : 'N'，在正则里也有类似的运算操作。

表达式：(?(判断表达式) 为真时执行表达式| 为假时执行表达式)，当判断表达式匹配到内容的时候，则这里就会匹配为真时的表达式，否则就会匹配为假时的表达式。

例如：(?(\d+) [\s\d,]| [\s,])

在我们平时用正则表达式处理字符串的时候，主要会使用到它的四大功能：

上次已经说了四个比较常用的方法，主要用来做匹配和提取，另外还有一些方法用来做替换和拆分，在这里我们也说一下：

sub(str, t, n)：这个方法用来替换操作。即将每个匹配到的文本用 str 进行替换，并返回替换后的字符串。当指定了 n 时，则最多替换 n 次。对于 str 可以是组名或者编号来引用捕获到的内容。
subn(str, t, n)：这个方法和 sub() 方法基本相同，只是这个会返回一个二元组，其中除了包括结果字串，还有替换的数量。
split(str, n)：这个方法是用来拆分字串操作。即将匹配到的文本对字符串进行分割，并返回一个结果列表。如果正则存在分组，则把分组匹配文本放列表中，并且每两个分割的中间作为列表的一部分。

一般正则表达式可以匹配的对象不同，需要调用不同的方法获取。

好了，今天就算是把 Python 正则表达式相关的都介绍完了，为了方便大家理解，讲的比较基础，但真正用在项目中的时候，可以举一反三灵活运用。OK，今天就聊这些，如果你喜欢记得点在看。

延伸阅读👇

《Effective Python》（原书第2版）

干货直达👇

更多精彩👇

在公众号对话框输入以下关键词

查看更多优质内容！

PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作

大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化

AI | 人工智能 | 机器学习 | 深度学习 | NLP

5G | 中台 | 用户画像 | 1024 | 数学 | 算法 | 数字孪生

据统计，99%的大咖都关注了这个公众号

👇