python常用的正则表达式大全

2022-04-17 05:05:20

1.正则表达式

正则表达式是用来匹配与查找字符串的,从网上爬取数据自然或多或少会用到正则表达式,python的正则表达式要先引入re模块,正则表达式以r引导,例如:

者字符串结尾.

结果匹配&qmrVRVuot;car",因为"car"后面是一个空格.

,例如[0-9]表示0-9的其中一个数字,[A-Z]表示A-Z的其中一个大写字符,[0-9A-z]表示0-9的其中一个数字或者A-z的其中一个大写字符.

python常用的正则表达式大全

11."^"出现在[]的第一个字符位置,就代表取反,例如[ ^ab0-9]表示不是a、b,也不是0-9的数字.

python常用的正则表达式大全

12."s"匹配任何空白字符,等价"[rnx20tfv]"

python常用的正则表达式大全

13."w"匹配包括下划线子内的单词字符,等价于"[a-zA-Z0-9]"

python常用的正则表达式大全

14."$"字符比配字符串的结尾位置

匹配结果是最后一个"ab",而不是第一个"ab"

python常用的正则表达式大全

15.使用括号(…)可以把(…)看出一个整体,经常与"+"、"*"、"?"的连续使用,对(…)部分进行重复.

结果匹配"abab","+“对"ab"进行了重复

python常用的正则表达式大全

16.查找匹配字符串

正则表达式re库的search函数使用正则表达式对要匹配的字符串进行匹配,如果匹配不成功返回None,如果匹配成功返回一个匹配对象,匹配对象调用start()函数得到匹配字符的开始位置,匹配对象调用end()函数得到匹配字符串的结束位置,search虽然只返回匹配第一次匹配的结果,但是我们只要连续使用search函数就可以找到字符串全部匹配的字符串.

匹配找出英文句子中所有单词

我们可以使用正则表达式r”[A-Za-z]+b"匹配单词,它表示匹配由大小写字母组成的连续多个字符,一般是一个单词,之后"b"表示单词结尾.

程序开始匹配到一个单词后m.start(),m.end()就是单词的起始位置,s[start:end]为截取的单词,之后程序再次匹配字符串s=s[end:],即字符串的后半段,一直到匹配完毕为止就找出每个单词.

python常用的正则表达式大全

总结