揭开正则表达式的神秘面纱(regexlab出品)

2020-02-22 21:59:10王振洲
修饰匹配次数为至少 1 次。要匹配 "+" 字符本身,请使用 "+" * 修饰匹配次数为 0 次或任意次。要匹配 "*" 字符本身,请使用 "*" | 左右两边表达式之间 "或" 关系。匹配 "|" 本身,请使用 "|"

3.4 括号 "( )" 内的子表达式,如果希望匹配结果不进行记录供以后使用,可以使用 "(?:xxxxx)" 格式

举例1:表达式 "(?:(w)1)+" 匹配 "a bbccdd efg" 时,结果是 "bbccdd"。括号 "(?:)" 范围的匹配结果不进行记录,因此 "(w)" 使用 "1" 来引用。

3.5 常用的表达式属性设置简介:Ignorecase,Singleline,Multiline,Global

表达式属性

说明
Ignorecase 默认情况下,表达式中的字母是要区分大小写的。配置为 Ignorecase 可使匹配时不区分大小写。有的表达式引擎,把 "大小写" 概念延伸至 UNICODE 范围的大小写。
Singleline 默认情况下,小数点 "." 匹配除了换行符(n)以外的字符。配置为 Singleline 可使小数点可匹配包括换行符在内的所有字符。
Multiline 默认情况下,表达式 "^" 和 "$" 只匹配字符串的开始 ① 和结尾 ④ 位置。如:

①xxxxxxxxx②n
③xxxxxxxxx④

配置为 Multiline 可以使 "^" 匹配 ① 外,还可以匹配换行符之后,下一行开始前 ③ 的位置,使 "$" 匹配 ④ 外,还可以匹配换行符之前,一行结束 ② 的位置。
Global 主要在将表达式用来替换时起作用,配置为 Global 表示替换所有的匹配。

4. 其他提示

4.1 如果想要了解高级的正则引擎还支持那些复杂的正则语法,可参见本站 DEELX 正则引擎的说明文档。

4.2 如果要要求表达式所匹配的内容是整个字符串,而不是从字符串中找一部分,那么可以在表达式的首尾使用 "^" 和 "$",比如:"^d+$" 要求整个字符串只有数字。

4.3 如果要求匹配的内容是一个完整的单词,而不会是单词的一部分,那么在表达式首尾使用 "b",比如: 使用 "b(if|while|else|void|int……)b" 来匹配程序中的关键字。

4.4 表达式不要匹配空字符串。否则会一直得到匹配成功,而结果什么都没有匹配到。比如:准备写一个匹配 "123"、"123."、"123.5"、".5" 这几种形式的表达式时,整数、小数点、小数数字都可以省略,但是不要将表达式写成:"d*.?d*",因为如果什么都没有,这个表达式也可以匹配成功。 更好的写法是:"d+.?d*|.d+"。