强大的Perl正则表达式实例详解

2019-10-01 10:10:33王振洲

  [^a]* 表示匹配除a以外的所有字符,*代表0次或多次。

  [^abc]* 表示匹配除a、b、c以外的所有字符。

  ((?!win).)* 表示匹配除单词win的其它所有字符

  Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配

          "Windows 2000" 中的 "Windows"。

9. 匹配数字:

  ^d+(.d+)?

    ^: 定义以什么开始;
    d+: 表示匹配数字;
    ?: 表示内容可选;

匹配下面的内容:

  1): {"service":"nutcracker", "source":"ubuntu", "version":"0.3.0",

       m|^{"service":"nutcracker", "source":"([^"]+)", "version":"([d.]+)",|

  2):220 yzwb.net ESMTP MDaemon 10.1.2;

     m|^220[ -]([-.w]+) ESMTP MDaemon (d[-.w]+);

  3):AMQPx01x01x00n

     m|^AMQPx01x01x00x0a$|:注意回车键n对应16进制x0a,r对应x0d.

  Nmap nmap-services-probe文件给出的匹配

三、正则元字符

元字符是正则表达式组成的基本元素。

字符 描述
将下一个字符标记为一个特殊字符、或一个原义字符、或一个 后向引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'n' 匹配一个换行符。序列 '' 匹配 "" 而 "(" 则匹配 "("。
^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 'n' 或 'r' 之后的位置。
$ 匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性,$ 也匹配 'n' 或 'r' 之前的位置。
* 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等价于{0,}。
+ 匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。
? 匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。
{n} n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。
{n,} n 是一个非负整数。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。刘, "o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。
? 当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串 "oooo",'o+?' 将匹配单个 "o",而 'o+' 将匹配所有 'o'。
.