浅谈C#中正则表达式的使用

2019-12-30 15:07:01于丽

目前为止,许多编程语言和工具都包含对正则表达式的支持,C#也不例外,C#基础类库中包含有一个命名空间(System.Text.RegularExpressions)和一系列可以充分发挥规则表达式威力的类(Regex、Match、Group等)。那么,什么是正则表达式,怎么定义正则表达式呢?

一、正则表达式基础

什么是正则表达式

在编写字符串的处理程序时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。

通常,我们在使用WINDOWS查找文件时,会使用通配符(*和?)。如果你想查找某个目录下的所有Word文档时,你就可以使用*.doc进行查找,在这里,*就被解释为任意字符串。和通配符类似,正则表达式也是用来进行文本匹配的工具,只不过比起通配符,它能更精确地描述你的需求——当然,代价就是更复杂。

一个简单的例子——验证电话号码

学习正则表达式的最好方法是从例子开始,下面我们从验证电话号码开始,一步一步的了解正则表达式。

在我们国家,电话号码(如:0379-65624150)通常包含3到4为以0开头的区号和一个7或8为的号码,中间通常以连字符'-'隔开。在这个例子中,首先我们要介绍一个元字符d,它用来匹配一个0到9的数字。这个正则表达式可以写成:^0d{2,3}-d{7,8}$

我们来对他进行分析,0匹配数字“0”,d匹配一个数字,{2,3}表示重复2到3次,-只匹配”-”自身,接下来的d同样匹配一个数字,而 {7,8}则表示重复7到8次。当然,电话号码还可以写成 (0379)65624150,这里就交给读者完成。

元字符

在上面的例子中,我们接触到了一个元字符d,正如你所想的,正则表达式还有很多像d一样的元字符,下表列出了一些常用的元字符:

 

元字符

说明

.

匹配除换行符以外的任意字符

b

匹配单词的开始或结束

d

匹配数字

s

匹配任意的空白符

w

匹配字母或数字或下划线或汉字

^

匹配字符串的开始

$

匹配字符串的结束