每种语言都对正则表达式有着不同程度的支持,在C语言中,有输入功能的这三个函数对正则表达式的支持并不强大,但是我们还是有必要了解一下。
首先来看看他们的原型:
#include <stdio.h>
int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *str, const char *format, ...);
均可以接受变参,sscanf与scanf类似,可以将标准输入(stdin)作为输入源。最关键的部分,就是format这个参数了。它可以是一个或者多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | 't' | 'n' | 非%符号}。
参数解释:
1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)
2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
3、width表示读取宽度。
4、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。
5、type : 就是%s,%d之类。
6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值
支持的集合操作:%[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)%[aB'] 匹配a、B、'中一员,贪婪性%[^a] 匹配非a的任意字符,贪婪性
返回值
这三个函数返回成功匹配和分配的输入项。意思就是你在format参数列表中的格式,返回值可以比你提供的匹配项目数少(有些将会匹配失败)。提前匹配失败则返回0。如果达到文件末尾,则返回EOF,当发生错误的时候也将返回EOF。你可以通过输出errno来查看错误代码。
如果使用fscanf来判断文件是否结束,将会存在安全隐患,如果每次读取的时候都是匹配失败,那么返回值永远都不会是EOF。scanf族的函数都是要先将数据读入缓冲区,然后在冲缓冲里读取。
注意:scanf族函数会忽略一行开始的空白
sscanf/scanf正则用法
%[ ] 的用法:
%[ ] 表示要读入一个字符集合 , 如果 [ 后面第一个字符是 ”^” ,则表示反意思。
[ ] 内的字符串可以是 1 或更多字符组成。空字符集( %[] )是违反规定的,可
导致不可预知的结果。 %[^] 也是违反规定的。
%[a-z] 读取在 a-z 之间的字符串,如果不在此之前则停止,如
char s[]="hello, my friend” ; // 注意 : , 逗号在不 a-z 之间
sscanf( s, “%[a-z]”, string ) ; // string=hello
%[^a-z] 读取不在 a-z 之间的字符串,如果碰到 a-z 之间的字符则停止,如










