c语言 sscanf,scanf,fscanf正则表达式用法
每种语言都对正则表达式有着不同程度的支持,在C语言中,有输入功能的这三个函数对正则表达式的支持并不强大,但是我们还是有必要了解一下。
首先来看看他们的原型:
#includeintscanf(constchar*format,...); intfscanf(FILE*stream,constchar*format,...); intsscanf(constchar*str,constchar*format,...);
均可以接受变参,sscanf与scanf类似,可以将标准输入(stdin)作为输入源。最关键的部分,就是format这个参数了。它可以是一个或者多个{%[*][width][{h|l|I64|L}]type|''|'\t'|'\n'|非%符号}。
参数解释:
1、*亦可用于格式中,(即%*d和%*s)加了星号(*)表示跳过此数据不读入.(也就是不把此数据读入参数中)
2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
3、width表示读取宽度。
4、{h|l|I64|L}:参数的size,通常h表示单字节size,I表示2字节size,L表示4字节size(double例外),l64表示8字节size。
5、type:就是%s,%d之类。
6、特别的:%*[width][{h|l|I64|L}]type表示满足该条件的被过滤掉,不会向目标参数中写入值
支持的集合操作:%[a-z]表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)%[aB']匹配a、B、'中一员,贪婪性%[^a]匹配非a的任意字符,贪婪性
返回值
这三个函数返回成功匹配和分配的输入项。意思就是你在format参数列表中的格式,返回值可以比你提供的匹配项目数少(有些将会匹配失败)。提前匹配失败则返回0。如果达到文件末尾,则返回EOF,当发生错误的时候也将返回EOF。你可以通过输出errno来查看错误代码。
如果使用fscanf来判断文件是否结束,将会存在安全隐患,如果每次读取的时候都是匹配失败,那么返回值永远都不会是EOF。scanf族的函数都是要先将数据读入缓冲区,然后在冲缓冲里读取。
注意:scanf族函数会忽略一行开始的空白
sscanf/scanf正则用法
%[]的用法:
%[]表示要读入一个字符集合,如果[后面第一个字符是”^”,则表示反意思。
[]内的字符串可以是1或更多字符组成。空字符集(%[])是违反规定的,可
导致不可预知的结果。%[^]也是违反规定的。
%[a-z]读取在a-z之间的字符串,如果不在此之前则停止,如
chars[]="hello,myfriend”;//注意:,逗号在不a-z之间 sscanf(s,“%[a-z]”,string);//string=hello
%[^a-z]读取不在a-z之间的字符串,如果碰到a-z之间的字符则停止,如
chars[]="HELLOkitty”;//注意:,逗号在不a-z之间 sscanf(s,“%[^a-z]”,string);//string=HELLO
%*[^=]前面带*号表示不保存变量。跳过符合条件的字符串。
chars[]="notepad=1.0.0.1001"; charszfilename[32]=""; inti=sscanf(s,"%*[^=]",szfilename);//szfilename=NULL,因为没保存 inti=sscanf(s,"%*[^=]=%s",szfilename);//szfilename=1.0.0.1001
%40c读取40个字符
Therun-time
librarydoesnotautomaticallyappendanullterminatortothestring,nordoesreading40characters
automaticallyterminatethescanf()function.Becausethelibraryusesbufferedinput,youmustpresstheENTERkeytoterminatethestringscan.IfyoupresstheENTERbeforethescanf()reads40characters,itisdisplayednormally,andthelibrarycontinuestopromptforadditionalinputuntilitreads40characters
%[^=]读取字符串直到碰到'='号,'^'后面可以带更多字符,如:
chars[]="notepad=1.0.0.1001"; charszfilename[32]=""; inti=sscanf(s,"%[^=]",szfilename);//szfilename=notepad
如果参数格式是:%[^=:],那么也可以从notepad:1.0.0.1001读取notepad
使用例子:
chars[]="notepad=1.0.0.1001"; charszname[32]=""; charszver[32]=“”; sscanf(s,"%[^=]=%s",szname,szver);//szname=notepad,szver=1.0.0.1001
总结:%[]有很大的功能,但是并不是很常用到,主要因为:
1、许多系统的scanf函数都有漏洞.(典型的就是TC在输入浮点型时有时会出错).
2、用法复杂,容易出错.
3、编译器作语法分析时会很困难,从而影响目标代码的质量和执行效率.
个人觉得第3点最致命,越复杂的功能往往执行效率越低下。而一些简单的字符串分析我们可以自已处理。
C语言中scanf(),sscanf(),fscanf()的用法和区别
scanf(),sscanf(),fscanf()区别:
第一个是从控制台(键盘)输入;
第二个是从字符串输入;
第三个是从文件输入;
scanf
scanf()函数根据由format(格式)指定的格式从stdin(标准输入)读取,并保存数据到其它参数.
intmain() { inta,b,c; printf("输入:a,b,c\n"); scanf("%d,%d,%d",&a,&b,&c); printf("a=%db=%dc=%d",a,b,c); return0; }
sscanf
函数sscanf()和scanf()类似,只是输入从buffer(缓冲区)中读取.
sscanf与scanf类似,都是用于输入的,只是后者以屏幕(stdin)为输入源,前者以固定字符串为输入源
用法:
%[]表示要读入一个字符集合,如果[后面第一个字符是”^”,则表示反意思。[]内的字符串可以是1或更多字符组成。空字符集(%[])是违反规定的,可导致不可预知的结果。%[^]也是违反规定的。
1.常见用法。
charbuf[512];
sscanf("123456","%s",buf);//此处buf是数组名,它的意思是将123456以%s的形式存入buf中!
printf("%s\n",buf);
结果为:123456
2.取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。
sscanf("123456","%4s",buf);
printf("%s\n",buf);
结果为:1234
3.取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。
sscanf("123456abcdedf","%[^]",buf);
printf("%s\n",buf);
结果为:123456
4.取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。
sscanf("123456abcdedfBCDEF","%[1-9a-z]",buf);
printf("%s\n",buf);
结果为:123456abcdedf
当输入:sscanf("123456abcdedfBCDEF","%[1-9A-Z]",buf);
printf("%s\n",buf);
结果为:123456
5.取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。
sscanf("123456abcdedfBCDEF","%[^A-Z]",buf);
printf("%s\n",buf);
结果为:123456abcdedf
6、给定一个字符串iios/12DDWDFF@122,获取/和@之间的字符串,
先将"iios/"过滤掉,再将非'@'的一串内容送到buf中
sscanf("iios/12DDWDFF@122","%*[^/]/%[^@]",buf);
printf("%s\n",buf);
结果为:12DDWDFF
7、给定一个字符串“hello,world”,仅保留world。
(注意:“,”之后有一空格,%s遇空格停止,加*则是忽略第一个读到的字符串)
sscanf(“hello,world”,"%*s%s",buf);
printf("%s\n",buf);
结果为:world
%*s表示第一个匹配到的%s被过滤掉,即“hello,”被过滤了
如果没有空格则结果为NULL。