欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

c# 正则指引--字符组

程序员文章站 2023-11-12 22:38:10
字符组:在同一个位子可能出现的各种字符。 用正则表达式判断数字字符: re.search("[0123456789]",charstr) != none 其中[012345...
字符组:在同一个位子可能出现的各种字符。

用正则表达式判断数字字符:

re.search("[0123456789]",charstr) != none

其中[0123456789]以字符串形式给出正则表达式,他是一个字符组,表示可以是0到9的任意一个字符。
net中regex.ismatch(charstr,"[0123456789]");
在默认情况下,search(pattern,string)只会判断某个子串能否匹配pattern,只要pattern能匹配string中的一部分,也认为是匹配成功,为了测整个string是否能匹配pattern,要在pattern两端加上^和$.他们表示定位字符串的起始和结束位置,这样就能保证,只有是整个string都可以由pattern匹配,才算成功。
像[0123456789]这个字符组,还可以使用范围表示法:[0-9]

在字符组中:“-”表示范围,一般根据字符对应的一个码值,码值小的在“-”前面,大的在后面。
上面的例子中,“-”用来表示范围,并不能匹配横线字符,这一类字符叫做元字符,像[、]、^、$都是元字符。

那么当我们需要匹配这些特殊的元字符的时候,需要进行转义处理。
像“-”字符,如果是紧挨着“[”,会认为是普通字符,其他的情况都是元字符,可以使用“\”,对元字符进行转义:
re.search("^[0\\-9]$","3") != none //false
上面的“\”字符本身会联合其他的例如“\n \r”等来使用,单独使用也需要“\\”来进行转义。
使用原生字符串: re.search(r"^[0\-9]$","3") != none ,在字符串前面加上r。就可以不用“\\”来表示"\"了。
排除型字符组:[^...]:表示当前位置,匹配一个没有列出的字符。
[^0-9]:表示匹配一个不是数字的字符
字符组简记法:
常见的有:
\d:[0-9]
\w:[0-9a-za-z] 这个还包括一个下划线
\s:[ \t\r\n\v\f]

对应的排除型字符组简记法:
\d :与\d互补
\w :与\w互补
\s :与\s互补
最简单的应用:[\s\s]组合使用,匹配所有的字符。