正则表达式元字符 本文主要介绍 正则表达式元字符 元字符说明 元字符 说明 :: . 匹配除“n”之外的任何单个字符,如果要匹配包括“n”在内的任意字符,需使用诸如“[sS]”之类的模式。 ^ 匹配输入字符串的开始位置,不匹配任何字符,要匹配“^”字符本身,需使用“^”。 $ 匹配输入字符串结尾的位置,不匹配任何字符,要匹配“$”字符本身,需使用“$”。 零次或多次匹配前面的字符或子表达式,“”等效于“{0,}”,如“^b”可以匹配“b”、“^b”、“^^b”、…。 + 一次或多次匹配前面的字符或子表达式,等效于“{1,}”,如“a+b”可以匹配“ab”、“aab”、“abb”“aaab”、…。 ? 零次或一次匹配前面的字符或子表达式,等效于“{0,1}”,如“a[cd]?”可以匹配“a”、“ac”、“ad”; 当此字符紧随任何其他限定符“”、“+”、“?”、“{n}”、“{n,}”、“{n,m}”之后时,匹配模式是“非贪心的”。“非贪心的”模式匹配搜索到的、尽可能短的字符串,而默认的“贪心的”模式匹配搜索到的、尽可能长的字符串。如,在字符串“oooo”中,“o+?”只匹配单个“o”,而“o+”匹配所有“o”。 将两个匹配条件进行逻辑“或”(Or)运算,如正则表达式“(himher)”匹配“it belongs to him”和“it belongs to her”,但是不能匹配“it belongs to them”。 将下一字符标记为特殊字符、文本、反向引用或八进制转义符,如“n”匹配字符“n”,“n”匹配换行符,序列“”匹配“”,“(”匹配“(”。 w 匹配字母或数字或下划线,任意一个字母或数字或下划线,即Az,az,0~9,中任意一个。 W 匹配任意不是字母、数字、下划线的字符。 s 匹配任意的空白符,包括空格、制表符、换页符等空白字符的其中任意一个,与“[ fnrtv]”等效。 S 匹配任意不是空白符的字符,与“[^fnrtv]”等效。 d 匹配数字,任意一个数字,0~9中的任意一个,等效于“[09]”。 D 匹配任意非数字的字符,等效于“[^09]”。 b 匹配一个字边界,即字与空格间的位置,也就是单词和空格之间的位置,不匹配任何字符,如“erb”匹配“never”中的“er”,但不匹配“verb”中的“er”。 B 非字边界匹配,“erB”匹配“verb”中的“er”,但不匹配“never”中的“er”。 f 匹配一个换页符,等价于“x0c”和“cL”。 n 匹配一个换行符,等价于“x0a”和“cJ”。 r 匹配一个回车符,等价于“x0d”和“cM”。 t 匹配一个制表符,等价于“x09”和“cI”。 v 匹配一个垂直制表符,等价于“x0b”和“cK”。 cx 匹配“x”指示的控制字符,如“cM”匹配“ControlM”或回车符,“x”的值必须在“AZ”或“az”之间,如果不是这样,则假定c就是“c”字符本身。 {n} “n”是非负整数,正好匹配n次,如“o{2}”与“Bob”中的“o”不匹配,但与“food”中的两个“o”匹配。 {n,} “n”是非负整数,至少匹配n次,如“o{2,}”不匹配“Bob”中的“o”,而匹配“foooood”中的所有“o”,“o{1,}”等效于“o+”,“o{0,}”等效于“o”。 {n,m} “n”和“m”是非负整数,其中n来引用。 (pattern) 匹配pattern并捕获该匹配的子表达式,可以使用$0…$9属性从结果“匹配”集合中检索捕获的匹配。 (?:pattern) 匹配pattern但不捕获该匹配的子表达式,即它是一个非捕获匹配,不存储供以后使用的匹配,这对于用“or”字符“()”组合模式部件的情况很有用,如“industr(?:yies)”是比“industryindustries”更简略的表达式。 (?pattern) 非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。如“Windows(?9598NT2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。 (?!pattern) 非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。如“Windows(?!9598NT2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。 说明 要匹配某些特殊字符时,需在此特殊字符前面加上“”,如要匹配字符“^”、“$”、“()”、“[]”、“{}”、“.”、“?”、“+”、“”、“”,需使用“^”、“$”、“ (”、“)”、“ [”、“]”、“{”、“}”、“.”、“?”、“+”、“”、“”。