学习c#的第十六天
最佳答案 问答题库768位专家为你答疑解惑
目录
C# 正则表达式
定义正则表达式
字符转义
字符类
定位点
分组构造
Lookaround 概览
数量词
反向引用构造
替换构造
替代
正则表达式选项
其他构造
Regex 类
代码示例
实例 1
实例 2
实例 3
C# 正则表达式
正则表达式 是一种匹配输入文本的模式。.Net 框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成。如果你还不理解正则表达式可以阅读官方文档或者看完这篇文章。
定义正则表达式
字符转义
正则表达式中的反斜杠字符 (\) 指示其后跟的字符是特殊字符(如下表所示),或应按原义解释该字符。 有关详细信息,请参阅字符转义。
字符类
字符类与一组字符中的任何一个字符匹配。 字符类包括下表中列出的语言元素。 有关更多信息,请参见 字符类。
若要匹配原意句点字符(. 或 \u002E),您必须在该字符前面加上转义符 (\.)。a.e"have" 中的 "ave", "mate" 中的 "ate"\p{ name }与 name 指定的 Unicode 通用类别或命名块中的任何单个字符匹配。\p{Lu}"City Lights" 中的 "C" 和 "L"\P{ name }与不在 name 指定的 Unicode 通用类别或命名块中的任何单个字符匹配。\P{Lu}"City" 中的 "i"、 "t" 和 "y"\w与任何单词字符匹配。\w"Room#1" 中的 "R"、 "o"、 "m" 和 "1"\W与任何非单词字符匹配。\W"Room#1" 中的 "#"\s与任何空白字符匹配。\w\s"ID A1.3" 中的 "D "\S与任何非空白字符匹配。\s\S"int __ctr" 中的 " _"\d与任何十进制数字匹配。\d"4 = IV" 中的 "4"\D匹配不是十进制数的任意字符。\D"4 = IV" 中的 " "、 "="、 " "、 "I" 和 "V"
定位点
定位点或原子零宽度断言会使匹配成功或失败,具体取决于字符串中的当前位置,但它们不会使引擎在字符串中前进或使用字符。 下表中列出的元字符是定位点。 有关详细信息,请参阅 定位点。
分组构造
分组构造描述了正则表达式的子表达式,通常用于捕获输入字符串的子字符串。 分组构造包括下表中列出的语言元素。 有关详细信息,请参阅 分组构造。
Lookaround 概览
当正则表达式引擎命中 Lookaround 表达式时,其需要一个子字符串从当前位置到达原始字符串的开始(后行)或结束(先行),然后使用 Lookaround 模式在该子字符串上运行 Regex.IsMatch。 然后,根据此子表达式的结果是正断言还是负断言,可判断其结果是否成功。
(?=check)
正预测先行断言字符串中紧随当前位置之后的内容是 "check"(?<=check)
正预测后行断言字符串中紧随当前位置之前的内容是 "check"(?!check)
负预测先行断言字符串中紧随当前位置之后的内容并非 "check"(?<!check)
负预测后行断言字符串中紧随当前位置之前的内容并非 "check"
结果匹配后,不会再次重新计算原子组,即使该模式的其余部分由于匹配而失败。 当限定符出现在原子组内或模式的其余部分时,可显著提高性能。
数量词
限定符指定在输入字符串中必须存在上一个元素(可以是字符、组或字符类)的多少个实例才能出现匹配项。 限定符包括下表中列出的语言元素。 有关更多信息,请参见 数量词。
反向引用构造
反向引用允许在同一正则表达式中随后标识以前匹配的子表达式。 下表列出了 .NET 正则表达式支持的反向引用构造。 有关详细信息,请参阅 反向引用构造。
替换构造
替换构造用于修改正则表达式以启用 either/or 匹配。 这些构造包括下表中列出的语言元素。 有关详细信息,请参阅 替换构造。
|
匹配以竖线 (|
) 字符分隔的任何一个元素。th(e|is|at)
"this is the day."
中的 "the"
和 "this"
(?(
expression)
yes|
no)
或
(?(
expression)
yes)
如果由 expression指定的正则表达式模式匹配,则匹配 yes ;否则,匹配可的 no 部分。 expression 解释为零宽度的断言。为了避免已命名或已编号的捕获组出现歧义,可选择使用显式断言,如下所示:
(?( (?=
expression) )
yes|
no)
(?(A)A\d{2}\b|\b\d{3}\b)
"A10 C103 910"
中的 "A10"
和 "910"
(?(
name)
yes|
no)
或
(?(
name)
yes)
如果 name (已命名或已编号的捕获组)具有匹项,则匹配 yes;否则,匹配可的 no。(?<quoted>")?(?(quoted).+?"|\S+\s)
"Dogs.jpg \"Yiska playing.jpg\""
中的 "Dogs.jpg "
和 "\"Yiska playing.jpg\""
替代
替换是替换模式中支持的正则表达式语言元素。 有关更多信息,请参见 替代。 下表中列出的元字符是原子零宽度断言。
正则表达式选项
可以指定控制正则表达式引擎如何解释正则表达式模式的选项。 其中的许多选项可以指定为内联(在正则表达式模式中)或指定为一个或多个 RegexOptions 常量。 本快速参考仅列出内联选项。 有关内联和 RegexOptions 选项的详细信息,请参阅文章 正则表达式选项。
可通过两种方式指定内联选项:
- 通过使用其他构造(?imnsx-imnsx),可用选项或选项组前的减号 (-) 关闭这些选项。 例如, (?i-mn) 启用不区分大小写的匹配 (i),关闭多行模式 (m) 并关闭未命名的组捕获 (n)。 该选项自定义选项的点开始应用于此正则表达式,且持续有效直到模式结束或者到另一构造反转此选项的点。
- 通过使用 分组构造(?imnsx-imnsx:子表达式)(只定义指定组的选项)。
.NET 正则表达式引擎支持以下内联选项:
i
使用不区分大小写的匹配。\b(?i)a(?-i)a\w+\b
"aardvark AAAuto aaaAuto Adam breakfast"
中的 "aardvark"
和 "aaaAuto"
m
使用多行模式。 ^
和 $
匹配行的开头和结尾,但不匹配字符串的开头和结尾。有关示例,请参阅 正则表达式选项中的"多行模式"部分。n
不捕获未命名的组。有关示例,请参阅 正则表达式选项中的"仅显式捕获"部分。s
使用单行模式。有关示例,请参阅 正则表达式选项中的"单行模式"部分。x
忽略正则表达式模式中的非转义空白。\b(?x) \d+ \s \w+
"1 aardvark 2 cats IV centurions"
中的 "1 aardvark"
和 "2 cats"
其他构造
其他构造可修改某个正则表达式模式或提供有关该模式的信息。 下表列出了 .NET 支持的其他构造。 有关详细信息,请参阅 其他构造。
Regex 类
Regex 类用于表示一个正则表达式。
下表列出了 Regex 类中一些常用的方法:
指示 Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项。2public bool IsMatch( string input, int startat )
指示 Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项,从字符串中指定的开始位置开始。3public static bool IsMatch( string input, string pattern )
指示指定的正则表达式是否在指定的输入字符串中找到匹配项。4public MatchCollection Matches( string input )
在指定的输入字符串中搜索正则表达式的所有匹配项。5public string Replace( string input, string replacement )
在指定的输入字符串中,把所有匹配正则表达式模式的所有匹配的字符串替换为指定的替换字符串。6public string[] Split( string input )
把输入字符串分割为子字符串数组,根据在 Regex 构造函数中指定的正则表达式模式定义的位置进行分割。
如需了解 Regex 类的完整的属性列表,请参阅微软的 C# 文档。
代码示例
实例 1
下面的实例用于判断手机号是否以152开头,并以0123结尾:
using System;
using System.Text.RegularExpressions;class Program
{static void Main(){Console.WriteLine("请输入手机号码:");string phoneNumber = Console.ReadLine();bool isMatch = IsPhoneNumberValid(phoneNumber);if (isMatch){Console.WriteLine("手机号符合要求");}else{Console.WriteLine("手机号不符合要求");}}static bool IsPhoneNumberValid(string phoneNumber){Regex regex = new Regex(@"^152\d{4}0123$");return regex.IsMatch(phoneNumber);}
}
在上述代码中,我们使用Console.ReadLine()来读取用户在控制台中输入的手机号码。然后,我们调用IsPhoneNumberValid()函数来判断输入的手机号是否符合要求,并根据结果输出相应的信息。
实例 2
下面的实例替换掉多余的空格:
using System;
using System.Text.RegularExpressions;namespace RegExApplication
{class Program{static void Main(string[] args){string input = "Hello World ";string pattern = @"[\s\u00A0]+";string replacement = " ";Regex rgx = new Regex(pattern);string result = rgx.Replace(input, replacement);Console.WriteLine("原始字符串: {0}", input);Console.WriteLine("替换字符串: {0}", result);Console.ReadKey();}}
}
实例 3
下面的实例匹配了以 'm' 开头以 'e' 结尾的单词:
using System;
using System.Text.RegularExpressions;namespace RegExApplication
{class Program{static void Main(string[] args){Console.WriteLine("请输入英语句子:");string input = Console.ReadLine();string pattern = @"\bm[a-zA-Z]*e\b";Regex rgx = new Regex(pattern);MatchCollection matches = rgx.Matches(input);Console.WriteLine("匹配结果:");foreach (Match match in matches){Console.WriteLine(match.Value);}Console.ReadKey();}}
}
这段代码会在输入字符串中查找以'm'开头以'e'结尾的单词,并输出所有匹配的结果。
99%的人还看了
相似问题
猜你感兴趣
版权申明
本文"学习c#的第十六天":http://eshow365.cn/6-40811-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!