正则表达式的3种匹配模式
正则表达式是处理字符串的常用工具。在C#中,我们一般使用Regex类来表示一个正则表达式。一般正则表达式引擎支持以下3种匹配模式:单行模式(Singleline)、多行模式(Multiline)与忽略大小写(IgnoreCase)。
1. 单行模式(Singleline) Console.WriteLine("Miatch!");
MSDN定义:更改点 (.) 的含义,使它与每一个字符匹配(而不是与除 \n 之外的每个字符匹配)。
使用单行模式的典型场景是获取网页源码中的信息。
示例:
我们使用WebBrowser控件,从http://www. 网站站点" rel="nofollow" />
Regex regex = new Regex(pattern);
if (regex.Iatch(str))
Console.WriteLine(regex.Match(str).Value);
else
//结果为:Miatch! 而我们从网站上获取的HTML源码,极少有不换行的。这时候单行模式派上用场了,它可以改变点符号的意义。修改regex实例的构造函数,用RegexOptions.Singleline来声明使用单行模式:
错误分析:
一般认为点符号(.)是匹配任意单个字符的,而(.*)就是匹配任意多个字符。但实际上点符号不能匹配换行符。在Windows中与它等效的表达式为[^\r\n]。
string pattern = @"<div>.*</div>"; Console.WriteLine("Miatch!");
Regex regex = new Regex(pattern, RegexOptions.Singleline);
if (regex.Iatch(str))
Console.WriteLine(regex.Match(str).Value);
else
/* */
结果为:
<div>
Line 1
Line 2
</div>
单行模式的嵌入修饰符: 注意:嵌入模式的优先级要高于Regex类的RegexOptions设置,所以使用了(?s)后,无论是否使用RegexOptions.Singleline,均按照单行模式解析。
我们可以直接在正则表达式中嵌入单行模式:
(?s)<div>.*</div>
(?s)修饰符说明,其后面的表达式采用单行模式。所以使用时请不要将它放在末尾。另外可以使用(?-s)关闭单行模式。
2. 多行模式(Multiline) 我们想找出一个使用英文字母开头的用户名,编写代码如下:
MSDN定义:更改 ^ 和 $ 的含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。
示例:
有一个文本文件,它的每一行是一个用户名,将文件读入变量str中进行处理。其内容如下:
二十四画生
TerryLee
莫相会
Dflying Chen
Rainy
借用博客园各位前辈的大名:)
string pattern = @"^[A-Za-z]+.*"; Console.WriteLine("Miatch!");
Regex regex = new Regex(pattern);
if (regex.Iatch(str))
Console.WriteLine(regex.Match(str).Value);
else
//结果为:Miatch! 更改代码如下:
错误分析:
(^)是字符串的起始锚定,str的个字符是一个中文字,所以匹配不上。我们就可以使用多行模式来改变(^)的含义,使它匹配每一行的起始,而不是整个字符串的起始。
string pattern = @"^[A-Za-z]+.*"; Console.WriteLine("Miatch!");
Regex regex = new Regex(pattern, RegexOptions.Multiline);
if (regex.Iatch(str))
Console.WriteLine(regex.Match(str).Value);
else
//结果为:TerryLee 多行模式的嵌入修饰符:(?m)与(?-m)
同时,多行模式也会改变($)的含义,使它匹配每一行的结尾,而不是整个字符串的结尾。
与(^)和($)不同的是,(\A)和(\Z)并不受多行模式的影响,永远匹配整个字符串的起始和结尾。
3. 忽略大小写(IgnoreCase) 示例:
MSDN定义:指定不区分大小写的匹配。
这个模式很容易理解,它认为大小写字符是相同的。我们仍以上例来说明。
string pattern = @"^[a-z]+.*"; Console.WriteLine("Miatch!");
Regex regex = new Regex(pattern, RegexOptions.Multiline | RegexOptions.IgnoreCase);
if (regex.Iatch(str))
Console.WriteLine(regex.Match(str).Value);
else
//结果为:TerryLee 忽略大小写的嵌入修饰符:(?i)与(?-i)
分析:请注意这次使用的正则表达式,我们并没有写入大写字母,但却匹配了以大写字母开头的名字,这就是忽略大小写的效果。
总结: 忽略大小写 指定不区分大小写的匹配。 IgnoreCase (?i)
我们用一个表格来总结一下这三个模式
定义 影响的表达式 RegexOptions枚举 嵌入标识符
单行模式 更改点 (.) 的含义,使它与每一个字符匹配(而不是与除 \n 之外的每个字符匹配)。 . Singleline (?s)
多行模式 更改 ^ 和 $ 的含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。 ^$ Multiline (?m)
- 随机文章
- 核心危机(核心危机魔石合成攻略)
- 风儿(风儿轻轻的吹)
- 饿了么红包怎么用(饿了么红包怎么用微信支付)
- 儿童教育文章(儿童教育)
- 光遇花手先祖位置(安卓光遇手花先祖)
- 抖音卡(抖音卡顿怎么解决)
- xboxones(xboxone手柄怎么配对主机)
- 兵马俑(兵马俑介绍和历史背景)
- 帆船比赛(帆船比赛视频)
- 海猫鸣泣之时游戏(海猫鸣泣之时游戏在哪玩)
- 韩国媳妇和小雪(韩国媳妇和小雪的父亲工资是多少)
- 儋州市第二中学(儋州市第二中学录取分数线)
- 鬼泣5攻略(鬼泣5攻略第三关怎么跳)
- 地球日主题(2020年世界地球日主题)
- 和柳亚子(和柳亚子先生于田)
- 冰客(冰客果汁)
- yy魔兽(yy魔兽世界)
- 充值卡代理(充值卡代理加盟)
- 拆奶罩
- 郭妮小说(恶魔的法则郭妮小说)
- 东天目山(东天目山景区)
- 杭同(杭同培训中心怎么样)
- 蝙蝠给人类的一封信(蝙蝠给人类的一封信)
- 大松电饭煲(美的大松电饭煲)
- 疯狂填字(疯狂填字5)
- 点对点短信息(点对点短信息费是什么意思)
- 观音普门品(观音普门品念诵全文)
- 河北省大运会(河北省大运会时间)
- 哈利波特官网(哈利波特官网在哪里)
- 骇客神条(骇客神条怎么辨别真假)
