1 / 8
文档名称:

正则表达式 regex.doc

格式:doc   大小:141KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

正则表达式 regex.doc

上传人:zbfc1172 2018/6/1 文件大小:141 KB

下载得到文件列表

正则表达式 regex.doc

文档介绍

文档介绍:正则表达式
相信大家都有在电脑上查找某个文件的经历,例如需要把C盘中的所有Word文档给找出来,很简单,只需要按“Ctrl+F”快捷键,调出系统的搜索窗口,然后在文件名窗口输入“*.doc”,单击“搜索”按钮后Windows就会找到所有的Word文档。如果改变搜索目标,改为“w*.doc”,那么Windows就会找出所有以字母w开头的Word文档。
为什么Windows知道我们要找的是Word文档?为什么它会把所有的Word文档都找出来?秘密就是“*.doc”。这里的*是通配符,表示文件名不限,。可见,就是这样一个描述了查询目标特征的字符串,让系统了解了我们的查询目标。
正则表达式也类似一个字符串,它描述了目标字符串的特征。正则表达式引擎正是使用这种特征,实现了在一在堆的字符串中查找或者替换我们符合要求的字符串。先来看一个简单的正则表达式:“hi”,使用这个正则表达式可以在“aabbhibbaahiaa”中将两个“hi”字符串给找出来,.NET还提供了一些非常复杂的类来识别字符串,或从长字符串中提取满足某些复杂条件的子字符串。例如,找出字符串中重复出现的某个字符或一组字符,或者找出以s开头、且至少包含一个n的所有单词,或者找出遵循雇员ID或社会安全号码约定的字符串。虽然可以使用String类,编写方法来执行这类处理,但这类方法编写起来比较繁琐,,. RegularExpressions专门用于执行这类处理。
正则表达式在很多领域都得到了广泛的应用,例如:
在B/S应用程序前端表达验证中,我们使用正则表达式来验证诸如电子邮件、网址、日期等的格式是否正确,以及用户名、密码的合法性等。
在网络爬虫应用程序中,可以使用正则表达式来分析网页的源代码HTML,找出其中的URL等有用信息。
在文本/代码编辑器应用程序中,可以使用正则表达式来查找某个特定的字符,甚至可以将之替换为别的特定字符串。
正则表达式的语法
很多语言都提供了对于正则表达工的支持,C#自然也不例外。使用正则表达式处理文本或字符串至少要有两个输入项,然后正则表达式引擎才可以根据这两个输入来输入来输出结果。这两个输入如下。
使用正则表达式语法编写的模式字符串。
正则表达式有其独待的语法定义,虽然很多语言都支持正则表达式,但其语法不尽相同,C#中支持的正则表达式语法和Perl5中的语法相兼容,而且还添加了一些其他特性,诸如从右到左匹配。
需要分析的文本或者字符串。
第二项不需多说,关键在于第一个输入项。要编写一个模式字符串,就需要十分地熟悉正则表达式语法,这也是本节的目标。由于正则表达式的内容实在太多,因此这里挑选了一些比较重要的,或者比较常用的部分语法进行介绍。
正则表达式的语法内容主要分成如下几个部分:字符转义、定位点、字符类、限定类、分构造以及替换构造。
字符转义
这里的转意字符主要是指当一个反斜杠(\)和某些字符放在一起时代表一些特殊含义,主要包括以下两种情况
其后的字符是一个特殊字符。例如:\b指示正则表达式匹配应在单词边界上开始的定位点,\t表示一个制表符,而\x020表示空格。
按某些字符的愿意解释,避免