1 / 11
文档名称:

正则表达式入门 使用.ppt

格式:ppt   大小:209KB   页数:11页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

正则表达式入门 使用.ppt

上传人:zhoubingchina1 2018/8/19 文件大小:209 KB

下载得到文件列表

正则表达式入门 使用.ppt

相关文档

文档介绍

文档介绍:正则表达式入门
正则表达式是什么?
简言之,正则表达式就是记录文本规则的代码。
和通配符类似(*.doc),正则表达式也是用来进行文本匹配的工具,只不过比起通配符,它能更精确地描述你的需求、更复杂。
元字符

代码
说明
.
匹配除换行符以外的任意字符
\w
匹配字母或数字或下划线或汉字
\s
匹配任意的空白符
\d
匹配数字
\b
匹配单词的开始或结束
^
匹配字符串的开始
$
匹配字符串的结束
比如一个网站如果要求你填写的QQ号必须为5位到12位数字时,可以使用:^\d{5,12}$。
字符转义
如何查找元字符本身(比如你查找. 或者*,就出现了问题:你没办法指定它们,因为它们会被解释成别的意思。)?
答:使用字符转义
如何让字符转义?
答:使用\来取消这些字符的特殊意义。
例如,使用\.和\*代表. 和* 。要查找\本身,得用\\。
例如:deerchao\.,C:\\Windows匹配C:\Windows。
重复

代码/语法
说明
*
重复零次或更多次
+
重复一次或更多次
?
重复零次或一次
{n}
重复n次
{n,}
重复n次或更多次
{n,m}
重复n到m次
下面是一些使用重复的例子:
Windows\d+匹配Windows后面跟1个或更多数字
.{1,100}匹配1到100个字符。
字符类
如果不想匹配任意的字母,只想匹配a,e,i,o,u,怎么办?
答:使用[ ]来匹配预定义元字符没有定义的字符集合。[ ]中的内容只选其一。
[aeiou]匹配元音字母(a,e,i,o,u)。
[.?!]匹配标点符号(.或?或!)。
[0-9]代表的含意与\d完全一致:一位数字;
[a-z0-9A-Z_]也完全等同于\w(如果只考虑英文的话)。
分组
.*匹配任意字符串,如何表示指定子表达式的重复次数?
答:使用分组即(), (”和“)”也是元字符。
例如: (\d{1,3}\.){3}\d{1,3}是一个简单的IP地址匹配表达式。
要理解这个表达式,请按下列顺序分析它:\d{1,3}匹配1到3位的数字,(\d{1,3}\.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次,最后再加上一个一到三位的数字(\d{1,3})。
不幸的是,。如果能使用算术比较的话,或许能简单地解决这个问题,但是正则表达式中并不提供关于数学的任何功能,所以只能使用冗长的分组,选择,字符类来描述一个正确的IP地址:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)。
理解这个表达式的关键是理解2[0-4]\d|25[0-5]|[01]?\d\d?,这里我就不细说了,你自己应该能分析得出来它的意义。
分枝条件
下面是一个更复杂的表达式:\(?0\d{2}[) -]?\d{8}。
这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。我们对它进行一些分析吧:首先是一个转义字符\(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\d{2}),然后是)或-或空格中的一个,它出现1次或不出现(?),最后是8个数字(\d{8})。
不幸的是,刚才那个表达式也能匹配010)12345678或(022-87654321这样的“不正确”的格式。要解决这个问题,我们需要用到分枝条件。正则表达式里的分枝条件指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,具体方法是用|把不同的规则分隔开。
例子:0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)。
反义
有时需要查找不属于某个能简单定义的字符类的字符。比如想查找除了数字以外,其它任意字符都行的情况,这时需要用到反义:

代码/语法
说明
\W
匹配任意不是字母,数字,下划线,汉字的字符
\S
匹配任意不是空白符的字符
\D
匹配任意非数字的字符
\B
匹配不是单词开头或结束的位置
[^x]
匹配除了x以外的任意字符
[^aeiou]
匹配除了aeiou这几个字母以外的任意字符
例子:\S+匹配不包含空白符的字符串。
<a[^>]+>匹配用尖括号括起来的以a开头的字符串,这个字符串中间不能有>。
读懂正则表达式的方法
找最外层的分