1 / 8
文档名称:

初识正则表达式.docx

格式:docx   页数:8页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

初识正则表达式.docx

上传人:zhangbing32159 2015/6/19 文件大小:0 KB

下载得到文件列表

初识正则表达式.docx

相关文档

文档介绍

文档介绍:正则表达式是个什么东东?
正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE)。在很多文本编辑器里、命令中,通常要使用检索、替换、放行和拒绝那些符合某个模式的文本。而正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
摘自《正则表达式之道》)
正则表达式 由一些普通字符和一些元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义,我们下面会给予解释。
在最简单的情况下,一个正则表达式看上去就是一个普通的查找串。例如,正则表达式"testing"中没有包含任何元字符,它可以匹配"testing"和"testing123"等字符串,但是不能匹配"Testing"。
要想真正的用好正则表达式,正确的理解元字符是最重要的事情。下表列出了所有的元字符和对它们的一个简短的描述。元字符是工具,组合起来就是方式,普通字符是目标。目标有一个方式有多种。
正则表达式分类标准正则表达式和扩展正则表达式;主要的区别是在于一些元字符的书写方式和支持上,没有根本的区别。
元字符
描述
字符匹配
.(点)
一个任意字符,回车符换行符除外
[ ]
匹配所包含的任意一个字符
[^xyz]
负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。
[a-z]
字符范围。匹配指定范围内的任意字符。例如,“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。
注意:只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围; 如果出字符组的开头,则只能表示连字符本身.
[^a-z]
^表示取反;匹配不在指定范围内的任意一个字符。例如,[^a-z]可以匹配任何不在“a”到“z”范围内的任意字符。
[:space:]
一个空白字符
[:punct:]
一个(所有)标点符号
[:lower:]
一个小写字母[a-z] 不能写成[z-a]
[:upper:]
一个大写字母[A-Z]
[:digit:]
一个数字[0-9]
[:alnum:]
一个数字和字母[A-Z0-9a-z]
[:alpha:]
一个大小写字母[a-zA-Z]
位置锚定
^
匹配输入字符串的开始位置。行首写在左侧
$
匹配输入字符串的结束位置。写在行尾
\b
匹配一个单词边界,\bhello\b 匹配单词hello
\B
匹配非单词边界。\bhe\B.*\w\b 同样能匹配hello 也能匹配he_llo
\< \>
匹配词(word)的开始(\<)和结束(\>)。\<hello\>
重叠次数
*
匹配前面的子表达式、字符零次或多次(大于等于0次)。\w*
+
匹配前面的子表达式一次或多次(大于等于1次)
?
匹配前面的子表达式零次或一次。(基本表达式需要转意\)
{n}
前面字符匹配n次。'h\{3\}' hhhhhhhhhhello hhhhhhhe (基本表达式需要转意\)
{n,}
至少匹配n次,至多不管啊(基本表达式需要转意\)
{n,m}
其中n<=m。最少匹配n次且最多

最近更新