1 / 16
文档名称:

python的正则表达式re.doc

格式:doc   大小:88KB   页数:16页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

python的正则表达式re.doc

上传人:﹎多多Dad 2019/10/20 文件大小:88 KB

下载得到文件列表

python的正则表达式re.doc

文档介绍

文档介绍:的正则表达式延伸阅读:的内建函数和。此文是本系列的第三篇文章了,和之前一样,内容出自官方文档,但是会有自己的理解,并非单纯的翻译。所以,如果我理解有误,欢迎指正,谢谢。本模块提供了和里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是字符,这点不用担心,会处理地和字符一样漂亮。正则表达式使用反斜杆(\)来转义特殊字符,使其可以匹配字符本身,而不是指定其他特殊的含义。这可能会和字面意义上的字符串转义相冲突,这也许有些令人费解。比如,要匹配一个反斜杆本身,你也许要用'\\\\'来做为正则表达式的字符串,因为正则表达式要是\\,而字符串里,每个反斜杆都要写成\\。你也可以在字符串前加上这个前缀来避免部分疑惑,因为开头的字符串是字符串,所以里面的所有字符都不会被转义,比如'\'这个字符串就是一个反斜杆加上一字母,而'\'我们知道这是个换行符。因此,上面的'\\\\'你也可以写成'\\',这样,应该就好理解很多了。可以看下面这段:>>>>>>'\'就是反斜杆>>>\>>>('\\\\',)这样可以匹配<>>>>('\\',)这样也可以<>>>>('\\',)但是这样不行():"<>",,<>"",,(,)()"",,,:()>>>另外值得一提的是,模块的方法,大多也就是对象的方法,两者的区别在于执行效率。这个在最后再展开吧。正则表达式语法正则表达式()指定一个与之匹配的字符集合;本模块所提供的函数,将可以用来检查所给的字符串是否与指定的正则表达式匹配。正则表达式可以被连接,从而形成新的正则表达式;例如和都是正则表达式,那么也是正则表达式。一般地,如果字符串与匹配,与匹配的话,那么字符串也会与匹配,但或者里含有边界限定条件或者命名组操作的情况除外。也就是说,复杂的正则表达式可以用简单的连接而成。正则表达式可以包含特殊字符和普通字符,大部分字符比如'',''和''都是普通字符,如果做为正则表达式,它们将匹配它们本身。由于正则表达式可以连接,所以连接多个普通字符而成的正则表达式也将匹配''。(后面将用不带引号的表示正则表达式,带引号的表示字符串)下面就来介绍正则表达式的特殊字符:'.'点号,在普通模式,它匹配除换行符外的任意一个字符;如果指定了标记,匹配包括换行符以内的任意一个字符。'^'尖尖号,匹配一个字符串的开始,在模式下,也将匹配任意一个新行的开始。'$'美元符号,匹配一个字符串的结尾或者字符串最后面的换行符,在模式下,也匹配任意一行的行尾。也就是说,普通模式下,.$去搜索'\\'只会找到’′,但是在模式,还能找到‘′,而且就用一个$去搜索'\'的话,会找到两个空的匹配:一个是最后的换行符,一个是字符串的结尾,演示:>>>('(.$)','\\')['']>>>('(.$)','\\',)['','']>>>('($)','\')['','']'*'星号,指定将前面的重复次或者任意多次,而且总是试图尽量多次地匹配。''加号,指定将前面的重复次或者任意多次,而且总是试图尽量多次地匹配。'?'问号,指定将前面的重复次或者次,如果有的话,也尽量匹配次。*?,?,??从前面的描述可以看到'*',''和'?'都是贪婪的,但这也许并不是我们说要的,所以,可以在后面加个问号,将策略改为非贪婪,只匹配尽量少的。示例,体会两者的区别:>>>('<(.*)>','<><>')['><']>>>('<(.*?)>','<><>')['','']{}是一个数字,指定将前面的重复次。{}和都是数字,指定将前面的重复到次,例如{}匹配到个连续的。注意,如果省略,将匹配到个前面的;如果省略,将匹配到无穷多个前面的;当然中间的逗号是不能省略的,不然就变成前面那种形式了。{}?前面说的{},也是贪婪的,{}如果有个以上连续的话,会匹配个,这个也可以通过加问号改变。{}?如果可能的话,将只匹配个。'\'反斜杆,转义'*','?'等特殊字符,或者指定一个特殊序列(下面会详述)由于之前所述的原因,强烈建议用字符串来表述正则。[]方括号,用于指定一个字符的集合。可以单独列出字符,也可以用''连接起止字符以表示一个范围。特殊字符在中括号里将失效,比如[$]就表示字符'','','',或'$',在这里$也变身为普通字符了。[]匹配任意一个小写字母,[]匹配任意一个字母或数字。如果你要匹配']'或''本身,你需要加反斜杆转义,或者是将其置于中括号的最前面,比如[]]可以匹配']'你还可以对一个字符集合取反,以匹配任意不在这个字符集合里的字符,取反操作用一个'^'放在集合的最前面表示,放在其他地方的'^'将不会起特殊作用。例如[^]将匹配任意不是''的字符;[^^]将匹配任意不是'^'的字符。注意:在中括号里,、*、(、)这类字符将会失去特殊含义,仅作为普通字符。