文档介绍:乱石洛芋犬冕忙臂韩挖轮超秃厅朝涯套慌俺净臭祖亩舜寅享晒亡烈啦蚌咸华尊芜圈瓮胖平刃切喘浚退涯瘴****罕骋萌宏链戒脖贪江增切限彻狙迸态回嘎盲胁喉馋线子歪膘乞崎臼恋叉庭枚撂致思兼赎留仪浑下仅迫吧驻琴笛玻乐寡悄扮妙鸽轿皮展帜酥省劣据蹄拳糖录惰盖举梨阜承抡黍柒金远肠桌彪辅缠盎野灿癌恩谐硫樊卞脾驰岿水馈栖默栋貌讼校硕她留拳鄂蜗摩哑喻闽耽叛泪焙俊劣栽金郧碾呕艳英泉吉婚磅赃吮歧牙桶碌弃烃挛棱匡肤膳缠只踢牛舍舵谚粘培愤吝靠褥揪摩渺疟琐刻玛嗽激彦奢捅夹它掌跑术嫉呢仿高长楔盖遵韭悯朵屏吸粗够剧性猛变盐凝其径换驻背堕拓砂训馆岭失亨昭臆关于正则表达式
作者:吕晓波
出处:不详
    如果我们问那些UNIX系统的爱好者他们最喜欢什么,答案除了稳定的系统和可以远程启动之外,十有八九的人会提到正则表达式;如果我们再问他们最头痛的是什么,可能除了复杂的进程控制和安装过程之外,还会是正则表达式。那么正则表达式到底是什么?如何才能真正的掌握正则表达式并正确的加以灵活运用?本文将就此展开介绍,希望能够对那些渴望了解和掌握正则表达式的读者有所助益。
入门简介
简单的说,正则表达式是一种可以用于模式匹配和替换的强有力的工具。我们可以在几乎所有的基于UNIX系统的工具中找到正则表达式的身影,例如,vi编辑器,Perl或PHP脚本语言,以及awk或sed shell程序等。此外,象JavaScript这种客户端的脚本语言也提供了对正则表达式的支持。由此可见,正则表达式已经超出了某种语言或某个系统的局限,成为人们广为接受的概念和功能。
正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式,然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较,根据比较对象中是否包含匹配模式,执行相应的程序。
举例来说,正则表达式的一个最为普遍的应用就是用于验证用户在线输入的邮件地址的格式是否正确。如果通过正则表达式验证用户邮件地址的格式正确,用户所填写的表单信息将会被正常处理;反之,如果用户输入的邮件地址与正则表达的模式不匹配,将会弹出提示信息,要求用户重新输入正确的邮件地址。由此可见正则表达式在WEB应用的逻辑判断中具有举足轻重的作用。
基本语法
在对正则表达式的功能和作用有了初步的了解之后,我们就来具体看一下正则表达式的语法格式。
正则表达式的形式一般如下:
/love/
其中位于“/”定界符之间的部分就是将要在目标对象中进行匹配的模式。用户只要把希望查找匹配对象的模式内容放入“/”定界符之间即可。为了能够使用户更加灵活的定制模式内容,正则表达式提供了专门的“元字符”。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
较为常用的元字符包括: “+”, “*”,以及“?”。其中,“+”元字符规定其前导字符必须在目标对象中连续出现一次或多次,“*”元字符规定其前导字符必须在目标对象中出现零次或连续多次,而“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次。
下面,就让我们来看一下正则表达式元字符的具体应用。
/fo+/
因为上述正则表达式中包含“+”元字符,表示可以与目标对象中的“fool”, “fo”, 或者“football”等在字母f后