1 / 33
文档名称:

正则表达式.ppt

格式:ppt   大小:720KB   页数:33页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

正则表达式.ppt

上传人:分享精品 2017/7/23 文件大小:720 KB

下载得到文件列表

正则表达式.ppt

相关文档

文档介绍

文档介绍:回顾
字符串的定义都有哪三种方式,简单区别?
常用的字符串的输出函数都有哪些?
常用的字符串的格式化函数都有哪些?
预习检查
使用正则表达式可以实现字符串的哪些操作?
正则表达式中的元字符都有哪些?
与Perl兼容的正则表达式都有哪些操作函数?
本章任务
1. 正则表达式简介
2. 正则表达式的语法规则
3. 与Perl兼容的正则表达式函数
1、正则表达式介绍
定义:正则表达式是用于描述字符排列和匹配模式的一种语法规则。
作用:它主要用于字符串的模式分割、匹配、查找及替换操作。
PHP中,正则表达式有三个作用:
匹配:也常常用于从字符串查找信息
替换:用新文本替换匹配文本
分割:将一个字符串分割为一组更小的信息块
【了解】PHP中有两套正则表达式函数库,两者功能相似,只是执行效率略有差异:
1、一套由PCRE库提供的,使用“preg_”为前缀命名的函数;
2、一套由POSIX扩展提供的,使用以“ereg_”为前缀命名的函数;
【了解】如下:
1、PCRE来源于Perl语言,而Perl是对字符串操作功能最强大的语言之一,PHP的最初版本就是由Perl开发的产品;
2、PCRE语法支持更多特性,比POSIX语法更强大。
1、两种正则表达式函数库
2、正则表达式的语法规则
定界符
原子
元字符
模式修正符
2、Perl兼容正则表达式
正则表达式是一个字符串匹配的模版,包括3部分:
1、原子:普通字符,例如字符a到zA-Z0-9;
2、特殊字符:元字符,例如*、+和?等;
3、模式修正符。
注意:一个最简单正则表达式至少包含一个原子
示例:将下面的正则表达式拆分如下
'/<a.*?(?:|\\t|\\r|\\n)?href=[\"]?(.+?)[\"]?(?:(?:|\\t|\\r|\\n)+.*?)?>(.+?)<\/a.*?>/sim'
1、定界符:两个斜线”/”
2、转义字符:原子用到了< a href = ‘“/ >等普通字符和\t \r \n等转义字符
3、特殊字符:元字符使用了[] () | . ? * + 等具有特殊含义的字符
4、模式修正符:模式修正符是在定界符最后一个斜线之后的三个字符: s i m
、定界符
Perl兼容的正则表达式:通常都需要将表达式放入定界符之间
常用定界符:
1、语法:常使用正斜线“/”,如“/apple/”;
2、用法:用户只要把需要匹配的模式内容放入定界符之间即可;
3、说明了解:作为定界的字符也不仅仅局限于“/”,除了字母、数字和斜线“\”以外的任何字符都可以作为定界符,像# | !
示例:
/<\/\w+>/ 使用反斜线作为定界符合法
|(\d{3})-\d+|Sm 使用竖线”|”作为定界符合法
!^(?i)php[34]! 使用竖线”!”作为定界符合法
{^\s+(\s+)?$} 使用竖线”}”作为定界符合法
、原子
原子是正则表达式的最基本的组成单元,具体分为5类:
1. 普通字符作为原子: 如 a~z、A~Z、0~9 等
2. 一些特殊字符和转义后元字符作为原子:
所有标点符号,但语句特殊意义的符号需要转义后才可作为原子,如:\”\’\* \+ \? \. 等
3. 一些非打印字符作为原子: 如:\f \n \r \t \v \cx
4. 使用“通用字符类型”作为原子:如:\d \D \w \W \s \S。
5. 自定义原子表([])作为原子:如:’/[apj]sp/’