一、贪婪与非贪婪
什么叫贪婪,比如说要从字符串中面包一面包二吃面包,本来你只可以吃面包一,可是你贪心,于是就把第一个到最后一个里面的两个面包取出来了,你想多吃点,非贪婪也就是你不贪吃了,就只吃面包一。
我们来看看正则里面是怎么贪婪的
面包一面包二'; preg_match('/(.*)<\/td>/',$str,$res); print_r($res);
结果:
array
(
[0] => 面包一面包二
[1] => 面包一面包二
)
0记录的是整个字符,1表示的是第一次匹配。
怎么来限制贪婪?
面包一面包二'; preg_match('/(.*?)<\/td>/',$str,$res); print_r($res); array ( [0] => 面包一 [1] => 面包一 )
在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配。
在php中还可以通过修饰符来实现,
面包一面包二'; preg_match('/(.*)<\/td>/u',$str,$res); print_r($res);
结果和上面一样。这就是修饰符u的作用
二、预搜索
预搜索是一个非获取匹配,不进行存储供以后使用。
1、正向预搜索 "(?=xxxxx)","(?!xxxxx)"
"(?=xxxxx)”:所在缝隙的右侧,必须能够匹配上 xxxxx 这部分的表达式,
结果:
array
(
[0] => windows
)这个是xp前面的windows,不会取nt和2003前面的。
格式:"(?!xxxxx)",所在缝隙的右侧,必须不能匹配 xxxxx 这部分表达式
结果:
array
(
[0] => array
(
[0] => windows 这个是nt前面的
[1] => windows 这个是2003前面的
))
从这里可以看出,预搜索不进行存储供以后使用。
与会存储的对比下。
结果:
array
(
[0] => array 全部模式匹配的数组(
[0] => windows n
[1] => windows 2
)[1] => array 子模式所匹配的字符串组成的数组,通过存储取得。
(
[0] => n
[1] => 2
))
2、反向预搜索 "(?<=xxxxx)","(?
"(?<=xxxxx)" :所在缝隙的 "左侧”能够匹配xxxxx部分。
结果:
array
(
[0] => 56789012
)匹配除了前4个数字和后4个数字之外的中间8个数字
"(?结果:
array
(
[0] => 234567890123456
)
三、preg和ereg的区别
php同时使用两套正则表达式规则,一套是由电气和电子工程师协会(ieee)制定的posix extended 1003.2兼容正则(事实上php对此标准的支持并不完善),另一套来自pcre(perl compatible regular expression)库提供perl兼容正则。 php5.3开始posix被删除了。preg_match 比 ereg效率高。