一起学习网 一起学习网


正则表达式匹配不包含某些字符串的技巧

网络编程 正则表达式匹配不包含某些字符串的技巧 06-21

经常我们会遇到想找出不包含某个字符串的文本,程序员最容易想到的是在正则表达式里使用,^(hede)来过滤”hede”字串,但这种写法是错误的。我们可以这样写:[^hede],但这样的正则表达式完全是另外一个意思,它的意思是字符串里不能包含‘h',‘e',‘d'三个但字符。那什么样的正则表达式能过滤出不包含完整“hello”字串的信息呢?

事实上,说正则表达式里不支持逆向匹配并不是百分之百的正确。就像这个问题,我们就可以使用否定式查找来模拟出逆向匹配,从而解决我们的问题:

^((?!hede).)*$

上面这个表达式就能过滤出不包含‘hede'字串的信息。我上面也说了,这种写法并不是正则表达式“擅长”的用法,但它是可以这样用的。

解释

一个字符串是由n个字符组成的。在每个字符之前和之后,都有一个空字符。这样,一个由n个字符组成的字符串就有n+1个空字符串。我们来看一下“ABhedeCD”这个字符串:

查看图片

所有的e编号的位置都是空字符。表达式(?!hede).会往前查找,看看前面是不是没有“hede”字串,如果没有(是其它字符),那么.(点号)就会匹配这些其它字符。这种正则表达式的“查找”也叫做“zero-width-assertions”(零宽度断言),因为它不会捕获任何的字符,只是判断。

在上面的例子里,每个空字符都会检查其前面的字符串是否不是‘hede',如果不是,这.(点号)就是匹配捕捉这个字符。表达式(?!hede).只执行一次,所以,我们将这个表达式用括号包裹成组(group),然后用*(星号)修饰——匹配0次或多次:

((?!hede).)*。

你可以理解,正则表达式((?!hede).)*匹配字符串"ABhedeCD"的结果false,因为在e3位置,(?!hede)匹配不合格,它之前有"hede"字符串,也就是包含了指定的字符串。

在正则表达式里, ?! 是否定式向前查找,它帮我们解决了字符串“不包含”匹配的问题。

匹配form表单中所有内容的正则表达式
需求是这样子的:现在有一个表单formaction='mk.php'......./form表单里面的省略号代表里面的内容,里面有各式各样的标签。想写一个正则表达式匹配整个form

正则表达式(括号)、[中括号]、{大括号}的区别小结
正则表达式的()[]{}有不同的意思。()是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串。(s*)表示连续空格的字符串。[]是定义匹

正则表达式中的"g"是什么意思附件参数g的用法
为了解答正则表达式(/[^0-9]/g,'')中的"/g"是什么意思?这个问题,也为了能够便于大家对正则表达式有一个更为综合和深刻的认识,我将一些关键点和容


编辑:一起学习网

标签:字符串,字符,正则表达式,表达式,括号