首页前端开发其他前端知识正则表达式不包含属性

正则表达式不包含属性

时间2024-02-01 13:53:02发布访客分类其他前端知识浏览502
导读:收集整理的这篇文章主要介绍了正则表达式不包含属性,觉得挺不错的,现在分享给大家,也给大家做个参考。 找出所有img标签的,没有带说明属性alt的标签: 正则:<img(?![^&l...
收集整理的这篇文章主要介绍了正则表达式不包含属性,觉得挺不错的,现在分享给大家,也给大家做个参考。 找出所有img标签的,没有带说明属性alt的标签:

正则:img(?![^> ]*?alt[^> ]*?> ).*?>
例子:img src="" alt="">  img src="" >   img src="" tITle="">   img src="" id="">   img src=""  title="" alt="">


扩展,如果要找没有带title属性的a应该是:

正则:a(?![^> ]*?title[^> ]*?> ).*?>
例子:a src="" alt="">  a src="" >   a src="" title="">   a src="" id="">   a src=""  title="" alt="">
用正则表达式找出不包含连续字符串abc的单词

[^abc]表示不包含a、b、c中任意字符, 我想实现不包含字符串abc应该如何写表达式?

就我自己而言,这个问题最简单的解决方法是使用编程语言的配合,找出那些包含abc的,剩下的就是不包含的了——懒人的风格。但我写的是教程,读者未必都有编程的基础,有些只是使用一些工具从txt文档中抽取出一些信息,所以要回答还是必须完全通过正则表达式来完成。

于是打开了Regextester,开始试验,先是试了使用((?'test'abc)|.)*(?(test)(?!))(含意是:查找abc,或任意的字符,如果找到了abc,就把它存入命名为test的组里,到最后检查test组里是否有内容,如果有就匹配失败,相关说明见教程),结果是"abc","aabc","abcd","aa"都能通过测试,看来是到最后测试到test组存在后又回溯了,此解决方案不可行。

然后又试了(.(?!abc))*(找出所有后面不是abc的字符),结果是"abc","abcd"通过测试,"aabc"则只截取了后面的"abc",显然不行。

那加强条件试试:((?!abc).(?!abc))*(找出所有前面和后面都不是abc的字符),结果是所有包含abc的字符串都只截取了里面的"abc",不包含abc的则直接通过。

现在看来有点戏了,但是怎么把那些内部包含abc的字符串过滤掉呢?这个问题换句话说也就是怎么匹配整体而不是部分呢?现在需要明确用户的需求了:如果用户想要找的是单词,那就在表达式的两端加上\b,如果要找的是行,就加上^和$。由于用户的问题没有明确说明,我就当作是单词吧。

于是等到了这样的表达式:\b((?!abc).(?!abc))*\b,经过测试,这个表达式能匹配所有不包含abc的单词,以及单词abc。

怎么排除单词abc?经过一番思考,最后我认为判断单词是否以a开头的方式最为方便:\b(a(?!bc)|[^a](?!abc))((?!abc).(?!abc))*\b(要么以后面不是bc的a开头,要么不以a开头,除了开头后面所有的字符必须前面和后面都不是abc)。经过测试,完全满足要求,Bingo!

使用正则表达式查找不包含连续字符串abc的单词,最终结果:\b(a(?!bc)|[^a](?!abc))((?!abc).(?!abc))*\b
----------------
更新:根据maple的评论,更简洁的作法是:\b((?!abc)\w)+\b

正则表达式-不包含某个字符串

在使用正则表达式的场合,常常有这种需求,就是匹配一个不包含某个子串的子符串。比如说,我要从“eabcDFgh”得到"cd"之前的子串。有些人可能会写:

([^cd]*)

这种写法是彻底错误的,因为[]中的是集合,也就是说,[^cd]表示不等于c或者d,而不是cd。下面的程序中没有cd,但eab还是被匹配出来了。
复制代码 代码如下:
String s = "([^cd]*)";  
Match m = Regex.Match("eabCFgh", s);  
MessageBox.Show(m.Value); //eab 
MessageBox.Show(m.Groups[1].Value); //eab

上面这种写法是错的比较离谱的,正常青年一般都可以避免这种错误。在特殊情况下,正则表达式可以这么写,而且效率是比较高的。

([/s/S]*cd)

先说明下/s/S是表示匹配任何字符。所谓特殊情况,就是我知道这个字符串中必有cd的存在。假如,我的要求是匹配不包含cd的部分(为了描述方便,只匹配cd之前的部分),也就是说,当cd不存在时,应该把整个字符串都取出来。
复制代码 代码如下:
String s = "((.(?!cd))*.)";  
//String s = "([/s/S]*cd)";  
Match m = Regex.Match("eabcdfgh", s);  
MessageBox.Show(m.Value); //eab 
MessageBox.Show(m.Groups[1].Value); //eab

这种写法终于符合要求了。不过值得一提的是,相较前一种而言,它的效率比较低。
回顾一下相关的语法:
(?:子表达式)         定义非捕获组。
复制代码 代码如下:
//定义非捕获组 
String s = "e(?:ab)(.*)";  
Match m = Regex.Match("eabcd", s);  
MessageBox.Show(m.Value); //eabcd 
MessageBox.Show(m.Groups[1].Value); //cd

ab是被匹配的,但是它所在的组没有被捕获,Group[1]是cd

(?=子表达式)       零宽度正预测先行断言。
复制代码 代码如下:
//零宽度正预测先行断言 
//String s = "b(cd|de)(.*)";  
String s = "b(?=cd|de)(.*)";  
Match m = Regex.Match("eabcdfg", s);  
MessageBox.Show(m.Value);  
MessageBox.Show(m.Groups[1].Value); //区别 cd  cdfg

这种写法和注释掉的写法是有区别的,区别就是“零宽度”,这种写法会被捕获,也就是不占一个Group。

(?!子表达式)       零宽度负预测先行断言。

!表示非,就是不包含,同样是零宽度,不会被捕获。

(?=子表达式)    零宽度正回顾后发断言。

例:(?=19)\d{ 2} \b

“1851 1999 1950 1905 2003”中的“99”、“50”和“05”

(?!子表达式)     零宽度负回顾后发断言。

例:(?!19)\d{ 2} \b

“1851 1999 1950 1905 2003”中的“51”和“03”

您可能感兴趣的文章:
  • 正则表达式匹配不包含某些字符串的技巧
  • PHP正则提取不包含指定网址的图片地址的例子
  • 用正则删除不包含某个字符串的行的代码
  • 用正则表达式表示不包含2950的字符串
  • php 正则 不包含某字符串的正则表达式
  • 正则表达式不包含align该怎么写
  • 使用正则表达式找出不包含特定字符串的条目

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!

正则:<img(?![^<>]*?alt[^<]*?>).*?>例子:<imgsrc=\"\"alt=\"\"><imgsrc=\"\">&l" />切换导航网站首页网页制作网络编程脚本专栏数据库服务器操作系统

若转载请注明出处: 正则表达式不包含属性
本文地址: https://pptw.com/jishu/595485.html
用Javascript正则实现url链接的解析类 asp 图片正则 替换,替换前检查图片是不是本地地址的方法

游客 回复需填写必要信息