首页前端开发其他前端知识正则表达式轻松消除HTML代码

正则表达式轻松消除HTML代码

时间2024-02-01 14:25:03发布访客分类其他前端知识浏览285
导读:收集整理的这篇文章主要介绍了正则表达式轻松消除HTML代码,觉得挺不错的,现在分享给大家,也给大家做个参考。 一、清楚内容中的Javsscript 代码 复制代码 代码如下:Functi...
收集整理的这篇文章主要介绍了正则表达式轻松消除HTML代码,觉得挺不错的,现在分享给大家,也给大家做个参考。 一、清楚内容中的Javsscript 代码
复制代码 代码如下:
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "SCRIPT[^]*/SCRIPT> "
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function

二、清除内容中的HTML代码 
复制代码 代码如下:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "[^> ]*> "
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function

现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!

正则表达式

若转载请注明出处: 正则表达式轻松消除HTML代码
本文地址: https://pptw.com/jishu/595517.html
Java 正则表达式详解 c# 正则表达式对网页进行有效内容抽取

游客 回复需填写必要信息