如何通过正则表达式简便地移除网页中的HTML标签?

2026-04-29 21:275阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计209个文字,预计阅读时间需要1分钟。

如何通过正则表达式简便地移除网页中的HTML标签?

一、清除内容中的JavaScript代码

以下是一个简化的JavaScript代码,用于清除HTML内容中的JavaScript代码段:

javascriptfunction clearJSCode(originCode) { var reg; reg=new RegExp(SCRIPT[^]*?/SCRIPT, gi); return reg.replace(originCode, );}

一、清楚内容中的Javsscript 代码
复制代码 代码如下:
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function

二、清除内容中的HTML代码
复制代码 代码如下:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function

现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。

如何通过正则表达式简便地移除网页中的HTML标签?

本文共计209个文字,预计阅读时间需要1分钟。

如何通过正则表达式简便地移除网页中的HTML标签?

一、清除内容中的JavaScript代码

以下是一个简化的JavaScript代码,用于清除HTML内容中的JavaScript代码段:

javascriptfunction clearJSCode(originCode) { var reg; reg=new RegExp(SCRIPT[^]*?/SCRIPT, gi); return reg.replace(originCode, );}

一、清楚内容中的Javsscript 代码
复制代码 代码如下:
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function

二、清除内容中的HTML代码
复制代码 代码如下:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function

现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。

如何通过正则表达式简便地移除网页中的HTML标签?