Python去除html标签有哪些方法,你了解多少?
导读:Python去除html标签有哪些方法?有时候我们需要html标签,其中,Python去除html标签的常见方法有三种,接下来小编通过一个简单的示例给大家来介绍一下,更便于大家学习和理解,那么感兴趣的朋友就继续往下看吧。本文操作环境:win...
Python去除html标签有哪些方法?有时候我们需要html标签,其中,Python去除html标签的常见方法有三种,接下来小编通过一个简单的示例给大家来介绍一下,更便于大家学习和理解,那么感兴趣的朋友就继续往下看吧。
本文操作环境:windows7系统、python3.6.4版,DELL G3电脑。
python去除html标签的几种方法
import re
from bs4 import BeautifulSoup
from lxml import etree
html = 'p>
你好/p>
br/>
font>
哈哈/font>
b>
大家好/b>
'
# 方法一
pattern = re.compile(r'[^>
]+>
',re.S)
result = pattern.sub('', html)
print(result)
br>
# 方法二
soup = BeautifulSoup(html,'html.parser')
print(soup.get_text())
# 方法三
response = etree.HTML(text=html)
# print(dir(response))
print(response.xpath('string(.)'))
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好以上就是Python去除html标签的三个方法看,从示例代码可见实现方法还是比较简单的,几行代码就能解决,有需要的朋友也可以了解看看,希望对大家学习Python语言有帮助,想要了解更多可以继续浏览网络其他相关的文章。
文本转载自PHP中文网
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: Python去除html标签有哪些方法,你了解多少?
本文地址: https://pptw.com/jishu/651305.html
