Python去除html标签有哪些方法,你了解多少?
导读:Python去除html标签有哪些方法?有时候我们需要html标签,其中,Python去除html标签的常见方法有三种,接下来小编通过一个简单的示例给大家来介绍一下,更便于大家学习和理解,那么感兴趣的朋友就继续往下看吧。本文操作环境:win...
Python去除html标签有哪些方法?有时候我们需要html标签,其中,Python去除html标签的常见方法有三种,接下来小编通过一个简单的示例给大家来介绍一下,更便于大家学习和理解,那么感兴趣的朋友就继续往下看吧。
本文操作环境:windows7系统、python3.6.4版,DELL G3电脑。
python去除html标签的几种方法
import re from bs4 import BeautifulSoup from lxml import etree html = 'p> 你好/p> br/> font> 哈哈/font> b> 大家好/b> ' # 方法一 pattern = re.compile(r'[^> ]+> ',re.S) result = pattern.sub('', html) print(result) br> # 方法二 soup = BeautifulSoup(html,'html.parser') print(soup.get_text()) # 方法三 response = etree.HTML(text=html) # print(dir(response)) print(response.xpath('string(.)')) # 你好哈哈大家好 # 你好哈哈大家好 # 你好哈哈大家好
以上就是Python去除html标签的三个方法看,从示例代码可见实现方法还是比较简单的,几行代码就能解决,有需要的朋友也可以了解看看,希望对大家学习Python语言有帮助,想要了解更多可以继续浏览网络其他相关的文章。
文本转载自PHP中文网
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: Python去除html标签有哪些方法,你了解多少?
本文地址: https://pptw.com/jishu/651305.html