首页前端开发HTMLPython爬虫:scrapy内置网页解析库parsel-通过css和xpath解析xml、html

Python爬虫:scrapy内置网页解析库parsel-通过css和xpath解析xml、html

时间2023-04-25 03:48:01发布访客分类HTML浏览1060
导读:文档https://pypi.org/project/parsel/https://github.com/scrapy/parsel安装pip install parsel代码示例from parsel import Selector s...

文档

  • https://pypi.org/project/parsel/
  • https://github.com/scrapy/parsel

安装

pip install parsel

代码示例

from parsel import Selector

selector = Selector(text="""html>
    
        body>
    
            h1>
    Hello, Parsel!/h1>
    
            ul>
    
                li>
    a href="http://example.com">
    Link 1/a>
    /li>
    
                li>
    a href="http://scrapy.org">
    Link 2/a>
    /li>
    
            /ul>
    
        /body>
    
        /html>
    """)

selector.css('h1::text').get()
'Hello, Parsel!'

selector.xpath('//h1/text()').re(r'\w+')
['Hello', 'Parsel']

for li in selector.css('ul >
     li'):
    print(li.xpath('.//@href').get())
http://example.com
http://scrapy.org


声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!

数据采集XML前端开发数据格式Python

若转载请注明出处: Python爬虫:scrapy内置网页解析库parsel-通过css和xpath解析xml、html
本文地址: https://pptw.com/jishu/7922.html
html:自定义网页右键菜单 走进Vue【三】vue-router详解

游客 回复需填写必要信息