2025年3月24日 星期一 甲辰(龙)年 月廿三 设为首页 加入收藏
rss
您当前的位置:首页 > 计算机 > 编程开发 > Python

Python爬虫:scrapy内置网页解析库parsel-通过css和xpath解析xml、html

时间:05-28来源:作者:点击数:35

Python爬虫:scrapy内置网页解析库parsel-通过css和xpath解析xml、html

文档

安装

  • pip install parsel

代码示例

  • from parsel import Selector
  • selector = Selector(text="""<html>
  • <body>
  • <h1>Hello, Parsel!</h1>
  • <ul>
  • <li><a href="http://example.com">Link 1</a></li>
  • <li><a href="http://scrapy.org">Link 2</a></li>
  • </ul>
  • </body>
  • </html>""")
  • selector.css('h1::text').get()
  • 'Hello, Parsel!'
  • selector.xpath('//h1/text()').re(r'\w+')
  • ['Hello', 'Parsel']
  • for li in selector.css('ul > li'):
  • print(li.xpath('.//@href').get())
  • http://example.com
  • http://scrapy.org
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门