2025年4月15日 星期二 乙巳(蛇)年 正月十六 设为首页 加入收藏
rss
您当前的位置:首页 > 计算机 > 编程开发 > Python

网页动态数据加载爬取

时间:05-19来源:作者:点击数:36

网页动态数据加载爬取

  • from selenium import webdriver
  • from lxml import etree
  • from time import sleep
  • #实例化一个浏览器对象(传入浏览器的驱动成)
  • bro = webdriver.Chrome(executable_path='./chromedriver')
  • #让浏览器发起一个指定url对应请求
  • bro.get('http://125.35.6.84:81/xk/')
  • #page_source获取浏览器当前页面的页面源码数据
  • page_text = bro.page_source
  • #解析企业名称
  • tree = etree.HTML(page_text)
  • li_list = tree.xpath('//ul[@id="gzlist"]/li')
  • for li in li_list:
  • name = li.xpath('./dl/@title')[0]
  • print(name)
  • sleep(5)
  • bro.quit()

 

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门