python selenium提取标签中的@href链接
- import requests
- from selenium import webdriver
- import time
-
- # 西瓜美食频道
- # url = "https://www.ixigua.com/channel/meishi/"
-
- # 取到当前的text
- def get_source(url):
- browser = webdriver.Chrome()
- browser.get(url)
- time.sleep(3)
- """
- for i in range(3):
- # 鼠标拉动滚动条
- browser.execute_script(
- "window.scrollTo(0, document.body.scrollHeight); var lenOfPage=document.body.scrollHeight; return lenOfPage")
- time.sleep(1)
- """
- source = browser.page_source
- # 查到title,id元素
-
- href = browser.find_element_by_xpath('//*[@id="insertTag"]/li[1]/a')
- title = browser.find_element_by_css_selector("span.document_R_text")
-
- print(title.text, href.get_attribute('href'))
-
- browser.quit()
-
这里主要关注get_attribute('href') 就可以了.
我找到的是a标签下的href 链接