python selenium提取标签中的@href链接
import requests
from selenium import webdriver
import time
# 西瓜美食频道
# url = "https://www.ixigua.com/channel/meishi/"
# 取到当前的text
def get_source(url):
browser = webdriver.Chrome()
browser.get(url)
time.sleep(3)
"""
for i in range(3):
# 鼠标拉动滚动条
browser.execute_script(
"window.scrollTo(0, document.body.scrollHeight); var lenOfPage=document.body.scrollHeight; return lenOfPage")
time.sleep(1)
"""
source = browser.page_source
# 查到title,id元素
href = browser.find_element_by_xpath('//*[@id="insertTag"]/li[1]/a')
title = browser.find_element_by_css_selector("span.document_R_text")
print(title.text, href.get_attribute('href'))
browser.quit()
这里主要关注get_attribute('href') 就可以了.
我找到的是a标签下的href 链接