您当前的位置:首页 > 计算机 > 编程开发 > Python

python selenium提取标签中的@href链接

时间:11-15来源:作者:点击数:

python selenium提取标签中的@href链接

import requests
from selenium import webdriver
import time

# 西瓜美食频道
# url = "https://www.ixigua.com/channel/meishi/"

# 取到当前的text
def get_source(url):
    browser = webdriver.Chrome()
    browser.get(url)
    time.sleep(3)
    """ 
    for i in range(3):
        # 鼠标拉动滚动条
        browser.execute_script(
            "window.scrollTo(0, document.body.scrollHeight); var lenOfPage=document.body.scrollHeight; return lenOfPage")
        time.sleep(1)
    """
    source = browser.page_source
    # 查到title,id元素
    
    href = browser.find_element_by_xpath('//*[@id="insertTag"]/li[1]/a')
    title = browser.find_element_by_css_selector("span.document_R_text")
    
    print(title.text, href.get_attribute('href'))

    browser.quit()

这里主要关注get_attribute('href')  就可以了.

我找到的是a标签下的href 链接

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门