Selenium 是通过程序控制网络浏览器和执行浏览器自动化的强大工具。它适用于所有浏览器,适用于所有主要操作系统,其脚本是用各种语言编写的,如 Python、Java、C#等,我们将使用 Python。
安装
1.1 Python 中的 Selenium 绑定Selenium Python 绑定提供了一个方便的 API 来访问像 Firefox、Chrome 等 Selenium Web Driver。
Pip install Selenium
1.2 网络驱动程序Selenium 需要一个网络驱动程序来与所选的浏览器交互。Web 驱动程序是一个与 web 浏览器交互的包。它通过通用的有线协议与网络浏览器或远程网络服务器进行交互。您可以签出并安装您选择的网络驱动程序。
Chrome: https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox: https://github.com/mozilla/geckodriver/releases
Safari: https://webkit.org/blog/6900/webdriver-support-in-safari-10/
分步方法:
# import modules
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
# assign web page url
driver.get("https://www.cdsy.xyz/")
实施:
#import module
from selenium import webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
# url
driver.get('https://www.cdsy.xyz/')
# find web links
link = driver.find_elements(By.TAG_NAME, 'a')
# using len function count how many links
print(len(link))
输出: