2025年4月15日 星期二 乙巳(蛇)年 正月十六 设为首页 加入收藏
rss
您当前的位置:首页 > 计算机 > 编程开发 > Python

Selenium成长之路-23cookie的处理

时间:03-20来源:作者:点击数:26

cookie的处理,一部分是运用到爬虫,另一部分是运用到登录的验证码的获取。

今天来看看webdriver对 cookie都有哪些神操作。

  • get_cookies() 获取所有cookie信息;
  • get_cookie(name) 返回特定name有cookie信息;
  • add_cookie(cookie_dict) 添加cookie,必须有name和value值;
  • delete_cookie(name) 删除特定部分的cookie信息;
  • delete_all_cookie() 删除所有cookie信息。

知道了cookie 有这么多神操作,那么怎么能抓取到cookie呢?

使用我们的神秘武器 "Fiddler"(Charles 也可以)。

Fiddler确实是一个十分牛叉的工具:可以抓包,可以测试接口(Web/APP),可以抓信息等,

>>> 这里我就不演示Fiddler的用法了

我们上代码,看看cookie到底有啥操作:

  • # -*- coding: utf-8 -*-
  • """
  • @ auth : carl_DJ
  • @ time : 2020-5-22
  • """
  • from selenium import webdriver
  • #不打开浏览器运行
  • option = webdriver.ChromeOptions()
  • option.add_argument('headless')
  • driver = webdriver.Chrome(chrome_options=option)
  • url = "http://www.baidu.com"
  • driver.get(url)
  • #获取cookie
  • cookie= driver.get_cookies()
  • #打印cookie
  • print(cookie)
  • #退出浏览器
  • driver.quit

打印的结果如下:

  • [{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '31355_1449_31670_21120_31110_31596_30842_31464_31322_30823'}, {'domain': '.baidu.com', 'expiry': 1621646261.050973, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': '8DDCEC4A62A0DE72D84C5A02861269B2:FG=1'}, {'domain': '.baidu.com', 'expiry': 3737593908.050941, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': '8DDCEC4A62A0DE7242C056D21382AE78'}, {'domain': '.baidu.com', 'expiry': 3737593908.050959, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1590110259'}, {'domain': 'www.baidu.com', 'expiry': 1590974262, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314753'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '1'}]

是不是很乱,因为所有的信息都打印出来了,那么我们只想要几个的信息怎么办,有办法的,看下面的代码:

  • .....
  • #向cookie添加信息
  • driver.add_cookie({"name":"abc123456","value":"value123456"})
  • #遍历cookies中的name和value信息,并打印
  • for cookie in driver.get_cookies():
  • print("%s -> %s" % (cookie['name'], cookie['value']))
  • #删除cookie#
  • ##删除一个指定的cookie
  • driver.delete_cookie("CookieName")
  • ##删除所有cookie信息
  • driver.delete_all_cookies()
  • #退出浏览器
  • driver.quit()

打印结果如下:

  • abc123456 -> value123456
  • H_PS_PSSID -> 31351_1445_31669_21078_31594_31270_31464_30823
  • BAIDUID -> 185872EDC7B507D5EBF82AD614049B02:FG=1
  • BIDUPSID -> 185872EDC7B507D50824068F1F271AD8
  • PSTM -> 1590111110
  • BD_UPN -> 12314753
  • BD_HOME -> 1

是不是很简单。

在实际项目中,我们验证cookie方法有三种:

①获取真的 cookie信息,然后填写;

②开发写一个万能验证码,随便填写cookie信息;

③不填写cookie信息,跳过。

>>>安全性最高的,肯定是第一种,当然,也是最麻烦的了。没办法,鱼与熊掌不能兼得。

举个例子,我们来整一个登录操作

  • from selenium import webdriver
  • from selenium.webdriver.common.by import By
  • import os,time
  • #不打开浏览器运行
  • option = webdriver.ChromeOptions()
  • option.add_argument('headless')
  • driver = webdriver.Chrome(chrome_options=option)
  • url = "http://项目地址"
  • driver.get(url)
  • #填写登录名和密码
  • driver.find_element(By.ID,"usn").send_keys("username")
  • driver.find_element(By.ID,"pwd").send_keys("password")
  • # #获取cookie
  • cookies =driver.get_cookies()
  • # #遍历cookies中的信息,并打印
  • for cookie in cookies:
  • print(cookie)
  • #添加cookie
  • driver.add_cookie({"name":"abc123456","value":"value123456"})
  • #点击登录按钮
  • driver.find_element(By.ID,"login").click()
  • #刷新页面
  • driver.refresh()
  • time.sleep(3)
  • #退出
  • driver.quit()
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门