最近需要用到selenium浏览器抓取,在windows下对照chrome浏览器开发的代码,在linux服务器上换成phantomjs驱动后,却不能运行了,通过截图发现phantomjs渲染效果和chrome不同。于是考虑在centos上安装chrome浏览器。
下面是做的一些记录。
(1) 添加chrome的repo源
- vi /etc/yum.repos.d/google.repo
-
- [google]name=Google-x86_64baseurl=http://dl.google.com/linux/rpm/stable/x86_64enabled=1gpgcheck=0gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pub
-
(2)安装
yum update , 然后yum install google-chrome-stable
这时候在非root账号下运行google-chrome会输出没有显示器,无法启动之类的。
不知道为什么不能在root账号下运行。
也可以通过下载rpm包谷歌文件进行安装
安装命令
- yum localinstall *.rpm
-
查看谷歌版本号google-chrome-stable --version
- yum update
- yum install Xvfb
- yum -install libXfont
- yum install xorg-x11-fonts*
-
(1)安装selenium、pyvirtualdisplay
- pip install selenium
- pip install pyvirtualdisplay
-
(2)下载chromedriver
从https://sites.google.com/a/chromium.org/chromedriver/home下载chromedriver
配置在PATH路径或者在脚本中指定路径
(3) demo
- # -*- coding:utf-8 -*-
- from selenium import webdriver
- from pyvirtualdisplay import Display
-
-
- display = Display(visible=0, size=(800,600))
- display.start()
- driver = webdriver.Chrome("./chromedriver")
- driver.get("http://www.baidu.com")
- print driver.page_source
-
- driver.quit()
- display.stop()
-
期望输出百度首页的html文档。
1、 nohup Xvfb -ac :7 -screen 0 1280x1024x8 > /dev/null 2>&1 &
2,、export DISPLAY=:7
3、java -jar selenium-server-standalone-3.0.1.jar
- # -*- coding:utf-8 -*-
- from selenium import webdriver
- from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
-
-
- driver = webdriver.Remote(
- command_executor='http://127.0.0.1:4444/wd/hub',
- desired_capabilities=DesiredCapabilities.CHROME)
-
- driver.get("http://www.baidu.com")
- print driver.page_source
- driver.quit()
-