之前在学爬虫的时候,经常听见 PhantomJS 的大名。业内众所周知,互联网这个行业,各类技术多得令人眼花缭乱,一两年就能出现不少技术革新,而此前熟知的技术却不断地被淘汰,抛弃。 PhantomJS 就是其中之一。
最近在查阅爬虫资料的时,仍然经常出现 PhantomJS 的教程,而且是近期刚发布的。
网上很多教程确实都是抄来抄去,作者都没有实操过,或者只是玩玩,没有真正转化为生产力。可信度非常低。
PhantomJS ,在谷歌浏览器无头模式出来之后,就标志着它退出历史舞台的命运。
我先去项目主页看看
我们来看下GitHub项目主页 :https://github.com/ariya/phantomjs
发现最前面有一句话:
Important: PhantomJS development is suspended until further notice (see #15344 for more details).
翻译过来就是:
重要提示:PhantomJS开发将暂停,直到另行通知(有关更多详细信息,请参阅#15344)。
再看项目暂停开发的时间,是 2018年3月4日:
https://github.com/ariya/phantomjs/issues/15344
连大名鼎鼎的 Selenium 也已经宣布后面的版本,不再支持PhantomJS了。
现在网上很多关于Python的爬虫教程还是使用 PhantomJS 浏览器。
再重复一遍:不要在用PhantomJS做爬虫了。
有需要可用火狐或谷歌浏览器代替。