本文使用自己创建的网页进行模拟和演示,在爬取真实网页时,分析网页源代码然后修改代码中的正则表达式即可。
假设某网页源代码为:
在Hbuilder中单击菜单“运行”,选择使用Google Chrome浏览器打开,如图所示:
编写下面的Python程序:
爬虫程序生成的本地Excel文件内容如下: