任务描述:
使用Python语言编写网络爬虫程序,采集山东省考试院发布的2024年普通高校招生专业(专业类)选考科目要求,然后统计不同要求的本科专业数量和专科专业数量。
网页源代码分析与爬虫程序原理请参考:
赋分规则与计算方法请参考:
爬虫程序代码,需要安装扩展库openpyxl:
采集到的数据保存至Excel文件中,内容格式如下(可以后台发送消息“20220102”下载Excel文件):
这样的数据分析相对来说比较简单,一般就是是查询不同高校和专业对选考科目的要求,主要使用数据筛选和过滤技术,下面的代码统计了不同选考科目要求的专业数量,大家可以参考思路自由发挥和改写代码。
运行结果: