2025年3月25日星期二甲辰(龙)年月廿四设为首页加入收藏

进入网站首页面

掌上城东书院
定制您的专属资源库
m.cdsy.xyz

掌上城东书院
随时随地，想看就看

关注我们

首页

您当前的位置：首页 > 计算机 > 编程开发 > Python

python爬虫爬取mp3

时间：11-05来源：作者：点击数：62

python爬虫爬取mp3

import requests
from lxml import etree
import os

if __name__=='__main__':
    if not os.path.exists('xiaofang'):
        os.mkdir('xiaofang')

    url='https://www.yespik.com/search-sound/77822.html'

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36'
    }

    resp = requests.get(url=url, headers=headers).text
    # fp=open('a.html','w',encoding='utf-8')
    # fp.write(resp)
    # fp.close()

    #数据解析
    tree=etree.HTML(resp)
    ul_list=tree.xpath('/html/body/div[4]/div[1]/div')
    # print(ul_list)
    for li in ul_list:
        wang_url = li.xpath('div/div[3]/audio/source/@src')[0]
        wang_url='http:'+ wang_url
        print(wang_url)
        name= li.xpath('div/div[2]/a/text()')[0]+'.mp3'
        print(name)
        data1 = requests.get(url=wang_url, headers=headers)
        data2=data1.content
        # # 压缩包路径
        page3_path = 'xiaofang/' + name
        with open(page3_path, mode='wb') as fp:
            fp.write(data2)
            print(name, "下载完成!!!")

方便获取更多学习、工作、生活信息请关注本站微信公众号 城东书院微信服务号

城东书院微信服务号

城东书院微信订阅号

3

上一篇:python爬虫爬取单页保存为csv 下一篇:python字典：省、市、县三级菜单 python调用

推荐内容

高考生入学注意：这些大	【健康】纯净水、天然
14种竞赛生升学路径盘	excel后缀xls和xlsx有

相关内容

栏目更新

栏目热门

关于我们 | 联系我们 | 用户协议 | 广告服务 | 申请链接 | 网站地图 | 版权声明 | 用户留言 | 招聘信息 | 帮助中心 | 社区讨论 | 下载服务

中国文明网传播文明

Copyright ©2019-2024 CDSY Corporation, All Rights Reserved

城东书院^® CDSY.XYZ 版权所有湘ICP备19021508号-1 公安网备案

公安网备案

湘公网安备 43102202000103号

※学习、工作、生活信息平台※

悠悠岁月多漫长，生世轮回为谁茫？今日随缘来此处，尘封记忆在此敞。

本网大部分资源来源于会员上传，除本网组织的资源外，版权归原作者所有，如有侵犯版权，请立刻和本网联系并提供证据，本网将在三个工作日内改正。