python怎么从网站下载音频(想要音频数据却不好批量下载怎么弄)

环境的引入

python 3.8

pycharm

模块的运用

requests(pip install requests)>数据请求模块(pip)第三方模块

re>>>正则表达式分析数据内置模块无须安装

win+R录入cmd录入安装指令pip install模块名,一旦爆红,可能是网络连接超时间切换国内镜像源的原因

要实现爬虫案例,该怎么办?

解析:解析我们所需要的信息是来自于能够得到……音频url

利用开发者工具实现抓包分析

查找音频url的地址

查找音频数据包

在此数据包中包含我们所希望的音频url地址

比较数据包请求参数的变化规律每个音频均为具有相应音频ID

在开发者工具中搜索ID,询问ID的出处。在网页源代码中包含了我们所需要的音频ID

编写代码的目的是最后为获得音频url>>>>>音频数据包>>>而获得音频ID

代码的执行步骤:爬虫通过模拟浏览器对url地址的发出请求来获得数据

一。首次申请,以获得音频ID和音频标题

发送请求,针对所述音频目录页面的请求

获取数据,得到服务器返回的响应数据

解析数据,并抽取出我们所需要的音频ID和音频标题

二。第2次申请,以获得音频url地址

发出请求,针对所述音频数据包的发出请求

获取数据,得到服务器返回的响应数据

解析数据,并抽取音频url地址

三。第3次请求,以获得音频二进制数据,以便保存

保存资料

编码

import requests “”” 发送请求 对于哪一个url地址发送请求, 发送什么样请求 爬虫发送请求你可以看做打电话的一个过程 import requests 工具 手机 url 电话号码 headers 信号 get 打电话的方式 座机是需要加区号 长沙0731 打电话通了 200 嘟嘟嘟的声音 404 您所拨打电话是空号 “”” for page in range(2, 17): url = f’https://www.ximalaya.com/revision/album/v1/getTracksList?albumId=8625924&pageNum={page}&sort=0′ headers = { ‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36’ } response = requests.get(url=url, headers=headers) audio_info = response.json()[‘data’][‘tracks’] for index in audio_info: link = f’https://www.ximalaya.com/revision/play/v1/audio?id={index[“trackId”]}&ptype=1′ json_data = requests.get(url=link, headers=headers).json() audio_url = json_data[‘data’][‘src’] “”” response.text 数据类型是字符串 响应对象文本数据 response.json() 数据类型是字典 响应对象json字典数据 response.content 二进制数据内容 ctrl + alt + L 格式化代码 和网易云收藏按键 以及QQ 锁定按键冲突 “”” audio_content = requests.get(url=audio_url, headers=headers).content with open(‘audio\\’ + index[‘title’] + ‘.mp3′, mode=’wb’) as f: f.write(audio_content) print(link, index[‘title’]) def get_num(): lis = [] for a in range(10): for b in range(10): for c in range(10): for d in range(10): num = f'{a}{b}{c}{d}’ lis.append(num) return lis print(get_num()) string = ‘1111122211’ string = string.replace(‘2’, ‘3’) print(string)

尾语

好吧,本文到此结束!

还有更多的意见或者疑问,欢迎在评论区或者私信给我噢!欢迎大家的参与,也希望您能把对《汽车商业评论》的看法和观点告诉我们。谢谢你!谢谢你为我们带来了新鲜而有趣的话题。一起来加油,努力做到叭(我的名字叫:我的名字)

原文链接:http://www.sfdkj.com/12372.html

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片