python下载百度音乐

之前看到有人写过类似的代码,感觉有点累赘,其中登陆那些东西其实可以避免的

我把百度音乐的网页代码稍微分析了一下,如果要求不高,下载普通音质的歌曲是不需要登陆的(当然如果你用浏览器打开下载的话,普通音质也是要求登陆下载的)

看其代码发现,即使你没有登陆,其实下载链接也已经暴露出来了,只是用javascript阻止了你在浏览器中下载,

我下面写了一个下载的demo,顺便测试了一下多进程,批量下载很实用:

#!/usr/bin/env python
#-*- coding: UTF-8 -*-

import sys,os
import urllib,urllib2
from bs4 import BeautifulSoup
import json
from multiprocessing import Process

class BaiDuMusic():
    def __init__(self):
        reload(sys)
        sys.setdefaultencoding('utf8')   

    def search(self,songName):
        firstUrl = "http://music.baidu.com/search?key="+urllib.quote(str(songName))
        userAgent = " User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36 "
        headers = { 'User-Agent' : userAgent }
        requst = urllib2.Request(firstUrl,headers = headers)
        result = urllib2.urlopen(requst).read()

        #使用BeautifulSoup快速解析html文档
        soup = BeautifulSoup(result,from_encoding="utf-8")
        res_arr = []
        try:
            tmpjson = soup.find_all("li", { "class" : "bb-dotimg clearfix song-item-hook " })
            for x in tmpjson:
                tmpobj = json.loads(x['data-songitem'])
                value = unicode(tmpobj['songItem']['oid'])+"+++"+unicode(tmpobj['songItem']['author'])+"+++"+unicode(tmpobj['songItem']['sname'])[4:-5]
                res_arr.append(value)
            return res_arr
        except Exception, e:
            print u"抱歉没有找到相关资源".encode("utf-8")
            return 0
    def download(self,songid,songName,savePath="down/"):
        songNewUrl = "http://music.baidu.com/data/music/file?link=&song_id="+str(songid)
        if not os.path.isdir(savePath):
        	os.makedirs(savePath)
        savemp3 = savePath.decode('utf-8')+songName.decode('utf-8')+u".mp3"
        urllib.urlretrieve(songNewUrl, savemp3) 

if __name__=='__main__':

    bMusic = BaiDuMusic()
    res = bMusic.search(u"冰雨")
    # for x in res:
        # print x
    # 1128053+++刘德华+++冰雨
    # 7327899+++李翊君+++冰雨
    # 53535187+++张恒+++冰雨
    Process(target=bMusic.download, args=(1128053,"刘德华-冰雨")).start()
    Process(target=bMusic.download, args=(7327899,"李翊君-冰雨")).start()
    Process(target=bMusic.download, args=(53535187,"张恒-冰雨")).start()

多次测试发现还有一些小问题,比如你搜的歌曲不完整,歌曲:”我可以抱你吗“,你搜的是“我可以抱你” 那么结果会把“我可以抱你”加上em标签

上面代码是没有去掉的,需要用正则处理一下

时间: 2024-10-15 21:58:35

python下载百度音乐的相关文章

下载百度音乐无损品质音乐

1.<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVer

python 下载虾米音乐

#!/usr/bin/env python2 # coding:utf-8 import urllib import re import sys import urllib2 # xml => http://www.xiami.com/widget/xml-single/sid/1769215777 # string = "5h3%..i%2323F27%_3ueb5cc554e525-ntA2fx.2%9F211_5l%ty5d227E4-E8E%ut%FiicF2532759E.3h%

[python] 1、python鼠标点击、移动事件应用——写一个自动下载百度音乐的程序

1.问题描述: 最近百度总爱做一些破坏用户信任度的事——文库金币变券.网盘限速,吓得我赶紧想办法把存在百度云音乐中的歌曲下载到本地. http://yinyueyun.baidu.com/ 可问题是云音乐中并没有批量下载,而上面我总共存了700多首音乐! 因此:有必要写一个脚本自动下载这些音乐了!!! 2.解决问题 自动下载歌曲有两种方法: JS法 模拟鼠标点击法 由于考虑到JS法需要分析网页结构.寻找下载链接,工作量有点大,于是选择用模拟鼠标点击法! 在linux上我首先想到用python来做

python下载百度贴吧的指定帖子的所有图片

''' Created on 2016年10月4日 @author: lee :下载百度贴吧的指定帖子的所有图片 ''' import re import os import urllib.request def getHtml(url): res = urllib.request.urlopen(url) return res.read().decode('utf-8') def getMaxPage(home): """ :获取总共的页数 ""&quo

ubuntu 14.04 安装 深度音乐播放器与百度音乐插件

从window转到ubuntu真有点不习惯,之前玩玩虚拟机感觉还挺好,但看到ubuntu的界面感觉还蛮好看的,一狠心把硬盘给格了.我,从此IT男!!!囧 罗嗦完了,转正题,刚刚搞好的音乐播放器,把步骤写出来,以后重装少花点时间: 1: 更新源和安装deepin-music-player sudo add-apt-repository ppa:mc3man/trusty-media sudo add-apt-repository ppa:noobslab/deepin-sc sudo apt-ge

用python实现的百度音乐下载器-python-pyqt-改进版

之前写过一个用python实现的百度新歌榜.热歌榜下载器的博文,实现了百度新歌.热门歌曲的爬取与下载.但那个采用的是单线程,网络状况一般的情况下,扫描前100首歌的时间大概得到40来秒.而且用Pyqt做的界面,在下载的过程中进行窗口操作,会出现UI阻塞的现象. 前两天有时间调整了一下,做了几方面的改进: 1.修改了UI界面阻塞的问题,下载的过程中可以进行其它的UI操作; 2.爬虫程序采用一个主线程,8个子线程的方式快速爬取,网络状况一致的情况下,将扫描100首歌曲的时间提高到了8.9秒左右:(本

一步步分析百度音乐的播放地址,利用Python爬虫批量下载

百度音乐不需要登录也可以下载?听到这个消息是不是很兴奋呢, 接下来我们打开百度音乐,随便打开一首歌,切换到百度播放页面:如图 我这里用的是Firfox 浏览器,打开firebug 先清空所有的请求,如图: 现在我们重新刷新下页面,看到这个.mp3的地址就是百度音乐的地址,我们可以直接复制到迅雷里下载,但是这种做法太初级了吧,如果有很多首歌曲呢,每个都这样复制,岂不是很麻烦啊.,接下来我们继续分析. 这个链接有个特点,就是music/1658513  这个是什么呢? 你猜的没错,这个是每首歌曲的I

Python抓取百度音乐。

今天挑战下百度音乐抓取,先用Chrome分析下请求的链接. 最关键的就是这个链接 http://play.baidu.com/data/music/songlink 请求这个带上songid就能返回给你音乐的json,那么怎么来获取songid呢? 点开 http://music.baidu.com/tag,找个标签进去.然后查看页面源码.发现有以下片段. 在每首歌曲的li元素的data-songitem里面恰巧包含我们需要的sid.ok,目标明确了,首先请求百度音乐的音乐标签页,然后获得sid

Android获取百度音乐的音乐下载地址和歌词下载连接

首先通过你要下载的歌曲通过下列连接: http://box.zhangmen.baidu.com/x?op=12&count=1&title={title}$${author}$$$$ 可以获取一个xml文件通过解析xml文件就可以读取到音乐下载的地址和歌词下载的地址. 部分代码: String title = "六月的雨"; String singer = "胡歌"; String url = "http://box.zhangmen.b