在家无聊,想看看小说,不过看的眼睛痛,就想着下个有声小说来听听。但风上找到的都是要一集一集下,还得重命名,122集啊,点到什么时候。
写个批处理下载的脚本。记录下过程。
一、老套路了,找到下载URL。通过查看网页源码,发现主页:http://www.qktsw.com/down/1831.html 的下载列表隐藏在:
打开这个js文件,看看是什么东西:
看标红的东西,觉得眼熟,这不就是主页上面的下载列表的ID号么:
二、获取id号:
简单,正则表达式:
m=re.compile(r‘\$(.*?)\$‘)
result=m.findall(content)
i=0
for s in result:
print s
result就是匹配的所有id列表了
接下来,写进文件就可以了:
fp = open(file, ‘wb‘)
req = urllib2.urlopen(url)
for line in req:
fp.write(line)
fp.close()
所有代码如下:
#coding=utf-8 __author__ = ‘Administrator‘ import urllib2 import re content = urllib2.urlopen(‘http://www.qktsw.com/playdata/39/1831.js‘).read() m=re.compile(r‘\$(.*?)\$‘) result=m.findall(content) i=0 rawStr=‘http://www.qktsw.com/downbook.asp?id=‘ for s in result: print s i+=1 fp = open(str(i)+‘.f4v‘, ‘wb‘) req = urllib2.urlopen(rawStr+s) for line in req: fp.write(line) fp.close() print ‘第%d集下完‘,i
下载下来的:
打开后可以正常听!嘿嘿,搞定
时间: 2024-09-30 10:46:55