爬虫登陆极客学院,并下载视频

首先说明:这个代码不是免费下载视频,需要你有vip账号

只是方便大家批量下载

不过体验vip也很好获得,有了体验机会赶紧用这个批量下载吧

完整代码在这:我的github

只需要修改最下面的存储地址和需要下载的页面,就可以将一个页面中的课程的所有视频批量下载到指定文件夹

主要是登陆网站这一块废了些时间,简要说一下登陆模块:

首先必须有下面这一部分代码,意思是给urlopen()函数加上cookie处理,否则是不会处理cookie的,但是网站记录我们是谁就是靠cookie的,没有这个那么就无法登陆,所以这一部分极其重要

# 初始化一个CookieJar来处理Cookie
cookieJar = cookielib.CookieJar()
# 实例化一个全局opener
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))
# 把这个cookie处理机制装上去,大概是这个意思-.-
urllib2.install_opener(opener)

下面就是处理登陆要发送的数据包了,准备好data就可以,然后还有一个要点,就是验证码这一块,我是直接把验证码获取下来,然后显示,最后手动输入验证码的

# 从登录页面获取登陆参数
login_url = ‘http://passport.jikexueyuan.com/sso/login‘
# 登陆信息发送到这个地址
passport_url = ‘http://passport.jikexueyuan.com/submit/login?is_ajax=1‘
verifyCode_url = ‘http://passport.jikexueyuan.com/sso/verify‘

# 获取登陆页面源码
request = urllib2.urlopen(login_url)
html = request.read()
request.close()

# 获取登陆要post的数据
expire = re.search(r"(?s)value=‘(.*?)‘ name=‘expire",html)
# 验证码
verifyCodeGifPath = ‘/tmp/jikexueyuan.gif‘
request = urllib2.urlopen(verifyCode_url)
gif = request.read()
request.close()
fGif = open(verifyCodeGifPath,‘w‘)
fGif.write(gif)
fGif.close()
# 读取保存到本地的验证码图片
os.system(‘eog ‘ + verifyCodeGifPath)
verify = raw_input("请输入图中的验证码:")

data = {
    ‘expire‘: expire.group(1),
    ‘referer‘: ‘http%3A%2F%2Fwww.jikexueyuan.com%2F‘,
    ‘uname‘: 用户名,
    ‘password‘: 密码,
    ‘verify‘: verify,
}
post_data = urllib.urlencode(data)

request = urllib2.Request(passport_url,post_data)
# 给一个useragent,防止被认为是爬虫程序
request.add_header(‘User-Agent‘, ‘Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.125 Safari/537.36‘)
# 发送登录请求
request = urllib2.urlopen(request)
request.close()
print ‘登陆完成‘

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-12-28 23:33:14

爬虫登陆极客学院,并下载视频的相关文章

极客学院年VIP卡原价260的F码,200出售

F码是中国最大的IT职业在线教育平台——极客学院推出的VIP时间兑换码,凭此可在极客学院官网兑换年VIP,畅享平台上所有IT技术课程. 购买请点击 http://www.bejson.com/other/jikefma/ 这个会员能做什么 观看全部课程 技术问答 资料下载 高清视频下载 优先提交课程需求 使用方法: 1.登陆极客学院官网:www.jikexueyuan.com 2.登陆会员账号\注册极客学院会员账号 3.点击主页右上角账户名,找到“我的F码”,输入获得的F码,畅享全部IT技术课程

极客学院视频下载脚本

在极客学院充了三个月的会员,在线看视频,感觉有点卡,一级一级下载,又麻烦,于是写了个脚本.帮我下.呵呵. 请看截图.如果想要,留言哈.

python极客学院爬虫V1

定向爬取极客学院视频,原本只有年费VIP只能下载,经过分析,只要找个免费体验VIP即可爬取所有视频 涉及的基本技术:python xpath 正则 com+ 通过python调用迅雷从组件,实现自动创建文件夹和自动添加批量下载任务,前提要成功安装迅雷和迅雷组件 思路:path路径爬取所有标签->搜索页面所有该课程分类->课程页面获取课程明细->正则分析视频地址 极客学院的一直在改进,可能需要自己改进 import requests from lxml import etree impor

基于requests实现极客学院课程爬虫

背景 本文主要是为了完成极客学院课程<Python 单线程爬虫>中讲师布置的实战作业. 开发环境 操作系统:windows 10 Python :Python 2.7 IDE:PyCharm 4.5.3 安装requests 在CMD命令提示窗口敲以下一行命令即可安装. pip install requests 实现代码 # coding=utf-8 __author__ = 'scaleworld' import requests import re import sys reload(sy

科大讯飞&极客学院首发语音云视频课程

本着为开发者提供优质课程内容.一站式智能人机交互解决方案为初衷,亚洲最大的语音技术提供商"科大讯飞"和国内最大的IT职业在线教育平台"极客学院"达成合作,共同策划.录制,出品<科大讯飞语音服务>系列课程,为开发者在开发"能听会说会理解"应用的Coding路上排忧解难. 经过科大讯飞和极客学院双方精心策划,联手打造的国内首个语音云视频课程<科大讯飞语音服务 Android项目开发实战介绍>重磅上线,将给小伙伴们带来哪些干货和

极客学院Android视频分享

知识是用来分享的,愿能够帮助需要帮助的人,相互学习相互交流共同进步! 这是极客学院关于Android学习的一部分视频,还是非常有学习的意义的. 其中涉及到Android基本知识点,项目知识,新技术相关学习. 分享地址:http://pan.baidu.com/s/1gd7vEcr    密码:q3hf

极客学院Web前端开发技术实战视频教程 初级入门+高级实战++专家课程+面试指导

===============课程目录=============== ├<初级中级>│  ├<1. HTML5开发前准备>│  │  ├1.HTML5开发前准备.mp4│  │  └2.开发前的准备-快捷键.mp4│  ├<10. React.js>│  │  ├React.js简介.txt│  │  ├<1.React 概述>│  │  │  ├React 开发环境搭建.mp4│  │  │  ├编写第一个 React 程序.mp4│  │  │  └什么

极客学院前端实战开发 网页小游戏/网页布局/导航/标签页/语音识别

===============课程目录===============<实战开发教程>├<1 围住神经猫-HTML5实战游戏开发教程>│  ├1. 围住神经猫-游戏玩法.mp4│  ├2.围住神经猫-使用createjs.mp4│  ├3. 围住神经猫-绘制页面元素.mp4│  ├4.围住神经猫-添加监听事件.mp4│  ├5.围住神经猫-简单的逻辑实现游戏效果.mp4│  ├6. 围住神经猫-完整游戏效果实现.mp4│  └<source>├<10 回到顶部功能实

极客学院开源硬件视频教程 玩转Arduino

玩转Arduino 极客学院开源硬件视频教程玩转 Arduino --数据通信:串口通信玩转Arduino--周边模块:执行部件玩转Arduino-周边模块-传感器部件(1)玩转 Arduino --周边模块-传感器部件(2) 下载地址:http://www.feixueteam.net/thread-840-1-1.html