python爬取小视频，看完身体一天不如一天！

Python现在非常火，语法简单而且功能强大，很多同学都想学Python！所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍，都放在了文章结尾，欢迎前来领取！
python爬取小视频记录
学习python简单爬虫小程序，记录代码和学习过程
环境信息
python 2.7.12
分析与步骤

要分析网站信息 http://www.budejie.com/video/
查看网页不同页面的信息
http://www.budejie.com/video/2
http://www.budejie.com/video/3
http://www.budejie.com/video/4
可以知道，不同页面的URL规则，直接在后面输入数字查看跳转到不同页
分析视频内容特点
如图：

查看网页代码：

通过这段代码，我们可以考虑分析。在python代码中用一段存放描述内容，一段存放视频所在的url
对于每个url地址，通过urllib所提供的urlretrieve下载
具体代码实现

-- encoding:utf8 --

import re
import sys
import urllib2
import urllib
import os
reload(sys)
sys.setdefaultencoding("utf-8")
#a = 1
url_name = []
def get(pageindex):
url = ‘http://www.budejie.com/video/‘ + str(pageindex)

var1.set(‘已经获取到第%s页的视频视频‘%(a))

print url
html = urllib.urlopen(url).read()
url_reg = r‘data-mp4="(.?)"‘
url_items = re.findall(url_reg, html)
name_reg = re.compile(‘<div class="j-r-list-c-desc".?<a href=".?>(.?)</a>.*?</div>‘, re.S)
name_items = re.findall(name_reg, html)
for i, k in zip(name_items, url_items):
url_name.append([i, k])
#传入文件名和video地址
def saveVideo(filename,videoUrl):
print ‘Saving : %s ...‘%filename
urllib.urlretrieve(videoUrl,‘D:\video\%s.mp4‘%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
文末福利

获取方式：加python群 839383765 即可获取！

原文地址：https://blog.51cto.com/14186420/2380430

时间： 2024-12-28 01:39:02

python爬取小视频，看完身体一天不如一天！

-- encoding:utf8 --

var1.set(‘已经获取到第%s页的视频视频‘%(a))

python爬取小视频，看完身体一天不如一天！的相关文章

第一篇博客（python爬取小故事网并写入mysql）

python爬取百思不得姐视频

Python 爬取笔趣看小说

最后轻松一夏，周末利用python爬取“陈翔六点半”搞笑视频！

没有内涵段子可以刷了，利用Python爬取段友之家贴吧图片和小视频(含源码)

都说抖音是毒品软件？我用Python爬取了里面的小视频！

Python爬取视频指南

python爬虫：爬取网站视频

分手后，小伙怒用Python爬取上万空姐照片，赢取校花选举大赛！