python爬取小视频,看完身体一天不如一天!

Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍,都放在了文章结尾,欢迎前来领取!
python爬取小视频记录
学习python简单爬虫小程序,记录代码和学习过程
环境信息
python 2.7.12
分析与步骤

  1. 要分析网站信息 http://www.budejie.com/video/
  2. 查看网页不同页面的信息
    http://www.budejie.com/video/2
    http://www.budejie.com/video/3
    http://www.budejie.com/video/4
    可以知道,不同页面的URL规则,直接在后面输入数字查看跳转到不同页
  3. 分析视频内容特点
    如图:

    查看网页代码:

    通过这段代码,我们可以考虑分析。在python代码中用一段存放描述内容,一段存放视频所在的url
    对于每个url地址,通过urllib所提供的urlretrieve下载
  4. 具体代码实现

-- encoding:utf8 --

import re
import sys
import urllib2
import urllib
import os
reload(sys)
sys.setdefaultencoding("utf-8")
#a = 1
url_name = []
def get(pageindex):
url = ‘http://www.budejie.com/video/‘ + str(pageindex)

var1.set(‘已经获取到第%s页的视频视频‘%(a))

print url
html = urllib.urlopen(url).read()
url_reg = r‘data-mp4="(.?)"‘
url_items = re.findall(url_reg, html)
name_reg = re.compile(‘<div class="j-r-list-c-desc".
?<a href=".?>(.?)</a>.*?</div>‘, re.S)
name_items = re.findall(name_reg, html)
for i, k in zip(name_items, url_items):
url_name.append([i, k])
#传入文件名和video地址
def saveVideo(filename,videoUrl):
print ‘Saving : %s ...‘%filename
urllib.urlretrieve(videoUrl,‘D:\video\%s.mp4‘%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
文末福利


获取方式:加python群 839383765 即可获取!

原文地址:https://blog.51cto.com/14186420/2380430

时间: 2024-10-19 18:52:53

python爬取小视频,看完身体一天不如一天!的相关文章

第一篇博客(python爬取小故事网并写入mysql)

前言: 这是一篇来自整理EVERNOTE的笔记所产生的小博客,实现功能主要为用广度优先算法爬取小故事网,爬满100个链接并写入mysql,虽然CS作为双学位已经修习了三年多了,但不仅理论知识一般,动手能力也很差,在学习的空余时间前前后后DEBUG了很多次,下面给出源代码及所遇到的BUG. 本博客参照代码及PROJECT来源:http://kexue.fm/archives/4385/ 源代码: 1 import requests as rq 2 import re 3 import codecs

python爬取百思不得姐视频

声明:本文只用来学习python ,切勿用于非法用途 #coding:utf-8 from  Tkinter import * from ScrolledText import ScrolledText   ##scrollbar import re import threading import requests import sys import urllib reload(sys) sys.setdefaultencoding('utf-8')   ## output encodig ut

Python 爬取笔趣看小说

# -*- coding:utf-8 -*- from bs4 import BeautifulSoup import requests import sys class DownLoader(object): def __init__(self): self.server = 'http://www.biqukan.com/' self.target = 'http://www.biqukan.com/0_790/' self.header = {'User-Agent': 'Mozilla/

最后轻松一夏,周末利用python爬取“陈翔六点半”搞笑视频!

觉得程序员再忙也需要给自己安排一点娱乐时间,对自己好点,自己对自己不好,谁会? 自己娱乐一般会有:跑步.看电影.小视频,而小视频是最家常的娱乐方式,看得最多的小视频是「 陈翔六点半 」,咦! 拍得搞笑,演技也一流,也不乏有内涵!非常推荐大家看看. 时间太贵,我耗不起 正题 先上Python爬取小视频的效果图,duang.duang.duang.想下载什么就是什么,哈哈. 打开浏览器(电脑版,方便调试)输入微博 url 点击输入框,输入「陈翔六点半」,回车搜索 但是发现在这个页面就只用几个视频.滑

没有内涵段子可以刷了,利用Python爬取段友之家贴吧图片和小视频(含源码)

由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不是打广告的,没收广告费的) 同时,之前同事也发了一个贴吧的段子聚居地,客官稍等,马上奉上连接:段友之家?https://tieba.baidu.com/f?ie=... 然后呢,看到上面,确实好多段友在上面,于是乎,我就想爬取他们的图片和小视频,就有了这篇文章的主题: 其实吧,用Python爬取网站数据是最基

都说抖音是毒品软件?我用Python爬取了里面的小视频!

简介 抖音,是一款可以拍短视频的音乐创意短视频社交软件,该软件于2016年9月上线,是一个专注年轻人的15秒音乐短视频社区.用户可以通过这款软件选择歌曲,拍摄15秒的音乐短视频,形成自己的作品.此APP已在Android各大应用商店和APP Store均有上线. 今天咱们就用Python爬取抖音视频 获得视频播放地址 查询的用户ID 视频名字列表 视频链接列表 用户昵称 获得带水印的视频播放地址 video_url:带水印的视频播放地址 download_url: 带水印的视频下载地址 视频下载

Python爬取视频指南

摘自:https://www.jianshu.com/p/9ca86becd86d 前言 前两天尔羽说让我爬一下菜鸟窝的教程视频,这次就跟大家来说说Python爬取视频的经验 正文 https://www.cniao5.com/ 菜鸟窝上有很多教程视频,但是这些视频好像没有直接的下载地址,而且有些教程视频还是有期限的,那么问题就产生了我看的速度比较慢而且视频又很多,没等我看完视频就到期了怎么办?这时候写一个爬虫将这些教程视频下载下来就很好地解决了这个问题 当然,对于某些视频网站的VIP电影.视频

python爬虫:爬取网站视频

python爬取百思不得姐网站视频:http://www.budejie.com/video/ 新建一个py文件,代码如下: #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re,requests import sys reload(sys) sys.setdefaultencoding('utf-8') url_name = [] #url name def get():     #获取源码     hd = {"User-Age

分手后,小伙怒用Python爬取上万空姐照片,赢取校花选举大赛!

首先展示下Python爬取到的成果:   我做什么都要争第一,这次的校花投票选举大赛也不例外,虽然我是个男的......但是我看到了前女友竟然已经有三百多票排到第三名了,我怎么能眼睁睁的看着她优秀呢?我必须要让她排到前三除外,·不行,必须是前十开外!我想到一个办法就是用Python开发一个百度爬虫,爬取百度所有美女的照片,然后申请多个账号进行参赛.   其实比起Python爬取图片外,我对微信上的投票小程序也有所研究,已经有了Python实现微信上刷票脚本的思路,这个我下次再分享大家,这次先学习