python扒取c++视频示例

#!/usr/bin/pytyon
# -*- coding:utf-8 -*-
import re
import urllib

vurl = 'http://www.enet.com.cn/eschool/video/c++/'
domain = 'http://www.enet.com.cn'

def getVideoList(vurl):

    #find all c++ url
    html = urllib.urlopen(vurl).read()
    reg = r'href="(/eschool/video/autohtml/310/.*?.shtml)".*>(.*?)<\/a>'
    videoRe = re.compile(reg)
    videoList = re.findall(videoRe, html)

    videoListCount = len(videoList)
    x = 0

    # iteration c++ url
    for urlInfo in videoList:

        url = urlInfo[0]
        # find real c++ url
        url = domain+url
        html = urllib.urlopen(url).read()
        reg = r'(http:\/\/images\.enet\.com\.cn\/eschool\/c\+\+\/.*?\.swf)'
        videoRe = re.compile(reg)
        swfUrl = re.findall(videoRe, html)
        #print swfUrl

        # name
        reg = r'c\+\+\/(.*?)\/.*?\.swf'
        videoRe = re.compile(reg)
        videoName = re.findall(videoRe, swfUrl[0])[0].replace('/','_')+'_'+urlInfo[1].replace(':','').replace(' ','_').replace('.','_')+'.swf'
        urllib.urlretrieve(swfUrl[0], videoName)

        x = x + 1
        ratio = x*100/videoListCount
        print videoName,' to -->  ',x,'  ==>  ',videoListCount
        print '[','#'*ratio,' '*(100-ratio),']  ',ratio,'%'
        #exit()
    else:
        print 'endding!!'

getVideoList(vurl)

时间: 2024-11-05 14:57:04

python扒取c++视频示例的相关文章

python爬取小视频,看完身体一天不如一天!

Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍,都放在了文章结尾,欢迎前来领取!python爬取小视频记录学习python简单爬虫小程序,记录代码和学习过程环境信息python 2.7.12分析与步骤 要分析网站信息 http://www.budejie.com/video/ 查看网页不同页面的信息http://www.budejie.com/video/2http://www.budejie.

python爬取百思不得姐视频

声明:本文只用来学习python ,切勿用于非法用途 #coding:utf-8 from  Tkinter import * from ScrolledText import ScrolledText   ##scrollbar import re import threading import requests import sys import urllib reload(sys) sys.setdefaultencoding('utf-8')   ## output encodig ut

python扒取百宝彩网站江西快三当日期号及开奖结果

一.环境 windows10+python27 二.需求: 1.获取百宝彩网站中,江西快三当日的开奖期号和中奖号码: 2.根据输入期号,输出开奖号码: 三.上代码 1 #!/bin/env python 2 # coding=utf-8 3 4 import urllib2 5 import time 6 import re 7 8 9 class GetK3Issue: 10 """ 11 获取百宝彩网站快三当日输入的期号 12 """ 13

最后轻松一夏,周末利用python爬取“陈翔六点半”搞笑视频!

觉得程序员再忙也需要给自己安排一点娱乐时间,对自己好点,自己对自己不好,谁会? 自己娱乐一般会有:跑步.看电影.小视频,而小视频是最家常的娱乐方式,看得最多的小视频是「 陈翔六点半 」,咦! 拍得搞笑,演技也一流,也不乏有内涵!非常推荐大家看看. 时间太贵,我耗不起 正题 先上Python爬取小视频的效果图,duang.duang.duang.想下载什么就是什么,哈哈. 打开浏览器(电脑版,方便调试)输入微博 url 点击输入框,输入「陈翔六点半」,回车搜索 但是发现在这个页面就只用几个视频.滑

python爬虫:爬取网站视频

python爬取百思不得姐网站视频:http://www.budejie.com/video/ 新建一个py文件,代码如下: #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re,requests import sys reload(sys) sys.setdefaultencoding('utf-8') url_name = [] #url name def get():     #获取源码     hd = {"User-Age

都说抖音是毒品软件?我用Python爬取了里面的小视频!

简介 抖音,是一款可以拍短视频的音乐创意短视频社交软件,该软件于2016年9月上线,是一个专注年轻人的15秒音乐短视频社区.用户可以通过这款软件选择歌曲,拍摄15秒的音乐短视频,形成自己的作品.此APP已在Android各大应用商店和APP Store均有上线. 今天咱们就用Python爬取抖音视频 获得视频播放地址 查询的用户ID 视频名字列表 视频链接列表 用户昵称 获得带水印的视频播放地址 video_url:带水印的视频播放地址 download_url: 带水印的视频下载地址 视频下载

没有内涵段子可以刷了,利用Python爬取段友之家贴吧图片和小视频(含源码)

由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不是打广告的,没收广告费的) 同时,之前同事也发了一个贴吧的段子聚居地,客官稍等,马上奉上连接:段友之家?https://tieba.baidu.com/f?ie=... 然后呢,看到上面,确实好多段友在上面,于是乎,我就想爬取他们的图片和小视频,就有了这篇文章的主题: 其实吧,用Python爬取网站数据是最基

python之OpenCv(五)---抓取摄像头视频图像

OpenCV 可以通过 头videoCapture()方法打开摄像 摄像头变量 = cv2.VideoCapture(n)   n为整数,内置摄像头为0,若有其他摄像头则依次为1,2,3,4,... cap = cv2.VideoCapture(0) 摄像头是否处于打开状态可以通过isOpened()方法进行判断 摄像头变量.isOpened() 若打开返回True,反正返回False cap.isOpened() 布尔变量,图像变量 = 摄像头变量.read()  可以通过read() 方法读

【Python】Python抓取分享页面的源代码示例

本文章是关于利用Python方法来抓取某网站分享页面中的源码方法示例.需要大家注意的是Python抓取分享页面的源代码示例,是要在运行时导入BeautifulSoup.py文件后才可以使用. Python抓取分享页面的源代码示例,需要用到python urllib2模块方法,及BeautifulSoup模块. 源码如下: #coding:utf-8 import urllib2 from BeautifulSoup import BeautifulSoup ''' www.iplaypy.com