python实现简单的百度云自动下载

最近女同让我帮助从百度云下载200个文件,给了我连接和提取码,这种重复的工作不适合人做写了一个简单的爬虫

#coding=utf-8
‘‘‘
自动填写提取码下载百度云资源
方法:
for
  读取文件中的连接和提取码
1 打开网页(link)
2 输入提取码
3 下载
‘‘‘
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

driver = webdriver.Chrome()
f = open("baidulink.txt",encoding="utf-8")
l = open("log.txt","w")
lines = f.readlines()
for line in lines: 

    if line != ‘\n‘:
        if len(line) > 10:
            print (line)
            list = line.split(" ")
            print (list)
            link = list[2]
            link = link.split(":")[1]
            link = link.strip()
            print (link)
            num = list[3].split(":")[1]
            num = num.strip()
            print (num)
            driver.get(link)
            elem = driver.find_element_by_id("eoX9ze")
            elem.send_keys(num)
            elem.send_keys(Keys.RETURN)
            time.sleep(1)
            sreach_window = driver.current_window_handle
            driver.find_element_by_xpath("//*[@id=‘layoutMain‘]/div[1]/div[1]/div/div[2]/div/div/div[2]/a[2]").click()
            ‘‘‘
            写日志,便于检查下载丢失的文件
            ‘‘‘
            l.writelines(line)
            l.write(‘\n‘)
    line = f.readline()
    time.sleep(3)
f.close() 

我把连接存在 baidulink.txt中,文件是逐行读取,提取出连接和提取码

使用selenium模拟浏览器,必须保证你的浏览器是Google Chrome,并装了chromedriver,相关内容自行百度

注意一下几点:

1 elem = driver.find_element_by_id("eoX9ze")

这个id好是会变的,如果变了按F12查看

2  sreach_window = driver.current_window_handle

页面跳转后,需要把driver定位到当前页面

3 driver.find_element_by_xpath("//*[@id=‘layoutMain‘]/div[1]/div[1]/div/div[2]/div/div/div[2]/a[2]").click()

这里使用xpath(还有id name selector等,选择适合的),可以使用选择那段代码然后复制xpath

以上功能十分简单,能够节省很多时间。如果频繁下载,会遇到输入验证码的时候,我选择等待,还有其他方法(可以使用代理等)

原文地址:https://www.cnblogs.com/zhxuxu/p/9683464.html

时间: 2024-10-30 01:00:57

python实现简单的百度云自动下载的相关文章

百度云离线下载含有违规内容检测方法分析

最近国家开始一轮净网行动,清除网上的淫秽***信息.各大互联网厂家纷纷开始行动,比如当年很好用的百度云离线下载就一度关闭.后来再次开启后,就出现了这句经典词,因含有违规内容被屏蔽无法下载. 其实被屏蔽的不一定都是不健康视频,有些仅仅是因为文件名含有一些字眼而已,比如一些美国大片的枪版就几乎都不能通过百度云的离线下载检测.据说这种方法还在迅雷等地方都有检测,因此我们来分析一下,这个检测到底是如何进行的. 首先上传了一个BT文件,BT文件里面的内容为大闹天宫的电影,但是我把文件名改成了含有敏感词汇的

百度云管家下载大文件速度慢的解决办法

win7下百度云管家下载百度网盘上的大文件,速度基本在100K以内.网上搜索解决办法有2类: 1,一种是迅雷法.采用替换URL中的home为wap,取得下载链接,然后用迅雷下载.但实际上迅雷下载速度也不快,且不稳定,有时200~300KB/s,有时根本没速度,下载会失败.换成QQ旋风也一样,没速度. 2,一种是换云管家版本,采用不限速的低版本.实践中发现,2.1版并不行,4.1版OK,基本满速下载. 新版本的百度云的问题,换个老版本,我用4.1.0,一样全速下载,下面百度云4.1.0绿色版连接,

计算机相关专业所用软件---百度云链接下载

计算机相关专业所用软件---百度云链接下载 Unity3D软件:链接:http://pan.baidu.com/s/1qYJhWXQ 密码:4qexAdobe Adobe+CC系列软件2014+激活补丁(PS.DW等):链接:http://pan.baidu.com/s/1pLhWjPp 密码:fk7kadt-bundle-windows-x86_64:链接:http://pan.baidu.com/s/1i4UBnUl 密码:pqlrVS2008专业版.iso:链接:http://pan.ba

如何用Python爬虫实现百度图片自动下载?

Github:https://github.com/nnngu/LearningNotes 制作爬虫的步骤 制作一个爬虫一般分以下几个步骤: 分析需求 分析网页源代码,配合开发者工具 编写正则表达式或者XPath表达式 正式编写 python 爬虫代码 效果预览 运行效果如下: 存放图片的文件夹: 需求分析 我们的爬虫至少要实现两个功能:一是搜索图片,二是自动下载. 搜索图片:最容易想到的是爬百度图片的结果,我们就上百度图片看看: 随便搜索几个关键字,可以看到已经搜索出来很多张图片: 分析网页

百度云资源下载加速软件推荐:proxyee-down

百度云是个好东西(现在叫百度网盘不过我还是习惯叫百度云),2个T的免费容量可以存视频.软件包等各式文件,就是下载速度有点让人看不下去,不开会员的话就算你是百兆光纤还是量子通信都是被限速的,做为一个商业公司还是能理解的.前些天有个朋友找我要会员,仿佛我就是大财主了,什么会员都有,虽然我没有会员,但是我有数亿的网友啊,之前在网上碰到过一款可以突破下载速度限制的软件,现在推荐给大家. proxyee-down:让下载速度得到解放 机缘巧合之下在一个帖子上面遇见了这款神器,我是一个喜欢收集软件的人,遇到

网易云课堂资源合集百度云分享 下载

2019康复职称考试[全套四门] 资源 百度云 康复教育网校Python-机器学习-进阶实战 资源 百度云 唐宇迪全民一起VBA提高篇(Excel数据处理) 资源 百度云 杨洋老师全网稀缺好课--徐sir的PS超神课 资源 百度云 PS东方站经济学人的动态图表与交互设计 资源 百度云 刘万祥ExcelPro19中级师康复医学治疗技术考试 资源 百度云 康复医学网校PS+AI+ID平面设计入门精通必修课 资源 百度云 顾领中Excel Power Query教程_数据整理 资源 百度云 Power

python实现简单的百度搜索

#!/usr/bin/python # coding=utf-8 import urllib import urllib2 #实现百度关键字查询的小例子 #定义基础url url = "http://www.baidu.com/s?" #定义请求头信息 headers = {"User-Agent" : "Mozilla......"} #用户输入查询关键字 keyword = raw_input("请输入要查询的关键字:")

诛仙在线观看_百度云迅雷下载

导演: 程小东编剧: 申捷 / 宋朝云主演: 肖战 / 李沁 / 孟美岐 / 唐艺昕 / 邱心志 / 更多...类型: 爱情 / 奇幻 / 古装制片国家/地区: 中国大陆语言: 汉语普通话上映日期: 2019-09-13(中国大陆)片长: 101分钟又名: 诛仙 / 诛仙电影版 / Jade Dynasty 诛仙 Ⅰ的剧情简介 · · · · · · 草庙村被屠,少年张小凡双亲离世,被青云门大竹峰收留.机缘巧合之下,他习得佛门天音功法,又意外获得魔教法器烧火棍,踏上强者之路的同时,也让他陷入了巨

python+selenium爬取百度文库不能下载的word文档

有些时候我们需要用到百度文库的某些文章时,却发现需要会员才能下载,很难受,其实我们可以通过爬虫的方式来获取到我们所需要的文本. 工具:python3.7+selenium+任意一款编辑器 前期准备:可以正常使用的浏览器,这里推荐chrome,一个与浏览器同版本的驱动,这里提供一个下载驱动的链接https://chromedriver.storage.googleapis.com/77.0.3865.40/chromedriver_win32.zip 首先我们来看一下百度文库中这一篇文章https