python3获取指定网页,指定保存位置

import osimport request

def DownloadFile(url, savePath):
    if not os.path.exists(savePath):
        print("downloading {0}".format(url))
        kv={‘user-agent‘:‘Mozilla/5.0‘}
        try:
            r = requests.get(url,headers=kv, timeout=60)
            r.raise_for_status()    # 如果响应状态码不是 200,就主动抛出异常
            with open(savePath,‘wb‘)as f:
                f.write(r.content)
                f.close()
                print("save file succeed")
                time.sleep(1)
        except requests.RequestException as e:
            print(e)
            with open(‘D:/timeout.txt‘, ‘a+‘,encoding = ‘UTF-8‘) as fw: #读入存储文件路径
                fw.write(‘%s,%s\n‘ % (url,e))
    else:
        print("file already exists")#

一个简单的下载,并指定保存位置的函数

原文地址:https://www.cnblogs.com/yanghao2008/p/10499018.html

时间: 2024-10-08 08:10:48

python3获取指定网页,指定保存位置的相关文章

使用iframe调用指定网页的特定位置(显示目标网页某区域的我想要的内容)

使用iframe调用指定网页的特定位置(显示目标网页某区域的我想要的内容) 有些时候我们并不需要显示iframe标签属性src指定的目标网页的所有内容,往往只需要显示某一特定区域.现有两种实现方法提供,但严禁使用此方法用于欺骗.隐瞒目的. 这里用到了Iframe的一些属性,稍微介绍下:       1. marginheight 属性规定框架内容与框架的上方和下方之间的高度,以像素计.       2. maiginweidth 属性规定框架内容与框架的左侧和右侧之间的高度,以像素计.     

python3获取中文网页乱码的问题

在python3中读取网页的时候,会有乱码的问题,如果直接打开,会有错误 Traceback (most recent call last): File "E:/Source_Code/python34/HTMLParser_in_3.py", line 81, in <module> context = f.read() UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 175: ille

python3获取一个网页特定内容

我们今天要爬取的网址为:https://www.zhiliti.com.cn/html/luoji/list7_1.html 一.目标:获取下图红色部分内容 即获取所有的题目以及答案. 二.实现步骤. 分析:1,首先查看该网站的结构. 分析网页后可以得到: 我们需要的内容是在该网页<li>标签下,详细内容链接在<small>的<a>的href中. 但是这样我们最多只能获取这一页的内容 别着急 我们点击第二页看一下目标网址有什么变化 我们发现目标网址最后的数字变成了2 再

JavaScript基础--小案例:在网页指定位置弹出错误信息(十二)

案例分析:点击按钮后,在网页上指定区域,提示错误信息!5秒后,错误信息提示自动消失! 1 <script languag="javascript" type="text/javascript"> 2 var clearId; 3 function test(){ 4 document.getElementById("showMsg").style.cssText="width:200px;height:50px;left:6

获取字符串中指定位置开始的指定长度的字符串,支持汉字英文混合 汉字为2字节计数

#region 函数:GetSubString() 作用:获取字符串中指定位置开始的指定长度的字符串,支持汉字英文混合 汉字为2字节计数 /// <summary> /// 获取字符串中指定位置开始的指定长度的字符串,支持汉字英文混合 汉字为2字节计数 /// </summary> /// <param name="strSub">输入中英混合字符串</param> /// <param name="start"

C++11 —— 获取 tuple 参数列表中指定数据类型的索引位置

1. 问题背景 ??在 C++11 的标准中,我们可以通过 std::get< Index >(tuple) (以常量整数值为索引号)操作 tuple 中的参数,而到了 C++14 之后的标准,新增了 std::get< Type >(tuple) (以数据类型为索引)的方式操作 tuple 中的参数.那么,若只是在 C++11 标准中,是否有办法使用 以数据类型为索引 的方式操作 tuple 中的参数呢? 2. 解决办法 ??解决上面所提到的问题,其本质上,就是要解决 如何获取

获取指定原色的index位置

<ul> <li id="foo">foo</li> <li id="bar">bar</li> <li id="baz">baz</li> </ul> $("li").click(function(){ alert($(this).index());//点击列表项可获得其相对于同胞元素的 index 位置 }); $('li').

Python 爬虫5——爬取并下载网页指定规格的图片

看完上篇文档之后,我们对于正则表达式已经有了基本的了解,其实学习最有效的办法就是带着问题和目的,这里我们假设有一个目标:获取某个网页上指定规格的图片的链接地址,并下载到本地. 一.实现步骤: 1.在浏览器中打开某个网页,例如:http://tieba.baidu.com/p/4691693167 2.假设我们要下载该页面中的几张大图,那么我们需要获取图片的url,这其实需要有两步操作来获取,一是先知道该图片的url,二是查看当前网页的html内容找到包含此url地址的格式,这样我们就能通过正则表

(三十一)工具方法:获得应用程序包名/安装apk/如何获得当前栈顶的Activity/android如何实现点击一个按钮进入指定网页

(1).获得应用程序包名代码 /** * 获取当前应用程序的版本号 * * @return */ private String getVersion() { try { PackageManager manager = getPackageManager(); // 获取包管理服务 PackageInfo ClientInfo = manager .getPackageInfo(getPackageName(), 0); // 获取包的信息 return ClientInfo.versionNa