python3获取指定网页，指定保存位置

import osimport request

def DownloadFile(url, savePath):
    if not os.path.exists(savePath):
        print("downloading {0}".format(url))
        kv={‘user-agent‘:‘Mozilla/5.0‘}
        try:
            r = requests.get(url,headers=kv, timeout=60)
            r.raise_for_status()    # 如果响应状态码不是 200，就主动抛出异常
            with open(savePath,‘wb‘)as f:
                f.write(r.content)
                f.close()
                print("save file succeed")
                time.sleep(1)
        except requests.RequestException as e:
            print(e)
            with open(‘D:/timeout.txt‘, ‘a+‘,encoding = ‘UTF-8‘) as fw: #读入存储文件路径
                fw.write(‘%s,%s\n‘ % (url,e))
    else:
        print("file already exists")#

一个简单的下载，并指定保存位置的函数

原文地址：https://www.cnblogs.com/yanghao2008/p/10499018.html

时间： 2024-10-08 08:10:48

python3获取指定网页，指定保存位置的相关文章

使用iframe调用指定网页的特定位置(显示目标网页某区域的我想要的内容)

使用iframe调用指定网页的特定位置(显示目标网页某区域的我想要的内容) 有些时候我们并不需要显示iframe标签属性src指定的目标网页的所有内容,往往只需要显示某一特定区域.现有两种实现方法提供,但严禁使用此方法用于欺骗.隐瞒目的. 这里用到了Iframe的一些属性,稍微介绍下: 1. marginheight 属性规定框架内容与框架的上方和下方之间的高度,以像素计. 2. maiginweidth 属性规定框架内容与框架的左侧和右侧之间的高度,以像素计.

python3获取中文网页乱码的问题

在python3中读取网页的时候,会有乱码的问题,如果直接打开,会有错误 Traceback (most recent call last): File "E:/Source_Code/python34/HTMLParser_in_3.py", line 81, in <module> context = f.read() UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 175: ille

python3获取一个网页特定内容

我们今天要爬取的网址为:https://www.zhiliti.com.cn/html/luoji/list7_1.html 一.目标:获取下图红色部分内容即获取所有的题目以及答案. 二.实现步骤. 分析:1,首先查看该网站的结构. 分析网页后可以得到: 我们需要的内容是在该网页<li>标签下,详细内容链接在<small>的<a>的href中. 但是这样我们最多只能获取这一页的内容别着急我们点击第二页看一下目标网址有什么变化我们发现目标网址最后的数字变成了2 再

JavaScript基础--小案例：在网页指定位置弹出错误信息(十二)

案例分析:点击按钮后,在网页上指定区域,提示错误信息!5秒后,错误信息提示自动消失! 1 <script languag="javascript" type="text/javascript"> 2 var clearId; 3 function test(){ 4 document.getElementById("showMsg").style.cssText="width:200px;height:50px;left:6

获取字符串中指定位置开始的指定长度的字符串，支持汉字英文混合汉字为2字节计数

#region 函数:GetSubString() 作用:获取字符串中指定位置开始的指定长度的字符串,支持汉字英文混合汉字为2字节计数 /// <summary> /// 获取字符串中指定位置开始的指定长度的字符串,支持汉字英文混合汉字为2字节计数 /// </summary> /// <param name="strSub">输入中英混合字符串</param> /// <param name="start"

C++11 —— 获取 tuple 参数列表中指定数据类型的索引位置

1. 问题背景 ??在 C++11 的标准中,我们可以通过 std::get< Index >(tuple) (以常量整数值为索引号)操作 tuple 中的参数,而到了 C++14 之后的标准,新增了 std::get< Type >(tuple) (以数据类型为索引)的方式操作 tuple 中的参数.那么,若只是在 C++11 标准中,是否有办法使用以数据类型为索引的方式操作 tuple 中的参数呢? 2. 解决办法 ??解决上面所提到的问题,其本质上,就是要解决如何获取

获取指定原色的index位置

<ul> <li id="foo">foo</li> <li id="bar">bar</li> <li id="baz">baz</li> </ul> $("li").click(function(){ alert($(this).index());//点击列表项可获得其相对于同胞元素的 index 位置 }); $('li').

Python 爬虫5——爬取并下载网页指定规格的图片

看完上篇文档之后,我们对于正则表达式已经有了基本的了解,其实学习最有效的办法就是带着问题和目的,这里我们假设有一个目标:获取某个网页上指定规格的图片的链接地址,并下载到本地. 一.实现步骤: 1.在浏览器中打开某个网页,例如:http://tieba.baidu.com/p/4691693167 2.假设我们要下载该页面中的几张大图,那么我们需要获取图片的url,这其实需要有两步操作来获取,一是先知道该图片的url,二是查看当前网页的html内容找到包含此url地址的格式,这样我们就能通过正则表

（三十一）工具方法：获得应用程序包名/安装apk/如何获得当前栈顶的Activity/android如何实现点击一个按钮进入指定网页

(1).获得应用程序包名代码 /** * 获取当前应用程序的版本号 * * @return */ private String getVersion() { try { PackageManager manager = getPackageManager(); // 获取包管理服务 PackageInfo ClientInfo = manager .getPackageInfo(getPackageName(), 0); // 获取包的信息 return ClientInfo.versionNa