python 给定URL 如何获取其内容，并将其保存至HTML文档。

获取URL的内容需要用到标准库urllib包，其中的request模块。

import urllib.request
url=‘http://www.baidu.com‘
response=urllib.request.urlopen(url)
string=response.read()
html=string.decode(‘utf-8‘)
print(html)

urlopen()方法返回一个<class ‘http.client.HTTPResponse‘>

即标准库http包里的对象，该包是一个底层包，由request模块调用。

read()方法返回一个<class ‘bytes‘>

字节对象转成str对象用str.decode()方法

将获取的str对象内容保存到HTML文件,需用到程序内置的方法open()

f=open(‘lc.html‘,‘w‘)
f.write(html)
f.close()

　　open()方法返回一个<class ‘_io.TextIOWrapper‘>

　　write()方法是向文件对象写入str内容

　　最后要关闭文件对象

原文地址：https://www.cnblogs.com/blogzyq/p/11067648.html

时间： 2024-08-30 13:39:14

python 给定URL 如何获取其内容，并将其保存至HTML文档。的相关文章

网络抓取功能实现将获取的结果进行过滤并写入到TXT文档中

下面是自己编写的网络抓取功能实现将获取的结果进行过滤并写入到TXT文档中 (以防忘记) 原创哟 import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.FileWriter;import java.io.IOException;import java.io.Inp

“Word自动更改后的内容保存到通用文档模板上。是否加载该模板？“的解决办法

在win7系统下,Word2010出现了不能正常关闭.打开一个已有word文档,点击右上角关闭按钮后,先提示"word已停止工作,windows正在检查该问题的解决方案",随后提示"Microsoft word正试图恢复您的信息,这可能需要几分钟",最后提示"Microsoft Word已停止工作,出现了一个问题,导致程序停止正常工作.如果有可用的解决方案,Windows将关闭程序并通知您".之后,再重新打开word时,提示"Word自

js获取窗口滚动条高度、窗口可视范围高度、文档实际内容高度、滚动条离浏览器底部的高度

1.获取窗口可视范围的高度 1 //获取窗口可视范围的高度 2 function getClientHeight(){ 3 var clientHeight=0; 4 if(document.body.clientHeight&&document.documentElement.clientHeight){ 5 var clientHeight=(document.body.clientHeight<document.documentElement.clientHeight)?doc

Python监控进程性能数据并画图保存为PDF文档

引言利用psutil模块(https://pypi.python.org/pypi/psutil/),可以很方便的监控系统的CPU.内存.磁盘IO.网络带宽等性能參数,下面是否代码为监控某个特定程序的CPU资源消耗.打印监控数据,终于画图显示,而且保存为指定的 PDF 文档备份. 示范代码 #!/usr/bin/env python # -*- coding: utf-8 -*- ''' Copyright (C) 2015 By Thomas Hu. All rights reserved.

C# 通过url地址获取页面内容

using System.Net; using System.IO; HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://192.168.1.88:8018/test.html?name=121212"); WebResponse response = request.GetResponse(); Stream resStream = response.GetResponseStream(); Strea

python从网络摄像头获取rstp视频流并截取图片保存

import cv2 def get_img_from_camera_net(folder_path): cap = cv2.VideoCapture("rtsp://admin:[email protected]/ch1/stream1")#获取网络摄像机 i = 1 while i<3: ret, frame = cap.read() cv2.imshow("capture", frame)

PHP将HTML的内容保存成word文档

<?php class word { function start() { ob_start(); echo '<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40"> <head> &l

java通过URL获取文本内容

原文地址https://www.cnblogs.com/myadmin/p/7634262.html public static String readFileByUrl(String urlStr) { String res=null; try { URL url = new URL(urlStr); HttpURLConnection conn = (HttpURLConnection)url.openConnection(); //设置超时间为3秒 conn.setConnectTimeo

用python从符合一定格式的txt文档中逐行读取数据并按一定规则写入excel（openpyxl支持Excel 2007 .xlsx格式）

前几天接到一个任务,从gerrit上通过ssh命令获取一些commit相关的数据到文本文档中,随后将这些数据存入Excel中.数据格式如下图所示观察上图可知,存在文本文档中的数据符合一定的格式,通过python读取.正则表达式处理并写入Excel文档将大大减少人工处理的工作量. 1. 从gerrit获取原始信息,存入文本文档: $ssh –p 29418 <your-account>@192.168.1.16 gerrit query status:merged since:<date