python 给定URL 如何获取其内容,并将其保存至HTML文档。

获取URL的内容需要用到标准库urllib包,其中的request模块。

import urllib.request
url=‘http://www.baidu.com‘
response=urllib.request.urlopen(url)
string=response.read()
html=string.decode(‘utf-8‘)
print(html)

urlopen()方法返回一个<class ‘http.client.HTTPResponse‘>

即标准库http包里的对象,该包是一个底层包,由request模块调用。

read()方法返回一个<class ‘bytes‘>

字节对象转成str对象用str.decode()方法

将获取的str对象内容保存到HTML文件,需用到程序内置的方法open()

f=open(‘lc.html‘,‘w‘)
f.write(html)
f.close()

  open()方法返回一个<class ‘_io.TextIOWrapper‘>

  write()方法是向文件对象写入str内容

  最后要关闭文件对象

原文地址:https://www.cnblogs.com/blogzyq/p/11067648.html

时间: 2024-08-30 13:39:14

python 给定URL 如何获取其内容,并将其保存至HTML文档。的相关文章

网络抓取功能实现 将获取的结果进行过滤并写入到TXT文档中

下面是自己编写的 网络抓取功能实现 将获取的结果进行过滤并写入到TXT文档中 (以防忘记) 原创哟 import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.FileWriter;import java.io.IOException;import java.io.Inp

“Word自动更改后的内容保存到通用文档模板上。是否加载该模板?“的解决办法

在win7系统下,Word2010出现了不能正常关闭.打开一个已有word文档,点击右上角关闭按钮后,先提示"word已停止工作,windows正在检查该问题的解决方案",随后提示"Microsoft word正试图恢复您的信息,这可能需要几分钟",最后提示"Microsoft Word已停止工作,出现了一个问题,导致程序停止正常工作.如果有可用的解决方案,Windows将关闭程序并通知您".之后,再重新打开word时,提示"Word自

js获取窗口滚动条高度、窗口可视范围高度、文档实际内容高度、滚动条离浏览器底部的高度

1.获取窗口可视范围的高度 1 //获取窗口可视范围的高度 2 function getClientHeight(){ 3 var clientHeight=0; 4 if(document.body.clientHeight&&document.documentElement.clientHeight){ 5 var clientHeight=(document.body.clientHeight<document.documentElement.clientHeight)?doc

Python监控进程性能数据并画图保存为PDF文档

引言 利用psutil模块(https://pypi.python.org/pypi/psutil/),可以很方便的监控系统的CPU.内存.磁盘IO.网络带宽等性能參数,下面是否代码为监控某个特定程序的CPU资源消耗.打印监控数据,终于画图显示,而且保存为指定的 PDF 文档备份. 示范代码 #!/usr/bin/env python # -*- coding: utf-8 -*- ''' Copyright (C) 2015 By Thomas Hu. All rights reserved.

C# 通过url地址获取页面内容

using System.Net; using System.IO; HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://192.168.1.88:8018/test.html?name=121212"); WebResponse response = request.GetResponse(); Stream resStream = response.GetResponseStream(); Strea

python从网络摄像头获取rstp视频流并截取图片保存

import cv2 def get_img_from_camera_net(folder_path):     cap = cv2.VideoCapture("rtsp://admin:[email protected]/ch1/stream1")#获取网络摄像机         i = 1     while i<3:         ret, frame = cap.read()         cv2.imshow("capture", frame)

PHP将HTML的内容保存成word文档

<?php class word { function start() { ob_start(); echo '<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40"> <head> &l

java通过URL获取文本内容

原文地址https://www.cnblogs.com/myadmin/p/7634262.html public static String readFileByUrl(String urlStr) { String res=null; try { URL url = new URL(urlStr); HttpURLConnection conn = (HttpURLConnection)url.openConnection(); //设置超时间为3秒 conn.setConnectTimeo

用python从符合一定格式的txt文档中逐行读取数据并按一定规则写入excel(openpyxl支持Excel 2007 .xlsx格式)

前几天接到一个任务,从gerrit上通过ssh命令获取一些commit相关的数据到文本文档中,随后将这些数据存入Excel中.数据格式如下图所示 观察上图可知,存在文本文档中的数据符合一定的格式,通过python读取.正则表达式处理并写入Excel文档将大大减少人工处理的工作量. 1. 从gerrit获取原始信息,存入文本文档: $ssh –p 29418 <your-account>@192.168.1.16 gerrit query status:merged since:<date