Python 获取URL访问的HEAD头信息

主要给出两个版本，一个是通过 urllib 实现的，另一个是通过 urllib2 实现的，此为第二种，代码及实例如下：

>>> import urllib2
>>> from urllib2 import *
>>> webUrl = "http://www.baidu.com"
>>> doc = urllib2.urlopen(webUrl)
>>> print doc.info() #或 doc.headers

打印信息

Date: Mon, 24 Nov 2014 07:22:07 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: Close
Vary: Accept-Encoding
Set-Cookie: BAIDUID=6F43AAA51E609EB80D9C0A18BB11720D:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: BAIDUPSID=6F43AAA51E609EB80D9C0A18BB11720D; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: BDSVRTM=0; path=/
Set-Cookie: BD_HOME=0; path=/
Set-Cookie: H_PS_PSSID=7931_10161_1433_7800_9452_10120_10016_9499_10051_10065_9967_9769_9105_9757_10007_9979_9024; path=/; domain=.baidu.com
P3P: CP=" OTI DSP COR IVA OUR IND COM "
Cache-Control: private
Cxy_all: baidu+86091fc3efbc80d96c839cee1b7a0a36
Expires: Mon, 24 Nov 2014 07:21:28 GMT
X-Powered-By: HPHP
Server: BWS/1.1
BDPAGETYPE: 1
BDQID: 0xcf6e6ab100002443
BDUSERID: 0

时间： 2024-07-30 00:49:46

Python 获取URL访问的HEAD头信息的相关文章

读取页面元素的onclick属性值禁止重定向获取url重定向后Location头指定的重定向目标

(1) 读取页面元素的onclick属性值 html代码: <a id='linka' onclick="alert('ok');">链接</a> 取出item身上onclick属性的值:alert('ok'); 实现: IHTMLElement *item;// 已经找到该元素 CComQIPtr<IHTMLElement> spElem(item); VARIANT var; spElem->get_onclick(&var); C

python 获取Dmidecode 输出的系统硬件信息

目的: 熟悉利用python 分析文本的信息.分析的文件信息是通过dmidecode 工具抓取的系统硬件信息. 本文结构: (1) 分析dmidecode 工具的输出信息结构 (2) 分别用两种方式对dmidecode 输出的信息实现抓取,获取Manufacturer.Product Name和 Serial Number. dmidecode 输出信息分析 dmidecode 是系统的工具,如果没有安装,需要先安装.在我的机器上的Dmidecode 版本: 安装的方式也很简单,用命令:yum

如何获取url访问历史记录

在院里的群里,有人问了这么一个问题: A页面提交表单到B页面,然后在B页面点了后退,如果在A页面上判断是直接访问的还是后退进去的呢?我不想改B页面. 于是乎本着热心人的想法,我就帮他搞了搞,首先我想到了window.history,不过很遗憾,其没有提供相应的属性,只是提供了向前和向后跳转的方法.于是乎我找到了document.referrer,这个可以获得页面的上一个url,这样我只要判断一下其上一个url是不是B]不就ok了吗?但是,事与愿违,因为在使用document.referrers时

通过Python 获取Linux系统用户的登录信息

通过Python脚本实现用户登入Linux的时候自动发邮件通知管理员系统环境CentOS 7 #!/usr/bin/env python#coding:utf-8 #导入需要的库,如果没有自行安装import osimport smtplibfrom email.mime.text import MIMETextfrom email.header import Header #获取需要的内容reslut = os.popen("w").read()Login_User = os.pop

python获取url响应

前言 requests发请求时,接口的响应时间,也是我们需要关注的一个点,如果响应时间太长,也是不合理的.如果服务端没及时响应,也不能一直等着,可以设置一个timeout超时的时间关于requests请求的响应时间,官网上没太多介绍,并且我百度搜了下,看很多资料写的是r.elapsed.microseconds获取的,然而都是错的!!! elapsed官方文档 elapsed方法的官方文档地址:http://cn.python-requests.org/zh_CN/latest/api.htm

[Python]获取win平台文件的详细信息

import win32api def getFileProperties(fname): """ 读取给定文件的所有属性, 返回一个字典. """ propNames = ('Comments', 'InternalName', 'ProductName', 'CompanyName', 'LegalCopyright', 'ProductVersion', 'FileDescription', 'LegalTrademarks', 'Priv

Python获取Nginx访问日志，写入数据库

#!/usr/bin/env python # coding: utf-8 # Auther:liangkai # Date:2018/6/26 11:26 # License: (C) Copyright 2013-2018, Node Supply Chain Manager Corporation Limited. # Describe: import pymysql import re import datetime import sys import time # DB variabl

python 获取html置顶标签文本信息

class MyParser(HTMLParser): def __init__(self,key): self.data=[] self.key=key self.falg=False self.linkname='' HTMLParser.__init__(self) def handle_starttag(self,tag,attrs): if self.key and tag ==self.key: self.falg=True def handle_data(self,data): i

AFNetworking 2.0获取响应头信息

转载请注明出处:http://blog.csdn.net/dengbin9009/article/details/43304813 前文有提到在初始化的时候可以设置Http的头信息,这没有任何问题,但是在笔者使用过程中,时常是要获取Http返回的一些头信息,在初次用AFNetworking2.0新特性NSURLSessionDataTask的时候,为了获取返回的头信息,搞了两个晚上,先是度娘,谷歌,StackOverflow,然后各种那个群找人,嘴壶问同事找大神,最后都说没有用过.就在想要放弃,