http协议(转)

主要还是为了存放状态码···

剖析 HTTP 协议

目录

回到顶部

HTTP 概述

HTTP 是什么?

HTTP(HyperText Transfer Protocol,超文本传输协议)是WWW (World Wide Web)实现数据通信的基石。

HTTP是由IETF(Internet Engineering Task Force,互联网工程工作小组) 和W3C(World Wide Web Consortium,万维网协会) 共同合作制订的,它们发布了一系列的RFC(Request For Comments),其中最著名的是RFC 2616,它定义了HTTP /1.1

它是一种应用层协议(OSI七层模型的最顶层),它基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。

实例

如果你学习过计算机网络,熟悉OSI模型,那么你可以跳过这个实例了。

而不了解OSI模型的朋友,不妨通过一个实例来对HTTP报文有一个感性的认识。

以下是使用 wireshark 抓取的一个实际访问百度首页的 HTTP GET 报文:

可以清楚的看到它的层级结构如下图,经过了层层的包装。

工作原理

HTTP 工作于Client/Server(客户端/服务器)模型上。

客户端和服务器之间的通信采用request/response(请求/响应)机制。

客户端是终端(可以是浏览器、爬虫程序等),服务器是网站的Web服务器。

一次HTTP 操作称为一个事务,其工作过程大致可分为四步:

(1)建立连接:首先,客户端和服务器需要建立一个到服务器指定端口(默认端口号为80)的TCP连接。

注:虽然HTTP 采用TCP连接是最流行的方式,但是RFC并没有指定一定要采用这种网络传输方式。

(2)发送请求信息:客户端向服务器发送请求。请求方式的格式为,统一资源标识符、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。

(3)发送响应信息:服务器监听指定接口是否收到请求,一旦发现请求,处理后,返回响应结果给客户端。其格式为一个状态行包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。

(4)关闭连接:客户端根据响应,显示结果给用户,最后关闭连接。

特点

l  无连接的:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

l  无状态的:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

l  媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。

l  C/S模型的:基于Client/Server模型工作。

回到顶部

HTTP 消息结构

HTTP是基于客户端/服务端(C/S)的架构模型,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。

一个HTTP"客户端"是一个应用程序(Web浏览器或其他任何客户端),通过连接到服务器达到向服务器发送一个或多个HTTP的请求的目的。

一个HTTP"服务器"同样也是一个应用程序(通常是一个Web服务,如Apache Web服务器或IIS服务器等),通过接收客户端的请求并向客户端发送HTTP响应数据。

HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。

一旦建立连接后,数据消息就通过类似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。

客户端请求消息

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下图给出了请求报文的一般格式。

 

服务器响应消息

HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。

回到顶部

HTTP 请求

根据HTTP标准,HTTP请求可以使用多种请求方法。

HTTP1.0定义了三种请求方法: GETPOST 和 HEAD方法。

HTTP1.1新增了五种请求方法:OPTIONSPUTDELETETRACE 和 CONNECT方法。


方法


描述


GET


请求指定的页面信息,并返回实体主体。


HEAD


类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头


POST


向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。


PUT


从客户端向服务器传送的数据取代指定的文档的内容。


DELETE


请求服务器删除指定的页面。


CONNECT


HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。


OPTIONS


允许客户端查看服务器的性能。


TRACE


回显服务器收到的请求,主要用于测试或诊断。

HTTP 请求消息头


请求消息头


说明


Accept


浏览器支持的格式


Accept-Encoding


支持的编码格式,如(UTF-8,GBK)


Accept-Language


支持的语言类型


User-Agent


浏览器信息


Cookie


记录的是用户当前的状态


Referer


指从哪个页面单击链接进入的页面


HOST


目的地址对应的主机名


Connection


连接类型。如Keep-Alive表示长连接,不会断开


Content-Length


内容长度


Content-Type


内容类型

回到顶部

HTTP 响应

HTTP 响应消息头


响应消息头


说明


Allow


服务器支持哪些请求方法(如GET、POST等)。


Content-Encoding


文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet应该通过查看Accept-Encoding头(即request.getHeader("Accept-Encoding"))检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。


Content-Length


表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入ByteArrayOutputStram,完成后查看其大小,然后把该值放入Content-Length头,最后通过byteArrayStream.writeTo(response.getOutputStream()发送内容。


Content-Type


表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentType。


Date


当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。


Expires


应该在什么时候认为文档已经过期,从而不再缓存它?


Last-Modified


文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not Modified)状态。Last-Modified也可用setDateHeader方法来设置。


Location


表示客户应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。


Refresh


表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader("Refresh", "5; URL=http://host/path")让浏览器读取指定的页面。 
注意这种功能通常是通过设置HTML页面HEAD区的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。 
注意Refresh的意义是"N秒之后刷新本页面或访问指定页面",而不是"每隔N秒刷新本页面或访问指定页面"。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META HTTP-EQUIV="Refresh" ...>。 
注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。


Server


服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。


Set-Cookie


设置和页面关联的Cookie。Servlet不应使用response.setHeader("Set-Cookie", ...),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。


WWW-Authenticate


客户应该在Authorization头中提供什么类型的授权信息?在包含401(Unauthorized)状态行的应答中这个头是必需的。例如,response.setHeader("WWW-Authenticate", "BASIC realm=\"executives\"")。 
注意Servlet一般不进行这方面的处理,而是让Web服务器的专门机制来控制受密码保护页面的访问(例如.htaccess)。

回到顶部

HTTP 状态码

当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。

HTTP状态码的英文为HTTP Status Code。

下面是常见的HTTP状态码:

l  200 - 请求成功

l  301 - 资源(网页等)被永久转移到其它URL

l  404 - 请求的资源(网页等)不存在

l  500 - 内部服务器错误

HTTP状态码分类

HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型:


分类


分类描述


1**


信息,服务器收到请求,需要请求者继续执行操作


2**


成功,操作被成功接收并处理


3**


重定向,需要进一步的操作以完成请求


4**


客户端错误,请求包含语法错误或无法完成请求


5**


服务器错误,服务器在处理请求的过程中发生了错误

HTTP 状态列表:


状态码


状态码英文名称


中文描述


100


Continue


继续。客户端应继续其请求


101


Switching Protocols


切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议


 


200


OK


请求成功。一般用于GET与POST请求


201


Created


已创建。成功请求并创建了新的资源


202


Accepted


已接受。已经接受请求,但未处理完成


203


Non-Authoritative Information


非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本


204


No Content


无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档


205


Reset Content


重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域


206


Partial Content


部分内容。服务器成功处理了部分GET请求


 


300


Multiple Choices


多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择


301


Moved Permanently


永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替


302


Found


临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI


303


See Other


查看其它地址。与301类似。使用GET和POST请求查看


304


Not Modified


未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源


305


Use Proxy


使用代理。所请求的资源必须通过代理访问


306


Unused


已经被废弃的HTTP状态码


307


Temporary Redirect


临时重定向。与302类似。使用GET请求重定向


 


400


Bad Request


客户端请求的语法错误,服务器无法理解


401


Unauthorized


请求要求用户的身份认证


402


Payment Required


保留,将来使用


403


Forbidden


服务器理解请求客户端的请求,但是拒绝执行此请求


404


Not Found


服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面


405


Method Not Allowed


客户端请求中的方法被禁止


406


Not Acceptable


服务器无法根据客户端请求的内容特性完成请求


407


Proxy Authentication Required


请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权


408


Request Time-out


服务器等待客户端发送的请求时间过长,超时


409


Conflict


服务器完成客户端的PUT请求是可能返回此代码,服务器处理请求时发生了冲突


410


Gone


客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置


411


Length Required


服务器无法处理客户端发送的不带Content-Length的请求信息


412


Precondition Failed


客户端请求信息的先决条件错误


413


Request Entity Too Large


由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息


414


Request-URI Too Large


请求的URI过长(URI通常为网址),服务器无法处理


415


Unsupported Media Type


服务器无法处理请求附带的媒体格式


416


Requested range not satisfiable


客户端请求的范围无效


417


Expectation Failed


服务器无法满足Expect的请求头信息


 


500


Internal Server Error


服务器内部错误,无法完成请求


501


Not Implemented


服务器不支持请求的功能,无法完成请求


502


Bad Gateway


充当网关或代理的服务器,从远端服务器接收到了一个无效的请求


503


Service Unavailable


由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中


504


Gateway Time-out


充当网关或代理的服务器,未及时从远端服务器获取请求


505


HTTP Version not supported


服务器不支持请求的HTTP协议的版本,无法完成处理

参考

http://blog.csdn.net/gueter/article/details/1524447

http://www.runoob.com/http/http-intro.html

https://en.wikipedia.org/wiki/Hypertext_Transfer_Protocol

时间: 2024-09-30 23:54:43

http协议(转)的相关文章

Cisco-HSRP 热备份路由器协议-配置实例

同样的,首先做一些理论的扫盲.最起码要知道自己在配什么东西才行. 简介 HSRP(Hot StandbyRouter Protocol 热备份路由器协议)是Cisco的专有协议.HSRP把多台路由器组成一个"热备份组",形成一个虚拟路由器.这个组内只有一个路由器是Active(活动)的,并由它来转发数据包,如果活动路由器发生了故障,备份路由器将成为活动路由器.从网络内的主机来看,网关并没有改变. HSRP的工作过程 HSRP路由器利用Hello包来互相监听各自的存在.当路由器长时间没有

WAF——针对Web应用发起的攻击,包括但不限于以下攻击类型:SQL注入、XSS跨站、Webshell上传、命令注入、非法HTTP协议请求、非授权文件访问等

核心概念 WAF Web应用防火墙(Web Application Firewall),简称WAF. Web攻击 针对Web应用发起的攻击,包括但不限于以下攻击类型:SQL注入.XSS跨站.Webshell上传.命令注入.非法HTTP协议请求.非授权文件访问等.

iOS---代理与协议以及通知的使用

一.代理 1.代理的介绍 代理是一种通用的设计模式 代理使用方式:A 让 B 做件事,空口无凭,签个协议. 所以代理有三部分组成: 委托方: 定义协议 协议   : 用来规定代理方可以做什么,必须做什么 代理方: 按照协议完成委托方的需求 2. 协议的介绍 协议是定义了一套公用的接口,是方法的列表,但是无法实现. 可以通过代理,实现协议中的方法. 协议是公用方法,一般写在一个类里面. 如果多个类都使用这个协议,可以写成一个peotocol文件. 3.代理的使用 (1)委托某人做某事   先建立一

如何生成HLS协议的M3U8文件

什么是HLS协议: HLS(Http Live Streaming)是由Apple公司定义的用于实时流传输的协议,HLS基于HTTP协议实现,传输内容包括两部分,一是M3U8描述文件,二是TS媒体文件. HLS协议应用: 由于传输层协议只需要标准的 HTTP 协议, HLS 可以方便的透过防火墙或者代理服务器, 而且可以很方便的利用CDN进行分发加速, 这样就可以很方便的解决大规模应用的瓶颈.并且客户端实现起来也容易. HLS 目前广泛地应用于点播和直播领域,HLS协议是将音视频流通过HTTP协

新Krypt技术服务等级协议

各位用户您好, 自2017年3月20日起,Krypt将对所有独立服务器(Outlet以及R2O除外)的新订单实施新的技术服务等级协议.这项全新的改革,将直接影响到您购买每台独立服务器的成本以及后台技术工单的响应速度.请您仔细阅读下文: 全新的Krypt技术服务等级协议(SLA's)将分为基础级别Basic, 精品级别Essential, 增强级别Plus以及专业级别Pro四个不同的等级,所有已经购买的独立服务器套餐将自动被划分为Legacy等级. Krypt独立服务器与云服务器的基础SLA包括可

Http协议头

######### #概览 ######### 超文本传输协议(Http: Hyper Text Transfer Protocol) :用于发送WWW方式的数据.采用TCP/IP协议,是一个无状态协议.采用了请求/响应模型. ######### #Http请求 Request ######### 客户端向服务器发送一个请求,看图: HTTp请求包括: 1) 请求方法.URI(uniform Resource identity 统一资源标识符question/23133/. URL:统一资源定位

网络基础协议之http协议

作为一个开发人员,掌握必要的 HTTP 协议十分重要,下面就通过本文记录自己对 HTTP 协议的理解.本文很长,希望你有耐心看完,会有很多收获的,面试的时候很受用. 首先让我们从一个问题入手,当我们在浏览器中输入  http://www.baidu.com/ 访问百度的时候浏览器做了哪些事情.(这里以 Chrome 浏览器为例) 首先 Chrome 搜索自身的 DNS 缓存.(如果 DNS 缓存中找到百度的 IP 地址,就跳过了接下来查找 IP 地址步骤,直接访问该 IP 地址.) 搜索操作系统

重温Http协议--请求报文和响应报文

http协议是位于应用层的协议,我们在日常浏览网页比如在导航网站请求百度首页的时候,会先通过http协议把请求做一个类似于编码的工作,发送给百度的服务器,然后在百度服务器响应请求时把相应的内容再通过http协议做一个类似于解码的工作,这样浏览器才能理解这个数据,然后为我们展示出来百度首页. 这相当于是一种规范,网络中数据的传输在位于应用之下的各层(传输层,应用层)来完成的,在tcp/ip协议接收到数据时,我们是不能直接使用和浏览的,需要先通过一种规范来进行梳理,也就是解码,得到浏览器支持的一种格

数据链路层的协议分析

数据链路层目的是建立在物理层基础上,通过一些数据链路层协议,在不太可靠的物理链路上实现可靠的数据传输.即数据链路层提供网络中相邻节点之间可靠的数据通信. 数据链路层的主要功能是为网络层提供连接服务,并在数据链路连接上传送帧.依据功能可以分为有连接和无连接两种.本实验采用的是有应答,无连接服务. 无连接服务时,发送方的数据链路层要发送数据时,就直接发送数据帧.接收方的数据链路层能够接受数据帧,或者收到的帧校验正确,就像源主机数据链路层发送应答帧:不能接受或接受到的帧校验不正确时,就返回否定应答,发

tcp协议分析

tcp协议解析 TCP在网络OSI的七层模型中的第四层--Transport层,IP在第三层--Network层,ARP在第二层--Data Link层.在第二层上的数据,我们叫Frame,在第三层上的数据叫Packet,第四层的数据叫Segment. 我们程序的数据首先会打到TCP的Segment中,然后TCP的Segment会打到IP的Packet中,然后再打到以太网Ethernet的Frame中,传到对端后,各个层解析自己的协议,然后把数据交给更高层的协议处理 TCP头格式 TCP数据段格