Java网络编程-HTTP协议

HTTP协议的定义

这篇文章暂时不研究HTTP底层的TCP/IP的握手和挥手过程,只从表面的交互流程分析HTTP协议。

HTTP英文全称是Hypertext Transfer Protpcol,也就是超文本传输协议。HTTP是一个标准,定义了Web客户端如何与服务器对话以及数据如何从服务器传回到客户端。在日常开发和使用过程中,HTTP经常被认为是一种用于传输HTML文件和文件中内嵌的图片的协议或者手段,实际上HTTP是一种通用的网络数据传输格式,它的传输内容不仅仅局限于HTML文件或者图片,也可以用来传输Microsoft Word文档甚至是Windows的exe文件等等,所有可以用字节序列表示的数据都可以使用HTTP进行传输。

HTTP通过TCP/IP进行数据传输,如果忽略底层的TCP协议的握手和挥手的细节,对于从客户端到服务器的每一个请求和请求的响应,在HTTP1.0有下面几个步骤:

  • 1、默认情况下,客户端在端口80开启与服务器的一个TCP连接,当然也可以指定其他的端口。
  • 2、客户端向服务器发送消息,请求指定路径上的资源。一个HTTP请求包括一个首部,可选项包括一个空行和这次请求的数据。
  • 3、服务器向客户端发送响应。响应以响应码开头,接着是包含元数据的首部,可选项包括一个空行以及所请求的文档数据或者错误信息。
  • 4、服务器关闭TPC连接。

在HTTP1.1(目前最常用的就是HTTP1.1)以及以后的HTTP版本中,可以通过一个TCP连接连续发送多个请求和接收多个响应。也就是说,上面的1和4步骤中间的2和3步骤可以反复执行多次。另外,HTTP1.1中,请求数据和响应数据可以分块发送,提高了扩展性。

HTTP请求方法

HTTP中定义了多种请求方法,用于标识当次请求需要完成什么类型的操作,常用的HTTP请求方法有GET、HEAD、PUT、POST、PATCH、TRACE、OPTIONS、DELETE。

HTTP请求方法 描述 是否安全 是否幂等
GET 通常用于请求服务器获取某个资源
HEAD 类似于GET,但是响应结果中不包含响应体,只包含协议信息和首部,通常用于测试资源是否存在或者是否被修改 -
POST 客户端向服务器提交数据(支持HTML的表单数据),可能会导致新的资源的建立或者已有资源的修改
PUT 从客户端向服务器传送的数据取代指定的文档的内容(全部取代)
PATCH 客户端向服务器传送的数据取代指定的文档的内容(部分取代)
TRACE 回显客户端请求服务器的原始请求报文,用于"回环"诊断 -
OPTIONS 请求服务器获取服务器支持的各种功能,可以询问服务器支持什么类型的HTTP方法,一般用于性能测试 -
DELETE 请求服务器删除指定的资源

上面说到的"是否安全"的选项是"是",意味着使用该种HTTP请求方法不会发生任何数据的修改或者更新动作,也就是请求多次也不会影响到资源的状态。如果"是否幂等"的选项是"是",意味着使用该HTTP请求方法请求多次HTTP调用,无论调用多少次,请求结果或者资源的状态是一样的(可以理解为只有首次调用是真正修改了资源的状态,从第二次调用开始后面的调用只获取到第一次调用的结果)。HTTP方法的安全性和幂等性是我们在设计HTTP接口时候需要重点考虑的两个因素。

值得注意的是:上面提到的POST和PUT方法的功能可以理解为相同的,两者的主要区别在于POST不是幂等的,而PUT是幂等的。在目前的Web开发中,POST方法已经被滥用,一般很少人会使用PUT,除非是推崇RESTFUL风格编程。PUT方法和PATCH方法的功能类似,都是用客户端请求的数据去替换掉服务器中指定文档中的内容,不过PUT方法是全部替换,而PATCH方法是部分替换。

PS:上面的方法只是HTTP协议中的请求方法的一些规范,没有硬性规定一定要遵循。

常见的HTTP状态码

JDK中常见的HTTP状态码可以在类java.net.HttpURLConnection中找到,总结一下如下:

状态码 状态码消息 含义 HttpURLConnection中的常量 简单描述
1xx - 信息状态码。 - 不常见,暂不考虑
100 Continue 服务器准备接受请求主体,客户端发送请求主体;这允许客户端在请求发送大量数据之前询问服务器是否接受请求。 - 不常见,暂不考虑
101 Switching Protocols 服务器接受客户端在Upgrade首部字段中要求改变应用的协议请求,如从HTTP转换为WebSockets。 - 不常见,暂不考虑
2xx - 表示请求成功。 - -
200 OK 最常见的响应码,代表请求成功。如果请求方法是GET或者POST,所请求的数据与正常的首部都包含在响应体中。如果请求方法是HEAD,则只包含首部信息。 HTTP_OK 处理请求成功
201 Created 服务器已经在响应体中指定的URL创建了对应的资源。客户端现在应当尝试加载该URL。这个响应码只在响应POST请求时发送。 HTTP_CREATED 创建成功
202 Accepted 表示请求已经被处理,但是处理尚未结束,所以不会返回任何响应数据。 HTTP_ACCEPTED 接受请求
203 Non-Authoritative Information 由缓存代理或者其他本地源返回资源的表示,不能保证是最新的。 HTTP_NOT_AUTHORITATIVE 无权威的返回结果
204 No Content 服务器已经成功处理了该请求,但是没有信息发回给客户端。一般是由于服务器上的表单处理逻辑的问题,只接收数据不返回数据。 HTTP_NO_CONTENT 无返回内容
205 Reset Content 服务器已经成功处理了该请求,但是没有信息发回给客户端。客户端应该清除发送请求的表单信息。 HTTP_RESET 重置内容
206 Partial Content 服务器返回客户端请求的资源的部分内容,而不是整个文档。 HTTP_PARTIAL 部分内容
3xx - 重定向。 - -
300 Multiple Choices 服务器为所请求的文档提供一组不同的表示。 HTTP_MULT_CHOICE 多重选择
301 Moved Permanently 资源已经移动到一个新的URL。客户端应当自动加载这个URL的资源。 HTTP_MOVE_PERM 永久移动
302 Moved Temporarity 资源暂时移动到一个新的URL,但其位置在不久的将来还会再次改变。 HTTP_MOVE_TEMP 临时移动
4xx - 客户端错误 - -
400 Bad Request 客户端向服务器发出的请求使用了不正确的语法。 HTTP_BAD_REQUEST 错误请求
401 Unauthorized 访问这个URL需要身份验证,一般是用户名和口令。 HTTP_UNAUTHORIZED 未授权
403 Forbidden 服务器理解请求,但是有意拒绝进行处理。 HTTP_FORBIDDEN 禁止访问
404 Not Found 最常见的错误响应,指示服务器找不到所请求的资源。 HTTP_NOT_FOUND 未找到资源
405 Method Not Allowed 请求方法不支持用于请求指定的资源。 HTTP_BAD_METHOD 方法禁用
406 Not Acceptable 所请求的资源不能以客户端希望的格式提供,客户端期望的格式由请求HTTP首部Accept字段指定。 HTTP_NOT_ACCEPTABLE 不接受
5xx - 服务端错误 - -
500 Internale Server Error 服务器内部异常。 HTTP_SERVER_ERROR 服务器异常
501 Not Implemented 服务器不具备完成请求的功能。 HTTP_NOT_IMPLEMENTED 尚未实现
502 Bad Gateway 服务器作为网关或代理,从上游服务器收到无效响应。 HTTP_BAD_GATEWAY 错误网关
503 Service Unavailable 服务器暂时无法处理请求,可能是超负荷或者维护等原因。 HTTP_UNAVAILABLE 服务不可用

简单概括如下:

  • 响应码100-199表示一个提供信息的响应。
  • 响应码200-299表示请求成功。
  • 响应码300-399表示重定向。
  • 响应码400-499表示一个客户端引发的错误。
  • 响应码500-599表示一个服务器引发的错误。

常见的HTTP首部

下面简单列举一些比较常用的首部以及它们的作用。

User-Agent

User-Agent一般作为请求首部,用于告知服务器当前客户端使用的是什么浏览器,翻译过来就是用户代理,作用是允许服务器响应请求时候针对客户端用户代理的类型优化返回的数据或者文件。例如使用Chrome发送请求时,User-Agent如下:

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36

Host

Host一般作为请求首部,用于指定接收该请求的服务器的主机名和端口号。例如:

Host: www.importnew.com

Accept

Accept一般作为请求首部,它的作用是告知服务器它可以使用或者想要什么已经不能使用或者不想要什么。下面是几个Accept首部以及它们的作用:

首部 作用
Accept 告知服务器客户端可以接收和处理哪些媒体类型
Accept-Charset 告知服务器客户端可以接收和处理哪些字符集
Accept-Encoding 告知服务器客户端可以接收和处理哪些编码方式
Accept-Language 告知服务器客户端可以接收和处理哪些语言

Accept首部用于指定接收媒体类类型的时候,需要指定类型和子类型,这是因为媒体类型(MIME)本来就是按二级分类的,例如JPEG图像的媒体类型是image/jpeg,类型是image,子类型是jpeg。MIME已经定义了八种顶级的类型:

  • text/*表示人可读的文字。
  • image/*表示图片。
  • model/*表示3D模型,如VRML文件。
  • audio/*表示音频。
  • video/*表示多媒体图片、视频,也可能是音频。
  • application/*表示二进制数据。
  • message/*表示协议特定的信封,如Email消息和HTTP响应。
  • muitipart/*表示多个文档和资源的容器。

举个例子,如果客户端只接收JSON数据:

Accept: application/json

Referer

Referer一般作为请求首部,它提供了包含当前请求的URL的文档的URL,也就是当前请求的上一个来源的文档,一般用作防盗链。例如www.baidu.com/search?name=doge,服务器在处理此请求的时候,需要判断Referer是否为www.baidu.comwww.baidu.com/search的上一个文档来源必须是www.baidu.com,否则服务器应该拒绝该请求。

Cookie

Cookie一般作为请求首部,客户端通过它向服务器传送一个或者多个令牌,原则上Cookie并不是安全的首部,Cookie的内容也会缓存在客户端。一般在Servlet应用中,Cookie是识别当前用户,实现持久会话的最佳方式。从过期时间分类来看,Cookie分为会话Cookie和持久Cookie,会话Cookie的过期时间比较短,持久Cookie的过期时间比较长或者不会过期,Cookie的过期策略等控制应该由服务端控制。由于Cookie是直接暴露在客户端,一般不能使用Cookie存放敏感的数据,需要存放敏感数据可以考虑使用数据加密处理。

Cookie: uid=10086; domain="localhost"

Set-Cookie

Set-Cookie一般作为响应首部,和Cookie对应,表示服务器设置成功的Cookie。

Cache-Control

Cache-Control一般作为请求首部,告知服务器对当前的请求的响应结果进行缓存相关操作。Cache-Control支持的值比较多,这里不展开细节,常见的如no-cache表示在没有成功通过源站校验的情况下不得使用缓存,如max-age表示响应结果需要缓存到指定的最大时间。

Content-Type

Content-Type是通用首部,可以作为请求首部或者响应首部,它的作用是告知服务器或者客户端当前请求或者响应结果的内容(媒体)类型。

Content-Length

Content-Length是通用首部,可以作为请求首部或者响应首部,它的作用是告知服务器或者客户端当前请求或者响应数据体的长度。

Content-Encoding

Content-Encoding一般作为响应首部,与Accept-Encoding对应,用于服务器告知客户端当前响应结果的内容编码。

Content-Language

Content-Language一般作为响应首部,与Accept-Language对应,用于服务器告知客户端当前响应结果的内容语言。

Connection

Connection一般作为请求首部,表示是否需要持久连接。在HTTP1.1中,如果指定为Keep-Alive,可以提供持久连接,提高Socket的复用率从而降低多次连接的性能消耗。下面有一个小节专门介绍Keep-Alive。

Orgin

Origin一般作为请求首部,指明当前的请求是一个针对跨域资源共享的请求(该请求要求服务器在响应中加入一个Access-Control-Allow-Origin的消息头,表示访问控制所允许的来源)。

Origin: http://www.baidu.com

Access-Control-Allow-Origin

Access-Control-Allow-Origin一般作为响应首部,和Origin对应,表示服务器允许的该跨域资源共享的请求来源。

Access-Control-Allow-Origin: http://www.baidu.com

Server

Server一般作为响应首部,用于告知客户端服务器的相关信息。

HTTP请求体

如果采用GET请求方法,只需要向远处服务器提供URL,URL中的路径和查询字符串就可以匹配到需要查询的资源。但是URL中无法提供详细的客户端信息。另外,像POST和PUT这些请求方法所携带的数据体有可能比较大,无法放在URL的查询字符串。因此HTTP需要请求体。HTTP请求体包括下面四个部分:

  • 1、一个起始请求行,包括HTTP方法、路径、查询字符串以及HTTP版本。
  • 2、HTTP请求的首部。
  • 3、一个空行(两个连续的回车或者换行对)。
  • 4、请求数据体。

文字描述可能比较抽象,用图表示如下:

PS:space代表空格,\r\n代表换行。

举个例子:

GET /wp-admin/admin-ajax.php?postviews_id=23996&action=postviews&_=1538708851063 HTTP/1.1
Host: www.importnew.com
Connection: keep-alive
Pragma: no-cache
Cache-Control: no-cache
Accept: */*
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36
Referer: http://www.importnew.com/23996.html
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9

postviews_id=23996&action=postviews&_=1538708851063

HTTP响应体

响应体和请求体的格式类似,主要是返回服务器的响应数据到客户端,包括服务器的一些信息和响应数据体。HTTP响应体主要包括下面的四个部分:

  • 1、一个起始响应行,包括HTTP版本、状态码、状态码描述。
  • 2、HTTP响应的首部。
  • 3、一个空行(两个连续的回车或者换行对)。
  • 4、响应数据体。

文字描述可能比较抽象,用图表示如下:

PS:space代表空格,\r\n代表换行。

举个例子:

HTTP/1.1 200 OK
Server: nginx
Date: Fri, 05 Oct 2018 03:07:37 GMT
Content-Type: text/html; charset=UTF-8
Transfer-Encoding: chunked
Connection: keep-alive
Keep-Alive: timeout=2
Vary: Accept-Encoding
X-Powered-By: PHP/5.3.3
X-Robots-Tag: noindex
X-Content-Type-Options: nosniff
X-Frame-Options: SAMEORIGIN
Content-Encoding: gzip

2995

Keep-Alive

在使用HTTP1.0的时候会为每个请求打开一个新的TCP连接,实际上,这导致了一个典型Web会话中打开和关闭所有连接所花费的事件远远大于实际传输数据所消耗的时间,特别是响应结果包含很多小文档的会话。对于使用SSL或者TLS加密的HTTPS连接,这个问题更加严重,因为建立一个安全的Socket的握手过程远比建立常规的Socket需要更多的工作。

在HTTP1.1和后面的版本中,服务器不必在返送响应之后就关闭连接。已经建立的连接可以保持打开,在同一个Socket上等待来自客户端的新请求。简单来说,就是可以在一个TCP连接上连续发送多个请求和连续进行多个请求的响应。

客户端可以在HTTP请求首部中添加一个Connection请求头,指定值为Keep-Alive,这样就能实现Socket的重用:

Connection: Keep-Alive

HTTP1.1或者之后的版本,Keep-Alive是默认开启的,不需要显式指定,如果需要关闭可以设置为close:

Connection: close

一旦开启了Keep-Alive,服务器在关闭一个Socket连接之前,如果有新的客户端再次连接到服务器,那么就是重用Socket。在JDK中可以通过系统属性来控制如果使用HTTP的Keep-Alive:

  • http.keepAlive:默认值为true,默认开启HTTP的Keep-Alive。
  • http.maxConnections:同时保持打开的Socket数量的最大值,默认值为5。
  • http.keepAlive.remainingData:默认值为false,如果设置为true,则JDK在丢弃连接之后会完成剩余数据的清理。
  • sun.net.http.errorstream.enableBuffering:默认值为false,如果设置为true,则尝试缓存400和500状态码的相对小的错误流,从而能释放连接以备后续使用。
  • sun.net.http.errorstream.bufferSize:为缓存错误流的缓冲区的字节大小,默认值为4096字节,只有上一项为true的时候才有意义。
  • sun.net.http.errorstream.timeout:默认值为300ms,读取错误流超时的毫秒数。

Cookie和Cookie管理

很多网站使用一些小文本串在连接之间存储持久的客户端状态,这些小文本串称为Cookie(中文翻译为:小甜点)。Cookie在请求和响应的首部从服务器传到客户端,再从客户端传回服务器,服务器使用Cookie来指示sessionID、购物车内容、登录凭据等。
除了简单的name=value对,Cookie可以有多个属性来控制它们的作用域,包括过期日期、路径、域、端口、版本和安全选项。

JDK中java.net.CookieStore类提供了对Cookie的增删查操作,它的默认实现是java.net.InMemoryCookieStore,如果实现CookieStore,JDK中的Cookie默认是存放在内存中的。另外,java.net.CookieManager内部持有CookiePolicy和CookieStore,定义了一系列管理Cookie的方法,一般通过CookieManager操作Cookie,当然也可以通过实现CookieStore,覆盖默认的CookieManager来实现Cookie的自定义管理。

小结

(本文完 c-2-d e-20181005)

原文地址:https://www.cnblogs.com/throwable/p/9746384.html

时间: 2024-10-07 13:43:57

Java网络编程-HTTP协议的相关文章

Java 网络编程 UDP协议

网络编程 TCP/IP协议:多台计算机网络连接的规则 包括:TCP协议.IP协议.UDP协议和其它协议的协议组 层次结构: 链路层:链路层是用于定义物理传输通道,通常是对某些网络连接设备的驱动协议,例如针对光纤.网线提供的驱动.硬件方面的 网络层:网络层是整个TCP/IP协议的核心,它主要用于将传输的数据进行分组,将分组数据发送到目标计算机或者网络. 传输层:主要使网络程序进行通信,在进行网络通信时,可以采用TCP协议,也可以采用UDP协议. 应用层:主要负责应用程序的协议,例如HTTP协议.F

java 网络编程 TCP协议 java 服务器和客户端 java socket编程

一个 HelloWord 级别的 Java Socket 通信的例子.通讯过程:        先启动 Server 端,进入一个死循环以便一直监听某端口是否有连接请求.然后运行 Client 端,客户端发出连接请求,服务端监听到这次请求后向客户端发回接受消息,连接建立,启动一个线程去处理这次请求,然后继续死循环监听其他请求.客户端输入字符串后按回车键,向服务器发送数据.服务器读取数据后回复客户端数据.这次请求处理完毕,启动的线程消亡.如果客户端接收到 "OK" 之外的返回数据,会再次

Java网络编程(TCP协议-服务端和客户端交互)

客户端: 1 package WebProgramingDemo; 2 3 import java.io.IOException; 4 import java.io.InputStream; 5 import java.io.OutputStream; 6 import java.net.Socket; 7 import java.net.UnknownHostException; 8 9 public class SocketDemo { 10 11 /** 12 * @param args

java 网络编程-TCP协议基本步骤

TCP:TCP协议基于请求-响应模式利用io流实现数据的传输 创建服务器1.指定端口 使用ServerSocket创建服务器2.阻塞式等待连接accept,有一个accept就建立了一个客户端3.操作:io流4.释放资源 public class tcp { public static void main(String[]args) throws IOException { System.out.println("-----Server-----"); // 1.指定端口 使用Serv

Java网络编程 - 基于UDP协议 实现简单的聊天室程序

最近比较闲,一直在抽空回顾一些Java方面的技术应用. 今天没什么事做,基于UDP协议,写了一个非常简单的聊天室程序. 现在的工作,很少用到socket,也算是对Java网络编程方面的一个简单回忆. 先看一下效果: 实现的效果可以说是非常非常简单,但还是可以简单的看到一个实现原理. "聊天室001"的用户,小红和小绿相互聊了两句,"聊天室002"的小黑无人理会,在一旁寂寞着. 看一下代码实现: 1.首先是消息服务器的实现,功能很简单: 将客户端的信息(进入了哪一个聊

java网络编程serversocket

转载:http://www.blogjava.net/landon/archive/2013/07/24/401911.html Java网络编程精解笔记3:ServerSocket详解ServerSocket用法详解 1.C/S模式中,Server需要创建特定端口的ServerSocket.->其负责接收client连接请求. 2.线程池->包括一个工作队列和若干工作线程->工作线程不断的从工作队列中取出任务并执行.-->java.util.concurrent->线程池

java网络编程socket解析

转载:http://www.blogjava.net/landon/archive/2013/07/02/401137.html Java网络编程精解笔记2:Socket详解 Socket用法详解 在C/S通信模式中,client需要主动创建于server连接的Socket(套接字).服务器端收到了客户端的连接请求,也会创建与客户连接的Socket.Socket可看做是通信两端的收发器.server与client都通过Socket来收发数据. 1.构造Socket 1.Socket() 2.So

java网络编程socket\server\TCP笔记(转)

java网络编程socket\server\TCP笔记(转) 2012-12-14 08:30:04|  分类: Socket |  标签:java  |举报|字号 订阅 1 TCP的开销 a  连接协商三次握手,c->syn->s,s->syn ack->c, c->ack->s b  关闭协商四次握手,c->fin->s, s->ack-c,s->fin->c,c->ack->s c  保持数据有序,响应确认等计算开销 d

Java网络编程基础【转】

网络编程 网络编程对于很多的初学者来说,都是很向往的一种编程技能,但是很多的初学者却因为很长一段时间无法进入网络编程的大门而放弃了对于该部分技术的学习. 在 学习网络编程以前,很多初学者可能觉得网络编程是比较复杂的系统工程,需要了解很多和网络相关的基础知识,其实这些都不是很必需的.首先来问一个问题:你 会打手机吗?很多人可能说肯定会啊,不就是按按电话号码,拨打电话嘛,很简单的事情啊!其实初学者如果入门网络编程的话也可以做到这么简单! 网络编程就是在两个或两个以上的设备(例如计算机)之间传输数据.