之前针对这个也不是很关注,这个chunked在nginx上是默认开启的,但是在apache上没有,所以当切换服务器的时候,同时遇到了这个问题,发现数据内容存在乱码。
定位我就知道应该是http header的问题,但是具体是什么也不是很清楚。
仔细查阅发现,这个chunked编码。
http以trunked编码方式传输的数据表示规则
一般HTTP通信时会使用是Content-Length头信息性来指定小,但是有时候无法确定信息大小,就要使用trunked编码动态的提供body内容的长度。
进行Chunked编码传输的HTTP数据要在消息头部设置:
Transfer-Encoding: chunked
表示Content Body将用chunked编码传输内容。
Chunked编码一般使用若干个chunk串连而成,最后由一个标明长度为0的chunk标示结束。
每个chunk分为头部和正文两部分,
头部内容指定下一段正文的字符总数(非零开头的十六进制的数字)和数量单位(一般不写,表示字节).
正文部分就是指定长度的实际内容,两部分之间用回车换行(CRLF)隔开。
在最后一个长度为0的chunk中的内容是称为footer的内容,是一些附加的Header信息(通常可以直接忽略)。具体的chunk编码格式如下:
- chunked-body =
*chunk - "0" CRLF
- footer
- CRLF
- chunk = chunk-size
[ chunk-ext ] CRLF - chunk-data CRLF
- hex-no-zero
= <HEX excluding "0"> - chunk-size = hex-no-zero
*HEX - chunk-ext =
*( ";" chunk-ext-name
[ "=" chunk-ext-value
] ) - chunk-ext-name
= token - chunk-ext-val
= token | quoted-string - chunk-data = chunk-size(OCTET)
- footer = *entity-header
RFC文档中的chunked解码过程如下:
- length := 0
- read chunk-size, chunk-ext
(if any) and CRLF - while (chunk-size >
0) { - read chunk-data and CRLF
- append chunk-data to entity-body
- length := length
+ chunk-size - read chunk-size and CRLF
- }
- read entity-header
- while (entity-header not empty)
{ - append entity-header to existing header fields
- read entity-header
- }
- Content-Length := length
- Remove "chunked" from Transfer-Encoding
nginx服务器关闭chunked编码方式:
chunked_transfer_encoding off;
参考链接:
http://www.6san.com/759/
http://www.sunnyu.com/?p=175
时间: 2024-10-01 00:29:06