[转] Request 接收参数乱码原理解析

起因:

今天早上被同事问了一个问题:说接收到的参数是乱码,让我帮着解决一下。

实际情景:

同事负责的平台是Ext.js框架搭建的,web.config配置文件里配置了全局为“GB2312”编码:

<globalization requestEncoding="gb2312" responseEncoding="gb2312" fileEncoding="gb2312" culture="zh-CN"/>

当前台提交“中文文字”时,后台用Request.QueryString["xxx"]接收到的是乱码。

无论用System.Web.HttpUtility.UrlDecode("xxx","编码类型")怎么解码都无效。

原理说明:

1:首先确定的是:客户端的url参数在提交时,Ext.js 会对其编码再提交,而客户端的编码默认是 utf-8 编码

客户端默认有三种编码函数:escape() encodeURI() encodeURIComponent()

2:那为什么用 Request.QueryString["xxx"] 接收参数时,收到的会是乱码?

为此,我们必须解开 Request.QueryString 的原始处理逻辑过程

我们步步反编绎,

2.1:看 QueryString 属性的代码:

 1 public NameValueCollection QueryString
 2 {
 3     get
 4     {
 5         if (this._queryString == null)
 6         {
 7             this._queryString = new HttpValueCollection();
 8             if (this._wr != null)
 9             {
10                 this.FillInQueryStringCollection();//重点代码切入点
11             }
12             this._queryString.MakeReadOnly();
13         }
14         if (this._flags[1])
15         {
16             this._flags.Clear(1);
17             ValidateNameValueCollection(this._queryString, "Request.QueryString");
18         }
19         return this._queryString;
20     }
21 }

2.2:切入 FillInQueryStringCollection()方法

 1 private void FillInQueryStringCollection()
 2 {
 3     byte[] queryStringBytes = this.QueryStringBytes;
 4     if (queryStringBytes != null)
 5     {
 6         if (queryStringBytes.Length != 0)
 7         {
 8             this._queryString.FillFromEncodedBytes(queryStringBytes, this.QueryStringEncoding);
 9         }
10     }//上面是对流字节的处理,即文件上传之类的。
11     else if (!string.IsNullOrEmpty(this.QueryStringText))
12     {
13         //下面这句是对普通文件提交的处理:FillFromString是个切入点,编码切入点是:this.QueryStringEncoding
14         this._queryString.FillFromString(this.QueryStringText, true, this.QueryStringEncoding);
15
16     }
17 }

2.3:切入:QueryStringEncoding

 1 internal Encoding QueryStringEncoding
 2 {
 3     get
 4     {
 5         Encoding contentEncoding = this.ContentEncoding;
 6         if (!contentEncoding.Equals(Encoding.Unicode))
 7         {
 8             return contentEncoding;
 9         }
10         return Encoding.UTF8;
11     }
12 }
13 //点击进入this.ContentEncoding则为:
14 public Encoding ContentEncoding
15 {
16     get
17     {
18         if (!this._flags[0x20] || (this._encoding == null))
19         {
20             this._encoding = this.GetEncodingFromHeaders();
21             if (this._encoding == null)
22             {
23                 GlobalizationSection globalization = RuntimeConfig.GetLKGConfig(this._context).Globalization;
24                 this._encoding = globalization.RequestEncoding;
25             }
26             this._flags.Set(0x20);
27         }
28         return this._encoding;
29     }
30     set
31     {
32         this._encoding = value;
33         this._flags.Set(0x20);
34     }
35 }

说明:

从QueryStringEncoding代码得出,系统默认会先取globalization配置节点的编码方式,如果取不到,则默认为UTF-8编码方式

2.4:切入  FillFromString(string s, bool urlencoded, Encoding encoding)

 1 internal void FillFromString(string s, bool urlencoded, Encoding encoding)
 2 {
 3     int num = (s != null) ? s.Length : 0;
 4     for (int i = 0; i < num; i++)
 5     {
 6         int startIndex = i;
 7         int num4 = -1;
 8         while (i < num)
 9         {
10             char ch = s[i];
11             if (ch == ‘=‘)
12             {
13                 if (num4 < 0)
14                 {
15                     num4 = i;
16                 }
17             }
18             else if (ch == ‘&‘)
19             {
20                 break;
21             }
22             i++;
23         }
24         string str = null;
25         string str2 = null;
26         if (num4 >= 0)
27         {
28             str = s.Substring(startIndex, num4 - startIndex);
29             str2 = s.Substring(num4 + 1, (i - num4) - 1);
30         }
31         else
32         {
33             str2 = s.Substring(startIndex, i - startIndex);
34         }
35         if (urlencoded)//外面的传值默认是true,所以会执行以下语句
36         {
37             base.Add(HttpUtility.UrlDecode(str, encoding), HttpUtility.UrlDecode(str2, encoding));
38         }
39         else
40         {
41             base.Add(str, str2);
42         }
43         if ((i == (num - 1)) && (s[i] == ‘&‘))
44         {
45             base.Add(null, string.Empty);
46         }
47     }
48 }

说明:

从这点我们发现:所有的参数输入,都调用了一次:HttpUtility.UrlDecode(str2, encoding);

3:结论出来了

当客户端js对中文以utf-8编码提交到服务端时,用Request.QueryString接收时,会先以globalization配置的gb2312去解码一次,于是,产生了乱码。

所有的起因为:

1:js编码方式为urt-8

2:服务端又配置了默认为gb2312

3:Request.QueryString默认又会调用HttpUtility.UrlDecode用系统配置编码去解码接收参数。

文章补充

1:系统取默认编码的顺序为:http请求头->globalization配置节点-》默认UTF-8

2:在Url直接输入中文时,不同浏览器处理方式可能不同如:ie不进行编码直接提交,firefox对url进行gb2312编码后提交。

3:对于未编码“中文字符”,使用Request.QueryString时内部调用HttpUtility.UrlDecode后,由gb2312->utf-8时,

如果查不到该中文字符,默认转成"%ufffd",因此出现不可逆乱码。

4:解决之路

知道了原理,解决的方式也有多种多样了:

a:全局统一为 UTF-8 编码,省事又省心。

b:全局指定了 GB2312 编码时,url 带中文,js 非编码不可,如 ext.js 框架。

这种方式你只能特殊处理,在服务端指定编码解码,
因为默认系统调用了一次HttpUtility.UrlDecode("xxx",系统配置的编码),
因此你再调用一次HttpUtility.UrlEncode("xxx",系统配置的编码),返回到原始urt-8编码参数
再用HttpUtility.UrlDecode("xxx",utf-8),解码即可。

5:其它说明:默认对进行一次解码的还包括 URI 属性,而 Request.RawUrl 则为原始参数

时间: 2024-10-08 00:56:30

[转] Request 接收参数乱码原理解析的相关文章

Request 接收参数乱码原理解析二:浏览器端编码原理

上一篇<Request 接收参数乱码原理解析一:服务器端解码原理>,分析了服务器端解码的过程,那么浏览器是根据什么编码的呢? 1. 浏览器解码 浏览器根据服务器页面响应Header中的“Content-Type: text/html; charset=gb2312”解码.修改web.config中“responseEncoding=utf-8”,发现服务器页面响应Header变成了“Content-Type: text/html; charset=utf8”. <system.web&g

Request 接收参数乱码原理解析一:服务器端解码原理

“Server.UrlDecode(Server.UrlEncode("北京")) == “北京””,先用UrlEncode编码然后用UrlDecode解码,这条语句永远为true吗?答案是否定的,结果可能与很多人预想的不大一样.本文主要分析这一问题出现的原理,研究下Server.UrlEncode(),Server.UrlDecode(),Request["xxx"]三个函数与编码方式的关系. 1. 问题出现的情景 网站采用了GB2312编码,在Web.confi

Request 接收参数乱码原理解析

起因: 今天早上被同事问了一个问题:说接收到的参数是乱码,让我帮着解决一下. 实际情景: 同事负责的平台是Ext.js框架搭建的,web.config配置文件里配置了全局为“GB2312”编码: <globalization requestEncoding="gb2312" responseEncoding="gb2312" fileEncoding="gb2312" culture="zh-CN"/> 当前台提交

处理request接收参数的中文乱码的问题:

? POST的解决方案: * POST的参数在请求体中,直接到达后台的Servlet.数据封装到Servlet中的request中.request也有一个缓冲区.request的缓冲区也是ISO-8859-1编码. * 设置request的缓冲区的编码: * request.setCharacterEncoding("UTF-8");  --- 一定要在接收参数之前设置编码就OK. ? GET的解决方案: * 1.修改tomcat的字符集的编码.(不推荐) * 2.使用URLEncod

pager-taglib分页中文乱码原理解析

关于使用pager-taglib分页前端传递中文参数乱码问题的解决方案 1.重现问题 在web项目中有时会用到pager-taglib来作为分页的标签,如上图红色框标识所示,当我们需要把页面参数保持的时候我们会在<pg:param />标签中把参数进行传递. 如果你的页面编码为gb2312那这样写是没有问题的,但是如果你的页面编码是utf-8的话那就会出现乱码问题.我尝试了很多方法,编码过滤器,编码拦截器(struts2),传递 参数的时候进行编码然后后台进行解码,还有WEB(如TomCat等

request.getParameter(“参数名”) 中文乱码解决方法

今天浏览项目时候,遇到一个问题,页面用${requestScope.参数名 }获取的值是乱码,然后搜了一下,最后说是编码的问题,附上查找的结果: 在Java 开发中,如果框架搭建的不完善或者初学者在学习过程中,出现中文乱码是经常的事儿(哈.谁让发明java语言的不是中国人呢) 今天跟大家分享几个解决java Web开发中,request.getParameter()获取URL中文参数乱码的解决办法 解决问题,先要研究问题,URL传中文参数为什么会出现乱码? 原因:Http请求传输时将url以IS

JSONP跨域的原理解析

JSONP跨域的原理解析 一种脚本注入行为 在 2011年10月27日 那天写的     已经有 99238 次阅读了 感谢 参考或原文 JavaScript是一种在Web开发中经常使用的前端动态脚本技术.在JavaScript中,有一个很重要的安全性限制,被称为"Same-Origin Policy"(同源策略).这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制,即JavaScript只能访问与包含它的文档在同一域下的内容. JavaScript这个安全策略在进

Spring?IOC设计原理解析:本文乃学习整理参考而来

Spring IOC设计原理解析:本文乃学习整理参考而来 一. 什么是Ioc/DI? 二. Spring IOC体系结构 (1) BeanFactory (2) BeanDefinition 三. IoC容器的初始化 1. XmlBeanFactory(屌丝IOC)的整个流程 2. FileSystemXmlApplicationContext 的IOC容器流程 1.高富帅IOC解剖 2. 设置资源加载器和资源定位 3.AbstractApplicationContext的refresh函数载入

springmvc传递参数与接收参数

springmvc和structs的接收参数的映射原理是一样的一.表单代码<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3