Servlet-中文乱码

背景

  从Tomcat5.x开始,GET,POST方法提交信息,Tomcat采用不同的方式来处理编码。
  对于GET请求,Tomcat不会考虑使用request.setCharacterEncoding("UTF-8")设置的编码,而会永远使用ISO-8859-1编码。
  对于POST请求,Tomcat会使用request.setCharacterEncoding("UTF-8")设置的编码,如果没有设置,则使用"ISO-8859-1"。

  1 get方式,即请求参数的乱码问题

  原因:
  Tomcat官方文档中The HTTP Connector的配置,其中对URIEncoding属性的描述:
  This specifies the character encoding used to decode the URI bytes, after %xx decoding the URL. If not specified, ISO-8859-1 will be used.

  翻译:如果没有指定,将使用ISO-8859-1解码URI。

  解决方法,有两种:
  1 根本方法:修改server.xml文件

<Connector connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443" URIEncoding="UTF-8" />

  2 局部方法:得到一次参数,解码,再编码

String name=request.getParameter(parameter);
byte[] arr=name.getBytes("ISO8859-1");
String nameAfterTransfer=new String(arr,"UTF-8");

  2 post方式,即请求体的乱码问题

  原因:如果没有设置Request,则使用"ISO-8859-1"解码,和你提交页面的编码方式无关。

  解决方法:
  Tomcat官方文档中Container Provided Filters的配置,系统提供了一些Filter。其中一个是,org.apache.catalina.filters.SetCharacterEncodingFilter,顾名思义,是设置编码的过滤器。其中有两个属性,encoding,要设置编码的名字,另一个是,ignore,确定是否忽略了由用户代理指定的任何字符编码。如果此属性是true的,则忽略了用户代 
理,即浏览器提供的任何值。如果false,只有当用户代理没有指定一个编码时,编码才被设置。默认值是false的。

<filter>
  <filter-name>SetCharacterEncodingFilter</filter-name>
  <filter-class>org.apache.catalina.filters.SetCharacterEncodingFilter</filter-class>
  <init-param>
    <param-name>encoding</param-name>
    <param-value>自己设置的编码</param-value>
  </init-param>
  <init-param>
    <param-name>ignore</param-name>
    <param-value>true</param-value>
  </init-param>
</filter>
<filter-mapping>
  <filter-name>SetCharacterEncodingFilter</filter-name>
  <url-pattern>/*</url-pattern>
</filter-mapping>

  SetCharacterEncodingFilter类的中的实现,就是设置request.setCharacterEncoding(上面配置中的参数);

  结论:
  我们平时request.setCharacterEncoding("UTF-8")的设置,只是改变请求体的编码方式。

  3 get和post编码问题一起解决的方式:使用useBodyEncodingForURI属性。

  useBodyEncodingForURI,如果该值是true,将使用请求体的编码方式编码URI。

  Tomcat官方文档对useBodyEncodingForURI属性是这么解释的,

  如果请求的字符编码是不知道的(不是由浏览器提供,不由setcharacterencodingfilter或使用request.setcharacterencoding方法类似的过滤器),默认的编码是“ISO-8859-1”。而URIEncoding设置对此无影响。

  4 您猜测以下结果会乱码吗?

  在如下html页面中进行操作,该页面已经进行了UTF-8编码,POST提交到后台:

<!DOCTYPE html>
<html>
<head>
  <meta charset="UTF-8">
  <title>测试</title>
</head>
<body>
<div>
  <form action="http://localhost/Web/B" method="post">//B是我使用的Servlet类。
    <input type="text" name="name" value="大"/>
    <input type="submit" value="提交表单"/>
  </form>
</div>
</body>
</html>

  答案是:乱码,您答对了吗?
  结论:
    1 Tomcat不会理会我们所提交页面的编码方式,或者说请求中根本不含有编码方式。
  2 如果没有进行request.setCharacterEncoding("UTF-8")设置或者添加过滤器,Tomcat还是会使用"ISO-8859-1"解码。
  3 所以不论提交前页面的编码格式是什么,我们都要设置自己的编码方式。

  终极解决方案
  假设我们要全部使用UTF-8进行解码,终极解决方案就是,
  1 设置server.xml中,useBodyEncodingForURI="true"
  2 设置request.setCharacterEncoding("UTF-8");//本质添加过滤器也就是这么处理的,故没有说添加过滤器。

  就这样,我们就达到了get与post请求全部UTF-8解码的效果。

  最后,如果里面有不对的地方,欢迎大家对我的总结进行指正。

                                                          欲戴王冠,必承其重。

时间: 2024-11-05 05:24:11

Servlet-中文乱码的相关文章

[转]Servlet 中文乱码问题及解决方案剖析

一.常识了解 1.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2.java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码: 3.getBytes() 是通过平台默认字符集进行编码: 二.中文乱码出现 在学习任何一门技术时,经常会有初学者遇到中文乱码问题,比如MySQL,是因为在安装时没有设置:而在Servlet中,也会遇到中文乱码问题: 比如: OutputStream out = response.

Servlet中文乱码问题解决办法

首先对于源jsp网站和servlet里面的字符集要一样,一般支持中文的字符集为UTF-8最好采用这个字符集(除此之外还有gb2312); 对于源jsp文件的代码中需要设置 设置你的page里面的字符集 <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> 设置html文件里面的字符集 <meta http-eq

jsp与servlet中文乱码问题(转)

大家在JSP的开发过程中,经常出现中文乱码的问题,可能一至困扰着大家,现把JSP开发中遇到的中文乱码的问题及解决办法写出来供大家参考.首先了解一下Java中文问题的由来: Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦.原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题.首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流

Servlet 中文乱码问题及解决方案剖析

一.常识了解 1.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2.java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码: 3.getBytes() 是通过平台默认字符集进行编码: 二.中文乱码出现 在学习任何一门技术时,经常会有初学者遇到中文乱码问题,比如MySQL,是因为在安装时没有设置:而在Servlet中,也会遇到中文乱码问题: 比如: OutputStream out = response.

[原]过滤器解决Servlet中文乱码

一.问题描述:Servlet接收来自JSP页面的中文参数时,在Servlet文件中编写输出语句,控制台输出中文乱码. (乱码问题以前经常碰到,改编码格式相当麻烦) 利用过滤器解决方法可以一次性解决问题 1.过滤器在此方法的作用:每当程序要运行Servlet文件之前,都要去执行过滤器文件:在过滤器文件中编写要在Servlet文件之前运行的代码. 2.实现过程:分为两步(1.编写过滤器类.2.编写配置文件) 1.过滤器类 (1).在src文件下建个包 com.filter (2).在此包下新建类  

java servlet 中文乱码

在servlet中向控制台输出中文乱码: 但是在servlet里的main函数输出,中文是正确的: 通过在main函数里加了一段 System.out.println(Charset.defaultCharset()); 发现在run main函数时,defaultCharset是 utf-8 但是在run servlet时,defaultCharset是Windows-1252

【转载】Servlet 中文乱码问题及解决方案剖析

转自:http://blog.csdn.net/xiazdong/article/details/7217022 一.常识了解 1.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2.java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码: 3.getBytes() 是通过平台默认字符集进行编码: 二.中文乱码出现 在学习任何一门技术时,经常会有初学者遇到中文乱码问题,比如MySQL,是因为在安装时没有设

servlet中文乱码问题

通过response对象向页面输出内容时遇到的乱码问题可分为两种情况 1.字节流 字节流输出时可以通过设置响应头"Content-Type"的值为"text/html;charset=UTF-8"来制定浏览器打开页面时用的编码,并在写入时通过相应编码传入字符串的字节数组,如 通过"中文".getBytes("UTF-8")获取中文部分的UTF-8编码的字节数组. 2.字符流 response字符流对象中存在一个缓冲区,用来将字

Servlet中文乱码原因 解决 Get 和 Post 和客户端

一.Get方式的中文乱码 1) 使用如下页面表单内容: <form action="http://127.0.0.1:8080/day07/params" method="get"> 用户名:<input name="username" type="text" /><br/> 密 码:<input name="password" type="passwor

jsp+servlet 中文乱码问题

一. 由于doget和dopost的处理方式不同,在做servlet的时候遇到这样一个问题:用doPost获得的参数只要加上“request.setCharacterEncoding("utf-8")”这样一行,则显示中文不会乱码,但是用doGet获得的参数加上“request.setCharacterEncoding("utf-8")”这一行后却依然乱码,解决方法如下: 1.这一个是一劳永逸的方法,从网上找到的    在你的Tomcat服务器根目录下找到conf/