tomcat的乱码问题

String filename=request.getParameter("filename");
filename=new String(filename.getBytes("iso8859-1"),"utf-8");
解释第二句,用意是什么?为什么这样做?原理是什么?
1、你这种情况往往是在http请求get传输参数方式的时候,web容器是tomcat,而tomcat的默认编码是iso8859-1。
2、若为iso8859-1,而你的项目非该编码在接收到中文类字符时,即会出现乱码。
3、解决方法,即是将iso8859-1转化为项目编码如gbk或utf-8,就解决了传输过程的中文乱码问题。
不清楚什么时候该这样处理?什么时候不应该?
1、在get请求时,关键看你的tomcat的server.xml中的
     “
<Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443"/>
”这条connector中是否配置URIEncoding的值,不配置默认为iso8859-1,如果写上了如utf-8,你的程序就不需要转了,如果还转反而乱码。
2、在post请求时,就不用考虑该点了,只要写个字符过滤器全布设置成utf-8,就可以避免乱码了。

这些需要自己反复测试,才能有较深刻的理解。
http请求是以ISO-8859-1的编码来传送url的
如果页面的content-type为utf-8,那么在发送请求时,会将字符转成utf-8后进行传送
如: 中 的UTF-8编码为:E4 B8 AD在请求时为%E4%B8%AD字节之间是%分隔
那么服务器收到这段字节流后,必须将它转成相应的字符,平时所使用的request.getParameter("name")直接得到了字符串,
那么从字节流到字符流这个过程系统己经帮助我们完成了(乱码的产生由此开始)类似下面的程序:将汉字"中"的UTF-8形式转成汉字
public class EncodingTest {

public static void main(String[] args) {

String utf_string = "E4%B8%AD";//中的UTF-8编码,三个字节表示,用%分开
String[] utf_array = utf_string.split("%");
byte[] utf_byte = new byte[utf_array.length];
for(int i=0;i<utf_array.length;i++){
utf_byte[i] = (byte)Integer.parseInt(utf_array[i], 16);
}
try {
System.out.println(new String(utf_byte,"UTF-8"));
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
请注意段代码:new String(utf_byte,"UTF-8")它将字节流以UTF-8的编码还原为字符串
但它使用的前提条件是utf_byte必须是utf-8的字节流,
如果这样:
String aa = "中";
bb = aa.getBytes("ISO-8859-1");
new String(bb ,"UTF-8")肯定是乱码了
也就是说一个字符串以什么样的编码转换成字节流,就必须以什么样的编码进行还原
bb=aa.getBytes("UTF-8")就必须new String(bb,"UTF-8")否则乱码言归正传:
url通过iso-8859-1传输,服务器收到这个字节流,默认会以ISO-8859-1来将这个字节流还原成相应的字符串,
就如同这样:
客户端:bb = aa.getBytes("UTF-8");
到了服务器:cc = new String(bb,"ISO-8859-1")还原字节流为节符串
request.getParameter("");获取到这个cc,那么cc当然乱码了
所以就产生了这样的做法:new String(request.getParameter("").getBytes("ISO-8859-1"),"UTF-8")还原成原始字符串
将乱码字符串还原成原始的字节流,重新按UTF-8来编码.这里是因为
request.getParameter("")其实是进行了一次ISO-8859-1解码的,然后得到了一个乱码的字符串,那么就要重新按ISO-8859-1编码成字节流,然后在用
String(bb,"UTF-8")按UTF-8解码为字符流。
至于在tomcat中更改URI-Encoding及使用过滤器,我估计是用来更改将字节流转成字符串的编码
这里只是本人的一点看法,有误请大家指正
时间: 2024-08-10 23:18:42

tomcat的乱码问题的相关文章

tomcat服务器乱码问题,tomcat与数据库之间的编码统一转换

在tomcat目录的conf目录下,修改server.xml文件,在下面截图中的位置加上URIEncoding="UTF-8"则表示tomcat编码转换为utf-8风格, 一般在前台获得相应的值后都会处理编码问题,如用String 类的转码,URLEncoder等转码以至于传到数据库不会乱码 tomcat服务器乱码问题,tomcat与数据库之间的编码统一转换

部署到Tomcat下乱码

1.采用json数据交互,将将后台从数据库查询到的数据用StringBuffer穿成json. 2.设置了response编码格式UTF-8 3.最初用PrintWrite的write()方法把StringBuffer.toString()写出到前台 在eclipse下面没有任何问题(项目是UTF-8的),打成war包部署到Tomcat出现乱码,最初以为是Tomcat的配置问题,最后把eclipse中server项目下Tomcat配置复制到Tomcat-home/config下面.结果还是一样.

Tomcat启动乱码

Tomcat启动乱码 旂敤绋嬪簭閮ㄧ讲鍒扮洰褰?[C:\Users\Administrator\Desktop\Servlet\apache-tomcat-8.5.50-windows-x64\apache-tomcat-8.5.50\webapps\examples] 28-Feb-2020 22:57:20.486 淇℃伅 [localhost-startStop-1] org.apache.catalina.startup.HostConfig.deployDirectory Deploy

Tomcat中文乱码问题的原理和解决方法

自从接触Java和JSP以来,就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享. 一.Java中文问题的由来 Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦.原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题. 首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java

tomcat中乱码问题解决

第一种:(不建议使用) new String (name.getBytes("ISO-8859-1","utf-8"); 第二种:(解决post方式提交乱码) setCharacterEncoding("utf-8") 第三种:(解决get方式提交乱码) 在Tomcat配置文件server.XML中加上URIEncoding="utf-8" <Connector port="8080" protoco

解决IntelliJ IDEA控制台乱码问题[包含程序运行时的log4j日志以及tomcat日志乱码]

这里使用的IntelliJ IDEA版本为[IntelliJ IDEA 14.1.4]: 一.控制台打印的程序运行时的log4j日志中包含中文乱码 在IDEA安装目录的bin目录下找到名为"idea.exe.vmoptions"的文件: 使用文本编译软件(Notepad++等)打开此文件,在文件内容从末尾追加一行设置(-Dfile.encoding=UTF-8),表示指定编码为UTF-8: 重启IDEA,再次测试,log4j日志不再乱码: 但是发现tomcat启动日志乱码了(修改IDE

tomcat日志乱码解决方法

日志乱码 vi  /usr/local/tomcat/bin/catalina.sh JAVA_OPTS="-Dfile.encoding=utf-8"

tomcat中文乱码问题

在JavaWeb开发中,使用tomcat,与字符编码有关的有 浏览器当前使用的编码(用于请求数据的编码),如果是jsp页面且没有手动修改浏览器浏览器编码,则就是page指令的pageEncoding属性所指定的编码 tomcat的server.xml中的Connector元素的URIEncoding和useBodyEncodingForURI属性值 URIEncoding This specifies the character encoding used to decode the URI b

解决CentOS7中文乱码(包括Tomcat日志乱码)问题

Linux系统中文语言乱码,是很多小伙伴在开始接触Linux时经常遇到的问题,而且当我们将已在Wndows部署好的项目搬到Linux上运行时,Tomcat的输出日志中文全为乱码(在Windows上正常),看着非常心塞,那么我们应该怎么解决呢? 系统中文乱码   Tomcat输出日志中文乱码 系统环境 CentOS 7.0 64位 jdk-8u11-linux-x64. apache-tomcat-8.5.16 解决步骤: 1.安装中文语言包 先查看系统是否有安装中文语言包 # locale -a