tomcat乱码原因--基本的编码问题

tomcat乱码原因：在学习servlet时候，经常会遇到中文乱码的问题，网上查只知道如何设置不乱码，其中的原理不是很明白。我认为明白其中的原理，乱码问题就很容易解决

tomcat乱码解决方法：

post请求：

request.setCharacterEncoding("utf-8");

如果不想每个请求方法里都写就写一个filter过滤器

get请求：

1.修改tomcat中的server.xml文件

2.获得参数是通过new String()方法

String name = request.getParameter("name");
name = new String(name.getBytes("iso-8859-1"),"utf-8");

问题：tomcat对于get请求使用了ISO-8859-1编码，对post请求默认使用你设置的编码，没有设置就使用默认ISO-8859-1编码。

对post请求设置编码就不会乱码，原理是使用utf-8编码，使用utf-8解码，不使用utf-8解码就会出错如下：

String s = new String("你好".getBytes(),"utf-8");
System.out.println(new String(s.getBytes(),"iso-8859-1"));
String s1 = new String(s.getBytes(),"utf-8");
System.out.println(s1);

结果：ä½ å¥½

　　你好

get请求浏览器的编码为utf-8,然而tomcat使用ISO-8859-1进行解码就会乱码，为什么这样可以解决乱码，

是因为ISO-8859-1编码是单字节编码，所以使用s1.getBytes("iso-8859-1")得到的直接数组和之前没有被解码时一样，

所以在使用utf-8就和上面的post一样，只是编码，解码

并不是所有的乱码都可以使用这种方式，只是因为ISO-8859-1编码是单字节编码，获得其字节数组是没有变的

String s = new String("你好".getBytes(),"utf-8");
System.out.println(Arrays.toString(s.getBytes()));
//相当于tomcat帮助解码
String s1 = new String(s.getBytes(),"iso-8859-1");
//打印iso-8859-1编码的字节数据，与解码前的字节数组比较，发现一样，所以以utf-8编码解码不会乱码
System.out.println(Arrays.toString(s1.getBytes("iso-8859-1")));
String s2 = new String(s1.getBytes("iso-8859-1"),"utf-8");
System.out.println(s2);

结果：

[-28, -67, -96, -27, -91, -67]
[-28, -67, -96, -27, -91, -67]
你好

时间： 2024-12-19 21:09:03

tomcat乱码原因--基本的编码问题的相关文章

tomcat下jsp乱码原因(下)

系列文章: tomcat下jsp乱码的原因上一篇文章里面, 主要讲解了文件编码.页面编码.如何解码, 以及分析了tomcat所起到的作用, 猛戳这里详细了解 tomcat下jsp乱码的原因(上) tomcat下jsp乱码原因(下) ,这里我们分为以下几点讲解下解决乱码的方式, 都是结合tomcat来的. 1.纯手工解码 2.setEncoding 3.get.post方法 4.通过配置tomcat参数好了, 我们详细看看以上几个方法 1.纯手工解码这个方式, 我们上篇文章已经做了比较详细的

tomcat服务器乱码问题,tomcat与数据库之间的编码统一转换

在tomcat目录的conf目录下,修改server.xml文件,在下面截图中的位置加上URIEncoding="UTF-8"则表示tomcat编码转换为utf-8风格, 一般在前台获得相应的值后都会处理编码问题,如用String 类的转码,URLEncoder等转码以至于传到数据库不会乱码 tomcat服务器乱码问题,tomcat与数据库之间的编码统一转换

JSP/ Servlet常见的中文乱码原因

在开发中,我们经常遇到中文乱码的问题,比方: &浏览器中看到的 Jsp/Servlet 页面中的汉字成了 '?' ? &浏览器中看到的 Servlet 页面中的汉字都成了乱码 &Jsp/Servlet 页面无法显示 GBK 汉字. &Jsp/Servlet 不能接收 form 提交的汉字. &JSP/Servlet 数据库读写无法获得正确的内容. 隐藏在这些问题后面的是各种错误的字符转换和处理.解决类似的字符encoding问题,须要了解 Jsp/Servlet

CSS失效网页乱码原因兼容问题-手写CSS代码注意什么

我们在写html代码和css 代码应该注意些什么,这节我们讲解大小写与编码问题.(体感音乐) 乱码VS编码前面我们介绍过导致网页乱码.CSS失效等原因一部分是由于自己编写的时候没有注意编码问题,不编码转化问题,常常因为自己写的时候使用一种编码,发现别人比较好的DIV+CSS片段比较好直接就复制过来用,结果别人编码与自己编码不符合从而造成网页在IE中呈现乱码,或CSS失效(CSS声明).解决办法使用软件中编码转化功能进行网页代码转化.如使用Dreamweaver中功能转化编码.-了解语言编码cha

Android访问服务器(TOMCAT)乱码引发的问题(转载)

Android访问服务器(TOMCAT)乱码引发的问题 1.浏览器往服务器发送的请求主要可分为2种:get.post:delete.head等不赘述. GET方式: 从浏览器上直接敲地址,最大特点就是参数直接跟在地址后面. POST方式:表单提交等. 2.访问过程: 浏览器中输入地址 –> 浏览器对中文进行编码 –>发送到服务器 ->服务器进行解码如何浏览器编码和服务器解码用的字符集不一致就会发生乱码问题. 3.乱码的解决默认浏览器使用UTF-8编码(IE默认GBK当然可以通过met

html乱码原因与网页乱码解决方法

造成html网页乱码原因主要是html源代码内中文字内容与html编码不同造成.但无论是哪种情况造成乱码在网页开始时候都需要设置网页编码. charset编码设置 html网页乱码效果截图一.乱码造成原因 - TOP 1.比如网页源代码是gbk的编码,而内容中的中文字是utf-8编码的,这样浏览器打开即会出现html乱码.反之网页是编码utf-8,内容是gbk也会出现乱码. 2.html网页编码是gbk,而程序从数据库中调出呈现是utf-8编码的内容也会造成编码乱码. 3.浏览器不能自

Java中文乱码原因

Java在中文环境中乱码无处不在,而且出现的时间和位置也包涵广泛,具体的解决方法也是千奇百怪. 但是如果能理清其中的脉络,理解字符处理的过程,对于解决问题很有指导意义,不至于解决了问题也不知道为什么. 其实,原因不外乎出在String输入时和输出时. 首先,Java中的任何String都是以UNICODE格式存在的. 很多人因为在GBK环境中使用String,会误以为String是GBK格式,实际上Java的String类中并没有存储CharSet信息的字段, 所有String中的字符只会以U

获取String乱码，如何进行编码

本文为博主原创,未经允许不得转载: 在解析properties文件中的汉字时,在java代码中解析得到的是一个乱码字符,形如图下: 导致乱码原因:由于在jdk中,默认为gbk编码方式进行编码盒接收的,所以导致了乱码, 避免方法,对字符进行utf-8编码,编码方法如下: String value = new String(str.getBytes("ISO-8859-1"),"utf-8"); 这样就ok了.谢谢点赞

Linux 下文件名乱码（无效的编码）的解决办法

文件是在WIndows 下创建的,Windows 的文件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码. sudo apt-get install convmv convmv 使用方法:convmv -f 源编码 -t 新编码 [选项] 文件名常用参数:-r 递归处理子文件夹–notest 真正进行操作,默认情况下是不对文件进行真实操作–list 显示所有支持的编码–unescap 可以做一下转义,比如把