关于Android与pc通信时中文乱码的分析和解决

初步实现了Android与pc服务器的通信之后,又碰到了传说中令人头疼不已的中文乱码问题。既然出现了乱码,那么原因自然是协议不通了。
我们知道eclipse中默认的编码标准是GBK,而安卓程序开发所默认的布局文件编码标准则是utf-8,这样一来,我们双方通信的时候便难免出现乱码。要解决它,就要从二者转换方面着手。
     首先我们知道,从安卓手机界面上获得的文字,其编码字符集是utf-8,所以,当我们的java文件获得它时,它是以utf-8形式编译的。所以这里,在得到EditText中的文字之后,用输出流将其输出,而服务器端再用一个字符串接收从输入缓冲流中获得的一行字符。

Java代码  

  1. // 读取客户端信息
  2. while (true) {
  3. while (is.available() > 0) {
  4. // 转码之前
  5. String msg_client1 = brd.readLine();
  6. System.out.println("转码之前:" + msg_client1);
  7. // 转码
  8. String msg_client = new String(msg_client1.getBytes("gbk"),
  9. "utf-8");
  10. String enter = new String("\r\n".getBytes("utf-8"));
  11. // 转码之后打印出
  12. System.out.println("客户端:" + msg_client);
  13. String msg_server = msg_client1 + enter;
  14. os.write(msg_server.getBytes());
  15. os.flush();
  16. Thread.sleep(1000);
  17. }
  18. }

不用猜,这时由于服务器端的编码标准是GBK,读出来的字符串必然是乱码。于是在下面,我们将得到的字节数组用utf-8的格式编译。于是,期盼已久的汉字终于出来了。

但是有没有发现,当输入偶数个汉字时,得到了正确的结果,而输入奇数个时,最后一个字变成了“??”?
     这又是为什么?这里纠结了很久,于是去搜索字符集编码的标准,终于发现了原因。对于gbk这种编码而言,中文所对应的字节数是2byte;而在utf-8中,中文则是对应三个字节。于是在输入奇数个汉字时,最后一个字节在gbk中则无法编译。譬如说utf-8编码的3个字,编码是123|456|789 ,在传输到服务器中时,系统认为这9个字节是gbk编码,于是就变成了12|34|56|78|9。后面多出的一个字节不能够编译成汉字,此时常用“?”来代替。于是最后一个byte变成了“?”(ASCII码为63)。这时再将它转成utf-8时,则变成了123|456|78?。这个时候第三个字也不能正确地读取了,于是出现了上图的结果(两个问号)。
      现在,要怎样解决呢?在尝试过各种编码的转换,徘徊于各种各样的乱码之间依然无法解决的时候,突然想到,之前的读取方式是通过bufferedreader一行一行的读取的,这样一来得到的输入流在字符缓冲区的时候,已经破坏了最后一个字节。那么,如果直接得到字节数组而不破坏它,是不是能解决呢?在这里改了一下代码,直接用得到的字节数组构成一个String,然后……

Java代码  

  1. // 读取客户端信息
  2. while (true) {
  3. while (is.available() > 0) {
  4. byte[] bb = new byte[is.available()];
  5. is.read(bb);
  6. // 转码之前
  7. String msg_client1 = new String(bb);
  8. System.out.println("转码之前:" + msg_client1);
  9. // 转码
  10. String enter = new String("\r\n".getBytes("utf-8"));
  11. String msg_client = new String(bb, "utf-8");
  12. System.out.println("客户端:" + msg_client);
  13. //发送
  14. String msg_server = msg_client1 + enter;
  15. os.write(msg_server.getBytes());
  16. os.flush();
  17. Thread.sleep(1000);
  18. }


     可以看到,奇数个汉字也能读取啦!(耶!)虽然说这个小问题纠结了很久,但也让自己更了解了编码的奥义,收获还是很大的。
     最后,解释一下new String(str.getBytes( "dd "), "cc ")的方法。简单来说,这种方法的用处是,当你的字符串的实际编码是“CC”,而被系统当成“DD”时,用这行代码可以得到正确的编码。

关于Android与pc通信时中文乱码的分析和解决

时间: 2024-12-21 10:19:03

关于Android与pc通信时中文乱码的分析和解决的相关文章

文《关于c++与java中文乱码问题分析与解决》中一个bug分析

文<关于c++与java中文乱码问题分析与解决>中一个bug分析 DionysosLai([email protected]) 2014/10/21 在前几篇一博客<关于c++与java中文乱码问题分析与解决>,地址如下:http://blog.csdn.net/dionysos_lai/article/details/38389765.文中详细介绍了c++与java数据传递时,为何会出现中文乱码的原因,并提出了适当的解决方法.方法如下: int CCDirector::GBKTo

关于c++与java中文乱码问题分析与解决

关于c++与java中文乱码问题分析与解决 DionysosLai([email protected])  2014/8/1 问题分析: 之所以会出现中文乱码问题,归根结底在于中文的编码与英文的编码方式存在差异. 在java内部是使用16bit的unicode编码(即utf-16)来表示字符串,无论英文还是中文都是2字节. C/C++使用的是原始数据,ascii是一个字节,中文一般是GB2312编码,用2个字节表示一个汉字. Jni内部是使用utf-8编码表示字符串的,utf-8是扁长的unic

php中文乱码问题分析及解决办法

中文乱码问题产生的原因,主要就是字符编码设置问题: 首先,mysql数据库安装的时候字符编码要选择正确,最好选择utf-8比较保险.如果安装时没有设置正确,找到mysql的安装目录,修改my.conf配置文件中的字符设置,打开文件,应该一个是在mysqll下面,一个是在server下面的. 如果是php页面的中文乱码,也就是非数据库查询出来的数据,HTML页面静态的部分出现乱码,应该使用header("content-type:text/html; charset=utf8") 来设定

get/post时中文乱码问题的解决办法

常有的方法,get请求用在tomcat的编码改为utf-8 即可 post 过滤器就可以 一.常识了解 1.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2.java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码: 3.getBytes() 是通过平台默认字符集进行编码: 二.中文乱码出现 在学习任何一门技术时,经常会有初学者遇到中文乱码问题,比如MySQL,是因为在安装时没有设置:而在Servlet中

中文乱码的分析 和 从Eclipse设置启动JVM时的字符集(转)

最近时常碰到中文乱码的问题,eclipse的编码环境设置的都是UTF-8,外部也是以UTF-8的编码进行传参的,但是遇到中文的时候还是因为乱码而产生一系列的错误.在网上查了许多资料,发现这是跟JVM的编码有关系的,JVM默认引用电脑操作系统的编码格式进行编码(大部分中文win xp系统的编码格式是GBK),所以JVM把java编译成class文件的时候会以GBK的方式进行编译.于是乎你会发现,有的机器运行工程会始终有乱码,有的机器则不会 获取JVM编码: import java.nio.char

maven测试时中文乱码问题解决方法

pom.xml增加-Dfile.encoding=UTF-8配置,如下: 1 <plugin> 2 <!--升级到新版本解决控制台乱码问题--> 3 <groupId>org.apache.maven.plugins</groupId> 4 <artifactId>maven-surefire-plugin</artifactId> 5 <version>2.19.1</version> 6 <confi

关于Mysql中文乱码问题该如何解决(乱码问题完美解决方案)(转)

这篇文章给大家介绍关于Mysql中文乱码问题该如何解决(乱码问题完美解决方案)的相关资料,还给大家收集些关于MySQL会出现中文乱码原因常见的几点,小伙伴快来看看吧 最近两天做项目总是被乱码问题困扰着,这不刚把mysql中文乱码问题解决了,下面小编把我的解决方案分享给大家,供大家参考,也方便以后自己查阅. 首先: 用show variables like "%colla%":show varables like "%char%":这两条命令查看数据库与服务端的字符集

mysql保存中文乱码的原因和解决办法

当你遇到这个mysql保存中文乱码问题的时候,期待找到mysql保存中文乱码的原因和解决办法这样一篇能解决问题的文章是多么激动人心. 也许30%的程序员会选择自己百度,结果发现网友已经贴了很多类似mysql 中文乱码.php mysql 中文乱码.mysql5.5中文乱码.mysql 乱码.mysql乱码问题.mysql jsp 乱码.mysql jdbc 乱码.mysql 查询乱码.mysql 导入数据乱码等一系列问题,到底哪个是自己要找的能解决自己问题的呀?15%的程序员一看就懵了,剩下15

如何解决android studio 运行时中文乱码的问题

相信很多朋友都会遇到android studio 在MAC OS中运行的时候中文乱码.而在代码编辑的时候正常.经过几天的不断寻找解决办法,终于解决了 比如: Toast.makeText(MainActivity.this,"我爱你", Toast.LENGTH_LONG).show(); 运行的时候在模拟器里就是乱码. 解决办法网上很多,但是都不能解决运行时乱码的问题.所以这个问题苦恼了几天. 我们在工程里的build.grandle 文件中添加一段代码即可 tasks.withTy