java中遇到字符串乱码的问题（转）

转发博客地址：http://blog.csdn.net/greenqingqingws/article/details/7395213

最近遇到一个问题，Java读取文本文件（例如csv文件、txt文件等），遇到中文就变成乱码。读取代码如下：

[java] view plain copy print ?

List<String> lines=new ArrayList<String>();
BufferedReader br = new BufferedReader(new FileReader(fileName));
String line = null;
while ((line = br.readLine()) != null) {
lines.add(line);
}
br.close();

后来百度和Google了之后，终于找到原因，还是从原理开始讲吧：

Java的I/O类处理如图：

Reader 类是 Java 的 I/O 中读字符的父类，而 InputStream 类是读字节的父类，InputStreamReader 类就是关联字节到字符的桥梁，它负责在 I/O 过程中处理读取字节到字符的转换，而具体字节到字符的解码实现它由 StreamDecoder 去实现，在 StreamDecoder 解码过程中必须由用户指定 Charset 编码格式。值得注意的是如果你没有指定 Charset，将使用本地环境中的默认字符集，例如在中文环境中将使用 GBK 编码。

Java的I/O类处理图

总结：Java读取数据流的时候，一定要指定数据流的编码方式，否则将使用本地环境中的默认字符集。

经过上述分析，修改之后的代码如下：

[java] view plain copy print ?

List<String> lines=new ArrayList<String>();
BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(fileName),"UTF-8"));
String line = null;
while ((line = br.readLine()) != null) {
lines.add(line);
}
br.close();

参考资料：

http://www.ibm.com/developerworks/cn/java/j-lo-chinesecoding/

http://hi.baidu.com/annleecn/blog/item/154770ed900738db2e2e2151.html

http://sd8089730.iteye.com/blog/1290895

http://www.360doc.com/content/07/0403/09/16749_427888.shtml

时间： 2024-11-05 16:06:31

java中遇到字符串乱码的问题（转）的相关文章

Java中的字符串常量池

最近做到一个题目: 问题:String str = new String("abc"),"abc"在内存中是怎么分配的? 答案是:堆,字符串常量区. 题目考查的为Java中的字符串常量池和JVM运行时数据区的相关概念."abc"为字面量对象,其存储在堆内存中.而字符串常量池则存储的是字符串对象的一个引用. Java中的字符串常量池 Java中字符串对象创建有两种形式,一种为字面量形式,如String str = "droid&qu

protobuf在java中的字符串化

最近由于项目需要,大致研究了一下protobuf的java使用.说实话,习惯了C++的protobuf,java用起来真别扭. 由于需要将protobuf序列化后,存入redis,而且redis没法直接存储非字符串的数据,所以我只能想办法将protobuf序列化成字符串. protobuf的java实现里,并没有直接序列化成String类型变量的方法,但是提供了toByteArray()方法,可以序列化成byte[]. 于是乎很容易想到可以这么做: byte[] raw_bytes = prot

Android学习笔记----Java中的字符串比较

用习惯了C#.C++,在做字符串比较时想当然地使用如下语句: 1 string str1 = "abcd", str2 = "abcd"; 2 if(str1==str2) 3 { 4 return true; 5 } 6 else 7 { 8 return false; 9 } 殊不知在Java中,两个String类型的变量,尽管字符相同,使用”==“进行比较,也会返回false. Java中进行字符串比较需采用String类型的equals方法: 1 Strin

JAVA中创建字符串的两种方式的区别

我们知道,通常在Java中创建一个字符串会有两种方式,通过双引号直接赋值和通过构造器来创建. String x = "abcd"; String y = new String("abcd"); 然而,这两种方式之间的区别是什么?分别应用于哪些情况,之前还不是很懂. 1.双引号的方式 String x = "abcd"; String y = "abcd"; System.out.println(x==y);//true Sys

Java中的字符串比较，按照使用习惯进行比较

java中的字符串比较一般可以采用compareTo函数,如果a.compareTo(b)返回的是小于0的数,那么说明a的unicode编码值小于b的unicode编码值. 但是很多情况下,我们开发一款app需要结合“国情”,比如在电话本中,我们希望“李四”排在“zhangsan”的前面,但是如果采用普通的compareTo函数的字符串比较的方式,那么“zhangsan”小于“李四”,由此造成了“zhangsan”的排序先于“李四”. 解决方式是采用java提供的 Collator类. 一.原理

java中判断字符串是否为数字的方法的几种方法

Java中判断字符串是否为数字的方法: 1.用JAVA自带的函数 public static boolean isNumeric(String str){ for (int i = 0; i < str.length(); i++){ System.out.println(str.charAt(i)); if (!Character.isDigit(str.charAt(i))){ return false; } } return true; } 2.用正则表达式首先要import java.

java中String字符串的替换函数：replace与replaceAll的区别

例如有如下x的字符串 String x = "[kllkklk\\kk\\kllkk]";要将里面的“kk”替换为++,可以使用两种方法得到相同的结果 replace(CharSequence target, CharSequence replacement) —— x.replace("kk", "++") replaceAll(String regex, String replacement) ——

为什么Java中的字符串是不可变的？

原文链接:https://www.programcreek.com/2013/04/why-string-is-immutable-in-java/ java字符串是不可变的.不可变类只是一个不能修改实例的类.实例创建时所有的信息都被初始化,并且信息不能被修改.不可变类有许多优点.本文总结了字符串为什么被设计成不可变的原因.这说明在记忆的角度不变性的概念,同步和数据结构. 1.字符串池的要求: 字符串池(字符串特定池)是方法区域中的一个特殊存储区域.当创建字符串时,如果字符串已经存在于池中,则将

转载：Java中的字符串常量池详细介绍

引用自:http://blog.csdn.net/langhong8/article/details/50938041 这篇文章主要介绍了Java中的字符串常量池详细介绍,JVM为了减少字符串对象的重复创建,其维护了一个特殊的内存,这段内存被成为字符串常量池或者字符串字面量池,需要的朋友可以参考下 Java中字符串对象创建有两种形式,一种为字面量形式,如String str = "droid";,另一种就是使用new这种标准的构造对象的方法,如String str = new Stri

猜你喜欢

CSS position 属性

实例定位 h2 元素: h2 { position:absolute; left:100px; top:150px; } 亲自试一试浏览器支持 IE Firefox Chrome Safari O ...

机器学习-逻辑回归

(整理的简单,公式也没使用公式编辑器.) 对于数据集D={(x1,y1),(x2,y2),...,{xn,yn}} ,而xi= {xi1,xi2,...,xim} 代表m维 . 在线性回归中,我们想学 ...

从 http://www.jianshu.com/p/d79901794e3d 转载目的最近因为需要在linux虚拟机里进行开发程序,虽然在linux里有超强的编辑器vim,但vim开发html前 ...

不写流水账了. 短爷签了好劲啊. 而我跟个sb一样,去写了点垃圾暴力就回来了. "考挂了自己弱,就是这样" 真的该努力了. 为了家人.为了教练.为了老邸.为了3班.为了二中,更重要 ...

最长回文（hdu 3068）

Problem Description 给出一个只由小写英文字符a,b,c...y,z组成的字符串S,求S中最长回文串的长度.回文就是正反读都是一样的字符串,如aba, abba等 Input 输入有 ...

ios换肤思想,及工具类

// 实现原理及思路:不同种类的皮肤放在不同的文件夹下,用一个plist文件存放不同控制器下的控件的背景颜色 //plist文件名称为控制器的名称,内部的数据字典的key value对自定义一个命名规 ...

原生js仿梦幻时间查看活动（代码临时存储）

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...

MVC Code First (代码先行)

首先配置好web.config [html] view plain copy <connectionStrings> <add name="BookDbContext&qu ...

网站安全-目录扫描

利用御剑对目标进行fuzz 多线程扫描需要注意避免被网站封IP 渗透中收集字典. 利用burpsuit爆破网站后台管理界面

算法笔记_163:算法提高最大乘积(Java)

目录 1 问题描述 2 解决方案 1 问题描述问题描述对于n个数,从中取出m个数,如何取使得这m个数的乘积最大呢? 输入格式第一行一个数表示数据组数每组输入数据共2行: 第1行给出总共的数 ...

【2017-2-17】VS基本应用及C#基础第一节（定义变量、输入及输出）

一VS基本应用 (一)新建项目新建项目可有多种方法例如: 1. 在VS起始页面建立新项目 2. 在集成环境中,通过"文件"/"新建"/"项目&q ...

Leetcode: Reverse Integer 正确的思路下-要考虑代码简化

题目: Reverse digits of an integer. Example1: x = 123, return 321Example2: x = -123, return -321 Have ...

ORACLE无法删除当前连接用户

今天在做Oracle数据库是遇到ORACLE无法删除当前连接用户 ,经查找可用如下方法解决 . 在Oracle中删除用户时提示:ORACLE无法删除当前连接用户可以用以下语句 Sql代码 SQL&g ...

重庆时时彩北京赛车PK10操盘战绩晒图

做一个职业操盘手,我的压力很大!!!! 时时彩自动投注北京赛车PK10自动下注软件开发订做联系微信1 ...

Web---JS-返回上一页并刷新代码整理

返回上一页并刷新在此功能有利于用户的体验,是每一个web开发人员所必备的一项,长话短说,今天介绍实现此功能的一个方法,需要了解的朋友可以参考下: 一:JS 重载页面,本地刷新,返回上一页代码如下: ...

02. Shell文件权限和脚本执行(更改权限)

Linux 有三种权限更改方式:chmod/acl/sudo 前两者用来更改文件权限,sudo用来更应用程序或者是命令的执行权限 chmod的局限是无法实现多种权限分配(用户群体只有三种),面对多权限 ...

非空验证

function shhh(){ f=document.getElementById('ll').value; v=document.getElementById('li').value; e=doc ...

细节问题(二)

1. 关于C++中的宏定义,宏展开还是有一些奇淫技巧的.参考:#define命令的一些高级用法. 2. 宏定义更多的还是用于预编译处理中,就是为了防止头文件被重复包含那种. 3. 关于C++中头文件. ...

使用jQuery进行组件开发（完整例子）

使用jQuery进行组件开发和使用纯JavaScript脚本(不使用框架)原理基本类似,特别是公共方法的组织是一样的. 不同点是,jQuery使用了插件机制,通过$()直接进行操作对象(DOM元素)绑 ...

python实现扫描论坛回帖，自动发附件(应对求种之类的)

背景: 笔者因为需要在 www.kindle114.com 上分享一些图书,鉴于各种网盘神马的,都会把涉及版权的分享给失效了,总是换分享连接很麻烦,所以不得已只能通过邮件来传播知识,这就需要每天去看回 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.017 s.