深入Java字符串

深入Java字符串

Java字符串类(java.lang.String)是Java中使用最多的类,也是最为特殊的一个类,很多时候,我们对它既熟悉又陌生。

一、从根本上认识java.lang.String类和String池

首先,我建议先看看String类的源码实现,这是从本质上认识String类的根本出发点。从中可以看到:

1、String类是final的,不可被继承。public final class String。

2、String类是的本质是字符数组char[], 并且其值不可改变。private final char value[];

然后打开String类的API文档,可以发现:

3、String类对象有个特殊的创建的方式,就是直接指定比如String x = "abc","abc"就表示一个字符串对象。而x是"abc"对象的地址,也叫做"abc"对象的引用。

4、String对象可以通过“+”串联。串联后会生成新的字符串。也可以通过concat()来串联,这个后面会讲述。

6、Java运行时会维护一个String Pool(String池),JavaDoc翻译很模糊“字符串缓冲区”。String池用来存放运行时中产生的各种字符串,并且池中的字符串的内容不重复。而一般对象不存在这个缓冲池,并且创建的对象仅仅存在于方法的堆栈区。下面是个系统内存示意图:

5、创建字符串的方式很多,归纳起来有三类:

其一,使用new关键字创建字符串,比如String s1 = new String("abc");

其二,直接指定。比如String s2 = "abc";

其三,使用串联生成新的字符串。比如String s3 = "ab" + "c";

二、String对象的创建

String对象的创建也很讲究,关键是要明白其原理。

原理1:当使用任何方式来创建一个字符串对象s时,Java运行时(运行中JVM)会拿着这个X在String池中找是否存在内容相同的字符串对象,如果不存在,则在池中创建一个字符串s,否则,不在池中添加。

原理2:Java中,只要使用new关键字来创建对象,则一定会(在堆区或栈区)创建一个新的对象。

原理3:使用直接指定或者使用纯字符串串联来创建String对象,则仅仅会检查维护String池中的字符串,池中没有就在池中创建一个,有则罢了!但绝不会在堆栈区再去创建该String对象。

原理4:使用包含变量的表达式来创建String对象,则不仅会检查维护String池,而且还会在堆栈区创建一个String对象。

另外,String的intern()方法是一个本地方法,定义为public native String intern(); intern()方法的价值在于让开发者能将注意力集中到String池上。当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(该对象由 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并且返回此 String 对象的引用。

三、认识trim()、intern()和concat()、“+”。

三、认识空格、空串、null

下面看个例子:

public class StringTest {
    public static void main(String args[]) {
        //在池中和堆中分别创建String对象"abc",s1指向堆中对象
        String s1 = new String("abc");
        //s2直接指向池中对象"abc"
        String s2 = "abc";
        //在堆中新创建"abc"对象,s3指向该对象
        String s3 = new String("abc");
        //在池中创建对象"ab" 和 "c",并且s4指向池中对象"abc"
        String s4 = "ab" + "c";
        //c指向池中对象"c"
        String c = "c";
        //在堆中创建新的对象"abc",并且s5指向该对象
        String s5 = "ab" + c;

String s6 = "ab".concat("c");
        String s7 = "ab".concat(c);

System.out.println("------------实串-----------");
        System.out.println(s1 == s2); //false
        System.out.println(s1 == s3); //false
        System.out.println(s2 == s3); //false
        System.out.println(s2 == s4); //true
        System.out.println(s2 == s5); //false
        System.out.println(s2 == s6); //false
        System.out.println(s2 == s7); //false

String b1 = new String("");
        String b2 = "";
        String b3 = new String("");
        String b4 = "".intern();
        String b5 = "" + "";
        String b6 = "".concat("");
        String b7 = "  ".trim();
        String b8 = "  ";
        String b9 = "    ".trim();

System.out.println("------------空串-----------");
        System.out.println(b1 == b2);  //false
        System.out.println(b1 == b3);  //false
        System.out.println(b2 == b3);  //false
        System.out.println(b2 == b4);  //true
        System.out.println(b2 == b5);  //true*
        System.out.println(b2 == b6);  //true*
        System.out.println(b2 == b7);  //false*
        System.out.println("-----a----");
        System.out.println(b2.equals(b7));  //true
        System.out.println(b7 == b8);  //false
        System.out.println(b7 == b9);  //false
        System.out.println(b7.equals(b9)); //true
        System.out.println(b9 == null);//false

System.out.println("b8.trim():");
        for (byte b : b8.getBytes()) {
            System.out.print(">>>" + (int) b + " ");
        }
        System.out.println("\nb8.trim():");
        for (byte b : b8.trim().getBytes()) {
            System.out.print(">>>" + (int) b + " ");
        }
        System.out.println("\nb9.trim():");
        for (byte b : b9.trim().getBytes()) {
            System.out.print(">>>" + (int) b + " ");
        }
    }
}

四、String的常见用法

1、字符串重编码

这个问题说来比较简单,转码就一行搞定,不信你看看,但究竟为什么要转码,是个很深奥的问题,看例子:

/**
* 字符串转码测试
*
* @author leizhimin 2009-7-17 10:50:06
*/
public class TestEncoding {
        public static void main(String[] args) throws UnsupportedEncodingException {
                System.out.println("转码前,输出Java系统属性如下:");
                System.out.println("user.country:" + System.getProperty("user.country"));
                System.out.println("user.language:" + System.getProperty("user.language"));
                System.out.println("sun.jnu.encoding:" + System.getProperty("sun.jnu.encoding"));
                System.out.println("file.encoding:" + System.getProperty("file.encoding"));

System.out.println("---------------");
                String s = "熔岩博客";
                String s1 = new String(s.getBytes(), "UTF-8");
                String s2 = new String(s.getBytes("UTF-8"), "UTF-8");
                String s3 = new String(s.getBytes("UTF-8"));
                String s4 = new String(s.getBytes("UTF-8"), "GBK");
                String s5 = new String(s.getBytes("GBK"));
                String s6 = new String(s.getBytes("GBK"), "GBK");
                System.out.println(s1);
                System.out.println(s2);
                System.out.println(s3);
                System.out.println(s4);
                System.out.println(s5);
                System.out.println(s6);
        }
}

输出结果:

转码前,输出Java系统属性如下:
user.country:CN
user.language:zh
sun.jnu.encoding:GBK
file.encoding:UTF-8
---------------
熔岩博客
熔岩博客
熔岩博客
鐔斿博鍗氬
???????
熔岩博客

Process finished with exit code 0

得出一结论:

a、转一个码,又用该码来构建一个字符串,是绝对不会出现乱码的,----你相当于没转。

b、转码与否,与字符串本身编码有关,字符串本身的编码与谁有关?----文件编码,或者你的IDE设置的编码有关。

在此,我用的IDEA开发工具,默认是UTF-8编码,但操作系统使用的是GBK,但没有问题,我只要按照UTF-8来读取我的字符串就不会有乱码。但是文件已经是UTF-8了,你非要转为GBK,不乱才怪!那有什么办法呢?在Windows下,用记事本或者Editplus打开后另存为(并修改编码方式即可)。

至于已经要从UFT-8转换为GBK,这就要靠内码转换工具了,是个比较复杂的问题,如果有谁想研究可以告诉我,一块研究研究。

2、字符比较

不就是个匹配关系吗?String类的API有一些可以做比较,如果不行,可以寻求正则表达式来解决。

3、获取某个字符

获取一个字符序列toCharArray() ,然后就随便玩去吧,中文就乱了。

4、字符串的截取

substring()

5、字符串的替换与查找

参看http://lavasoft.blog.51cto.com/blog/62575/179324

6、开始结束判断

startsWith()/endWith()

7、字符串的排序比较

compareTo(String anotherString)
          按字典顺序比较两个字符串。
compareToIgnoreCase(String str)
          不考虑大小写,按字典顺序比较两个字符串。

8、字符串的equals()和hashCode()

已经实现了好了,直接调用,不用重写

9、字符串的类型转化

太多了,String.valueOf()系列很多。

类似的Long.parseLong(String s)

10、字符串的复制

copyValueOf()

11、大小写转换

toLowerCase()

toUpperCase()

13、正则匹配

http://lavasoft.blog.51cto.com/blog/62575/179324

时间: 2024-12-31 22:37:28

深入Java字符串的相关文章

Java字符串学习笔记

通过看jdk源码发现Java字符串中有如下关系: 接口中的方法默认都是抽象的可以写也可以不写. public interface CharSequence { int length(); char charAt(int index); CharSequence subSequence(int start, int end); public String toString(); } 其他的都是该接口的实现类且是最终类,不能被继承. public final class String impleme

Java字符串

Java字符串 String对象是不可变的.String类中每一个看起来会修改String值的方法,实际上都是创建了一个全新的对象,以包含修改后的字符串.而最初的String对象则丝毫未动. import java.util.*; public class Immutable{ public static String upcase(String s){ return s.toUpperCase(); } public static void main(String[] args){ Strin

Java字符串转16 进制工具类Hex.java

原文:Java字符串转16 进制工具类Hex.java 源代码下载地址:http://www.zuidaima.com/share/1550463378410496.htm Java 字符串转 16 进制工具类 Hex.java 实现 16进制 0xfecd .. 和 java 字符串之间的互转换! 如果做开发,通常用户登陆密码都会 mad5(salt + pwd) 然后再将 md 之后的数据 hex 一下. 这个工具类,就是实现此效果的. /* * */ package com.zuidaim

图解Java字符串不变性

1. 声明字符串 String s = "abcd"; 这里,s存储了“abcd”在这个字符串对象的引用,如下图所示: 2. 将字符串变量s赋值给字符串变量s2 String s2 = s; 此时,s2也指向了“abcd”. 3. 字符串合并 s = s.concat("ef); 这里,明显是新创建了字符串对象“abcdef”,也就是说,在java中字符串对象一旦被创建就不会改变. 总结 在Java中,一旦一个字符串对象在内存中(通常在堆中)被创建,它就不会被改变.同时字符串

Java字符串常见实例与函数

字符串比较 字符串函数 compareTo (string) ,compareToIgnoreCase(String) 及 compareTo(object string) 来比较两个字符串,并返回字符串中第一个字母ASCII的差值. public class StringCompareEmp{ public static void main(String args[]){ String str = "Hello World"; String anotherString = "

Java字符串的10大热点问题,你都懂吗?

转自 威哥干JAVA http://www.codingke.com 下面我为大家总结了10条Java开发者经常会提的关于Java字符串的问题,如果你也是Java初学者,仔细看看吧: 1.如何比较字符串,应该用”==”还是equals()? 总的来说,”==”是用来比较字符串的引用地址,而equals()才是比较字符串的值.两个值相同的字符串用”==”比较结果有可能是false,而用equals()则一定为true.除非两个字符串是同一个new出来的对象,不然比较字符串值是否相同应该要用equa

JAVA字符串格式化-String.format()的使用(转)

常规类型的格式化 String类的format()方法用于创建格式化的字符串以及连接多个字符串对象.熟悉C语言的同学应该记得C语言的sprintf()方法,两者有类似之处.format()方法有两种重载形式. format(String format, Object... args) 新字符串使用本地语言环境,制定字符串格式和参数生成格式化的新字符串. format(Locale locale, String format, Object... args) 使用指定的语言环境,制定字符串格式和参

关于Java字符串的几个重点

String.StringBuilder和StringBuffer哪个更优? String和StringBuilder:StringBuilder是可变的,也就是说用StringBuilder创建的字符串你可以随时改变它.StringBuilder和StringBuffer:StringBuffer是同步的,它是线程安全(thread-safe)的,但效率要比StringBuilder差得多. 如何重复输出字符串? 在Python中,我们只需要为字符串乘上一个数字就可以重复输出该字符串了.然而在

java 字符串内存分配的分析与总结

经常在网上各大版块都能看到对于java字符串运行时内存分配的探讨,形如:String a = "123",String b = new String("123"),这两种形式的字符串是存放在什么地方的呢,其实这两种形式的字符串字面值"123"本身在运行时既不是存放在栈上,也不是存放在堆上,他们是存放在方法区中的某个常量区,并且对于相同的字符串字面值在内存中只保留一份.下面我们将以实例来分析. 1.==运算符作用在两个字符串引用比较的两个案例: p