Integer和Long部分源码分析

Integer和Long的java中使用特别广泛，本人主要一下Integer.toString(int i)和Long.toString(long i)方法，其他方法都比较容易理解。

Integer.toString(int i)和Long.toString(long i)，以Integer.toString(int i)为例，先看源码：

 1    /**
 2      * Returns a {@code String} object representing the
 3      * specified integer. The argument is converted to signed decimal
 4      * representation and returned as a string, exactly as if the
 5      * argument and radix 10 were given as arguments to the {@link
 6      * #toString(int, int)} method.
 7      *
 8      * @param   i   an integer to be converted.
 9      * @return  a string representation of the argument in base&nbsp;10.
10      */
11     public static String toString(int i) {
12         if (i == Integer.MIN_VALUE)
13             return "-2147483648";
14         int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
15         char[] buf = new char[size];
16         getChars(i, size, buf);
17         return new String(buf, true);
18     }

通过调用stringSize来计算i的长度，也就是位数，用来分配合适大小的字符数组buf，然后调用getChars来设置buf的值。

stringSize的Integer和Long中的实现有所不同，先看看源码

Integer.stringSize(int x)源码：

1    final static int [] sizeTable = { 9, 99, 999, 9999, 99999, 999999, 9999999,
2                                       99999999, 999999999, Integer.MAX_VALUE };
3
4     // Requires positive x
5     static int stringSize(int x) {
6         for (int i=0; ; i++)
7             if (x <= sizeTable[i])
8                 return i+1;
9     }

将数据存放在数组中，数组中的下标+1就是i的长度，当x小于sizeTable中的某个值时，这样设计只需要循环就可以得出长度，效率高。

Long.stringSize(long x)源码：

 1     // Requires positive x
 2     static int stringSize(long x) {
 3         long p = 10;
 4         for (int i=1; i<19; i++) {
 5             if (x < p)
 6                 return i;
 7             p = 10*p;
 8         }
 9         return 19;
10     }

因为Long的十进制最大长度是19，在计算长度时通过反复乘以10的方式求出来的，可能会问为什么不用Integer.stringSize(int x)的方法，我也没有找到合适的解释。

传统的方案可能是通过反复除以10的方法求出来的，但是这样的效率低，因为计算机在处理乘法时要比除法快。

getChars(int i, int index, char[] buf)源码：

 1    /**
 2      * Places characters representing the integer i into the
 3      * character array buf. The characters are placed into
 4      * the buffer backwards starting with the least significant
 5      * digit at the specified index (exclusive), and working
 6      * backwards from there.
 7      *
 8      * Will fail if i == Integer.MIN_VALUE
 9      */
10     static void getChars(int i, int index, char[] buf) {
11         int q, r;
12         int charPos = index;
13         char sign = 0;
14
15         if (i < 0) {
16             sign = ‘-‘;
17             i = -i;
18         }
19
20         // Generate two digits per iteration
21         while (i >= 65536) {
22             q = i / 100;
23         // really: r = i - (q * 100);
24             r = i - ((q << 6) + (q << 5) + (q << 2));
25             i = q;
26             buf [--charPos] = DigitOnes[r];
27             buf [--charPos] = DigitTens[r];
28         }
29
30         // Fall thru to fast mode for smaller numbers
31         // assert(i <= 65536, i);
32         for (;;) {
33             q = (i * 52429) >>> (16+3);
34             r = i - ((q << 3) + (q << 1));  // r = i-(q*10) ...
35             buf [--charPos] = digits [r];
36             i = q;
37             if (i == 0) break;
38         }
39         if (sign != 0) {
40             buf [--charPos] = sign;
41         }
42     }

这是整个转换过程的核心代码，首先确定符号，其次当i>=65536时将i除以100，并且通过DigitOnes[r]和DigitTens[r]来获取十位和个位上的值，因为除法慢，所以一次性除以100提高效率，DigitOnes和DigitTens如下：

 1   final static char [] DigitTens = {
 2         ‘0‘, ‘0‘, ‘0‘, ‘0‘, ‘0‘, ‘0‘, ‘0‘, ‘0‘, ‘0‘, ‘0‘,
 3         ‘1‘, ‘1‘, ‘1‘, ‘1‘, ‘1‘, ‘1‘, ‘1‘, ‘1‘, ‘1‘, ‘1‘,
 4         ‘2‘, ‘2‘, ‘2‘, ‘2‘, ‘2‘, ‘2‘, ‘2‘, ‘2‘, ‘2‘, ‘2‘,
 5         ‘3‘, ‘3‘, ‘3‘, ‘3‘, ‘3‘, ‘3‘, ‘3‘, ‘3‘, ‘3‘, ‘3‘,
 6         ‘4‘, ‘4‘, ‘4‘, ‘4‘, ‘4‘, ‘4‘, ‘4‘, ‘4‘, ‘4‘, ‘4‘,
 7         ‘5‘, ‘5‘, ‘5‘, ‘5‘, ‘5‘, ‘5‘, ‘5‘, ‘5‘, ‘5‘, ‘5‘,
 8         ‘6‘, ‘6‘, ‘6‘, ‘6‘, ‘6‘, ‘6‘, ‘6‘, ‘6‘, ‘6‘, ‘6‘,
 9         ‘7‘, ‘7‘, ‘7‘, ‘7‘, ‘7‘, ‘7‘, ‘7‘, ‘7‘, ‘7‘, ‘7‘,
10         ‘8‘, ‘8‘, ‘8‘, ‘8‘, ‘8‘, ‘8‘, ‘8‘, ‘8‘, ‘8‘, ‘8‘,
11         ‘9‘, ‘9‘, ‘9‘, ‘9‘, ‘9‘, ‘9‘, ‘9‘, ‘9‘, ‘9‘, ‘9‘,
12         } ;
13
14     final static char [] DigitOnes = {
15         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
16         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
17         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
18         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
19         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
20         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
21         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
22         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
23         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
24         ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘, ‘7‘, ‘8‘, ‘9‘,
25         } ;

假设r=34，通过查表可以得出DigitOnes[r]=4，DigitTens[r]=3。

1 q = (i * 52429) >>> (16+3); 的本质是将i/10，并去掉小数部分，2¹⁹=524288，52429/524288=0.10000038146972656，为什么会选择52429/524288呢，看了下面就知道了：

 1 2^10=1024, 103/1024=0.1005859375
 2 2^11=2048, 205/2048=0.10009765625
 3 2^12=4096, 410/4096=0.10009765625
 4 2^13=8192, 820/8192=0.10009765625
 5 2^14=16384, 1639/16384=0.10003662109375
 6 2^15=32768, 3277/32768=0.100006103515625
 7 2^16=65536, 6554/65536=0.100006103515625
 8 2^17=131072, 13108/131072=0.100006103515625
 9 2^18=262144, 26215/262144=0.10000228881835938
10 2^19=524288, 52429/524288=0.10000038146972656

可以看出52429/524288的精度最高，并且在Integer的取值范围内。

1 r = i - ((q << 3) + (q << 1)); // r = i-(q*10) ... 用位运算而不用乘法也是为了提高效率。

注：以上分析内容仅个人观点（部分参考网上），如有不正确的地方希望可以相互交流。

时间： 2024-11-10 01:27:03

Integer和Long部分源码分析的相关文章

Integer面试连环炮以及源码分析

场景: ??昨天有位朋友去面试,我问他面试问了哪些问题,其中问了Integer相关的问题,以下就是面试官问的问题,还有一些是我对此做了扩展. 问:两个new Integer 128相等吗? 答:不.因为Integer缓存池默认是-127-128: 问:可以修改Integer缓存池范围吗?如何修改? 答:可以.使用-Djava.lang.Integer.IntegerCache.high=300设置Integer缓存池大小问:Integer缓存机制使用了哪种设计模式? 答:亨元模式: 问:Int

JDK源码分析-Integer

Integer是平时开发中最常用的类之一,但是如果没有研究过源码很多特性和坑可能就不知道,下面深入源码来分析一下Integer的设计和实现. Integer: 继承结构: -java.lang.Object --java.lang.Number ---java.lang.Integer 其中父类Number是个抽象类,是所有数字类型相关的类的父类,例如Double.Float.Integer.Long 和 Short. Integer类还实现了Comparable接口用以比较两个Integer的

HashMap与TreeMap源码分析

1. 引言在红黑树--算法导论(15)中学习了红黑树的原理.本来打算自己来试着实现一下,然而在看了JDK(1.8.0)TreeMap的源码后恍然发现原来它就是利用红黑树实现的(很惭愧学了Java这么久,也写过一些小项目,也使用过TreeMap无数次,但到现在才明白它的实现原理).因此本着"不要重复造轮子"的思想,就用这篇博客来记录分析TreeMap源码的过程,也顺便瞅一瞅HashMap. 2. 继承结构 (1) 继承结构下面是HashMap与TreeMap的继承结构: pu

redis源码分析3---结构体---字典

redis源码分析3---结构体---字典字典,简单来说就是一种用于保存键值对的抽象数据结构: 注意,字典中每个键都是独一无二的:在redis中,内部的redis的数据库就是使用字典作为底层实现的: 1 字典的实现在redis中,字典是使用哈希表作为底层实现的,一个hash表里面可以有多个hash表节点,而每个hash表节点就保存了字典中的一个键值对: hash表定义 table属性是一个数组,数组中的每个元素都是一个指向dictEntry结构的指针,每个dictEntry结构保存着一个键值

Mybatis源码分析之Cache二级缓存原理（五）

一:Cache类的介绍讲解缓存之前我们需要先了解一下Cache接口以及实现MyBatis定义了一个org.apache.ibatis.cache.Cache接口作为其Cache提供者的SPI(ServiceProvider Interface) ,所有的MyBatis内部的Cache缓存,都应该实现这一接口 Cache的实现类中,Cache有不同的功能,每个功能独立,互不影响,则对于不同的Cache功能,这里使用了装饰者模式实现. 看下cache的实现类,如下图: 1.FIFOCache:先进

【JUC】JDK1.8源码分析之ConcurrentHashMap（一）

一.前言最近几天忙着做点别的东西,今天终于有时间分析源码了,看源码感觉很爽,并且发现ConcurrentHashMap在JDK1.8版本与之前的版本在并发控制上存在很大的差别,很有必要进行认真的分析,下面进行源码分析. 二.ConcurrentHashMap数据结构之前已经提及过,ConcurrentHashMap相比HashMap而言,是多线程安全的,其底层数据与HashMap的数据结构相同,数据结构如下说明:ConcurrentHashMap的数据结构(数组+链表+红黑树),桶中的结构

[Java] HashMap源码分析

1.概述 Hashmap继承于AbstractMap,实现了Map.Cloneable.java.io.Serializable接口.它的key.value都可以为null,映射不是有序的. Hashmap不是同步的,如果想要线程安全的HashMap,可以通过Collections类的静态方法synchronizedMap获得线程安全的HashMap. Map map = Collections.synchronizedMap(new HashMap()); (除了不同步和允许使用 null 之

【JAVA集合】HashMap源码分析（转载）

原文出处:http://www.cnblogs.com/chenpi/p/5280304.html 以下内容基于jdk1.7.0_79源码: 什么是HashMap 基于哈希表的一个Map接口实现,存储的对象是一个键值对对象(Entry<K,V>): HashMap补充说明基于数组和链表实现,内部维护着一个数组table,该数组保存着每个链表的表头结点:查找时,先通过hash函数计算hash值,再根据hash值计算数组索引,然后根据索引找到链表表头结点,然后遍历查找该链表: HashMap数据

JVM源码分析之堆外内存完全解读

概述广义的堆外内存说到堆外内存,那大家肯定想到堆内内存,这也是我们大家接触最多的,我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值,不过这还不是我们理解的Java堆,-Xmx的值是新生代和老生代的和的最大值,我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值,那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和,在分代算法下,新生代,老生代和持久代是连续的虚拟地址,因为它们是一起分配的,那么剩下的都可以认为是堆外内存