Java集合---ArrayList的实现原理

一、 ArrayList概述:

ArrayList是List接口的可变数组的实现。实现了所有可选列表操作,并允许包括 null 在内的所有元素。除了实现 List 接口外,此类还提供一些方法来操作内部用来存储列表的数组的大小。
   每个ArrayList实例都有一个容量,该容量是指用来存储列表元素的数组的大小。它总是至少等于列表的大小。随着向ArrayList中不断添加元素,其容量也自动增长。自动增长会带来数据向新数组的重新拷贝,因此,如果可预知数据量的多少,可在构造ArrayList时指定其容量。在添加大量元素前,应用程序也可以使用ensureCapacity操作来增加ArrayList实例的容量,这可以减少递增式再分配的数量。 
   注意,此实现不是同步的。如果多个线程同时访问一个ArrayList实例,而其中至少一个线程从结构上修改了列表,那么它必须保持外部同步。

二、 ArrayList的实现:

对于ArrayList而言,它实现List接口、底层使用数组保存所有元素。其操作基本上是对数组的操作。下面我们来分析ArrayList的源代码:

1) 底层使用数组实现:

private transient Object[] elementData; 

2) 构造方法: 
   ArrayList提供了三种方式的构造器,可以构造一个默认初始容量为10的空列表、构造一个指定初始容量的空列表以及构造一个包含指定collection的元素的列表,这些元素按照该collection的迭代器返回它们的顺序排列的。

2 public ArrayList() {
3    this(10);
4 }
5
6 public ArrayList(int initialCapacity) {
7    super();
8    if (initialCapacity < 0)
9        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
10    this.elementData = new Object[initialCapacity];
11}
12
13 public ArrayList(Collection<? extends E> c) {
14    elementData = c.toArray();
15    size = elementData.length;
16    // c.toArray might (incorrectly) not return Object[] (see 6260652)
17    if (elementData.getClass() != Object[].class)
18        elementData = Arrays.copyOf(elementData, size, Object[].class);
   } 

3) 存储:

ArrayList提供了set(int index, E element)、add(E e)、add(int index, E element)、addAll(Collection<? extends E> c)、addAll(int index, Collection<? extends E> c)这些添加元素的方法。下面我们一一讲解:

20 // 用指定的元素替代此列表中指定位置上的元素,并返回以前位于该位置上的元素。
21 public E set(int index, E element) {
22    RangeCheck(index);
23
24    E oldValue = (E) elementData[index];
25    elementData[index] = element;
26    return oldValue;
27 }
28 // 将指定的元素添加到此列表的尾部。
29 public boolean add(E e) {
30    ensureCapacity(size + 1);
31    elementData[size++] = e;
32    return true;
33 }
34 // 将指定的元素插入此列表中的指定位置。
35 // 如果当前位置有元素,则向右移动当前位于该位置的元素以及所有后续元素(将其索引加1)。
36 public void add(int index, E element) {
37    if (index > size || index < 0)
38        throw new IndexOutOfBoundsException("Index: "+index+", Size: "+size);
39    // 如果数组长度不足,将进行扩容。
40    ensureCapacity(size+1);  // Increments modCount!!
41    // 将 elementData中从Index位置开始、长度为size-index的元素,
42    // 拷贝到从下标为index+1位置开始的新的elementData数组中。
43    // 即将当前位于该位置的元素以及所有后续元素右移一个位置。
44    System.arraycopy(elementData, index, elementData, index + 1, size - index);
45    elementData[index] = element;
46    size++;
47 }
48 // 按照指定collection的迭代器所返回的元素顺序,将该collection中的所有元素添加到此列表的尾部。
49 public boolean addAll(Collection<? extends E> c) {
50    Object[] a = c.toArray();
51    int numNew = a.length;
52    ensureCapacity(size + numNew);  // Increments modCount
53    System.arraycopy(a, 0, elementData, size, numNew);
54    size += numNew;
55    return numNew != 0;
56 }
57 // 从指定的位置开始,将指定collection中的所有元素插入到此列表中。
58 public boolean addAll(int index, Collection<? extends E> c) {
59    if (index > size || index < 0)
60        throw new IndexOutOfBoundsException(
61            "Index: " + index + ", Size: " + size);
62
63    Object[] a = c.toArray();
64    int numNew = a.length;
65    ensureCapacity(size + numNew);  // Increments modCount
66
67    int numMoved = size - index;
68    if (numMoved > 0)
69        System.arraycopy(elementData, index, elementData, index + numNew, numMoved);
70
71    System.arraycopy(a, 0, elementData, index, numNew);
72    size += numNew;
73    return numNew != 0;
   }  

4) 读取:

75 // 返回此列表中指定位置上的元素。
76 public E get(int index) {
77    RangeCheck(index);
78
79    return (E) elementData[index];
   } 

5) 删除:

ArrayList提供了根据下标或者指定对象两种方式的删除功能。如下:

81 // 移除此列表中指定位置上的元素。
82 public E remove(int index) {
83    RangeCheck(index);
84
85    modCount++;
86    E oldValue = (E) elementData[index];
87
88    int numMoved = size - index - 1;
89    if (numMoved > 0)
90        System.arraycopy(elementData, index+1, elementData, index, numMoved);
91    elementData[--size] = null; // Let gc do its work
92
93    return oldValue;
94 }
95 // 移除此列表中首次出现的指定元素(如果存在)。这是应为ArrayList中允许存放重复的元素。
96 public boolean remove(Object o) {
97    // 由于ArrayList中允许存放null,因此下面通过两种情况来分别处理。
98    if (o == null) {
99        for (int index = 0; index < size; index++)
100            if (elementData[index] == null) {
101                // 类似remove(int index),移除列表中指定位置上的元素。
102                fastRemove(index);
103                return true;
104            }
105    } else {
106        for (int index = 0; index < size; index++)
107            if (o.equals(elementData[index])) {
108                fastRemove(index);
109                return true;
110            }
111        }
112        return false;
113    }
       } 

注意:从数组中移除元素的操作,也会导致被移除的元素以后的所有元素的向左移动一个位置。

6) 调整数组容量: 
   从上面介绍的向ArrayList中存储元素的代码中,我们看到,每当向数组中添加元素时,都要去检查添加后元素的个数是否会超出当前数组的长度,如果超出,数组将会进行扩容,以满足添加数据的需求。数组扩容通过一个公开的方法ensureCapacity(int minCapacity)来实现。在实际添加大量元素前,我也可以使用ensureCapacity来手动增加ArrayList实例的容量,以减少递增式再分配的数量。

115 public void ensureCapacity(int minCapacity) {
116    modCount++;
117    int oldCapacity = elementData.length;
118    if (minCapacity > oldCapacity) {
119        Object oldData[] = elementData;
120        int newCapacity = (oldCapacity * 3)/2 + 1;  //增加50%+1
121            if (newCapacity < minCapacity)
122                newCapacity = minCapacity;
123      // minCapacity is usually close to size, so this is a win:
124      elementData = Arrays.copyOf(elementData, newCapacity);
125    }
126 }  

从上述代码中可以看出,数组进行扩容时,会将老数组中的元素重新拷贝一份到新的数组中,每次数组容量的增长大约是其原容量的1.5倍。这种操作的代价是很高的,因此在实际使用时,我们应该尽量避免数组容量的扩张。当我们可预知要保存的元素的多少时,要在构造ArrayList实例时,就指定其容量,以避免数组扩容的发生。或者根据实际需求,通过调用ensureCapacity方法来手动增加ArrayList实例的容量。

Object oldData[] = elementData;//为什么要用到oldData[]
乍一看来后面并没有用到关于oldData, 这句话显得多此一举!但是这是一个牵涉到内存管理的类, 所以要了解内部的问题。 而且为什么这一句还在if的内部,这跟elementData = Arrays.copyOf(elementData, newCapacity); 这句是有关系的,下面这句Arrays.copyOf的实现时新创建了newCapacity大小的内存,然后把老的elementData放入。好像也没有用到oldData,有什么问题呢。问题就在于旧的内存的引用是elementData, elementData指向了新的内存块,如果有一个局部变量oldData变量引用旧的内存块的话,在copy的过程中就会比较安全,因为这样证明这块老的内存依然有引用,分配内存的时候就不会被侵占掉,然后copy完成后这个局部变量的生命期也过去了,然后释放才是安全的。不然在copy的的时候万一新的内存或其他线程的分配内存侵占了这块老的内存,而copy还没有结束,这将是个严重的事情。

关于ArrayList和Vector区别如下:

l ArrayList在内存不够时默认是扩展50% + 1个,Vector是默认扩展1倍。

l Vector提供indexOf(obj, start)接口,ArrayList没有。

l Vector属于线程安全级别的,但是大多数情况下不使用Vector,因为线程安全需要更大的系统开销。

ArrayList还给我们提供了将底层数组的容量调整为当前列表保存的实际元素的大小的功能。它可以通过trimToSize方法来实现。代码如下:

127 public void trimToSize() {
128    modCount++;
129    int oldCapacity = elementData.length;
130    if (size < oldCapacity) {
131        elementData = Arrays.copyOf(elementData, size);
132    }
    }

7) Fail-Fast机制: 
ArrayList也采用了快速失败的机制,通过记录modCount参数来实现。在面对并发的修改时,迭代器很快就会完全失败,而不是冒着在将来某个不确定时间发生任意不确定行为的风险。具体介绍请参考这篇文章深入Java集合学习系列:HashMap的实现原理 中的Fail-Fast机制。
   8) 关于其他 的一些方法的实现都很简单易懂,读者可参照API文档和源代码。

时间: 2024-12-20 19:46:14

Java集合---ArrayList的实现原理的相关文章

Java集合---ArrayList源码

本文转载自博客园牛奶.不加糖 原文地址:http://www.cnblogs.com/ITtangtang/p/3948555.html 本文仅供本人学习参考使用,如有侵权立即删除. 一. ArrayList概述: ArrayList是基于数组实现的,是一个动态数组,其容量能自动增长,类似于C语言中的动态申请内存,动态增长内存. ArrayList不是线程安全的,只能用在单线程环境下,多线程环境下可以考虑用Collections.synchronizedList(List l)函数返回一个线程安

【源码阅读】Java集合 - ArrayList深度源码解读

Java 源码阅读的第一步是Collection框架源码,这也是面试基础中的基础: 针对Collection的源码阅读写一个系列的文章,从ArrayList开始第一篇. [email protected] JDK版本 JDK 1.8.0_110 概述总结 ArrayList底层是通过数组实现的:其中capacity表示底层数组的长度,而ArrayList长度由size表示: ArrayList允许存放null元素,也可以查找null所在的index, 比如indexOf(), lastIndex

java集合-ArrayList

一直要总结java集合中的知识,不知道应该如何下笔.觉得集合太多东西了,写细了太难了,写粗了又感觉写不好.不管如何觉得还是要坚持的写一写基础这一类的东西,为了提高自己的编程基础.本来觉的自己对这些已经很熟悉,最近见过一些大神后发现差距太大了,瞬间懵了,只能在加强学习了. 一.ArrayList是什么? ArrayList是实现List接口的动态数组,所谓动态是指它的大小是可变的.实现了所有可选列表操作,并允许包括 null 在内的所有元素.除了实现 List 接口外,此类还提供一些方法来操作内部

7.Java集合-Arrays类实现原理及源码分析

Java集合---Arrays类源码解析 转自:http://www.cnblogs.com/ITtangtang/p/3948765.html 一.Arrays.sort()数组排序 Java Arrays中提供了对所有类型的排序.其中主要分为Primitive(8种基本类型)和Object两大类. 基本类型:采用调优的快速排序: 对象类型:采用改进的归并排序. 1.对于基本类型源码分析如下(以int[]为例): Java对Primitive(int,float等原型数据)数组采用快速排序,对

java集合(ArrayList练习)

import java.util.ArrayList; import java.util.Iterator; /* 1.存入自定义对象,并且去除重复元素. * 2.List集合判断元素是否相同,依据的是元素的equals方法. * 心得:Object 里的equals方法判断的是对象的地址值是否相同. *   String 里的equals方法判断对象里内容是否相同. *    在自定义类里面要复写Object中的equals方法,让其比较对象里的内容. 在java里能封装的变量.对象和方法尽量

java集合ArrayList

数组可以保存多个元素,但在某些情况下无法确定到底要保存多少个元素,此时数组将不再适用,因为数组的长度不可变. 为了保存这些数目不确定的元素,JDK中提供了一系列特殊的类,这些类可以存储任意类型的元素,并且长度可变,统称为集合. ArrayList集合是程序中最常见的一种集合,它属于引用数据类型(类).在ArrayList内部封装了一个长度可变的数组,当存入的元素超过数组长度时,ArrayList会在内存中分配一个更大的数组来存储这些元素,因此可以将ArrayList集合看作一个长度可变的数组.

Java集合ArrayList的应用

/** * * @author Administrator * 功能:Java集合类ArrayList的使用 */ package com.test; import java.io.BufferedReader; import java.io.InputStreamReader; import java.util.*; public class Test2 { public static void main(String[] args) throws Exception{ // TODO Aut

java集合-- arraylist小员工项目

import java.io.*; import java.util.ArrayList; public class Emexe { public static void main(String[] args) throws IOException { EmpManage em=new EmpManage(); BufferedReader br=new BufferedReader(new InputStreamReader(System.in)); while(true){ System.o

Java 集合--ArrayList

ArrayList构造函数 // 默认构造函数 ArrayList() // capacity是ArrayList的默认容量大小.当由于增加数据导致容量不足时,容量会添加上一次容量大小的一半. ArrayList(int capacity) // 创建一个包含collection的ArrayList ArrayList(Collection<? extends E> collection) ArrayList的API // Collection中定义的API boolean add(E obj