Java数据结构-------List

三种List：ArrayList，Vector，LinkedList

　　类继承关系图

　　　　ArrayList和Vector通过数组实现，几乎使用了相同的算法；区别是ArrayList不是线程安全的，Vector绝大多数方法做了线程同步。

　　　　LinkedList通过双向链表实现。

　　源代码分析

　　　　1、添加元素到列表尾端（Appends the specified element to the end of this list.）

　　　　　　ArrayList:当所需容量超过当前ArrayList的大小时，需要进行扩容，对性能有一定的影响。

　　　　　　　　优化策略：在能有效评估ArrayList数组初始值大小的情况下，指定其容量大小有助于性能提升，避免频繁的扩容。

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!! 确保内部数组有足够的空间
        elementData[size++] = e;　//将元素放在数组尾部
        return true;
    }
    private void ensureCapacityInternal(int minCapacity) {
        if (elementData == EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);  //如果数组为空数组，取初始容量和minCapacity中的最大值，初始容量DEFAULT_CAPACITY = 10
        }

        ensureExplicitCapacity(minCapacity);
    }
    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;  //被修改次数，iterator成员变量expectedModCount为创建时的modCount的值，用来判断list是否在迭代过程中被修改

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity); //如果所需容量大小大于数组的大小就进行扩展
    }
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1); //旧容量的1.5倍。二进制右移一位差不多相当于十进制除以2，对CPU来说，右移比除运算速度更快。如果oldCapacity为偶数，newCapacity为1.5*oldCapacity，否则为1.5*oldCapacity-1。
        if (newCapacity - minCapacity < 0)  //如果计算出的容量不够用，就使用minCapacity
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)  //如果计算出的容量大于MAX_ARRAY_SIZE=Integer.MAX_VALUE-8，
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);//调用System.arraycopy方法复制数组
    }
   //判断是否大于数组最大值Integer.MAX_VALUE,疑问：设置MAX_ARRAY_SIZE=Integer.MAX_VALUE-8的意义是什么？
　　private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
　　　　//
    }

　　　　　　LinkedList：每次新增元素都需要new一个Node对象，并进行更多的赋值操作。在频繁的调用中，对性能会产生一定的影响。

    public boolean add(E e) {
        linkLast(e);
        return true;
    }
    void linkLast(E e) {
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null); //每增加一个节点，都需要new一个Node
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }

　　　　2、在列表任意位置添加元素

　　　　　　ArrayList：基于数组实现，数组需要一组连续的内存空间，如果在任意位置插入元素，那么该位置之后的元素需要重新排列，效率低。

     public void add(int index, E element) {
        rangeCheckForAdd(index);//检查索引是否越界

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);//每次操作都会进行数组复制，System.arraycopy可以实现数组自身的复制
        elementData[index] = element;
        size++;
    }

    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

　　　　　　LinkedList：先找到指定位置的元素，然后在该元素之前插入元素。在首尾插入元素，性能较高；在中间位置插入，性能较低。

     //在列表指定位置添加元素
     public void add(int index, E element) {
        checkPositionIndex(index);//检查索引是否越界

        if (index == size) //index为列表大小，相当于在列表尾部添加元素
            linkLast(element);
        else
            linkBefore(element, node(index));
    }

    //返回指定索引的元素，在首尾查找速度快，在中间位置查找速度较慢，需要遍历列表的一半元素。
    Node<E> node(int index) {
        // assert isElementIndex(index);

        if (index < (size >> 1)) {  //如果index在列表的前半部分，从头结点开始向后遍历
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {  //如果index在列表的后半部分，从尾结点开始向前遍历
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

    //在指定节点succ之前添加元素
    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;
        final Node<E> newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null) //只有succ一个节点
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

　　　　3、删除任意位置元素

　　　　　　ArrayList：每次删除都会复制数组。删除的位置越靠前，开销越大；删除的位置越靠后，开销越小。

    public E remove(int index) {
        rangeCheck(index);//检查索引是否越界

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);//将删除位置后面的元素往前移动一位
        elementData[--size] = null; // clear to let GC do its work  最后一个位置设置为null

        return oldValue;
    }

　　　　　　LinkedList：先通过循环找到要删除的元素，然后删除该元素。删除首尾的元素，效率较高；删除中间元素，效率较差。

    public E remove(int index) {
        checkElementIndex(index);
        return unlink(node(index));
    }

    E unlink(Node<E> x) {
        // assert x != null;
        final E element = x.item;
        final Node<E> next = x.next;
        final Node<E> prev = x.prev;

        if (prev == null) {  //x为第一个元素
            first = next;
        } else {
            prev.next = next;
            x.prev = null;
        }

        if (next == null) {  //x为最后一个元素
            last = prev;
        } else {
            next.prev = prev;
            x.next = null;
        }

        x.item = null;
        size--;
        modCount++;
        return element;
    }

　　　　4、遍历列表

　　　　　　三种遍历方式：foreach，迭代器，for遍历随机访问。

　　　　　　foreach的内部实现也是使用迭代器进行遍历，但由于foreach存在多余的赋值操作，比直接使用迭代器稍慢，影响不大。for遍历随机访问对ArrayList性能较好，对LinkedList是灾难性的。

　　并发List

　　　　Vector和CopyOnWriteArrayList是线程安全的实现；

　　　　ArrayList不是线程安全的，可通过Collections.synchronizedList(list)进行包装。

　　　　CopyOnWriteArrayList，读操作不需要加锁，

　　　　　　1、读操作

　　　　　　　　CopyOnWriteArrayList：读操作没有锁操作

    public E get(int index) {
        return get(getArray(), index);
    }

    final Object[] getArray() {
        return array;
    }

    private E get(Object[] a, int index) {
        return (E) a[index];
    }

　　　　　　　　Vector：读操作需要加对象锁，高并发情况下，锁竞争影响性能。

    public synchronized E get(int index) {
        if (index >= elementCount)
            throw new ArrayIndexOutOfBoundsException(index);

        return elementData(index);
    }

　　　　　　2、写操作

　　　　　　　　CopyOnWriteArrayList：需要加锁且每次写操作都需要进行一次数组复制，性能较差。

    public boolean add(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            Object[] elements = getArray();
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1);  //通过复制生成数组副本
            newElements[len] = e;  //修改副本
            setArray(newElements); //将副本写会
            return true;
        } finally {
            lock.unlock();
        }
    }

　　　　　　　　Vector：和读一样需要加对象锁，相对CopyOnWriteArrayList来说不需要复制，写性能比CopyOnWriteArrayList要高。

    public synchronized boolean add(E e) {
        modCount++;
        ensureCapacityHelper(elementCount + 1); //确认是否需要扩容
        elementData[elementCount++] = e;
        return true;
    }
    private void ensureCapacityHelper(int minCapacity) {
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

　　　　　　总结：在读多写少的高并发应用中，适合使用CopyOnWriteArrayList；在读少写多的高并发应用中，Vector更适合。

时间： 2024-10-07 21:32:01

Java数据结构-------List的相关文章

Java数据结构之二叉搜索树

Java数据结构之二叉搜索树 1.二叉搜索树组成二叉搜索树又称为二叉排序树,它或者是一颗空树,或者是一颗具有如下特性的非空二叉树,需要满足一下三个条件: (1)若它的左子树非空,则左子树上所有结点的关键字均小于根结点的关键字: (2)若它的右子树非空,则右子树上所有结点的关键字均大于(可以等于)根结点的关键字. (3)左子树右子树本身又各是一颗二叉搜索树在算法描述中,均以结点值的比较来代表其关键字的比较,因为若结点的值为类类型时,该类必须实现系统提供的java.lang.comparable

Java数据结构和算法之递归

四.递归递归是函数调用自身的一种特殊的编程技术,其应用主要在以下几个方面: 阶乘在java当中的基本形式是: Public void mothed(int n){//当满足某条件时: Mothed(n‐1): } 递归二分查找 Java二分查找实现,欢迎大家提出交流意见. /** *名称:BinarySearch *功能:实现了折半查找(二分查找)的递归和非递归算法. *说明: * 1.要求所查找的数组已有序,并且其中元素已实现Comparable<T>接口,如Integ

Java数据结构和算法(二)——数组

数组的用处是什么呢?--当你需要将30个数进行大小排列的时候,用数组这样的数据结构存储是个很好的选择,当你是一个班的班主任的时候,每次要记录那些学生的缺勤次数的时候,数组也是很有用.数组可以进行插入,删除,查找等. 1)创建和内存分配 Java中有两种数据类型,基本类型和对象类型,也有人称为引用类型,Java中把数组当成对象,创建数组时使用new操作符. int array[] = new int[10]; 既然是对象,那么array便是数组的一个引用,根据Java编程思想(一) -- 一切都是

Java数据结构与算法之集合

线性表.链表.哈希表是常用的数据结构,在进行Java开发时,SDK已经为我们提供了一系列相应的类来实现基本的数据结构.这些类均在java.util包中. 一.Collection接口 Collection是最基本的集合接口,一个Collection代表一组Object.一些Collection允许相同元素而另一些不行.一些能排序而另一些不行.Java SDK不提供直接继承自Collection的类,Java SDK提供的类都是继承自Collection的"子接口"如List和Set

Java数据结构和算法之栈与队列

二.栈与队列 1.栈的定义栈(Stack)是限制仅在表的一端进行插入和删除运算的线性表. (1)通常称插入.删除的这一端为栈顶(Top),另一端称为栈底(Bottom). (2)当表中没有元素时称为空栈. (3)栈为后进先出(Last In First Out)的线性表,简称为LIFO表. 栈的修改是按后进先出的原则进行. 每次删除(退栈)的总是当前栈中"最新"的元素,即最后插入(进栈)的元素,而最先插入的是被放在栈的底部,要到最后才能删除. 图1 [示例]元素是以a1,a2,-,a

Java数据结构和算法之数组与简单排序

一.数组于简单排序数组数组(array)是相同类型变量的集合,可以使用共同的名字引用它.数组可被定义为任何类型,可以是一维或多维.数组中的一个特别要素是通过下标来访问它.数组提供了一种将有联系的信息分组的便利方法. 一维数组一维数组(one‐dimensional array )实质上是相同类型变量列表.要创建一个数组,你必须首先定义数组变量所需的类型.通用的一维数组的声明格式是: type var‐name[ ]; 获得一个数组需要2步: 第一步,你必须定义变量所需的类型. 第二步,你必

Java数据结构和算法之链表

三.链表链结点在链表中,每个数据项都被包含在'点"中,一个点是某个类的对象,这个类可认叫做LINK.因为一个链表中有许多类似的链结点,所以有必要用一个不同于链表的类来表达链结点.每个LINK对象中都包含一个对下一个点引用的字段(通常叫做next)但是本身的对象中有一个字段指向对第一个链结点的引用. 单链表用一组地址任意的存储单元存放线性表中的数据元素. 以元素(数据元素的映象) + 指针(指示后继元素存储位置) = 结点(表示数据元素或数据元素的映象) 以"结点的序列&q

Java数据结构和算法之哈希表

五.哈希表一般的线性表.树中,记录在结构中的相对位置是随机的即和记录的关键字之间不存在确定的关系,在结构中查找记录时需进行一系列和关键字的比较.这一类查找方法建立在"比较"的基础上,查找的效率与比较次数密切相关.理想的情况是能直接找到需要的记录,因此必须在记录的存储位置和它的关键字之间建立一确定的对应关系f,使每个关键字和结构中一个唯一的存储位置相对应.因而查找时,只需根据这个对应关系f找到给定值K的像f(K).若结构中存在关键字和K相等的记录,则必定在f(K)的存储位置上,由此不需

java数据结构与算法之顺序表与链表深入分析

转载请注明出处(万分感谢!): http://blog.csdn.net/javazejian/article/details/52953190 出自[zejian的博客] 关联文章: java数据结构与算法之顺序表与链表设计与实现分析 java数据结构与算法之双链表设计与实现 ??数据结构与算法这门学科虽然在大学期间就已学习过了,但是到现在确实也忘了不少,因此最近又重新看了本书-<数据结构与算法分析>加上之前看的<java数据结构>也算是对数据结构的进一步深入学习了,于是也就打算

Java数据结构与算法（第一章综述）

数据结构和算法能起到什么作用? 数据结构是对在计算机内存中(有时在磁盘中)的数据的一种安排.数据结果包括数组.链表.栈.二叉树.哈希表等等.算法对这些结构中的数据进行各种处理,例如,查找一条特殊的数据项或对数据进行排序. 可用于下面三类情况: 现实数据存储程序员的工具建模数据结构的特性: 数据结构优点缺点数组插入快,如果知道下标,可以非常快地存取查找慢,删除慢,大小固定有序数组比无序的数组查找快删除和插入慢,大小固定栈提供后进先出的方式存取存取其他项很慢队列提供先