从 Map 到 HashMap 到 LinkedHashMap

java 从 Map 到 HashMap 到 LinkedHashMap

Map 接口

Map 是 java 容器的基础接口,提供按照 kv 方式存取数据的能力。Map 定义了一系列的操作,以及一个内部接口 Map.Entry ,Entry 表示一个 kv 对 :

int size()
boolean isEmpty()
boolean containKey(Object)
boolean containValue(Object)
V get(Object)
V put(K, V)
V remove(Object)
...
Entry<K, V> {
    K getKey()
    V getValue()
    V setValue(V)
    ...
}

HashMap

HashMap 是 Map 的一种实现方式,内部通过 hashCode 把数据分布到对应的数组(表,table)位置上。HashMap 内部实现采用了很高效的方法来进行 hash。HashMap 有几个关键的因素:容量、负载因子、红黑树。

表的容量为 2^n ,初始默认值为 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4 ,每次增长时直接左移 1 。在进行 hash 时,直接用 k 的 hashCode 进行 hashCode & (table.lenght - 1) ,这样的方式不需要使用 mod 运算,全部使用位运算, 速度非常快。

当多个 k 对应到表的同一个位置时,需要进行扩展处理。HashMap 创建 HashMap.Node<K, V> 继承了 Map.Entry,并设计为链表方式,可在后面追加元素。

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;
    ...
}

要留意一点:Node 里面记录了数据项原始的 hash 值,一方面是减少计算 hash 的开销,另一方面的避免了因为 key 对象的修改导致的 hash 结果的变化。

但链表方式在追加或查找元素时速度比较慢,需要 O(n) 复杂度,因此 HashMap 在此基础上做了进一步的优化(jdk8),当一个链表的元素超过特定的数量 static final int TREEIFY_THRESHOLD = 8,将列表转换为红黑树 ,而小于特定的个数 static final int UNTREEIFY_THRESHOLD = 6; 时重新转为链表。

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;  // red-black tree links
    TreeNode<K,V> left;
    TreeNode<K,V> right;
    TreeNode<K,V> prev;    // needed to unlink next upon deletion
    boolean red;
    ...
}

TreeNode 扩展的 LinkedHashMap 里面的 Entry 而不只是 Node,使得它可以应用于带链接的节点。TreeMap 也是基于红黑树的结构,而 TreeMap 要求 key 实现 Comparable 接口,但是 HashMap 没有此要求,它通过 key 的 hash 值和 key 本身的 class 是否支持 Comparable 来进行查找

/**
* Finds the node starting at root p with the given hash and key.
* The kc argument caches comparableClassFor(key) upon first use
* comparing keys.
*/
final TreeNode<K,V> find(int h, Object k, Class<?> kc) {
    TreeNode<K,V> p = this;
    do {
        int ph, dir; K pk;
        TreeNode<K,V> pl = p.left, pr = p.right, q;
        if ((ph = p.hash) > h)  // 当前节点 hash 比 key 大,左子树
            p = pl;
        else if (ph < h)        // 当前节点 hash 比 key 小,右子树
            p = pr;
        else if ((pk = p.key) == k || (k != null && k.equals(pk)))
            return p;           // 找到了
        else if (pl == null)
            p = pr;             // hash 相等,只有右子树
        else if (pr == null)
            p = pl;             // hash 相等,只有左子树
        else if ((kc != null ||
                    (kc = comparableClassFor(k)) != null) &&
                    (dir = compareComparables(kc, k, pk)) != 0)
            p = (dir < 0) ? pl : pr;    // hash 相等,支持 Comparable
        else if ((q = pr.find(h, k, kc)) != null)
            return q;
        else
            p = pl;
    } while (p != null);
    return null;
}

在进行 putremove 时,HashMap 对表项的元素数进行计算,自动转换。以下为 put 使用的 putVal 内部函数的部分代码

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        /* tab[hash & (tab.length - 1)] 位置有数据项时 */
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;  // 相同的key,后面直接替换value
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); // 红黑树
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);  // 转换为红黑树
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        ...
    }
}

当 HashMap 数据量较多,而表不变的话,会导致查找量加大,因此,HashMap 使用一个 loadFactor 变量来数据量占比到达多大时进行表扩容,这个值默认为 static final float DEFAULT_LOAD_FACTOR = 0.75f; ,用 loadFactor * table.length 得到一个数据量阈值 threshold 就是衡量当前数据量是否需要进行扩容的指标。

扩容也不能无限扩容,HashMap 里面设置了最大容量为 static final int MAXIMUM_CAPACITY = 1 << 30;(hashCode 为 int 类型,int 最大值为 2^31 -1)。到达表最大容量时,原来的表不变,只将 HashMap 的容量指标 threshold 改到 Interger.MAX_VALUE

扩容的 resize() 函数比较复杂,包括以下的流程:

1. 确定新容量,如果旧容量为0,则为默认的初始容量,否则为旧容量的2倍(左移1)
2. 创建新容量的表
3. 从旧表转移所有的的节点到新表

LinkedHashMap

LinkedHashMap 在 HashMap 的基础上,增加对顺序的记录(插入顺序或访问顺序 accessOrder)。这使用 LinkedHashMap 经常用来作为 LRU cache 的实现基础。

顺序的记录主要是通过 LinkedHashMap.Entry 实现:

static class Entry<K,V> extends HashMap.Node<K,V> {
    Entry<K,V> before, after;
    ...
}

before 指向此记录的前一记录,after 为此记录的后一记录,同时,LinkedHashMap 中记录了头部和尾部:

/**
 * The head (eldest) of the doubly linked list.
 */
transient LinkedHashMap.Entry<K,V> head;

/**
 * The tail (youngest) of the doubly linked list.
 */
transient LinkedHashMap.Entry<K,V> tail;

每次进行修改时,需要同时处理 tail 指向的元素,以保证顺序记录准确。

原文地址:https://www.cnblogs.com/fengyc/p/12090339.html

时间: 2024-10-09 21:57:01

从 Map 到 HashMap 到 LinkedHashMap的相关文章

集合类源码(六)Map(HashMap, Hashtable, LinkedHashMap, WeakHashMap)

HashMap 内部结构 内部是一个Node数组,每个Node都是链表的头,当链表的大小达到8之后链表转变成红黑树. put操作 final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; // 当table为空或者长度为0,执行resize if ((tab = table) == null || (n

深入理解 hash 函数、HashMap、LinkedHashMap、TreeMap 【中】

LinkedHashMap - 有序的 HashMap 我们之前讲过的 HashMap 的性能表现非常不错,因此使用的非常广泛.但是它有一个非常大的缺点,就是它内部的元素都是无序的.如果在遍历 map 的时候, 我们希望元素能够保持它被put进去时候的顺序,或者是元素被访问的先后顺序,就不得不使用 LinkedHashMap. LinkdHashMap 继承了 HashMap,因此,它具备了 HashMap 的优良特性-高性能.在HashMap 的基础上, LinkedHashMap 又在内部维

HashMap与LinkedHashMap的区别

HashMap与LinkedHashMap的区别: 一般情况下,我们用的最多的是HashMap,在Map 中插入.删除和定位元素,HashMap 是最好的选择.但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好.如果需要输出的顺序和输入的相同,那么用LinkedHashMap 可以实现,它还可以按读取顺序来排列.工作流当中使用LinkedHashMap的好处是可以按照遍历集合的顺序来存值排列.

java集合List、Set、Map总结 + HashMap/Hashtable区别

List:(有序,可以重复)通过下标索引 ----ArrayList  可变数组,随机查找 ----LinkedList    链表,任何位置插入删除快 ----Vector    效率比arraylist低,但是可以用于多线程同步 Set:(无序,不可以重复)set最多有一个null元素,因为不可以重复 ----HashSet    没有排序,不重复(顺序随机) ----LinkedHashSet    按插入排序,不重复(按插入顺序) ----TreeSet    实现Comparable接

HashMap Hashtable LinkedHashMap 和TreeMap

java为数据结构中的映射定义了一个接口java.util.Map;它有四个实现类,分别是HashMap Hashtable LinkedHashMap 和TreeMap. Map主要用于存储健值对,根据键得到值,因此不允许键重复(重复了覆盖了),但允许值重复. HashMap是一个最常用的Map,它根据键的HashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度,遍历时,取得数据的顺序是完全随机的. HashMap最多只允许一条记录的键为Null;允许多条记录的值为 Null;

【JAVA】六 JAVA Map 一 HashMap

[JAVA]六 JAVA Map 一 HashMap JDK API java.util Interface Map Type Parameters: K - the type of keys maintained by this map V - the type of mapped values All Known Subinterfaces: Bindings, ConcurrentMap<K,V>, ConcurrentNavigableMap<K,V>, LogicalMe

深入理解 hash 函数、HashMap、LinkedHashMap、TreeMap 【上】

前言 Map 是非常常用的一种数据接口.在 Java 中,提供了成熟的 Map 实现. 图 1 最主要的实现类有 Hashtable.HashMap.LinkedHashMap和 TreeMap.在 HashTable 的子类中,还有 Properties的实现.Properties 是专门读取配置文件的类,我们会在稍后介绍.这里首先值得关注的是 HashMap 和 HashTable 两套不同的实现,两者都实现了 Map 接口.从表面上看,并没有多大差别,但是在内部实现上却有些微小的细节. 首

HashMap和LinkedHashMap的比较使用

由于现在项目中用到了LinkedHashMap,并不是太熟悉就到网上搜了一下. import java.util.HashMap; import java.util.Iterator; import java.util.LinkedHashMap; import java.util.Map; public class TestLinkedHashMap {   public static void main(String args[])   {    System.out.println("**

HashMap和LinkedHashMap的区别

一般情况下,我们用的最多的是HashMap,在Map 中插入.删除和定位元素,HashMap 是最好的选择.但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好.如果需要输出的顺序和输入的相同,那么用LinkedHashMap 可以实现,它还可以按读取顺序来排列. LinkedHashMap保存了记录的插入顺序,在用Iterator遍历LinkedHashMap时,先得到的记录肯定是先插入的. Map<String, Map<String, String>> map =