本文以jdk源码为线索学习几种数据类型实现机制。
【HashMap数据机制】
HashMap提供了key、value存储机制。
HashMap是LinkedHashMap的基类,其内部维护一个Node数组用来存储数据:
transient Node<K,V>[] table;
为了解决hash冲突,每个节点存储链表或者红黑树。当链表长度小于阈值8时,使用链表存储;当长度达到阈值8时,将链表转换为红黑树提升读写效率:
if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); }
A. put
public V put(K key, V value);
put数据时,首先依据key计算hash值,与数组尺寸做与运算,计算存储数据在数组中的位置。
若该位置没有数据(未发生hash冲突),直接依据hash值、key、value构造Node存入该位置:
if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null);
当存在冲突时,遍历链表/红黑树查找当前key是否存在。若key已经存在,则替代旧的value:
V oldValue = e.value; e.value = value; afterNodeAccess(e); return oldValue;
否则,将新的数据存入链表/红黑树:
插入链表:
if ((e = p.next) == null) { p.next = newNode(hash, key, value, null);
插入红黑树:
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
在插入数据之后,执行回调方法:
afterNodeInsertion(evict);
当数据数量达到一定阈值时,resize()方法将被执行,对数组进行扩容。
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab;
B. remove
public V remove(Object key);
执行remove方法时,将首先依据要移除key的hash值定位在数组中的位置,
之后依据Node类型是TreeNode或链表对key进行查找。
当匹配上时,将node从链表或tree中移除,并将其value作为remove方法返回值。
在remove之后,调用回调方法:
afterNodeRemoval(node);
【linkedHashMap】
为了解决hashMap无序的问题,引入了有序存储key、value的数据结构LinkedHashMap。
linkedHashMap以HashMap为基类,提供了记录插入key、value顺序的功能,读取时将按序输出。
记录的节点以双向链表的形式存储:
transient LinkedHashMap.Entry<K,V> head; transient LinkedHashMap.Entry<K,V> tail;
A. put
基类HashMap中当插入数据时,构造新节点时执行newNode方法。
LinkedHashMap重写了newNode方法:
Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) { LinkedHashMap.Entry<K,V> p = new LinkedHashMap.Entry<K,V>(hash, key, value, e); linkNodeLast(p); return p; }
每一个put的key、value被构造成双向链表节点p,最终被接在tail节点的后面,成为新的tail节点:
LinkedHashMap.Entry<K,V> last = tail; tail = p; p.before = last; last.after = p;
若put之前存在相同key的旧值,那么就需要将旧值移除。
在插入完成之后,HashMap中会调用afterNodeInsertion方法,LinkedHashMap中实现此模板方法,将双向链表中旧的节点移除。
B. remove
基类HashMap中当remove被调用,将相应key的节点移除后,回调方法afterNodeRemoval将被调用。
LinkedHashMap重写了此方法,将相应key的节点从双向链表中移除。
C. 读取
LinkedHashMap内部的迭代器iterator以双向链表head为起点遍历输出,从而实现有序输出的属性。
【HashSet】
HashSet实现了Set接口,存储一组不重复的元素。
为了实现不重复的功能,其内部使用HashMap存储数据,利用其key的唯一性:
public HashSet() { map = new HashMap<>(); }
执行add元素时,
public boolean add(E e) { return map.put(e, PRESENT)==null; }
执行remove移除元素时,
public boolean remove(Object o) { return map.remove(o)==PRESENT; }
遍历元素时,直接使用HashMap的KeySet():
public Iterator<E> iterator() { return map.keySet().iterator(); }
由于HashMap内部数据依据hash值在数组中存储,因此HashSet的iterator也是无序的。
【LinkedHashSet】
为了解决HashSet无序存储的问题,引入了LinkedHashSet。
其内部利用了LinkedHashMap有序的特性:
HashSet(int initialCapacity, float loadFactor, boolean dummy) { map = new LinkedHashMap<>(initialCapacity, loadFactor); }
其迭代器返回LinkedHashMap的KeySet,从而实现有序输出。
原文地址:https://www.cnblogs.com/xinxinBlog/p/10347259.html