Map是键值对,也是常用的数据结构。Map接口定义了map的基本行为,包括最核心的get和put操作,此接口的定义的方法见下图:
JDK中有不同的的map实现,分别适用于不同的应用场景,如线程安全的hashTable和非线程安全的hashMap.
如下图是JDK中map接口的子类UML类图,其中有个特例Dictionary已经不建议使用:
Map接口中的方法我们需要关注的就是get、put 和迭代器相关的方法如entrySet()、keySet()、values()方法。
Entry
在开始分析map之前,首先了解map中元素的存储,我们知道map可以认为是键值对的集合,java中map使用Entry存储键值对,这是一个接口,其定义如下,简单明了,接口方法主要是对键和值进行操作。
interface Entry<K,V> { K getKey(); V getValue(); V setValue(V value); boolean equals(Object o); int hashCode(); }
AbstractMap
Map接口的抽象实现,见以下示例实现代码:
Map<String,String> a = /** * *抽象map实现示意,根据文档说,和list接口及其类似。 * *map分为可变和不可变两种,不可变只需实现 entrySet方法即可,且返回的 set的迭代器不能支持修改操作。 * *可变map,需要实现put方法,然后 entrySet的迭代器也需要支持修改操作 * * *AbstractMap 里面实现了map的梗概,但是其效率难说,比如其get方法中时采用方法entrySet实现的。 * *通常子类用更有效率的方法覆盖之。如hashMap中覆盖了keySet 、values 、get方法等 */ new AbstractMap<String,String>(){ /* * 返回map中的元素集合,返回的集合通常继承AbstractSet 即可。 */ @Override public Set<Map.Entry<String, String>> entrySet() { return new AbstractSet<Map.Entry<String,String>>() { @Override public Iterator<java.util.Map.Entry<String, String>> iterator() { return null; } @Override public int size() { return 0; } }; } /* * 默认实现抛出异常,可变map需要实现此方法 */ @Override public String put(String key, String value) { return null; } };
HashMap
hashMap继承abstractMap,是相当常用的数据结构,采用hash散列的思想,可以在O(1)的时间复杂度内插入和获取数据。其基本实现可以分析上个小节中的抽象方法,文章
浅析HashMap的实现和性能分析 已经对hashMap的实现、put和get操作进行了较详细的说明。这里不再赘述,关键看他的迭代器实现,这里只分析下entrySet()方法,而keySet()和values()方法实现与之一脉相承。
关于迭代器,见下面摘出的部分源码和相关注释:
/** * 返回map中所有的键值对集合,用于遍历 */ public Set<Map.Entry<K,V>> entrySet() { return entrySet0(); } /** * 延迟初始化,只有使用的时候才构建。 * * values()和 keySet()方法也使用了类似的机制 */ private Set<Map.Entry<K,V>> entrySet0() { Set<Map.Entry<K,V>> es = entrySet; return es != null ? es : (entrySet = new EntrySet()); } /** * 真正的 enterySet,是一个内部类,其关键实现是迭代器实现。 * * values()和 keySet()方法也对应了相应的内部类。 * 对应的自己的迭代器实现。关键在于这个迭代器 * */ private final class EntrySet extends AbstractSet<Map.Entry<K,V>> { public Iterator<Map.Entry<K,V>> iterator() { return newEntryIterator(); } public boolean contains(Object o) { if (!(o instanceof Map.Entry)) return false; Map.Entry<K,V> e = (Map.Entry<K,V>) o; Entry<K,V> candidate = getEntry(e.getKey()); return candidate != null && candidate.equals(e); } public boolean remove(Object o) { return removeMapping(o) != null; } public int size() { return size; } public void clear() { HashMap.this.clear(); } } /** * entrySet迭代器,继承HashIterator,实现next方法。 * values()和 keySet()方法,也是继承HashIterator,只是实现next 的方法不同, * * 可以对比下。 * * 关键在于HashIterator * * */ private final class EntryIterator extends HashIterator<Map.Entry<K,V>> { public Map.Entry<K,V> next() { return nextEntry(); } } /** * *keySet()对应的迭代器 */ private final class KeyIterator extends HashIterator<K> { public K next() { return nextEntry().getKey(); } } /** * * hashmap entrySet() keySet() values()的通用迭代器 */ private abstract class HashIterator<E> implements Iterator<E> { Entry<K,V> next; // next entry to return int expectedModCount; // For fast-fail int index; // current slot Entry<K,V> current; // current entry HashIterator() { expectedModCount = modCount; if (size > 0) { // advance to first entry Entry[] t = table; //构造时候,在数组中查找第一个不为null的数组元素,即Entry链表,关于hashmap的实现请看 //本人前面的博文 while (index < t.length && (next = t[index++]) == null) ; } } public final boolean hasNext() { return next != null; } /** * 关键实现,很容易看懂,查找next的时候,和构造迭代器的时候一样 */ final Entry<K,V> nextEntry() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); Entry<K,V> e = next; if (e == null) throw new NoSuchElementException(); if ((next = e.next) == null) { Entry[] t = table; while (index < t.length && (next = t[index++]) == null) ; } current = e; return e; } public void remove() { if (current == null) throw new IllegalStateException(); if (modCount != expectedModCount) throw new ConcurrentModificationException(); Object k = current.key; current = null; HashMap.this.removeEntryForKey(k); expectedModCount = modCount; } }
HashTable
实现和hashMap基本一致,只是在方法上加上了同步操作。多线程环境可以使用它。不过现在有ConcurrentHashMap了,在高并发的时候,可以用它替换hashtable.
LinkedHashMap
hashMap可能在某些场景下不符合要求,因为放入到其中的元素是无序的。而LinkedHashMap则在一定程度上解决这个问题。
其在实现上继承了HashMap,在存储上扩展haspMap.enteySet,加入了before、after字段,把hashMap的元素用双向链表连接了起来。这个双向链表决定了它的遍历顺序。其顺序通常是插入map中的顺序,但是它有一个字段accessOrder当为true时,遍历顺序将是LRU的效果。
研究它的有序性,我们可以从put方法、get方法和遍历的方法入手,首先看get方法:
/** * 直接调用父类的getEntry方法。关键在于 * e.recordAccess(this) 这句代码 */ public V get(Object key) { Entry<K,V> e = (Entry<K,V>)getEntry(key); if (e == null) return null; e.recordAccess(this); return e.value; } /** * Entry.recordAccess 方法 * * 如果是访问顺序(accessOrder=true),那么就把它放到头结点的下一个位置 * 否则什么也不做, * 这样就可以根据初始 accessOrder 属性,来决定遍历的顺序。 */ void recordAccess(HashMap<K,V> m) { LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; if (lm.accessOrder) { lm.modCount++; remove(); addBefore(lm.header); } }
Put方法:
/** * put方法调用此方法,覆盖了父类中的实现, */ void addEntry(int hash,K key, V value, int bucketIndex) { createEntry(hash, key, value, bucketIndex); // Remove eldest entry if instructed, else grow capacity if appropriate Entry<K,V> eldest = header.after; //回调。如果有必要移除在老的元素,最新的元素在链表尾部。 if (removeEldestEntry(eldest)) { removeEntryForKey(eldest.key); } else { if (size >= threshold) resize(2 * table.length); } } /** * */ void createEntry(int hash,K key, V value, int bucketIndex) { HashMap.Entry<K,V> old = table[bucketIndex]; Entry<K,V> e = new Entry<K,V>(hash, key, value, old); table[bucketIndex] = e; //本质是插入双向链表的末尾 e.addBefore(header); size++; } /** * 插入到 existingEntry的前面,因为是双向链表。当existingEntry是 header时, * 相当于插入到链表最后。 * */ private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }
遍历迭代直接使用双向链表进行迭代接口,这里不赘述,可以看源码很容易理解。注意的是实现上市覆盖了父类中相关的生成迭代器的方法。
TreeMap和CurrentHashMap都可以单独开一篇文章来分析了。这里简单说下。TreeMap是基于b树map,根据key排序。CurrentHashMap是并发包中的一个强大的类,适合多线程高并发时数据读写。