java集合
l Java集合框架
l Collection接口API
l Iterator迭代器接口(遍历集合中的元素)
l Collection子接口之一:Set接口
Ø HashSet LinkedHashSet TreeSet
l Collection子接口之二: List接口
Ø ArrayList LinkedList Vector
l Map接口
Ø HashMap TreeMap Hashtable
l Collections工具类
Java 集合概述
l 一方面, 面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。另一方面,使用Array存储对象方面具有一些弊端,而Java 集合就像一种容器,可以动态地把多个对象的引用放入容器中。
l Java 集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的关联数组。
l 数组的弊端:一旦建立 长度不可变。数组中数据类型必须一致,数组中元素个数未知。
l Java 集合可分为 Collection 和 Map 两种体系
l Collection接口:
l Set:元素无序、不可重复的集合 ---类似高中的“集合”
l List:元素有序,可重复的集合 ---”动态”数组
l Map接口:具有映射关系“key-value对”的集合 ---类似于高中的“函数”
l Map接口继承树
Collection 接口
l Collection 接口是 List、Set 和 Queue 接口的父接口,该接口里定义的方法既可用于操作 Set 集合,也可用于操作 List 和 Queue 集合。
l JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List)实现。
l 在 Java5 之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都当成 Object 类型处理;从 Java5 增加了泛型以后,Java 集合可以记住容器中对象的数据类型
Collection 接口的方法
红色部分:集合与数组间转换操作的方法:如下图
使用 Iterator 接口遍历集合元素
l Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素。
l 所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象。
l Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建 Iterator 对象,则必须有一个被迭代的集合。
Iterator接口的方法
在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常
while(it.hasNext()){
…..it.next();
}
使用 foreach 循环遍历集合元素
• Java 5 提供了 foreach 循环迭代访问 Collection
List接口
l Java中数组用来存储数据的局限性
l List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。
l List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素。
l JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
l List 集合里添加了一些根据索引来操作集合元素的方法
l void add(int index, Object ele)
l boolean addAll(int index, Collection eles)
l Object get(int index)
l int indexOf(Object obj)
l int lastIndexOf(Object obj)
l Object remove(int index)
l Object set(int index, Object ele)
l List subList(int fromIndex, int toIndex)
List实现类之一:ArrayList
l ArrayList 是 List 接口的典型实现类
l 本质上,ArrayList是对象引用的一个变长数组
l ArrayList 是线程不安全的,而 Vector 是线程安全的,即使为保证 List 集合线程安全,也不推荐使用Vector
l Arrays.asList(…)方法返回的 List 集合既不是 ArrayList 实例,也不是 Vector 实例。 Arrays.asList(…) 返回值是一个固定长度的 List 集合
List实现类之二:LinkedList
l 对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高
l 新增方法:
Ø void addFirst(Object obj)
Ø void addLast(Object obj)
Ø Object getFirst()
Ø Object getLast()
Ø Object removeFirst()
Ø Object removeLast()
List 实现类之三:Vector
l Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。
l 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。
l 新增方法:
l void addElement(Object obj)
l void insertElementAt(Object obj,int index)
l void setElementAt(Object obj,int index)
l void removeElement(Object obj)
l void removeAllElements()
ListIterator接口(了解)
l List 额外提供了一个 listIterator() 方法,该方法返回一个 ListIterator 对象, ListIterator 接口继承了 Iterator 接口,提供了专门操作 List 的方法:
Ø void add()
Ø boolean hasPrevious()
Ø Object previous()
Ø Boolean hasNext()
Ø Object next()
Iterator和ListIterator主要区别(了解)
1、ListIterator和Iterator都有hasNext()和next()方法,可以实现顺序向后遍历。但是ListIterator有hasPrevious()和previous()方法,可以实现逆向(顺序向前)遍历。Iterator就不可以。
2、ListIterator可以定位当前的索引位置,nextIndex()和previousIndex()可以实现。Iterator 没有此功能。
3、ListIterator有add()方法,可以向List中插入对象,而Iterator不能。
4、都可实现删除对象,但是ListIterator可以实现对象的修改,set()方法可以实现。Iterator仅能遍历,不能修改。因为ListIterator的这些功能,可以实现对LinkedList等List数据结构的操作。
Set 接口
l Set接口是Collection的子接口,set接口没有提供额外的方法
l Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败。
l Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals 方法
Set实现类之一:HashSet
l HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。
l HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取和查找性能。
l HashSet 具有以下特点:
Ø 不能保证元素的排列顺序
Ø HashSet 不是线程安全的
Ø 集合元素可以是 null
l 当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法来得到该对象的 hashCode 值,然后根据 hashCode 值决定该对象在 HashSet 中的存储位置。
l HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相等,并且两个对象的 equals() 方法返回值也相等。
hashCode() 方法
l 如果两个元素的 equals() 方法返回 true,但它们的 hashCode() 返回值不相等,hashSet 将会把它们存储在不同的位置,但依然可以添加成功。
l 对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。
l 重写 hashCode() 方法的基本原则
Ø 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值
Ø 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode() 方法的返回值也应相等
对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值
Set实现类之二:LinkedHashSet
l LinkedHashSet 是 HashSet 的子类
l LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置,但它同时使用链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
l LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能。
l LinkedHashSet 不允许集合元素重复。
Set实现类之三:TreeSet
l TreeSet 是 SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。
Ø Comparator comparator()
Ø Object first()
Ø Object last()
Ø Object lower(Object e)
Ø Object higher(Object e)
Ø SortedSet subSet(fromElement, toElement)
Ø SortedSet headSet(toElement)
Ø SortedSet tailSet(fromElement)
l TreeSet 两种排序方法:自然排序和定制排序。默认情况下,TreeSet 采用自然排序.
排 序——自然排序 Comparable 接口
l 自然排序:TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系,然后将集合元素按升序排列
l 如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable 接口。
Ø 实现 Comparable 的类必须实现 compareTo(Object obj) 方法,两个对象即通过 compareTo(Object obj) 方法的返回值来比较大小。
l Comparable 的典型实现:
Ø BigDecimal、BigInteger 以及所有的数值型对应的包装类:按它们对应的数值大小进行比较
Ø Character:按字符的 unicode值来进行比较
Ø Boolean:true 对应的包装类实例大于 false 对应的包装类实例
Ø String:按字符串中字符的 unicode 值进行比较
Ø Date、Time:后边的时间、日期比前面的时间、日期大
l 向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添加的所有元素都会调用compareTo()方法进行比较。
l 因为只有相同类的两个实例才会比较大小,所以向 TreeSet 中添加的应该是同一个类的对象
l 对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过 compareTo(Object obj) 方法比较返回值
l 当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保证该方法与 compareTo(Object obj) 方法有一致的结果:如果两个对象通过 equals() 方法比较返回 true,则通过 compareTo(Object obj) 方法比较应返回 0
排 序——定制排序 comparator接口
l TreeSet的自然排序是根据集合元素的大小,进行元素升序排列。如果需要定制排序,比如降序排列,可通过Comparator接口的帮助。需要重写compare(T o1,T o2)方法。
l 利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2。
l 要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。
l 此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常。
l 使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0。
Map接口
l Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
l Map 中的 key 和 value 都可以是任何引用类型的数据
l Map 中的 key 用Set来存放,不允许重复,即同一个 Map 对象所对应的类,须重写hashCode()和equals()方法。
l 常用String类作为Map的“键”。
l key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到唯一的、确定的 value。
Map实现类之一:HashMap
l Map接口的常用实现类:HashMap、TreeMap和Properties。
l HashMap是 Map 接口使用频率最高的实现类。
l 允许使用null键和null值,与HashSet一样,不保证映射的顺序。
l HashMap 判断两个 key 相等的标准是:两个 key 通过 equals() 方法返回 true,hashCode 值也相等。
l HashMap 判断两个 value相等的标准是:两个 value 通过 equals() 方法返回 true。
Map实现类之二:LinkedHashMap
l LinkedHashMap 是 HashMap 的子类
l 与LinkedHashSet类似,LinkedHashMap 可以维护 Map 的迭代顺序:迭代顺序与 Key-Value 对的插入顺序一致
Map实现类之三:TreeMap
l TreeMap存储 Key-Value 对时,需要根据 key-value 对进行排序。TreeMap 可以保证所有的 Key-Value 对处于有序状态。
l TreeMap 的 Key 的排序:
Ø 自然排序:TreeMap 的所有的 Key 必须实现 Comparable 接口,而且所有的 Key 应该是同一个类的对象,否则将会抛出 ClasssCastException
Ø 定制排序:创建 TreeMap 时,传入一个 Comparator 对象,该对象负责对 TreeMap 中的所有 key 进行排序。此时不需要 Map 的 Key 实现 Comparable 接口
l TreeMap判断两个key相等的标准:两个key通过compareTo()方法或者compare()方法返回0。
若使用自定义类作为TreeMap的key,所属类需要重写equals()和hashCode()方法,且equals()方法返回true时,compareTo()方法应返回0
Map实现类之四:Hashtable
l Hashtable是个古老的 Map 实现类,线程安全。
l 与HashMap不同,Hashtable 不允许使用 null 作为 key 和 value
l 与HashMap一样,Hashtable 也不能保证其中 Key-Value 对的顺序
l Hashtable判断两个key相等、两个value相等的标准,与hashMap一致。
Map实现类之五:Properties
l Properties 类是 Hashtable 的子类,该对象用于处理属性文件
l 由于属性文件里的 key、value 都是字符串类型,所以 Properties 里的 key 和 value 都是字符串类型
l 存取数据时,建议使用setProperty(String key,String value)方法和getProperty(String key)方法
Properties pros = new Properties(); pros.load(new FileInputStream("jdbc.properties")); String user = pros.getProperty("user"); System.out.println(user); |
操作集合的工具类:Collections
l Collections 是一个操作 Set、List 和 Map 等集合的工具类
l Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
l 排序操作:(均为static方法)
Ø reverse(List):反转 List 中元素的顺序
Ø shuffle(List):对 List 集合元素进行随机排序
Ø sort(List):根据元素的自然顺序对指定 List 集合元素按升序排序
Ø sort(List,Comparator):根据指定的 Comparator 产生的顺序对 List 集合元素进行排序
Ø swap(List,int, int):将指定 list 集合中的 i 处元素和 j 处元素进行交换
查找、替换
l Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
l Object max(Collection,Comparator):根据 Comparator 指定的顺序,返回给定集合中的最大元素
l Object min(Collection)
l Object min(Collection,Comparator)
l int frequency(Collection,Object):返回指定集合中指定元素的出现次数
l void copy(List dest,List src):将src中的内容复制到dest中
l boolean replaceAll(List list,Object oldVal,Object newVal):使用新值替换 List 对象的所有旧值
同步控制
l Collections 类中提供了多个 synchronizedXxx() 方法,该方法可使将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题
Enumeration(了解)
l Enumeration 接口是 Iterator 迭代器的 “古老版本”
Enumeration stringEnum = new StringTokenizer("a-b*c-d-e-g", "-"); while(stringEnum.hasMoreElements()){ Object obj = stringEnum.nextElement(); System.out.println(obj); } |
集合部分面试题
1 Collection 和 Collections的区别
答:Collection是集合类的上级接口,继承与他的接口主要有Set 和List.
Collections是针对集合类的一个帮助类,他提供一系列静态方法实现对各种集合的搜索、排序、线程安全化等操作
--------------------------------------------------
2 Set里的元素是不能重复的,那么用什么方法来区分重复与否呢? 是用==还是equals()? 它们有何区别
答:Set里的元素是不能重复的,那么用iterator()方法来区分重复与否。equals()是判读两个Set是否相等
equals()和==方法决定引用值是否指向同一对象equals()在类中被覆盖,为的是当两个分离的对象的内容
和类型相配的话,返回真值
--------------------------------------------------
3 List, Set, Map是否继承自Collection接口
答: List,Set是,Map不是
--------------------------------------------------
4 两个对象值相同(x.equals(y) == true),但却可有不同的hash code,这句话对不对
答:不对,有相同的hash code
--------------------------------------------------
5 说出ArrayList,Vector, LinkedList的存储性能和特性
答:ArrayList和Vector都是使用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),通常性能上较ArrayList差,而LinkedList使用双向链表实现存储,按序号索引数据需要进行前向或后向遍历,但是插入数据时只需要记录本项的前后项即可,所以插入速度较快。
--------------------------------------------------
6 HashMap和Hashtable的区别
答:HashMap是Hashtable的轻量级实现(非线程安全的实现),他们都完成了Map接口,主要区别在于
HashMap允许空(null)键值(key),由于非线程安全,效率上可能高于Hashtable。
HashMap允许将null作为一个entry的key或者value,而Hashtable不允许。
HashMap把Hashtable的contains方法去掉了,改成containsvalue和containsKey。因为contains方法容易让人引起误解。
Hashtable继承自Dictionary类,而HashMap是Java1.2引进的Map interface的一个实现。
最大的不同是,Hashtable的方法是Synchronize的,而HashMap不是,在多个线程访问Hashtable时,不需要自己为它的方法实现同步,而HashMap 就必须为之提供外同步。
Hashtable和HashMap采用的hash/rehash算法都大概一样,所以性能不会有很大的差异。
--------------------------------------------------
7 ArrayList和Vector的区别,HashMap和Hashtable的区别
答:就ArrayList与Vector主要从二方面来说.
一.同步性:Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同步的
二.数据增长:当需要增长时,Vector默认增长为原来一培,而ArrayList却是原来的一半
就HashMap与HashTable主要从三方面来说。
一.历史原因:Hashtable是基于陈旧的Dictionary类的,HashMap是Java 1.2引进的Map接口的一个实现
二.同步性:Hashtable是线程安全的,也就是说是同步的,而HashMap是线程序不安全的,不是同步的
三.值:只有HashMap可以让你将空值作为一个表的条目的key或value
8 如何高效地判断数组中是否包含某特定值
如何检查一个未排序的数组中是否包含某个特定值,这是一个在Java中非常实用并且频繁使用的操作。检查数组中是否包含特定值可以用多种不同的方式实现,但是时间复杂度差别很大。下面,将为大家展示各种方法及其需要花费的时间。
1.检查数组中是否包含特定值的四种不同方法
1)使用List:
public static boolean useList(String[] arr, String targetValue) { return Arrays.asList(arr).contains(targetValue); } |
2)使用Set:
1 2 3 4 |
public static boolean useSet(String[] arr, String targetValue) { Set<String> set = new HashSet<String>(Arrays.asList(arr)); return set.contains(targetValue); } |
3)使用一个简单循环:
1 2 3 4 5 6 7 |
public static boolean useLoop(String[] arr, String targetValue) { for(String s: arr){ if(s.equals(targetValue)) return true; } return false; } |
4)使用Arrays.binarySearch():
注:下面的代码是错误的,这样写出来仅仅为了理解方便。binarySearch()只能用于已排好序的数组中。所以,你会发现下面结果很奇怪。
1 2 3 4 5 6 7 |
public static boolean useArraysBinarySearch(String[] arr, String targetValue) { int a = Arrays.binarySearch(arr, targetValue); if(a > 0) return true; else return false; } |
2.时间复杂度
通过下面的这段代码可以近似比较几个方法的时间复杂度。虽然分别搜索一个大小为5、1K、10K的数组是不够精确的,但是思路是清晰的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 |
public static void main(String[] args) { String[] arr = new String[] { "CD", "BC", "EF", "DE", "AB"}; //use list long startTime = System.nanoTime(); for (int i = 0; i < 100000; i++) { useList(arr, "A"); } long endTime = System.nanoTime(); long duration = endTime - startTime; System.out.println("useList: " + duration / 1000000); //use set startTime = System.nanoTime(); for (int i = 0; i < 100000; i++) { useSet(arr, "A"); } endTime = System.nanoTime(); duration = endTime - startTime; System.out.println("useSet: " + duration / 1000000); //use loop startTime = System.nanoTime(); for (int i = 0; i < 100000; i++) { useLoop(arr, "A"); } endTime = System.nanoTime(); duration = endTime - startTime; System.out.println("useLoop: " + duration / 1000000); //use Arrays.binarySearch() startTime = System.nanoTime(); for (int i = 0; i < 100000; i++) { useArraysBinarySearch(arr, "A"); } endTime = System.nanoTime(); duration = endTime - startTime; System.out.println("useArrayBinary: " + duration / 1000000); } |
结果:
1 2 3 4 |
useList: 13 useSet: 72 useLoop: 5 useArraysBinarySearch: 9 |
对于长度为1K的数组:
1 2 3 4 5 6 |
String[] arr = new String[1000]; Random s = new Random(); for(int i=0; i< 1000; i++){ arr[i] = String.valueOf(s.nextInt()); } |
结果:
1 2 3 4 |
useList: 112 useSet: 2055 useLoop: 99 useArrayBinary: 12 |
对于长度为10K的数组:
1 2 3 4 5 6 |
String[] arr = new String[10000]; Random s = new Random(); for(int i=0; i< 10000; i++){ arr[i] = String.valueOf(s.nextInt()); } |
结果:
1 2 3 4 |
useList: 1590 useSet: 23819 useLoop: 1526 useArrayBinary: 12 |
很明显,使用简单循环的方法比使用其他任何集合效率更高。许多开发者会使用第一种方法,但是它并不是高效的。将数组压入Collection类型中,需要首先将数组元素遍历一遍,然后再使用集合类做其他操作。
如果使用Arrays.binarySearch()方法,数组必须是已排序的。由于上面的数组并没有进行排序,所以该方法不可使用。
实际上,如果你需要借助数组或者集合类高效地检查数组中是否包含特定值,一个已排序的列表或树可以做到时间复杂度为O(log(n)),hashset可以达到O(1)。