用TreeSet和Comparator给list集合元素去重

今天在做导入功能时,看到一个感觉很好的去重算法,特分享给大家看看:

其原理利用了以下几点:

1.TreeSet里面不会有重复的元素,所以当把一个List放进TreeSet里面后,会自动去重

2.TreeSet去重也是有条件的,它依靠放入其中的元素的排序规则,所以放入其中的元素要有一个自定义的排序规则(此处表述不是很清楚,欢迎指正)

下面开始看好戏:

原本List<Person> persons 里面有3个元素:

List<Person> persons = new ArrayList<Person>();Person p1 = new Person("a",10,100);Person p2 = new Person("a",10,100);Person p3 = new Person("b",10,100);persons.add(p1);persons.add(p2);persons.add(p3);

它们中person1和person2元素相同,但是对于对象来说,它们是不同的元素,所以现在我要把它们去重,只保留一个,怎么搞?

也许有人说遍历,比较,这样自然也可以,但是当元素很多很多时,或者字段非常多时,那比较久非常麻烦了,因为涉及到foreach循环和字段的筛选.

编程不就是为了让一切更简单嘛,所以我们不用那种原始方法,我们用现成的简单方法,jdk给我们提供的TreeSet和Comparator搭配,特别适合做这种"比较"的事.

首先我们回顾一下思路:把List放进一个设定好比较规则的TreeSet中.

如下:

public static ArrayList<Person> removeDuplicated(List<Person> persons){    //1.创建一个带比较规则的set,这里使用匿名内部类创建了一个比较器    Set<Person> set = new TreeSet(new Comparator<Person>() {        public int compare(Person o1, Person o2) {            int a = o1.getName().compareTo(o2.getName());//比较name的自然顺序,0表示相同            int b = o1.getAge().compareTo(o2.getAge());//比较age的自然顺序,0表示相同            if(a==0 && b==0){                return 0;//如果name和age同时都相同,则返回0,0表示Person对象是相同的            }else{                return 1;            }        }

});    //2.将list放进Set中,自动去重    set.addAll(persons);    //3.将去重后的集合set再放进一个新的list中返回    return new ArrayList<Person>(set);}

测试:

System.out.println(persons);ArrayList<Person> newPersons = removeDuplicated(persons);System.out.println(newPersons);

结果:

　　[Person{name=‘a‘, age=10, height=100}, Person{name=‘a‘, age=10, height=100}, Person{name=‘b‘, age=10, height=100}]
　　[Person{name=‘a‘, age=10, height=100}, Person{name=‘b‘, age=10, height=100}]

扩展:

以上是去除list中完全一样的元素,大家有没有发现,Person有三个字段,但我比较的时候却只使用了两个,为什么没使用第三个?

有意思的就在这里,因为你可以随心所欲去决定:只要对象的某些特征相同,我就可以判它们是相同对象,感受到了吗?

所以你可以通过更改比较规则,去翻云覆雨,去一手遮天地决定:比 ! 较 ! 规 ! 则 !

注意点:new Comparator<>()时一定要加泛型

原文地址：https://www.cnblogs.com/wangxuejian/p/10421347.html

时间： 2024-10-21 14:35:38

用TreeSet和Comparator给list集合元素去重的相关文章

使用TreeSet和Comparator，写TreeSetTest2 要求：对TreeSet中的元素1，2，3，4，5，6，7，8，9，10进行排列，排序逻辑为奇数在前偶数在后，奇数按照升序排列，偶数按照降序排列

/* * 使用TreeSet和Comparator,写TreeSetTest2 *要求:对TreeSet中的元素1,2,3,4,5,6,7,8,9,10进行排列, *排序逻辑为奇数在前偶数在后,奇数按照升序排列,偶数按照降序排列 */ import java.util.Comparator; import java.util.TreeSet; public class TreeTest2 { public static void main(String[] args) { // TODO Aut

集合元素的比较

原文见: http://www.cnblogs.com/sunflower627/p/3158042.html 1. Comparator 和 Comparable 相同的地方他们都是java的一个接口, 并且是用来对自定义的class比较大小的, 什么是自定义class: 如 public class Person{ String name; int age }. 当我们有这么一个personList,里面包含了person1, person2, persion3....., 我们用Coll

TreeSet和Comparator 对TreeSet排序

使用TreeSet和Comparator,编写TreeSetTestInner类,要求对TreeSet中的元素"HashSet"."ArrayList"."TreeMap"."HashMap"."TreeSet"."LinkedList"进行升序和倒序排列,并使用匿名内部类和静态内部类分别实现. 方法一: 静态内部类 import java.util.*; public class Tr

当JAVA集合移除自身集合元素时发生的诸多问题

一段代码目的是想删除集合中包含"a"字符串的集合项: public class TestForeach { public static void main(String[] args){ //ArrayList<String> lists = new ArrayList<String>(); Collection<String> lists = new HashSet<String>(); lists.add("abvd&quo

利用Linq对集合元素合并、去重复处理

今晚看了一篇前辈写的linq对集合元素合并去重复处理,觉得有点麻烦,原文地址如下:http://www.cnblogs.com/yjmyzz/archive/2012/12/18/2823170.html#undefined. 于是我自己琢磨利用linq的分组函数,重新写了一个方法,代码如下: using System;using System.Collections.Generic;using System.Linq;using System.Text; namespace ConsoleAp

java8 增强的Iterator遍历集合元素

Iterator接口也是Java集合框架的成员,与Collection和Map两个系列的集合不一样的是Collection和Map系列主要用于充当容器的作用,而Iterator正如其名字一样是主要用于迭代访问Collection集合中的元素,Iterator对象也被称为迭代器. Iterator接口里面定义了下面4个方法: >boolean hasNext():如果被迭代遍历的集合还没有被遍历完,返回True >Object next():返回集合里面的下一个元素 >remove():删

java----数据结构与算法----集合元素的遍历：迭代器-------->JavaAPI:java.util.Iterator+java.util.ListIterator

概述: 迭代器用于集合元素的遍历迭代器有两种,分别是Iterator和ListIterator Iterator可以用于任何类型集合的遍历 ListIterator只能用于List集合的遍历 ListIterator接口继承了Iterator接口,所以前者拥有后者所定义的所有成员函数,同时,ListIterator还添加了一些具有List集合特性的操作函数,如按照索引访问集合元素.替换/添加集合元素等等 java.util.Iterator /** * @author chen * @date

跟王老师学集合（三）：使用Iterator接口遍历集合元素

使用Iterator接口遍历集合元素主讲人:王少华 QQ群号:483773664 学习目标: 1 掌握使用Iterator接口遍历集合元素一.Iterator概述 Iterator接口主要用于遍历,因此Iterator对象也被称为迭代器.Iterator接口里定义了如下三个方法: boolean hasNext():如果被迭代的集合元素还没有被遍历,则返回true Object next():返回集合里下一个元素 void remove():删除集合里上一次next方法返回的元素二.利用

集合元素

2407 集合元素 Time Limit : 2000/1000 MS(Java/Others) | Memory Limit :65312/32656 KB(Java/Others) Submits : 30 | Solved : 7 Description 已知集合A定义如下: (1)1属于A,2属于A: (2)若x和y都属于A则2x+3y也属于A: (3)再无其他数属于A. 试求集合A中元素从小到大排列的序列的前n项. Input 有多组测试,每组输入一个正整数n(n<=1000). Ou