在MR中我们在Map阶段的排序可是通过两种方式
要比较的值为key
1)实现WriteComparator接口---比较简单使用
2)自定义比较器(实现RawComparator接口)
这里我们介绍一下第二种方式
1、我们要自定义一个比较器实现RawComparator接口
2、重写方法
为什么有两个方法呢?追一下源码
RawComparator接口继承了Comparator,所以有两个方法
第一个方法中,我们可以有如下理解:
1、这个方法先被调用
2、在此方法中,将字节数组中的数据先封装成要比较的类型,在调用第二个方法
3、比较封装好的类型
那么字节数组的封装如何编写呢?
我们可以通过找RawComparator的实现类,看那个实现类中的方法是如何写的,按照那个来编写即可(注意体会这种编程思想)
当自定义比较器写好后,在Driver中设置比较器为自定义比较器即可。
原文地址:https://www.cnblogs.com/atBruce/p/12401382.html
时间: 2024-10-13 18:06:26