K-Means需要设定一个簇心个数的参数,现实中,最常用于确定K数的方法,
其实还是人手工设定。例如,当我们决定将衣服做成几个码的时候,其实就是在以
人的衣服的长和宽为为特征进行聚类。所以,弄清楚我们更在意的是什么,能够
引导选择更合适的K值。
有种方法能自动决定K值,也就是所谓的Elbow Method(DIVFRP层次聚类etc.)。
它的idea是将不同K值及其相对应的cost function值画出来,将转折明显的地方K值设置
为最合适的K。如图:
但实际上,它并不是总是好用的。有时整个变换曲线并没有明显的转折点。
关于如何实现Elbow Method未来我会专门写一篇随笔来介绍,并给出相应的python实现。
时间: 2024-11-05 20:37:59