使用后处理来提高聚类性能
利用误差来评价聚类的质量
一种衡量的指标是SSE:误差平方和,该方法更为重视远离簇中心的点。
一种方法是将具有最大SSE值的簇划分成两个簇。将该簇内重新进行分簇。
如果要保持簇的数目不变,可以再讲两个粗合并。合并最小的质心或者合并两个使得SSE枕骨最小的质心。
二分K-均值算法
先将所有点作为一个簇,然后将该粗一分为2,然后再选择其中一个簇进行划分。选择哪一个簇进行划分取决于划分是否可以最大程度的降低SSE的值。
或者
选择SSE最大的簇进行划分,直到簇的数目达到用户指定的数目位置。の3
使用Apriori算法进行关联分析
从频繁项集之中挖掘关联规则
时间: 2024-11-07 23:35:10