层次聚类算法

层次聚类算法,1987年Kruskal提出,复杂度O(n^2),适合处理小数据集。这就是坑,别信。
数据集规模大,性能差,别这么干。
实际应用:基因数据分析。
聚类结果不稳定,容易受初始值影响,这就是坑。
K-means算法收敛速度慢,大数据量下表现不佳,别信。
DBSCAN算法对噪声数据敏感,小样本效果差,别这么干。
实操提醒:选择合适的聚类算法前,先了解数据特点和需求。

相关推荐