因为K-means算法是基于欧式距离的聚类算法,其认为两个目标的距离越近,相似度越大。因此,K 值的选取对 K-means 影响很大,这也是 K-means 最大的缺点。K 值需要人为设定,不同 K 值得到的结果不一样。

常见的选取 K 值的方法有:手肘法、Gap statistic 方法。