目前我在寻找sklearn
的一个方法,可以做类似以下的事情:
arr = [13,15,41,45,90,100]print(KMeans.num_clusters(arr))
输出3
回答:
你可以使用均值漂移聚类。它不需要事先知道聚类的数量。然而,均值漂移的缺点是与k-means相比效率不高。由于你的示例数组只有一维,这应该不是问题。如果你打算在二维或更多维的数据上使用均值漂移,要注意维数灾难的问题。
目前我在寻找sklearn
的一个方法,可以做类似以下的事情:
arr = [13,15,41,45,90,100]print(KMeans.num_clusters(arr))
输出3
回答:
你可以使用均值漂移聚类。它不需要事先知道聚类的数量。然而,均值漂移的缺点是与k-means相比效率不高。由于你的示例数组只有一维,这应该不是问题。如果你打算在二维或更多维的数据上使用均值漂移,要注意维数灾难的问题。