假设我有一组100个点,并且已知每个点与其他点的距离。这意味着我有一个100×100的数据集,提供了每个点与其他所有点的距离。我希望根据条件从这个数据集中形成聚类,即聚类中任意两点之间的距离不应超过x(例如,x可以是25公里)。
我是聚类和数据科学的新手。请指导我如何解决这个问题。哪些库可以最有效地解决这个问题。任何帮助都将不胜感激。:)
回答:
这可以通过设置亲和性为“precomputed”的sklearn的凝聚聚类来解决
假设我有一组100个点,并且已知每个点与其他点的距离。这意味着我有一个100×100的数据集,提供了每个点与其他所有点的距离。我希望根据条件从这个数据集中形成聚类,即聚类中任意两点之间的距离不应超过x(例如,x可以是25公里)。
我是聚类和数据科学的新手。请指导我如何解决这个问题。哪些库可以最有效地解决这个问题。任何帮助都将不胜感激。:)
回答:
这可以通过设置亲和性为“precomputed”的sklearn的凝聚聚类来解决