我正在使用 ELKI's SimplifiedHierarchyExtraction
与 AnderbergHierarchicalClustering
,LatLngDistanceFunction
和 minClSize = 100
。
我注意到除了 "clu_" 聚类
之外,还有 2-3 个 "mrg_" 聚类
,这些聚类有一些 DBID's
,但其数量 < minClSize
。
我的问题是:处理这些 "mrg_" 聚类
的最佳方式是什么:
- 将其
DBID's
传递给其"clu_" 子聚类
中的一个? - 尽管它们低于
minClSize
,但仍然将它们视为一个聚类
? - 简单地忽略它们?
回答:
这是一个 层次 结果。
您需要将所有 子聚类 包含在一个聚类中。
所以 mrg_
聚类有一些(可能为 0)的新对象,加上 子聚类中的所有对象。特别是,它可以有多个子聚类(这就是为什么它被称为 合并)