嗨,我一直在学习数据挖掘,最近遇到了这个问题。我自己似乎无法解决它。
我们有一个无向图(无属性)G = (V,E),想要检测图中哪些节点是异常点。数据集D中的异常点O定义为:
|{o'|dist(o,o')}≤ r}|/|D|≤ π, where D = V.
如何定义一对节点之间的距离函数dist
?如何确定参数r
和π
的合适值?
回答:
图中两个节点之间的距离可以定义为
中间节点数 + 1
关于确定r和π,
可以根据数据 empirically 找到最适合的值。尝试不同的r和π值