我在编写一个聚类算法,其中一部分是计算每个点集的欧几里得距离矩阵。(顺便提一下,这一切都是在Tensorflow中进行的)。每个点集是一组8维向量,我将它们转换为一个M*8的矩阵。对于每个点集中的每个点,我希望找到它与最近邻点之间的距离。我认为最有效的方法是计算每个点集的点对点距离,然后在生成的M*M矩阵的每一行中找到第二小的值(因为每一行的最小值总是0,即一个点与自身的距离)。
以下是我用来为每个点集创建欧几里得距离矩阵的代码:
partitionedData = tf.dynamic_partition(inputs, pred, num_classes) for partition in partitionedData: N = tf.to_int32(partition.get_shape()[0]) qexpand = tf.expand_dims(partition,1) qTexpand = tf.expand_dims(partition,0) qtile = tf.tile(qexpand,[1,N,1]) qTtile = tf.tile(qTexpand,[N,1,1]) deltaQ = qtile - qTtile deltaQ2 = deltaQ*deltaQ d2Q = tf.reduce_sum(deltaQ2,2)
生成的矩阵可能看起来像这样(注意:这是距离的平方矩阵):
[[ 0. 8. 2. 18.] [ 8. 0. 10. 2.] [ 2. 10. 0. 20.] [ 18. 2. 20. 0.]]
对于输入矩阵为:
[[2,3],[4,5],[1,4],[5,6]]
我最终希望得到的是每一行中的第二小值,在这种情况下是2,2,2,和2。此外,如果有更好的方法在Tensorflow中计算每个点集中的每个点到最近邻点的距离,并且计算效率高,那将非常有帮助。
回答:
要在Tensorflow中找到第k个元素,你需要使用tf.nn.top_k。如果你需要找最小的值,你不在X
中搜索,而是在-X
中搜索。
在你的情况下,你甚至不需要这样做。 如果你的矩阵是一个距离矩阵,对角线总是0,这会搞乱你的计算。因此,只需使用tf.matrix_set_diag更改矩阵的对角线,其中你的对角线是一个大小与X相同的向量,每个值都是tf.reduce_max。
为此编写代码是非常简单的。