如何在Tensorflow数组中找到第二小的值

我在编写一个聚类算法,其中一部分是计算每个点集的欧几里得距离矩阵。(顺便提一下,这一切都是在Tensorflow中进行的)。每个点集是一组8维向量,我将它们转换为一个M*8的矩阵。对于每个点集中的每个点,我希望找到它与最近邻点之间的距离。我认为最有效的方法是计算每个点集的点对点距离,然后在生成的M*M矩阵的每一行中找到第二小的值(因为每一行的最小值总是0,即一个点与自身的距离)。

以下是我用来为每个点集创建欧几里得距离矩阵的代码:

    partitionedData = tf.dynamic_partition(inputs, pred, num_classes)    for partition in partitionedData:        N = tf.to_int32(partition.get_shape()[0])        qexpand = tf.expand_dims(partition,1)        qTexpand = tf.expand_dims(partition,0)        qtile = tf.tile(qexpand,[1,N,1])        qTtile = tf.tile(qTexpand,[N,1,1])        deltaQ = qtile - qTtile        deltaQ2 = deltaQ*deltaQ        d2Q = tf.reduce_sum(deltaQ2,2)

生成的矩阵可能看起来像这样(注意:这是距离的平方矩阵):

[[  0.   8.   2.  18.] [  8.   0.  10.   2.] [  2.  10.   0.  20.] [ 18.   2.  20.   0.]]

对于输入矩阵为:

[[2,3],[4,5],[1,4],[5,6]]

我最终希望得到的是每一行中的第二小值,在这种情况下是2,2,2,和2。此外,如果有更好的方法在Tensorflow中计算每个点集中的每个点到最近邻点的距离,并且计算效率高,那将非常有帮助。


回答:

要在Tensorflow中找到第k个元素,你需要使用tf.nn.top_k。如果你需要找最小的值,你不在X中搜索,而是在-X中搜索。

在你的情况下,你甚至不需要这样做。 如果你的矩阵是一个距离矩阵,对角线总是0,这会搞乱你的计算。因此,只需使用tf.matrix_set_diag更改矩阵的对角线,其中你的对角线是一个大小与X相同的向量,每个值都是tf.reduce_max

为此编写代码是非常简单的。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注