这似乎是一个直接的问题。我将在最后对其进行一些概括。
我试图在numpy中实现这个函数。我已经成功使用了嵌套的for循环,但我想不出用numpy的方法来实现它。
我的实现方式:
bs = 10 # 批量大小nb = 8 # 边界框的数量nc = 15 # 类别的数量bbox = np.random.random(size=(bs, nb, 4)) # 模型输出边界框p = np.random.random(size=(bs, nb, nc)) # 模型输出概率p = softmax(p, axis=-1)s_rand = np.random.random(size=(nc, nc))s = (s_rand + s_rand.T)/2 # 相似性矩阵pp = np.random.random(size=(bs, nb, nc)) # 提议的概率pp = softmax(pp, axis=-1)first_term = 0for b in range(nb): for b_1 in range(nb): if b_1 == b: continue for l in range(nc): for l_1 in range(nc): first_term += (s[l, l_1] * (pp[:, b, l] - pp[:, b_1, l_1])**2)second_term = 0for b in range(nb): for l in range(nc): second_term += (np.linalg.norm(s[l, :], ord=1) * (pp[:, b, l] - p[:, b, l])**2)second_term *= nbepsilon = 0.5output = ((1 - epsilon) * first_term) + (epsilon * second_term)
我努力去除循环,并尝试使用np.tile
和np.repeat
来完成任务,但我想不出可能的方法。
我尝试在谷歌上搜索类似的练习,以帮助我学习这种numpy转换,但没有成功。
回答:
最大优化的代码:(前两个循环的移除灵感来自于L.Iridium的回答)
squared_diff = (pp[:, :, None, :, None] - pp[:, None, :, None, :]) ** 2weighted_diff = s * squared_diffb_eq_b_1_removed = b.sum(axis=(3,4)) * (1 - np.eye(nb))first_term = b_eq_b_1_removed.sum(axis=(1,2))normalized_s = np.linalg.norm(s, ord=1, axis=1)squared_diff = (pp - p)**2second_term = nb * (normalized_s * squared_diff).sum(axis=(1,2))loss = ((1 - epsilon) * first_term) + (epsilon * second_term)
时间跟踪:512 µs ± 13 µs 每循环
问题中发布的代码的时间跟踪:62.5 ms ± 197 µs 每循环
这是一个巨大的改进。