我正在学习在Pytorch中实现因子分解机(Factorization Machine)。其中应该有一些特征交叉操作。例如,我有三个特征[A,B,C],经过嵌入后,它们变为[vA,vB,vC],所以特征交叉是“[vA·vB], [vA·vC], [vB·vc]”。
它可以通过矩阵运算来实现。但这只给出了一个最终结果,即一个单一的值。
问题是,如何在不使用FOR循环的情况下获取以下所有的cross_vec:注意:“feature_emb”的大小为[batch_size x feature_len x embedding_size]
g_feature = 0 for i in range(self.featurn_len): for j in range(self.featurn_len): if j <= i: continue cross_vec = feature_emb[:,i,:] * feature_emb[:,j,:] g_feature += torch.sum(cross_vec, dim=1)
回答:
你可以
cross_vec = (feature_emb[:, None, ...] * feature_emb[..., None, :]).sum(dim=-1)
这应该会给你corss_vec
的形状为(batch_size, feature_len, feature_len)
。
或者,你可以使用torch.bmm
cross_vec = torch.bmm(feature_emb, feature_emb.transpose(1, 2))