Home IT技术给定多个预测向量，如何高效地获得票数最多的标签（在numpy/pytorch中）？

给定多个预测向量，如何高效地获得票数最多的标签（在numpy/pytorch中）？

IT技术 xiaolong · 2025年5月31日 · 0 Comment

我有3个向量，代表同一数据的3个不同标签预测：

P1=[31, 22, 11, 10,  9, 9, 0, 0, 23 ....]  # 长度超过1MP2=[31, 22, 12, 10,  8, 9, 0, 0, 30 ....]  # 长度超过1MP3=[30, 22, 12, 11,  8, 9, 0, 1, 31 ....]  # 长度超过1MAns= [31, 22, 12, 10, 8, 9, 0, 0, 23, ....]

基本思路是，如果一个预测获得最高票数（例如，“31”在第一列中的票数为2），我们就选择它；但如果所有候选者都有不同的票数（例如，最后一列中的“23”、“30”、“31”），我们可以选择其中的任意一个。

这些向量可能是numpy数组、列表或pytorch张量。考虑到这种向量的长度超过100万，找到Ans的最有效方法（主要是运行时间）是什么？

回答：

您可以对张量取mode：

t = torch.tensor([P1,P2,P3])t.mode(0).values

tensor([31, 22, 12, 10,  8,  9,  0,  0, 23])

ensemble-learning machine-learning numpy python pytorch

发表回复取消回复