我有3个向量,代表同一数据的3个不同标签预测:
P1=[31, 22, 11, 10, 9, 9, 0, 0, 23 ....] # 长度超过1MP2=[31, 22, 12, 10, 8, 9, 0, 0, 30 ....] # 长度超过1MP3=[30, 22, 12, 11, 8, 9, 0, 1, 31 ....] # 长度超过1MAns= [31, 22, 12, 10, 8, 9, 0, 0, 23, ....]
基本思路是,如果一个预测获得最高票数(例如,“31”在第一列中的票数为2),我们就选择它;但如果所有候选者都有不同的票数(例如,最后一列中的“23”、“30”、“31”),我们可以选择其中的任意一个。
这些向量可能是numpy数组、列表或pytorch张量。考虑到这种向量的长度超过100万,找到Ans
的最有效方法(主要是运行时间)是什么?
回答:
您可以对张量取mode
:
t = torch.tensor([P1,P2,P3])t.mode(0).values
tensor([31, 22, 12, 10, 8, 9, 0, 0, 23])