给定多个预测向量,如何高效地获得票数最多的标签(在numpy/pytorch中)?

我有3个向量,代表同一数据的3个不同标签预测:

P1=[31, 22, 11, 10,  9, 9, 0, 0, 23 ....]  # 长度超过1MP2=[31, 22, 12, 10,  8, 9, 0, 0, 30 ....]  # 长度超过1MP3=[30, 22, 12, 11,  8, 9, 0, 1, 31 ....]  # 长度超过1MAns= [31, 22, 12, 10, 8, 9, 0, 0, 23, ....]

基本思路是,如果一个预测获得最高票数(例如,“31”在第一列中的票数为2),我们就选择它;但如果所有候选者都有不同的票数(例如,最后一列中的“23”、“30”、“31”),我们可以选择其中的任意一个。

这些向量可能是numpy数组、列表或pytorch张量。考虑到这种向量的长度超过100万,找到Ans的最有效方法(主要是运行时间)是什么?


回答:

您可以对张量取mode

t = torch.tensor([P1,P2,P3])t.mode(0).values
tensor([31, 22, 12, 10,  8,  9,  0,  0, 23])

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注