我正在处理Kaggle上的文档分类问题。
它有5个类别 – ‘商业’, ‘技术’, ‘政治’, ‘体育’, ‘娱乐’
我已经训练了我的深度学习模型,并且也获得了测试集的结果。但我得到的结果是不同类别的概率列表。
如何从我得到的输出中获取实际的类别(标签)?
我的神经网络架构如下 –
回答:
你应该选择数值最高的条目作为预测的类别。例如,在你提供的例子中:[0.045, 0.030, 0.015, 0.889, 0.019]
,预测的类别是第四个类别(即,idx=3
),它具有最高的概率值。
NumPy的argmax函数可能正是你需要的。假设pred
是你网络输出的概率,形状为:(batch_size, num_labels)
,那么np.argmax(pred, axis=1)
将为你提供与预测类别相关的索引(即,标签)。