我开发了一个程序,根据涉及几千个特征的训练数据,找出大约500个类别的概率。
它的工作原理是训练大约500个逻辑回归模型,这些模型接受这几千个特征,并找出单个类别的概率。每个模型为不同的类别找到概率,因此我能够找出每个类别的概率。
由于这些都是不同的模型,我能够找到每个模型的准确率,并通过平均所有这些值来获得平均准确率。
我的问题是,现在我有这大约500个数据点和平均值,我实在不知道如何以图形方式表示它们。我无法用线图来绘制,因为类别之间没有太多的关系,而ROC曲线也不适用,因为这不是二元分类。
有没有人对我如何绘制这些数据有任何建议?谢谢!
回答:
你是说你有500个类别,每个类别都被分配了500个概率吗?平均准确率是指特定类别的平均准确率(即有500个不同的平均准确率),还是指分配给每个类别的概率的准确率?
建议:为每个类别分配一个从1到500的任意唯一索引。绘制类别索引与类别概率的关系图,并添加垂直误差条。