我有两大组图像。每张图像都附有一个百分比。我用这些图像训练了一个模型,该模型返回一个二元结果,即0或1。我希望模型能够返回一个百分比,表示机器对0或1的确定程度。
举个例子,假设它们是猫的图像。我还知道猫的大小百分比(100%表示非常大,0%表示非常小)。我希望模型告诉我“这只猫有78%的大小”。
我当前的数据集基于两个文件夹(大的猫和小的猫)。第一个数字是图像的编号(例如1到1000)。第二个数字是猫的大小百分比:
../big_cats cat1_78.png cat2_97.png cat3_67.png ...../small_cats cat1_12.png cat2_9.png cat3_24.png ...
所以现在我没有使用百分比,我得到的是0或1(要么大要么小),但我的目标是让模型使用这个百分比来告诉我“这是一只67%大的猫”,其中50%是中等大小的猫,100%是最大的猫,0%是最小的猫。
我尝试使用softmax
和categorical_cassentropy
,但这只是告诉我二元决策的估计准确性,即猫是大还是小(如果我理解正确的话)。
我的问题是:我该如何准备数据集来获得这样的结果?如何创建训练和验证数据以读取图像名称中的百分比?有没有我可以参考的教程?我需要使用Keras + Tensorflow
。
回答:
你应该在输出预测层使用Dense(1)或(2)和softmax函数,因为你想知道图片是猫还是不是猫(两个类别)。这意味着你需要将标签重塑为(num_pic, 2),其中第一列表示图片是否是猫,第二列表示图片是否不是猫;或者(num_pic, 1),仅表示它是否是猫。
这样,每个两个(或一个)输出神经元将是一个介于0和1之间的数字,可以用作概率。