我得到了一些细菌数据,需要使用神经网络将这些细菌分类为A组或B组。
我得到的细菌数据集如下。共有18个.mat格式的Matlab数据集,分别是:A1.mat, A2.mat, A3.mat, A4.mat, A5.mat, A6.mat, A7.mat, A8.mat, A9.mat, B1.mat, B2.mat, B3.mat, B4.mat, B5.mat, B6.mat, B7.mat, B8.mat, B9.mat。
每个Matlab数据集包含一个2510 x 2的矩阵。第一列是时间信息,第二列是细菌信息。我只提取了第二列中索引900到1200之间的细菌信息。这是我的分析所需的部分。这产生了一个209 x 1的矩阵。
我继续创建输入数据为一个209 x 18的矩阵,即为每个数据集提取900到1200索引之间的数据,并将所有数据整合在一起。
这个项目的目标是将细菌分类为A组或B组。从这一点开始,我不知道如何获取需要输入到神经网络中的目标值。我是否需要额外的信息才能继续?也就是说,数据集是否也应该包含目标信息?此时任何帮助都将是有益的。谢谢。
回答:
听起来你总共有418个样本,每个样本有9个特征,其中209个属于A组,209个属于B组。顺便说一句,通常你需要更多的样本来训练神经网络。
不要将你的分类问题视为A或B,而是将其视为’A’或’非A’。因此,属于A组的样本的目标值为1,属于B组的样本的目标值为0。