我正在尝试使用非结构化数据进行我的第一次机器学习。预处理后的训练数据存储在一个CSV文件中,每一列作为一个样本。在运行
numpy_array.shape
后,结果是(240000, 400)
,这意味着总共有400个样本,每个样本有240000个特征。训练数据集中没有标题(字符串)。我的问题是如何让模型知道,每一列是一个样本。我是否应该先对训练数据集进行转置?
回答:
你可以通过np.transpose(your_array)
或your_array.T
来转置数据集,
这样形状将变为(400, 240000)
,每一行为一个样本