我有一个大型的CSV文件(3000行*20000列),数据没有标题列,我添加了一列来表示类别。当特征没有标题且由于列数太多无法手动添加时,我如何将数据拟合到模型中?有没有一种方法可以自动迭代每一行中的每一列?
当我处理一个只有4列的小文件时,我使用了以下代码:
但是对于一个3000行乘以20000列的文件,我不知道如何识别特征和标签/目标
回答:
假设你有一个这样的CSV文件:
1,2,3,4,01,2,3,4,11,2,3,4,11,2,3,4,0
其中前4列是特征,最后一列是你想要的标签或类别。你可以使用pandas.read_csv读取文件,并为你的特征和标签创建数据框,然后将它们拟合到你的模型中。