我在学习机器学习(ML)课程时,遇到一个问题,凭我目前的知识无法找到答案。假设我有以下数据集,
att1 att2 att3 class5 6 10 a2 1 5 b47 8 4 c4 9 8 a4 5 6 b
上述数据集很清晰,我认为在训练数据集后,我可以对新进入的数据应用分类算法。由于每个实例都有一个标签,很容易理解每个实例都有一个被标记的类。现在,我的疑问是,如果我们有一个由不同实例组成的类,比如手势识别数据。每个类将有多个实例来指定其类。例如,
xcor ycord depth 45 100 1050 20 4510 51 12
上述三个实例属于类A,而下面的三个实例作为一个组属于类B,我的意思是这三个数据实例共同构成了那个类。对于手势数据,手的移动坐标。
xcor ycord depth 45 100 1050 20 4510 51 12
现在,我希望每三个进入的实例被分组为A或B?是否可以不独立标记每个实例,而将它们全部标记为A或B?例如,假设以下组属于B,那么我希望所有实例都被一起标记为B,而不是因为它们独立地与类A或B相似而单独标记?如果可能,这被称为什么?
xcor ycord depth 45 10 105 20 8710 51 44
回答:
我不认为你会想要将数据集中不确定数量的行作为某个类的特征进行分组。它们要么独立地与某个类相关联,要么它们都是特征,因此是一个独特的行。就像这样:
Instead ofxcor ycord depth 45 10 105 20 8710 51 44
应该像这样:
xcor1 ycord1 depth1 xcor2 ycord2 depth2 xcor3 ycord3 depth3 45 10 10 5 20 87 10 51 44
这与用于建模时间序列的方法非常相似