我最近在学习机器学习课程。我发现示例输入数据通常是这样的(例如,恶性肿瘤分类):
/ size gender classificationm1 100 male malignantm2 50 female benign
所有这些数据都可以放入一个 m * n 的矩阵中,其中 m 是样本数量,n 是特征数量。
如果输入数据不是行列形式呢?例如,我想通过客户的订单历史来预测客户是否有恶意。而输入数据的形式是这样的:
我有多个客户:
[c1, c2, c3]
一个客户有多个订单:
[o1, o2, o3]
每个订单有多个属性:
[orderDate, itemName. itemType, isPayed]
因此,我认为这些数据无法直接放入矩阵。在程序代码中,这应该是一个三维数组。
如何处理这种数据呢?
回答:
你可以为每个订单使用不同的模型。如果基于某个订单判断客户无恶意,则该模型输出0,否则输出1。然后,采用多数投票的方式来得到最终结果。