我想在并行环境中将机器学习应用于一个分类问题。多个独立节点,每个节点都配备多个开/关传感器,可以互相通信传感器数据,目标是根据启发式方法、训练数据或两者的组合对事件进行分类。
每个节点将从其独特的视角测量相同的数据,并尝试对结果进行分类,同时考虑到任何邻近节点(或其传感器,或仅是与节点的连接)可能出现故障。节点应作为平等的对等体,通过通信各自的结果来确定最可能的分类。
最终,每个节点应基于自身的传感器数据及其对等节点的数据做出决策。如果有影响的话,某些分类中的误报是可以接受的(尽管不理想),但漏报是完全不可接受的。
鉴于每个最终分类将获得好或坏的反馈,如果节点之间可以通信以确定最可能的分类,那么解决这个问题的合适机器学习算法是什么?
回答:
如果每个节点的传感器数据通常足以做出合理决策,它们可以仅通信结果并进行多数投票。如果多数投票不合适,可以训练一个额外的分类器,使用节点的输出作为其特征向量。
由于您希望进行带反馈的在线监督学习,您可以使用带反向传播的神经网络,或使用将错误添加到训练集的增量支持向量机。研究分类器偏置以处理误报/漏报的权衡问题。