我正在进行一个项目,拥有100个传感器的数据及其运行周期直至损坏。这些数据在传感器故障前显示了许多特征,然后展示了替换传感器的情况。基于这些数据,我需要构建一个模型,以便预测传感器在故障前的运行时间,但只能使用少量数据,而非完整周期。我不知道哪种机器学习模型适合这个任务。
回答:
您描述的问题类型被称为生存分析。有一系列广泛的统计和机器学习方法可用于解决这类问题。
这些方法的优点在于,它们还允许您使用事件尚未发生的数据点。在您的例子中,这意味着您可以可能通过包含尚未故障的传感器数据来扩展数据集。
在查看我建议的方法时,您也应该花一些时间研究如何评估这些类型的模型,因为评估方法与典型的机器学习问题略有不同。
可用的综合技术范围见:http://dmkd.cs.vt.edu/TUTORIAL/Survival/Slides.pdf