考虑这样一个问题:我需要根据过去的数据(带有时间戳的数据)来预测特定事件何时会发生。
例如
假设有一台特定的机器正在运行,我们收集了这台机器和其他类似机器在不同时间点的数据。这些数据包括机器在某些功能上出现故障时收集的值,也包括机器正常运行时的数据。
我需要做的是预测这台特定机器(或某些功能)何时会发生故障。
从这个问题中,我理解这是个时间序列分析问题。我听说过生存分析,其结果是时间。但我不确定还有哪些其他模型可以尝试。
能否请有人解释一下可以用于这个特定问题的模型有哪些?(假设我会比较各种模型的质量矩阵)。如果有除时间序列之外的其他方法,请建议(我的假设是生存分析是时间序列分析的一部分)。
将要使用的技术是R或Python(scikit-learn)。
提前感谢
回答:
针对上述问题,已选择生存分析,因为它能提供特定事件何时发生的时间。在这种方法中,正在考虑各种模型,目前使用coxph,我们认为这是最佳模型。