我有以下数据集(共265个数据集)。这是一个每秒记录一次的心跳数据集。
**心率模式**82 82 87 87 89 90 89 89 89 8988 89 89 87 87 87 88 88 90 9087 80 88 88 88 88 91 93 92 9289 89 89 88 79 79 79 79 78 77...
最近我在使用scikit-learn的Python开发机器学习算法,以预测患者的危急情况。由于我还有其他12个参数(风险因素)需要与上述心率模式一起训练。由于将这些心率模式和其他12个参数一起训练并不是一个好的做法,我只需要找到一种方法,将这些时间序列数据集(心率模式)转换为单一值,使用任何数学技术都可以。它可能是向量,但我不知道如何操作!基于Python scikit-learn的示例代码将非常有用。
回答:
其他变量是否随时间变化?你每个患者有多少个心跳数据点?没有更多信息很难回答。心跳记录的持续时间需要相同才能进行充分的比较。然而,这里有一些想法:
- 计算时间序列的一些汇总统计数据,如均值、中位数、众数、最小值和最大值。
- 计算时间序列的移动平均值,如简单移动平均和指数移动平均。
- 计算每个数据点的标准偏差。
这将为时间序列提供多个数值,但这可能会对你的模型更有利,因为它更全面地描述了时间序列。