如何使用时间序列数据集创建单一值?

我有以下数据集(共265个数据集)。这是一个每秒记录一次的心跳数据集。

**心率模式**82 82 87 87 89 90 89 89 89 8988 89 89 87 87 87 88 88 90 9087 80 88 88 88 88 91 93 92 9289 89 89 88 79 79 79 79 78 77...

最近我在使用scikit-learn的Python开发机器学习算法,以预测患者的危急情况。由于我还有其他12个参数(风险因素)需要与上述心率模式一起训练。由于将这些心率模式和其他12个参数一起训练并不是一个好的做法,我只需要找到一种方法,将这些时间序列数据集(心率模式)转换为单一值,使用任何数学技术都可以。它可能是向量,但我不知道如何操作!基于Python scikit-learn的示例代码将非常有用。


回答:

其他变量是否随时间变化?你每个患者有多少个心跳数据点?没有更多信息很难回答。心跳记录的持续时间需要相同才能进行充分的比较。然而,这里有一些想法:

  1. 计算时间序列的一些汇总统计数据,如均值、中位数、众数、最小值和最大值。
  2. 计算时间序列的移动平均值,如简单移动平均和指数移动平均。
  3. 计算每个数据点的标准偏差。

这将为时间序列提供多个数值,但这可能会对你的模型更有利,因为它更全面地描述了时间序列。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注