变量长度数据的训练 – EEG数据分类

我是一名学生,正在进行一个使用EEG数据进行测谎的项目。我将使用来自两个通道的原始EEG数据,并在受试者回答问题期间记录EEG数据。因此,数据将是一个2乘以变量长度的数组,存储在csv文件中,该文件包含来自两个传感器的传感器读数。例如,它看起来像这样:

Time (ms) | Sensor 1 | Sensor 2|--------------------------------10        | 100.2    | -324.5  |20        | 123.5    | -125.8  |30        | 265.6    | -274.9  |40        | 121.6    | -234.3  |             ....2750      | 100.2    | -746.2  |

我希望根据这些数据预测受试者是说谎还是说实话(因此,是二元分类)。我原本打算简单地将其视为结构化数据并基于此进行训练。然而,经过重新考虑,这完全行不通,原因有几个:

  1. 数据的组织顺序很重要,因为它是连续时间数据。
  2. 数据的长度是可变的,因为它是时间数据,且受试者说谎或说实话所需的时间不一致。
  3. 我不知道如何处理多通道数据。

我该如何为这种类型的数据设置训练模型?我认为这是一个“时间序列分类”问题,但我不确定。任何帮助都将不胜感激。提前谢谢!


回答:

经过进一步研究,我决定使用运行在TensorFlow之上的Keras框架中的LSTM网络。LSTM处理时间序列数据,Keras层允许将多个特征的时间序列数据输入网络,所以如果有人遇到与我类似的问题,LSTM或RNN是解决方案。

Related Posts

如何使用Google Protobuf解析、编辑和生成object_detection/pipeline.config文件

我在一个常见的集成学习范式中训练多个模型,目前我在处理…

我的GridSearchCV不起作用,我不知道为什么

大家好,我在使用GridSearchCV时遇到了问题,…

Keras: 两个同时进行的层,其中一个对前一层的输出进行卷积

我想实现这样的模型连接: 输入图像1 -> 卷积层1 …

如何将行数据转换为列数据而不使用独热编码

我有一个如下所示的数据集。 MonthDate Day…

使用 ML Kit 与 NNAPI

我正在尝试在运行 Android 9 的设备上使用新的…

Vowpal Wabbit 可能的哈希冲突

我在VW中生成了一个模型,并且在相同的数据上生成了两个…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注