我是一名学生,正在进行一个使用EEG数据进行测谎的项目。我将使用来自两个通道的原始EEG数据,并在受试者回答问题期间记录EEG数据。因此,数据将是一个2乘以变量长度的数组,存储在csv文件中,该文件包含来自两个传感器的传感器读数。例如,它看起来像这样:
Time (ms) | Sensor 1 | Sensor 2|--------------------------------10 | 100.2 | -324.5 |20 | 123.5 | -125.8 |30 | 265.6 | -274.9 |40 | 121.6 | -234.3 | ....2750 | 100.2 | -746.2 |
我希望根据这些数据预测受试者是说谎还是说实话(因此,是二元分类)。我原本打算简单地将其视为结构化数据并基于此进行训练。然而,经过重新考虑,这完全行不通,原因有几个:
- 数据的组织顺序很重要,因为它是连续时间数据。
- 数据的长度是可变的,因为它是时间数据,且受试者说谎或说实话所需的时间不一致。
- 我不知道如何处理多通道数据。
我该如何为这种类型的数据设置训练模型?我认为这是一个“时间序列分类”问题,但我不确定。任何帮助都将不胜感激。提前谢谢!
回答:
经过进一步研究,我决定使用运行在TensorFlow之上的Keras框架中的LSTM网络。LSTM处理时间序列数据,Keras层允许将多个特征的时间序列数据输入网络,所以如果有人遇到与我类似的问题,LSTM或RNN是解决方案。