如何使用Keras深度学习对图像序列进行分类

我想为CT图像序列构建一个分类模型,使用Keras。我的数据集来自50个患者,每个患者有1000张图像。对于每个患者,每张图像与前一张图像之间存在有意义的关系。我想利用这些有意义的关系,但不知道如何为这种问题构建模型。您能给我一些建议或示例吗?


回答:

您的问题属于序列分类范畴。您需要对图像序列进行分类。在这种情况下,需要构建一个模型来学习两个方面的内容:

  1. 图像的特征
  2. 序列的特征(时间或时序相关特征)

这听起来可能类似于视频分类,其中视频是一系列帧的序列。请参见这里

用于从图像中提取特征:

大多数现实世界中的案例使用卷积神经网络(CNN)。它们使用像最大池化和卷积这样的层。它们非常擅长从像图像这样的3D输入中提取特征。您可以从这里了解更多信息。

用于处理时间序列数据:

在这里,您将需要一个RNN(循环神经网络)。LSTM(长短期记忆)单元是流行的RNN类型,因为它们比传统RNN具有更强的记忆能力。

RNN保留隐藏层的激活,并在处理序列中的每个项时使用它们。因此,在处理序列中的第二张图像时,RNN会知道或激活第一张图像的信息。

您可以从这里了解更多信息。

最后,我们需要将上述两种网络结合起来:

CNN-LSTM网络同时使用卷积和LSTM单元来对图像序列进行分类。

这是它们的外观。

您可以参考这里这里

希望这些对您有帮助。:-)

Related Posts

关于k折交叉验证的直观问题

我在使用交叉验证检查预测能力时遇到了一些直观问题,我认…

调整numpy数组大小以使用sklearn的train_test_split函数?

我正在尝试使用sklearn中的test_train_…

如何转换二维张量和索引张量以便用于torch.nn.utils.rnn.pack_sequence

我有一组序列,格式如下: sequences = to…

模型预测值的含义是什么?

我在网上找到一个数字识别器的CNN模型并进行了训练,当…

锯齿张量作为LSTM的输入

了解锯齿张量以及如何在TensorFlow中使用它们。…

如何告诉SciKit的LinearRegression模型预测值不能小于零?

我有以下代码,尝试根据非价格基础特征来估值股票。 pr…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注