如何使用CTC损失函数和数据集监控准确率？（包含可运行代码）

我一直在尝试加速我的CRNN网络用于光学字符识别的训练，但当使用TFRecords和tf.data.Dataset管道时，我无法使准确率指标正常工作。我之前使用了一个Keras序列并且它是有效的。以下是一个完整的可运行的玩具示例，展示了我的问题（已在Tensorflow 2.4.1上测试）：

（代码内容保持不变）

将use_generator = False设置为False，或者移除metrics=["accuracy"]，代码将不会出错地运行。

如您所见，DataGenerator使用了来自TFRecords的相同数据，但它也返回了一些零，出于某种原因，这似乎是关键所在：

（代码内容保持不变）

我还注意到这个Keras示例也存在相同的问题（如果您编辑代码以监控准确率，它会崩溃）：https://keras.io/examples/vision/captcha_ocr/

有没有办法使用Dataset模仿__getitem__的行为，或者在不使用Sequence的情况下获取准确率的其他方法？

回答：

当您传递数据集进行训练时，您需要包含输出。您的生成器函数（正确地）返回一个元组（inputs, outputs）；当您直接传递数据集时，这部分缺失了。

如果您这样修改映射函数：

（代码内容保持不变）

现在，代码在use_generator = False的情况下将不会出错地运行。请注意，准确率作为一个指标没有意义。该指标将网络的输出（y_pred）与目标（tf.constant([0])）进行比较。为了测量准确率，您需要将标签作为目标输入…而且您需要一个函数来比较您的网络输出的形状（batch_size, max_sequence_lenght, n_classes）与标签。即，您需要一个稀疏分类准确率指标。

您可以在以下位置找到我的笔记本：https://colab.research.google.com/drive/1z2NCQnYlG_UIpN7bBNpXXbLwy3JE_PX2?usp=sharing

学技术

如何使用CTC损失函数和数据集监控准确率？（包含可运行代码）

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复