为卷积神经网络的输入添加背景?

我正在尝试使用YOLOv2训练神经网络,以识别视频游戏中的字符和对象。作为输入数据,我从不同角度截取了游戏内资产的屏幕截图。然而,这些角色模型中没有背景——只有模型本身。当然,在游戏中,角色后面会有背景。

这会让神经网络感到困惑吗?如果是的话,我是否应该继续寻找一些游戏中的样本背景图片,并随机将它们应用到输入数据中?


回答:

是的,你应该为你的模型添加游戏中的背景,否则你永远不会得到 decent 的检测质量。网络需要了解背景、对象在背景上的放置位置,甚至场景中对象的照明情况。所有这些都对最终的检测质量有贡献。

此外,你用来融合背景和图像的技术也很重要。

关于这个主题的一个好读物:Synthesizing Training Data for Object Detection in Indoor Scenes

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注