使用机器学习从图像中计数车辆数量

我刚开始学习机器学习。我接到一个任务,需要使用机器学习的概念从图像中找出车辆的总数。我正在使用神经网络。这里是我最坏情况下的图像示例。

交通图像

我需要从这张图像中找出汽车的总数。我的想法是将这张大图像切割成小块,并训练网络从这些小块中计数车辆。每块的车辆数量少于5。然后在处理新图像时,我可以使用滑动窗口来获取车辆的总数。

我想知道这个想法是否可行,或者我应该进行特征提取并用这些特征训练神经网络。如果可行,数据集和训练是否有任何条件要求?


回答:

您寻找的是称为对象检测的技术。一个起点可以是用于对象检测的深度神经网络用于精确对象检测和分割的基于区域的卷积网络

一个相似但更困难的任务是实例分割。我在这方面看到的最新论文之一是像素级编码和深度分层用于实例级语义标记

实例分割可能是计算机视觉中最困难的任务。当您刚开始学习机器学习/计算机视觉时,您可能首先想要进行图像分类。如果您想朝实例分割的方向发展,那么您应该继续进行语义分割,然后是实例分割。

仅仅预测“汽车”/“无汽车”的简单滑动窗口方法将不起作用,因为图像中的汽车之间没有“无汽车”来分隔。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注