在HOG特征中为什么需要重新采样图像?

我阅读了Dalal和Triggs关于HOG描述的论文,以及@人名关于相同主题的博客。博客中提到,为了识别不同的人,需要在不同的尺度上对图像进行重新采样。

我的问题是:我们已经有一个大小为64*128的窗口,这个窗口在图像上滑动。那么,为什么不直接在整个图像上滑动这个窗口来检测人,而要进行重新采样呢?

如果我理解错了,请纠正我,提前谢谢!


回答:

你关于64*128大小被训练用于分类为“人”或“非人”的说法是正确的。但是在现实世界的图像中,所有的人都总是以64*128的尺寸出现吗?

这就是缩放发挥作用的地方。通过逐步缩小图像,同样的64*128像素区域将覆盖原始图像中更大的区域,从而允许检测不同尺寸的人。

例如,这是我在多尺度上运行检测后,我的模型的一个示例。呈现的结果是在应用非最大抑制以清除多余检测窗口之后的结果。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注