如何检测并从研究论文图像中提取（裁剪）图表区域

我想从这张研究论文的图像中提取所有的图表/图形。有什么方法可以做到这一点吗？

我只想要图表部分，有什么方法可以裁剪出那部分吗？

回答：

要仅提取图表/图形，这里有一个使用OpenCV的方法：

获取二值图像。 加载图像，转换为灰度，并使用Otsu阈值法获取二值图像。
连接文本轮廓。 利用文本按段落结构排列的观察结果，我们可以使用水平轮廓进行膨胀操作，将单个单词连接成一个轮廓。
移除非图表轮廓。 我们查找轮廓，并使用纵横比和轮廓面积进行过滤。通过填充轮廓，有效地移除非图表轮廓。
形成单一边界框。 遍历剩余的轮廓，确定边界框的坐标
提取ROI。 使用Numpy切片裁剪/提取图表。

以下是每一步的可视化展示：

阈值图像

使用水平核进行膨胀

过滤以移除非图表轮廓

检测到的图表边界框

提取的ROI

注意： 这种方法假设图像中只有一个图表。如果有多个图表，你可以删除步骤#4以获取多个ROI，并将每个ROI保存为单独的图像。我相信这将是一个简单的更改 🙂

代码





相关文章：

如何从图像中提取主要颜色而不受阴影影响？
如何从图像中去除背景以有效应用k-means聚类
Opencv – 从游戏图像中提取数据
检测灰度图像中黑色区域的存在
如何使用Python和OpenCV查找并将单词裁剪成单独的图像？
图像分类 – 向现有模型添加新类别
颜色和特征分类 opencv
使用训练好的分类器获取结果 – 图像处理
区分文档图像和其他图像
用于SVM多类图像分类的图像特征有哪些会产生好的结果？

学技术

如何检测并从研究论文图像中提取（裁剪）图表区域

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复