我在进行一个项目,需要处理一张包含明确表格结构(例如4×6或1×10,结构简单)的图片(.bmp, .jpeg等格式)。我需要从图片中的单元格中提取数据,只需要检测单元格的起始和结束位置(像素坐标,或其他任何可行的方法),这样我就可以处理单元格内的图像部分。我在一些人工智能项目(如时间差分学习、Q学习、神经网络)中积累了一些经验,但从未从事过需要计算机视觉的项目,所以在这方面的知识非常有限。有什么建议或算法可以用来检测图片中的表格结构吗?
回答:
我会使用霍夫变换来识别单元格的边界。
然后(根据单元格内容的不同),使用OCR工具来提取实际的单元格信息。