我有一张表格图片(如下所示),我想提取所有信息,包括印刷文本(书籍、ID)和手写数字文本(订单数量),并将其保存为txt文件。有人能建议我最好的解决方案吗?我的当前想法是:
- 使用深度学习来获取每个栏目中对象的位置。
- 应用Tesseract从这些对象中提取文本。(有没有更好的库?)
- 使用深度学习来识别手写文本
回答:
你可以使用一个名为EAST的文本定位模型来从图像中提取文本。https://github.com/argman/EAST
然后你可以使用其中一种OCR模型来转录文本。
我有一张表格图片(如下所示),我想提取所有信息,包括印刷文本(书籍、ID)和手写数字文本(订单数量),并将其保存为txt文件。有人能建议我最好的解决方案吗?我的当前想法是:
回答:
你可以使用一个名为EAST的文本定位模型来从图像中提取文本。https://github.com/argman/EAST
然后你可以使用其中一种OCR模型来转录文本。