### JavaScript中的数字光学识别(OCR)

我在寻找用于OCR或机器学习示例(如Tensorflow.js或其他)的JavaScript API,可以从图片中识别数字。我尝试过tesseract.js和OCRAD.js,但这两个对这种类型的图像效果不好。我只需要从这张图片中提取像2.243和0048这样的数字。我还在tesseract.js设置中指定了只识别数字,但效果不佳。

这张图片是一张数字设备的照片,该设备没有API可以连接并数字获取数据。我希望使用网络摄像头和JavaScript OCR定期从这个设备获取这些数字到列表中,并稍后构建图表。

我找到了很多Tensorflow识别手写数字的例子,但它们只能识别一个数字,不能识别由多个数字组成的数字。

P.S. 我不想花费很多时间,实际上我也没有这个时间 :)。只想重用现成的例子。

enter image description here


回答:

我使用过AWS Rekognition和Azure认知服务。这两者在准确性方面表现良好。我发现Azure的HTTP模型更简单。

请注意,Azure和AWS对提取印刷文本(OCR)和图片中的文本有不同的服务。

Azure

https://westus.dev.cognitive.microsoft.com/docs/services/56f91f2d778daf23d8ec6739/operations/587f2c6a154055056008f200

配置Azure认知服务的步骤

AWS Rekognition

https://docs.aws.amazon.com/rekognition/latest/dg/text-detection.html

这是我使用您的图片从AWS Rekognition得到的结果

enter image description here

EAST文本检测器

您可以尝试这个。OpenCV嵌入了这个功能。您需要设置后端服务。

https://www.youtube.com/watch?v=o5asMTdhmvAhttps://www.youtube.com/watch?v=NfiCmhLLxMA

Related Posts

在使用k近邻算法时,有没有办法获取被使用的“邻居”?

我想找到一种方法来确定在我的knn算法中实际使用了哪些…

Theano在Google Colab上无法启用GPU支持

我在尝试使用Theano库训练一个模型。由于我的电脑内…

准确性评分似乎有误

这里是代码: from sklearn.metrics…

Keras Functional API: “错误检查输入时:期望input_1具有4个维度,但得到形状为(X, Y)的数组”

我在尝试使用Keras的fit_generator来训…

如何使用sklearn.datasets.make_classification在指定范围内生成合成数据?

我想为分类问题创建合成数据。我使用了sklearn.d…

如何处理预测时不在训练集中的标签

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注