### JavaScript中的数字光学识别(OCR)

我在寻找用于OCR或机器学习示例(如Tensorflow.js或其他)的JavaScript API,可以从图片中识别数字。我尝试过tesseract.js和OCRAD.js,但这两个对这种类型的图像效果不好。我只需要从这张图片中提取像2.243和0048这样的数字。我还在tesseract.js设置中指定了只识别数字,但效果不佳。

这张图片是一张数字设备的照片,该设备没有API可以连接并数字获取数据。我希望使用网络摄像头和JavaScript OCR定期从这个设备获取这些数字到列表中,并稍后构建图表。

我找到了很多Tensorflow识别手写数字的例子,但它们只能识别一个数字,不能识别由多个数字组成的数字。

P.S. 我不想花费很多时间,实际上我也没有这个时间 :)。只想重用现成的例子。

enter image description here


回答:

我使用过AWS Rekognition和Azure认知服务。这两者在准确性方面表现良好。我发现Azure的HTTP模型更简单。

请注意,Azure和AWS对提取印刷文本(OCR)和图片中的文本有不同的服务。

Azure

https://westus.dev.cognitive.microsoft.com/docs/services/56f91f2d778daf23d8ec6739/operations/587f2c6a154055056008f200

配置Azure认知服务的步骤

AWS Rekognition

https://docs.aws.amazon.com/rekognition/latest/dg/text-detection.html

这是我使用您的图片从AWS Rekognition得到的结果

enter image description here

EAST文本检测器

您可以尝试这个。OpenCV嵌入了这个功能。您需要设置后端服务。

https://www.youtube.com/watch?v=o5asMTdhmvAhttps://www.youtube.com/watch?v=NfiCmhLLxMA

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注