如何读取图像文件/机器学习图像识别？

我在考虑使用Python和一些机器学习库（例如Keras、TensorFlow）创建一个图像识别模型。我想知道是否有人能告诉我哪些库适合这些任务。（我之前做过图像识别项目，但从未像现在计划的规模那么大）。我的计划是能够检测ASL字母和数字，并最终识别单词等。我遇到的第一个障碍是如何将示例图片转换成可读文件（例如，用一和零表示黑白数组，或者我是否应该这样做）。任何指导都将不胜感激。

回答：

我所知的Python中大多数计算机视觉应用通常使用以下三种选项之一将图像加载到numpy数组中：

Scikit-Image
OpenCV（注意：读取的是BGR而不是RGB）
Pillow

如果您的目标是深度学习，PyTorch有一些教程展示了对Pillow（PIL）的支持，不过一旦您有了numpy数组，使用任何Python图像处理/计算机视觉库并转换到所需格式就相当容易。这些都是大多数大规模图像处理应用的可行选项。

学技术

如何读取图像文件/机器学习图像识别？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复