如何读取图像文件/机器学习图像识别?

我在考虑使用Python和一些机器学习库(例如Keras、TensorFlow)创建一个图像识别模型。我想知道是否有人能告诉我哪些库适合这些任务。(我之前做过图像识别项目,但从未像现在计划的规模那么大)。我的计划是能够检测ASL字母和数字,并最终识别单词等。我遇到的第一个障碍是如何将示例图片转换成可读文件(例如,用一和零表示黑白数组,或者我是否应该这样做)。任何指导都将不胜感激。


回答:

我所知的Python中大多数计算机视觉应用通常使用以下三种选项之一将图像加载到numpy数组中:

如果您的目标是深度学习,PyTorch有一些教程展示了对Pillow(PIL)的支持,不过一旦您有了numpy数组,使用任何Python图像处理/计算机视觉库并转换到所需格式就相当容易。这些都是大多数大规模图像处理应用的可行选项。

Related Posts

神经网络反向传播代码不工作

我需要编写一个简单的由1个输出节点、1个包含3个节点的…

值错误:y 包含先前未见过的标签:

我使用了 决策树分类器,我想将我的 输入 作为 字符串…

使用不平衡数据集进行特征选择时遇到的问题

我正在使用不平衡数据集(54:38:7%)进行特征选择…

广义随机森林/因果森林在Python上的应用

我在寻找Python上的广义随机森林/因果森林算法,但…

如何用PyTorch仅用标量损失来训练神经网络?

假设我们有一个神经网络,我们希望它能根据输入预测三个值…

什么是RNN中间隐藏状态的良好用途?

我已经以三种不同的方式使用了RNN/LSTM: 多对多…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注