Google Vision API与自建系统的比较

我有一个关于图像识别的相当具有挑战性的用例。我想检测混合回收材料的组成,例如压碎的罐头、纸张、瓶子,并检测任何异常情况,如玻璃、袋子、鞋子等。

使用Google Vision API尝试这些图像时,结果主要是“垃圾”、“回收”、“塑料”等,可能是因为API没有针对这种混合和破损的材料进行训练?

对于这种情况,我是否需要使用像TensorFlow这样的工具,并从我自己的图像构建一个神经网络?我猜我不需要使用Google,因为TensorFlow是开源的?

谢谢。


回答:

因此,通常情况下,当你将机器学习应用于一个新的、现实世界的用例时,最好获取一个代表性的数据集,在你的案例中,就是这些垃圾材料的图像。

然后你可以选择一个合适的检测模型(如VGG、Inception、ResNet),修改最终的分类层以输出你需要的类别标签数量(在你的案例中可能是“正常”或“异常”,所以是2个类别)。

然后你加载这个网络的预训练权重,因为所学的特征具有泛化性(谷歌“迁移学习”),随机初始化你修改的分类层,然后训练最后一层,可能训练最后两层,或最后三层(取决于什么效果最好,你有多少数据,泛化性)等。

简而言之:1. 选择一个预训练模型。2. 针对你的问题进行修改。3. 在你自己的数据集上微调权重。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注