我已经创建了一个卷积神经网络,用于对猫和狗的图像进行分类。数据集和代码都在网上可以找到。我使用Python作为编程语言。但现在我需要将这个模型部署到服务器上,并且需要通过REST API来访问它。
我已经使用HDF5格式保存了我的模型,例如“model.h5”。参考资料:https://machinelearningmastery.com/save-load-keras-deep-learning-models/
我们也可以将模型转换成PMML文件,但目前PMML文件还不支持CNN。
我们可以使用flask库将模型转换成RESTful Web服务,像这样:“https://www.linode.com/docs/applications/big-data/how-to-move-machine-learning-model-to-production/”
但我更倾向于使用Java。
我希望使用Spring Boot创建一个微服务。但我没有找到任何关于如何操作的逐步文章。
谁能帮我解答一下,如何使用Java通过REST API访问模型?或者有其他什么方法可以部署和通过REST API访问模型?
任何帮助都将不胜感激。
回答:
由于您使用Keras
训练了模型,我建议您将模型转换为tensorflow
的冻结模型(pb
文件)。您可以使用这个库将h5
格式的keras
模型转换为tensorflow
的pb
模型。
一旦您有了准备好的tensorflow
模型,您就可以使用许多成熟的库来部署模型。Tensorflow-serving是最著名的之一,它有很多内置的便捷功能,比如从模型中获得RESTful输出、更快的并行预测等等。
这里有一篇文章展示了如何在tensorflow-serving
中部署keras
模型。部署到tensorflow-serving
后,您可以使用nvidia-docker
进行容器化,然后通过任何java
的spring-boot
应用程序来使用该服务。