ML模型部署CI/CD

我使用MLFlow在DataBricks上训练模型,并将最终模型输出到S3。然后,使用Seldon-Core来打包并部署模型到AWS EKS。

我正在寻找一种工具,能够从S3获取模型,将其打包进Docker容器,并使用Seldon-Core的K8S模板将其推送到AWS EKS。

我认为适合这项工作的工具是Kubeflow Pipelines。其他竞争者包括Jenkins、Gitlab和TravisCI。

Kubeflow是否是这项工作的绝对正确工具?Kubeflow与其他工具相比的优缺点是什么?如果有人已经做了研究甚至已经构建了管道…


回答:

GitLab实际上可以像Kubeflow Pipelines一样开箱即用,它的Yaml与CircleCI或TravisCI类似。我最终使用GitLab作为Kubeflow Pipelines的替代方案。

关于Kubeflow…在尝试了0.5和0.6版本后,我们觉得它还相当不稳定。无论是在MiniKube(本地K8S)还是AWS EKS上,安装过程都不顺利。对于MiniKube,文档中的安装脚本有问题,你会看到很多人遇到问题并手动编辑安装脚本(我也是这样做的才能正确安装)。在EKS上,我们无法安装0.5版本,不得不安装一个更旧的版本。Kubeflow希望以特定方式管理工作节点,而我们的安全政策不允许这样做,只有在更旧的版本中你可以覆盖这个选项。

Kubeflow也在转向Kustomize,但目前还不稳定,所以如果你现在使用它,你将使用不再支持的Ksonnet,你将学习一个你迟早会抛弃的工具。

总的来说,应该等到1.0版本,但Gitlab作为Kubeflow Pipelines的替代方案表现出色。

希望这能帮助有同样想法的其他人

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注