ML模型部署CI/CD

我使用MLFlow在DataBricks上训练模型,并将最终模型输出到S3。然后,使用Seldon-Core来打包并部署模型到AWS EKS。

我正在寻找一种工具,能够从S3获取模型,将其打包进Docker容器,并使用Seldon-Core的K8S模板将其推送到AWS EKS。

我认为适合这项工作的工具是Kubeflow Pipelines。其他竞争者包括Jenkins、Gitlab和TravisCI。

Kubeflow是否是这项工作的绝对正确工具?Kubeflow与其他工具相比的优缺点是什么?如果有人已经做了研究甚至已经构建了管道…


回答:

GitLab实际上可以像Kubeflow Pipelines一样开箱即用,它的Yaml与CircleCI或TravisCI类似。我最终使用GitLab作为Kubeflow Pipelines的替代方案。

关于Kubeflow…在尝试了0.5和0.6版本后,我们觉得它还相当不稳定。无论是在MiniKube(本地K8S)还是AWS EKS上,安装过程都不顺利。对于MiniKube,文档中的安装脚本有问题,你会看到很多人遇到问题并手动编辑安装脚本(我也是这样做的才能正确安装)。在EKS上,我们无法安装0.5版本,不得不安装一个更旧的版本。Kubeflow希望以特定方式管理工作节点,而我们的安全政策不允许这样做,只有在更旧的版本中你可以覆盖这个选项。

Kubeflow也在转向Kustomize,但目前还不稳定,所以如果你现在使用它,你将使用不再支持的Ksonnet,你将学习一个你迟早会抛弃的工具。

总的来说,应该等到1.0版本,但Gitlab作为Kubeflow Pipelines的替代方案表现出色。

希望这能帮助有同样想法的其他人

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注