我使用MLFlow在DataBricks上训练模型,并将最终模型输出到S3。然后,使用Seldon-Core来打包并部署模型到AWS EKS。
我正在寻找一种工具,能够从S3获取模型,将其打包进Docker容器,并使用Seldon-Core的K8S模板将其推送到AWS EKS。
我认为适合这项工作的工具是Kubeflow Pipelines。其他竞争者包括Jenkins、Gitlab和TravisCI。
Kubeflow是否是这项工作的绝对正确工具?Kubeflow与其他工具相比的优缺点是什么?如果有人已经做了研究甚至已经构建了管道…
回答:
GitLab实际上可以像Kubeflow Pipelines一样开箱即用,它的Yaml与CircleCI或TravisCI类似。我最终使用GitLab作为Kubeflow Pipelines的替代方案。
关于Kubeflow…在尝试了0.5和0.6版本后,我们觉得它还相当不稳定。无论是在MiniKube(本地K8S)还是AWS EKS上,安装过程都不顺利。对于MiniKube,文档中的安装脚本有问题,你会看到很多人遇到问题并手动编辑安装脚本(我也是这样做的才能正确安装)。在EKS上,我们无法安装0.5版本,不得不安装一个更旧的版本。Kubeflow希望以特定方式管理工作节点,而我们的安全政策不允许这样做,只有在更旧的版本中你可以覆盖这个选项。
Kubeflow也在转向Kustomize,但目前还不稳定,所以如果你现在使用它,你将使用不再支持的Ksonnet,你将学习一个你迟早会抛弃的工具。
总的来说,应该等到1.0版本,但Gitlab作为Kubeflow Pipelines的替代方案表现出色。
希望这能帮助有同样想法的其他人