第一个稳定发布的Kubeflow是谷歌LLC支持的工具包,用于在Kubernetes上运行人工智能工作负载,今天正式上线。
Kubeflow于2017年由一群谷歌工程师和其他科技公司的同行开设。这是一个工具包,使组织能够在Kubernetes驱动的基础设施上部署人工智能工作负载,这是一个流行的容器编排框架。
库流1.0版本引入了几个软件核心组件的horn版本。这些组件现在满足了与企业用户需求一致的“定义的稳定性、可支持性和可升级性”,这意味着整个工具包现在更适合生产。
Kubeflow1.0提供了内置管理控制台的稳定版本,并提供了关键功能的快捷方式。其中一个功能就是Jupyter笔记本控制器,该控制器也已经升级到稳定状态,并允许AI团队使用无处不在的Jupyter笔记本开发工具创建新的机器学习模型。
一旦模型准备好,用户可以用TensorFlow或Py torch进行训练。Kubeflow1.0支持两种代码抽象,即TFJob和Py TorchOperator,允许开发人员使用他们选择的框架和相对简单的脚本来设置AI培训工作流。
今天的版本还包括管理员的功能,他们管理开发人员在他们的基础设施上构建他们的人工智能工作负载。有一个kfctl,可以在云环境中自动部署Kubeflow,并对其进行控制,使环境的资源可以在各个开发人员之间进行分解。
“有了Kubeflow,每个数据科学家或团队都可以有自己的命名空间来运行他们的工作负载,”谷歌开源策略师TheaLamkin在他的博客文章中详细解释道。“命名空间提供安全性和资源隔离。使用Kubernetes资源配额,平台管理员可以轻松地限制个人或团队可以消耗多少资源,以确保公平的调度。
在另一篇文章中,谷歌云工程师JeremyLewi和AbhishekGupta写道,该公司可以在Anthos应用平台上部署Kubeflow1.0,以利用新功能。展望未来,搜索巨头计划加强对人工智能工具包的支持。谷歌将允许企业在Anthos的站点部署上建立Kubeflow,并将加强与谷歌云的网络安全功能的融合。