Kubernetes已经从一种多功能容器编排框架,转变为推动全球人工智能发展浪潮的主要动力。

云原生计算基金会(CNCF)在最近的一份报告中指出了这一演变趋势,该报告探讨了云原生基础设施与机器学习的结合点。虽然该技术生态系的技术能力已经发展到了相当成熟的阶段,但研究表明,如今人类因素和组织结构才是成功部署这些技术的关键障碍。

这项研究表明,对于那些希望扩大自身人工智能发展规模的企业来说,云原生技术已不再是可选项。现代工作负载确实需要Kubernetes所提供的动态资源分配和硬件抽象功能,尤其是在管理昂贵的GPU集群时。然而,这些复杂环境的复杂性仍然给许多工程团队带来了困扰。随着行业朝着“云原生人工智能”标准发展,人们的关注点正在从简单的容器化技术,转向对复杂数据流程和模型训练工作流的协同管理。

尽管使用Kubernetes具有诸多技术优势,但报告指出,当前基础设施的能力与各组织有效利用这些能力之间存在越来越大的差距。许多企业仍受限于Puppet所指出的那些阻碍平台工程成熟发展的僵化层级结构与孤立式运作模式。CNCF认为,要想让人工智能事业取得成功,企业必须营造一种跨职能协作的文化环境,使数据科学家和DevOps工程师能够更加紧密地合作。这种文化上的转变,被视作一个组织能否从实验性试点项目顺利过渡到生产级部署的决定性因素。

CNCF的首席技术官Chris Aniszczyk强调:在当前的发展格局中,编排工具扮演着基础性角色。“Kubernetes已经不再是一种小众工具;它已经成为支撑大规模应用、确保系统可靠性以及推动人工智能发展的核心基础设施层。”Aniszczyk在报告中这样表示。他还指出,整个行业需要努力“降低运行人工智能工作负载的难度,同时大幅增加可用的推理计算能力”,并将这一目标描述为“下一个重要的云原生工作负载发展方向”。这些观点充分体现了该组织认为:强大的技术基础设施,才是推动人工智能创新发展的关键因素。

虽然Kubernetes以82%的实际应用率成为了用于容器编排的首选方案,但市场上还存在其他多种替代方案,各组织可以根据自身的具体需求来选择适合自己的技术。诸如Amazon SageMakerGoogle Vertex AIAzure Machine Learning等大型云计算公司的专用解决方案,通常能为小型团队提供更加集成化、但同时也更具封闭性的使用体验。此外,在那些不希望引入容器编排层所带来的额外开销的场景中,传统的高性能计算集群和裸机部署方式依然被广泛使用。不过,云原生生态系统的灵活性依然是吸引开发者的重要因素——目前已有37%的组织选择同时使用多家云服务提供商,以此来保持技术选择的多样性,避免受到特定供应商的束缚。

该行业的未来发展趋势似乎是专业化硬件与自动化资源管理的整合程度会进一步加深。随着各组织的发展成熟,重点很可能会转向简化开发流程,从而降低非基础设施领域专家进入这一领域的门槛。通过解决报告中指出的那些文化层面的障碍,企业就能更好地利用自己在云技术方面的投资,在未来几年内推出更加可靠、更具可扩展性的人工智能解决方案。

Comments are closed.