来自谷歌和麻省理工学院的研究人员发表了一篇论文,描述了一种用于优化多智能体系统规模的预测性框架
这种规模优化模型依赖于系统的多个预测性因素,包括底层大语言模型的智能指数、单个智能体的基础性能、智能体数量、工具数量以及协同机制指标。研究人员发现,该模型中存在三种主要影响因素:首先是工具协同使用带来的权衡——当任务需要使用大量工具时,多智能体系统会因协调开销而降低性能;其次是能力饱和效应——当单个智能体的基础性能超过某个阈值后,增加智能体数量并不会进一步提升系统性能;最后是拓扑结构对错误传播的影响——集中式协调机制能够有效减少错误扩大的现象。他们还发现,最佳的协同策略需要根据具体任务来选择:在财务推理场景中,集中式协调更为有效;而在网页导航任务中,分散式协调方案则更合适。通过在独立测试数据上验证,该规模优化框架的正确预测率为87%。据谷歌方面表示:
随着像Gemini这样的基础模型不断取得进展,我们的研究表明,更智能的模型并不会取代多智能体系统的必要性,而是会加速其发展——前提是系统架构设计得当。通过从经验法则转向定量分析原则,我们能够打造出下一代人工智能智能体,这些智能体不仅数量更多,而且会更加聪明、安全、高效。
谷歌团队根据智能体之间的协调方式,将不同的多智能体系统架构分为几类:独立式架构中,各智能体之间没有协同机制;集中式架构中,所有智能体仅与中央协调器进行通信;分散式架构中,智能体之间采用点对点的协作方式;而混合式架构则结合了集中式和分散式的优点。每种架构都包含多种配置参数,例如智能体数量、每个智能体的迭代次数等,同时这些架构在计算复杂度、内存消耗以及大语言模型调用频率等方面也存在差异。
多智能体系统架构。图片来源:谷歌研究院
研究人员开发的这种建模方法是一种包含20个项的回归模型,这些项基于9个预测变量,同时也考虑了不同预测变量之间的交互作用。他们排除了那些“缺乏明确机制依据的交互作用”,目的是为了避免模型出现过拟合的情况。谷歌指出,这一模型确实存在一些局限性。尤其是对于那些需要使用大量工具来完成的任务来说,这种模型会导致多智能体协作效率低下,因此亟需为这类任务制定专门的协调机制。在Hacker News上关于这篇论文的讨论中,几位用户分享了他们自己在多智能体工作流程方面的经验。其中有一位用户写道:
多智能体系统的协作与协调策略目前是一个活跃的研究领域。2025年,InfoQ报道了亚马逊为Amazon Bedrock开发的多智能体协作框架,该框架使得各种专用智能体能够在监督智能体的协调下共同完成任务。今年早些时候,InfoQ还介绍了谷歌发布的关于多智能体系统的八种设计模式,这些文档为每种设计模式提供了详细的解释,并附有使用谷歌Agent开发工具包编写的示例代码。