Amazon Web Services推出了Strands Labs这一新的GitHub组织,该组织专门用于托管与基于智能体的AI开发相关的实验性项目。这一计划与Strands Agents SDK密切相关——这款开源工具包允许开发者使用Python或TypeScript来构建AI智能体。
Strands Labs包含了三个项目:Robots、Robots Sim以及AI Functions。每个项目都探讨了智能体开发的不同方面,其研究范围从机器人技术的集成应用到代码生成流程的优化。
Strands Robots项目专注于将AI智能体与物理硬件连接起来。它提供了一个统一的接口,使得使用Strands框架构建的智能体能够与传感器及机器人设备进行交互。在演示示例中,AWS展示了如何利用NVIDIA GR00T模型让AI智能体控制SO-101机械臂。GR00T是一种视觉语言行动模型,它能接收摄像头图像、机器人关节位置以及语言指令作为输入,并生成相应的动作指令。
Robots项目还与LeRobot进行了集成。LeRobot是一个专为简化与机器人硬件及数据集的交互而设计的开源框架。通过将LeRobot提供的抽象层与VLA模型相结合,开发者可以构建出能够处理视觉数据、解读指令并执行物理动作的智能体。
Strands Robots Sim项目为机器人技术实验提供了模拟环境。开发者无需使用真实的物理硬件,而是可以在基于物理规律的仿真环境中运行智能体。该系统支持Libero机器人基准测试中定义的各种环境,并且可以通过推理服务集成VLA模型。模拟器会收集来自摄像头和机器人关节的数据,然后将这些信息输入到策略模型中以生成驱动命令。此外,该系统还能将仿真过程录制为视频文件,并支持迭代控制循环,便于进行调试或进一步实验。
第三个项目AI Functions探索了一种全新的编写包含AI智能体的软件的方法。开发者无需直接实现具体功能,而是可以通过用Python编写的自然语言描述和验证条件来定义智能体应有的行为。一个名为@ai_function的装饰器会触发Strands智能体运行机制,该机制会自动生成满足要求的代码,并通过预先设定的条件对生成的结果进行验证。如果验证失败,系统会自动重新尝试。这个框架能够生成各种实现方案,这些方案可以用于解析文件、执行数据转换操作,或完成其他任务,同时最终生成的仍然是标准的Python对象,比如Pandas DataFrames。
社区对这一公告的反应主要集中在机器人的集成技术以及这些项目的实验性质上。
AWS的高级首席工程师Clare Liguori在X上发文称:
我认为Strands Labs为下一代人工智能开发理念提供了一个试验场——从如何构建具有自主能力的机器人,到如何让我们的日常应用程序具备更多的自主性,这些都可以在这里进行探索。
也有人指出,“AI Functions”实验体现了人们对规范驱动编程模式的日益关注:在这种模式下,开发者定义行为规则和验证标准,而机器人才负责生成相应的代码。
由自主框架驱动的机器人能与人类共同协作,它们共享感知与认知能力,从而协同完成各种任务。
AWS表示,Strands Labs将会继续发展,更多来自亚马逊不同团队的实验项目也将加入其中。这个平台旨在成为探索机器人协作、机器人与软件开发的集成技术以及人工智能辅助开发理念的试验场,这些成果未来有可能被纳入Strands SDK的核心功能中。