NVIDIA GB300 NVL72 GPU 在代理编码方面实现了 20 倍的效率提升,通过 AA-AgentPerf 设定了新的 AI 基准标准。
NVIDIA(纳斯达克股票代码:NVDA)在定义代理AI工作负载的性能标准方面迈出了重要一步。该公司宣布,与上一代 H200 芯片相比,其新型 GB300 NVL72 GPU 的代理编码任务效率提高了 20 倍。这一成就基于首个 AA-AgentPerf 基准测试的结果,这是第一个用于评估处理自主 AI 代理的推理系统的全行业标准。
代理人工智能是指为长期运行的自主任务而设计的系统,例如导航大型数据集、调用工具和自主生成软件的编码代理。到目前为止,业界还缺乏一致的方法来衡量这些复杂工作负载的性能。 AA-AgentPerf 通过评估推理系统可以支持多少个并发 AI 代理,同时满足令牌生成速度和延迟的严格服务级别目标 (SLO),从而填补了这一空白。
数字显示什么
根据基准测试,NVIDIA 的 GB300 NVL72 每兆瓦支持 61,400 个并发代理,比 H200 的 2,600 个代理有了巨大飞跃。在硬件效率方面,GB300 NVL72 每个 GPU 实现了 57.5 个代理,而其前身仅为 1.4 个代理。这些指标强调了 NVIDIA 极端协同设计方法的影响,即硬件和软件针对特定工作负载一起优化。
该基准测试还跨三个 SLO 层测试了 NVIDIA 的 DeepSeek-V4-Pro 模型。在最高层,需要每秒生成 300 个令牌,最大延迟为三秒,GB300 NVL72 保持了其性能优势,展示了其处理现实世界编码代理需求的能力。
为什么重要
NVIDIA 在代理 AI 领域的主导地位并非偶然。其战略围绕着拥有完整的人工智能堆栈——从 GPU 和 CPU(如最近推出的 Vera CPU)到模型和评估框架。本月早些时候,首席执行官黄仁勋将代理人工智能描述为从“生成文本的人工智能到采取行动的人工智能”的转变。这与 NVIDIA 致力于支持需要扩展会话和复杂工具编排的编码代理和企业工作流程相一致。
GB300 NVL72 的性能凸显了 NVIDIA 大规模满足这一需求的能力。对于企业来说,每瓦部署更多并发代理的能力意味着更低的基础设施成本和更高的效率。对于数据中心来说,基准测试结果为容量规划提供了重要的见解,特别是当工作负载转向这些长上下文、多步骤应用程序时。
更大的图景
此次发布巩固了 NVIDIA 在硬件、软件和基准测试日益相互交织的市场中的领先地位。同时宣布的 Vera Rubin 平台承诺通过集成下一代功能(例如用于低精度推理的 NVFP4 计算和用于工具调用的 CPU 加速)来扩大这些收益。 Vera Rubin 计划于今年晚些时候推出,预计将进一步优化代理工作流程。
对于投资者来说,NVIDIA 对代理 AI 的关注代表了一条利润丰厚的增长道路。截至 2026 年 6 月 12 日,该公司股价为 205.19 美元,反映出对其推动下一波人工智能创新浪潮的能力的信心。由于代理 AI 市场仍处于早期阶段,NVIDIA 的综合堆栈使其能够充分利用企业和云提供商不断增长的需求。
随着企业越来越多地采用人工智能代理来进行编码和其他自主任务,像 AA-AgentPerf 这样的基准对于塑造行业对性能和效率的理解将变得至关重要。 NVIDIA 在这方面的领导地位确保其始终处于这个快速发展的领域的最前沿。
