阿里发布“真武M890”128卡超节点服务器，百纳秒级时延助力Agentic时代

一句话看懂：阿里云在2026年峰会上正式推出基于自研“真武M890”芯片的128卡超节点服务器，通过专用互联芯片实现百纳秒级通信延迟，面向大规模Agent并发推理和大模型训练场景，试图解决AI Agent时代带来的极致算力挑战。

事件核心：发生了什么

在2026年阿里云峰会上，阿里云正式发布了基于旗下平头哥自研AI芯片“真武M890”的128卡超节点服务器。该服务器采用了平头哥自研的ICN Switch1.0互联芯片，使芯片间的通信延迟达到百纳秒级别。通过创新的超节点架构，系统成功将128颗AI芯片整合为一台高效协作的超级计算机。阿里云明确表示，该服务器旨在应对Agentic（智能体）时代带来的极致算力需求，未来将重点服务于海量Agent并发推理和大模型训练等核心业务场景。

为什么重要

目前公开信息显示，随着AI大模型从训练阶段逐步走向大规模推理和Agent落地，算力瓶颈正在从“单卡算力”转向“多卡通信效率”。传统服务器在多卡互联时的通信延迟往往成为制约整体性能的瓶颈，尤其在大规模Agent并发推理场景中，频繁的芯片间数据交换对延迟极为敏感。阿里这次推出的128卡超节点，通过自研互连芯片将通信延迟压至百纳秒级，意味着在大规模并行计算环境中，单次通信的等待时间极短，理论上可以支持更大规模、更低延迟的Agent集群调用。这也是阿里在自研芯片、自研互联和系统级架构三个维度上同时发力的信号，对国内AI算力生态的自主化和商业化落地具有指标意义。

对用户/开发者/创作者的影响

对于开发者和AI应用厂商而言，如果这款服务器正式进入商用，意味着部署大规模Agent集群时，可以在相同物理空间内获得更低的延迟和更高的吞吐量，从而降低Agent应用的响应延迟和维护复杂度。目前Agent类应用（如多轮对话、工具链调用、代码自动生成等）对实时性和并发能力要求很高，百纳秒级时延的算力平台可能使这类应用的体验和可靠性得到明显提升。对于普通用户和内容创作者，这类底层硬件的变化通常不直接感知，但会间接体现在AI产品的响应速度和容量提升上，例如更少的排队等待和更稳定的服务。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，真武M890及其超节点服务器的具体商用时间表和客户开放计划，阿里云目前尚未公布详细信息。第二，国际竞品如NVIDIA的NVLink等高性能互联方案已经迭代多年，阿里自研互联方案的实际性能数据和Benchmark对比值得关注。第三，该服务器对现有阿里云用户是否以API或实例形式提供、定价策略如何，将直接影响中小开发者和企业的使用门槛。

来源：AIbase

阿里发布“真武M890”128卡超节点服务器，百纳秒级时延助力Agentic时代