Token 工厂智启未来，2026 智算基础设施创新大会在杭州萧山开幕

一句话看懂：2026年首届智算基础设施创新大会在杭州萧山召开，核心议题从“谁拥有算力”转向“谁高效生产Token”。大会发布《2026 Token工厂生态图谱》，并披露了中国日均Token调用量两年增长超千倍至140万亿的关键数据，标志着AI基础设施正加速从训练转向推理。

事件核心：发生了什么

5月14日，由萧山区政府指导、浙江大学计算机创新技术研究院等机构主办的“2026智算基础设施创新大会”在杭州萧山开幕。大会主题为“Token工厂智启未来”，设智算基建、智算生态、产业链接三大专题。现场发布了《2026 Token工厂生态图谱》，系统梳理了能源层、算力层、模型层、数据层、调度运营层和Agent应用层六层生态结构。数据显示，中国日均Token调用量从2024年的1000亿跃升至2026年3月的140万亿，两年增长超千倍，且应用端需求量已超过美国。大会还举办了“浙江大学上海高等研究院-超会联”算力优化联合创新实验室签约，以及OWS Global与国讯信息的全球算力战略合作签约。

为什么重要

这次会议释放了一个明确信号：AI算力的竞争焦点正在从“多少张GPU”转向“每张GPU能稳定产出多少Token”。随着推理需求快速超过训练需求，基础设施的瓶颈从训练时的AllReduce集合通信，转向推理时的低延迟传输与KV Cache高效管理。创业邦创始人南立新在大会上指出，目前生态层投资严重不足，调度运营与数据服务层被低估，而中美竞争的核心在于基础设施而非应用。萧山湘湖发布了“芯机社区”200万方产业空间规划，并推出全国首个视觉智能专项政策和30亿元视谷基金，试图以地方政府力量加速国产算力产业链协同。

对用户/开发者/创作者的影响

对开发者：CPU不再只是调度角色，AMD和英特尔均在大会上强调，Agentic AI正推动CPU重回算力核心。开发者未来需关注异构计算架构，尤其是CPU+GPU+存储集群的三并行格局，以及KV Cache压缩、CXL内存池化等新调度技术。
对企业IT采购：评估算力系统时应采用“六力模型”（算力、存力、运力、电力、液冷能力、模型力），而非只看GPU规格。超会联推出的CE11-128N数据中心交换机已支持128×400G全线速端口与SONiC系统，适合高密度GPU集群。
对创作者和应用方：Token成本下降将直接推动Agent应用落地。但需注意，当前调度层和数据处理层投资不足，跨境算力流转面临物理网络鸿沟和合规性挑战。

值得关注的后续

1. “算力优化联合创新实验室”的SONiC交换机系统研发和容器化架构优化成果是否会在2026年下半年规模化落地；2. 《Token工厂生态图谱》是否会像Gartner技术曲线一样成为行业标准参考，以及其调度运营层是否会迎来新融资；3. 国产软件栈能否在真实万卡集群场景中完成“统一、开放、成熟”的跨越，特别是壁仞科技提出的“光互连GPU超节点”方案是否进入实际部署阶段。

来源：Readhub · AI

Token 工厂智启未来，2026 智算基础设施创新大会在杭州萧山开幕