
Token 工厂智启未来,2026 智算基础设施创新大会在杭州萧山开幕
一句话看懂:2026年首届智算基础设施创新大会在杭州萧山召开,核心议题从“谁拥有算力”转向“谁高效生产Token”。大会发布《2026 Token工厂生态图谱》,并披露了中国日均Token调用量两年增长超千倍至140万亿的关键数据,标志着AI基础设施正加速从训练转向推理。
事件核心:发生了什么
5月14日,由萧山区政府指导、浙江大学计算机创新技术研究院等机构主办的“2026智算基础设施创新大会”在杭州萧山开幕。大会主题为“Token工厂 智启未来”,设智算基建、智算生态、产业链接三大专题。现场发布了《2026 Token工厂生态图谱》,系统梳理了能源层、算力层、模型层、数据层、调度运营层和Agent应用层六层生态结构。数据显示,中国日均Token调用量从2024年的1000亿跃升至2026年3月的140万亿,两年增长超千倍,且应用端需求量已超过美国。大会还举办了“浙江大学上海高等研究院-超会联”算力优化联合创新实验室签约,以及OWS Global与国讯信息的全球算力战略合作签约。
为什么重要
这次会议释放了一个明确信号:AI算力的竞争焦点正在从“多少张GPU”转向“每张GPU能稳定产出多少Token”。随着推理需求快速超过训练需求,基础设施的瓶颈从训练时的AllReduce集合通信,转向推理时的低延迟传输与KV Cache高效管理。创业邦创始人南立新在大会上指出,目前生态层投资严重不足,调度运营与数据服务层被低估,而中美竞争的核心在于基础设施而非应用。萧山湘湖发布了“芯机社区”200万方产业空间规划,并推出全国首个视觉智能专项政策和30亿元视谷基金,试图以地方政府力量加速国产算力产业链协同。
对用户/开发者/创作者的影响
对开发者:CPU不再只是调度角色,AMD和英特尔均在大会上强调,Agentic AI正推动CPU重回算力核心。开发者未来需关注异构计算架构,尤其是CPU+GPU+存储集群的三并行格局,以及KV Cache压缩、CXL内存池化等新调度技术。
对企业IT采购:评估算力系统时应采用“六力模型”(算力、存力、运力、电力、液冷能力、模型力),而非只看GPU规格。超会联推出的CE11-128N数据中心交换机已支持128×400G全线速端口与SONiC系统,适合高密度GPU集群。
对创作者和应用方:Token成本下降将直接推动Agent应用落地。但需注意,当前调度层和数据处理层投资不足,跨境算力流转面临物理网络鸿沟和合规性挑战。
值得关注的后续
1. “算力优化联合创新实验室”的SONiC交换机系统研发和容器化架构优化成果是否会在2026年下半年规模化落地;2. 《Token工厂生态图谱》是否会像Gartner技术曲线一样成为行业标准参考,以及其调度运营层是否会迎来新融资;3. 国产软件栈能否在真实万卡集群场景中完成“统一、开放、成熟”的跨越,特别是壁仞科技提出的“光互连GPU超节点”方案是否进入实际部署阶段。
来源:Readhub · AI


