高通 CEO 安蒙：AI 词元需求至 2030 年将增长 40 倍

一句话看懂：高通 CEO 安蒙在 Computex 2026 上预测，到 2030 年全球 AI 词元生成总量将飙升至目前的 40 倍，同时发布了面向数据中心的定制 AI 推理芯片品牌“Dragonfly”，试图从低功耗计算优势切入算力市场。

事件核心：发生了什么

安蒙在主题演讲中明确提出，2026 年是“智能体之年”，AI 将从被动响应指令的工具进化为能自主规划、推理和执行的智能伙伴。当前全球 AI 词元生成量约为 317 亿个/10 秒，到 2030 年这一数字预计将增至约 1.27 万亿个/10 秒，增幅近 40 倍。面对指数级增长的推理算力需求，高通提出“计算连续体”战略，即构建覆盖从耳机内不足 2 毫瓦到数据中心千瓦级系统的完整算力光谱，让智能体根据成本、功耗、延迟和隐私需求，动态选择在终端、边缘或云端执行任务。此外，高通还宣布推出数据中心产品新品牌“Dragonfly”，其定制 AI 推理芯片聚焦数据中心推理场景，与英伟达主导的训练市场形成差异化竞争，预计年内实现首批出货。

为什么重要

这一预测揭示了 AI 行业从“训练竞赛”转向“推理普及”的关键路径。安蒙明确指出，现有设备大多围绕“用户主动操作”设计，而智能体需要持续在后台运行、保留上下文并跨系统协调任务，这对 CPU、NPU 和 GPU 的协同设计提出全新要求。高通在移动领域积累的低功耗计算能力，正成为其在智能体时代最核心的竞争优势。通过“计算连续体”战略，高通试图将移动时代的每瓦性能优势渗透到从手机、汽车到机器人和数据中心的每一个计算角落，从而在与英伟达、英特尔等对手的竞争中开辟独特的生态位。

对用户/开发者/创作者的影响

对普通用户而言，智能体将不再依赖云端集中算力，终端设备（如手机、PC）的 AI 处理能力将显著提升，设备可以在本地完成更多推理任务，从而降低延迟并增强隐私保护。对开发者来说，安蒙强调的“计算连续体”意味着应用开发需考虑动态算力调度——同一智能体可能部分在终端执行、部分在云端协同；高通推出的 Dragonwing IQ10 参考设计（最高 700 TOPS AI 性能）和骁龙 C 平台（面向 300 美元以上入门级 AI PC），为机器人、工业自动化和 AI PC 生态提供了明确的硬件参考。对创作者而言，推理算力的爆发式增长意味着图像生成、视频编辑等创意工具将能在更多设备上实时运行，且成本可能随能效提升而下降。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

一是 Dragonfly 定制 AI 推理芯片的详细路线图，高通计划在 6 月 24 日投资者日公布，需观察其性能指标、功耗表现以及与头部的云厂商合作落地情况。二是 Windows on Arm 生态的拓展速度，高通正通过骁龙 C 平台将 AI PC 推向 300 美元以上市场，需关注 OEM 厂商的跟进频率和首批产品的实际体验。三是高通在汽车电子领域已连续多个季度保持 38% 以上同比增长，座舱与辅助驾驶平台获得理想、零跑、蔚来等多家车企业量产项目，汽车端智能体落地进度将直接影响“计算连续体”战略的完整性。

来源：Readhub · AI

高通 CEO 安蒙：AI 词元需求至 2030 年将增长 40 倍