
高通 CEO 安蒙:AI 词元需求至 2030 年将增长 40 倍
一句话看懂:高通 CEO 安蒙在 Computex 2026 上预测,到 2030 年全球 AI 词元生成总量将飙升至目前的 40 倍,同时发布了面向数据中心的定制 AI 推理芯片品牌“Dragonfly”,试图从低功耗计算优势切入算力市场。
事件核心:发生了什么
安蒙在主题演讲中明确提出,2026 年是“智能体之年”,AI 将从被动响应指令的工具进化为能自主规划、推理和执行的智能伙伴。当前全球 AI 词元生成量约为 317 亿个/10 秒,到 2030 年这一数字预计将增至约 1.27 万亿个/10 秒,增幅近 40 倍。面对指数级增长的推理算力需求,高通提出“计算连续体”战略,即构建覆盖从耳机内不足 2 毫瓦到数据中心千瓦级系统的完整算力光谱,让智能体根据成本、功耗、延迟和隐私需求,动态选择在终端、边缘或云端执行任务。此外,高通还宣布推出数据中心产品新品牌“Dragonfly”,其定制 AI 推理芯片聚焦数据中心推理场景,与英伟达主导的训练市场形成差异化竞争,预计年内实现首批出货。
为什么重要
这一预测揭示了 AI 行业从“训练竞赛”转向“推理普及”的关键路径。安蒙明确指出,现有设备大多围绕“用户主动操作”设计,而智能体需要持续在后台运行、保留上下文并跨系统协调任务,这对 CPU、NPU 和 GPU 的协同设计提出全新要求。高通在移动领域积累的低功耗计算能力,正成为其在智能体时代最核心的竞争优势。通过“计算连续体”战略,高通试图将移动时代的每瓦性能优势渗透到从手机、汽车到机器人和数据中心的每一个计算角落,从而在与英伟达、英特尔等对手的竞争中开辟独特的生态位。
对用户/开发者/创作者的影响
对普通用户而言,智能体将不再依赖云端集中算力,终端设备(如手机、PC)的 AI 处理能力将显著提升,设备可以在本地完成更多推理任务,从而降低延迟并增强隐私保护。对开发者来说,安蒙强调的“计算连续体”意味着应用开发需考虑动态算力调度——同一智能体可能部分在终端执行、部分在云端协同;高通推出的 Dragonwing IQ10 参考设计(最高 700 TOPS AI 性能)和骁龙 C 平台(面向 300 美元以上入门级 AI PC),为机器人、工业自动化和 AI PC 生态提供了明确的硬件参考。对创作者而言,推理算力的爆发式增长意味着图像生成、视频编辑等创意工具将能在更多设备上实时运行,且成本可能随能效提升而下降。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
一是 Dragonfly 定制 AI 推理芯片的详细路线图,高通计划在 6 月 24 日投资者日公布,需观察其性能指标、功耗表现以及与头部的云厂商合作落地情况。二是 Windows on Arm 生态的拓展速度,高通正通过骁龙 C 平台将 AI PC 推向 300 美元以上市场,需关注 OEM 厂商的跟进频率和首批产品的实际体验。三是高通在汽车电子领域已连续多个季度保持 38% 以上同比增长,座舱与辅助驾驶平台获得理想、零跑、蔚来等多家车企业量产项目,汽车端智能体落地进度将直接影响“计算连续体”战略的完整性。
来源:Readhub · AI


