
一句话看懂:在 2026 北京智源大会上,面壁智能联合创始人兼 CEO 李大海提出,大模型技术演进将分化为“端侧”与“云侧”两条路径——端侧 AI 在受限硬件上运行,追求无处不在;云侧 AI 调用海量算力,追求无所不知。这一定位揭示了当前大模型落地的重要分化方向。
事件核心:发生了什么
6 月 12 日,在第八届北京智源大会上,李大海公开表示,端侧 AI 与云侧 AI 将成为大模型发展的两条主要路线。他指出,端侧 AI 必须穿透“体积受限、算力受限、能耗受限”三大物理限制,才能真正做到无处不在。为此,面壁智能正通过极小参数量模型逼近超大模型效果,并率先落地“AI 训练 AI”等技术框架,加速端侧 AI 发展。李大海还强调,苹果已发布其智能终端模型,SpaceX、特斯拉和谷歌等公司也在重资源投入推动端侧生态,面壁智能希望跟随这些伙伴向行业交付更多有用、好用的产品。
为什么重要
李大海的观点与当前 AI 行业从“参数竞赛”转向“场景落地”的趋势高度吻合。过去两年,产业焦点集中于云侧大模型,追求参数量与推理能力的极致。但随着终端设备(手机、汽车、IoT)对实时性、隐私性和低功耗的需求激增,端侧模型成为新的竞争高地。苹果、特斯拉等巨头的押注已表明,端侧 AI 不再仅是“小模型”,而是通过架构创新在有限资源下实现高质量推理的独立技术路线。面壁智能的定位——用极小参数实现接近超大规模模型效果——代表了一种务实的商业化思路:不盲目追求“更大”,而是追求“更巧”。这直接挑战了传统“大模型等于云端”的行业惯性,可能推动更多公司重新评估端侧部署的优先级。
对用户/开发者/创作者的影响
对于普通消费者:端侧 AI 意味着手机、手表、汽车等本地设备将拥有更聪明、更私密的智能助手,无需联网即可完成复杂任务,响应更快且数据不出设备。对开发者:需要开始关注端侧推理框架的兼容性与模型压缩技术,面壁智能等公司提供的“极小参数量”模型可能成为新标配,降低本地部署成本。对内容创作者:端侧 AI 在图像生成、实时语音翻译等场景中可提供更流畅的离线体验,但当前效果可能仍受限于算力,创作者需评估具体工具是否满足质量要求。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 产品落地验证:面壁智能的“极小参数量”模型能否在消费级硬件(如手机 SoC、车机芯片)上跑通且体验过关?苹果等巨头的终端产品发布后,实际性能将成为重要参照。2. 开发者生态建设:端侧模型需要配套的 SDK、API 和文档支持,面壁智能是否计划提供开放工具链以吸引第三方开发者?3. 商业定价与开源策略:如果端侧模型成本显著低于云端推理,可能催生新的按需计费模式或开源社区版本,影响企业采购决策。
来源:Readhub · AI


