苹果渴求的端侧 AI 杀出黑马：首个认知模型诞生，4B 打平 GPT-5.4！

一句话看懂：一家中国 AI 公司“明日新程”（Nextie）推出了名为“新程 Alpha”的 4B 参数端侧认知模型，在群体智能任务中效果与 GPT-5.4 等千亿级模型持平。这标志着行业开始从“堆参数”转向“减知识、留认知”的技术路径，可能显著降低 AI 推理的算力成本和门槛。

事件核心：发生了什么

明日新程发布了行业首个被定义为“认知模型”的产品——新程 Alpha。该模型仅有 4B 参数，但通过将知识记忆与认知能力解耦，强化泛化和抽象思考能力，在辩论、反思、投票等多智能体群体智能任务中，输出质量可对标千亿参数级别的大模型。更重要的是，该模型支持端侧部署，可直接在 MacBook 或具身智能设备上运行，实现 24 小时不间断、低成本的推理。此前，Andrej Karpathy 在访谈中曾预言将模型知识剥离后，仅保留 1B 参数的“认知核心”即可实现高效类人思考。今日新程 Alpha 的落地，意味着这一方向从理论走向了产品。

为什么重要

此次事件对 AI 行业有双重结构意义。第一，算力成本正在成为 AI 大规模商业化的硬约束。亚马逊内部因算力开销飙升而关停 AI 排行榜，部分公司单日推理成本已达亿元量级。新程 Alpha 用 4B 参数打平千亿效果，直接改变了 GPU 成本营收比（GPU Cost / Revenue）这一关键指标，使得模型部署的经济模型从“烧算力”转向“烧电力”。第二，它解锁了“主动式”（Proactive）智能体场景。在传统响应式模式下，每触发一次推理消耗一次 Token，而端侧认知模型能 24 小时自主决策，无需用户命令，使机器人、家庭助理等应用的商业可行性大幅提升。OpenAI 近期投资的多智能体公司 Isara 估值已达 6.5 亿美元，侧面验证了这一赛道的价值。

对用户/开发者/创作者的影响

对于开发者：降低了构建复杂 AI 应用的算力门槛。开发者可以利用新程 Alpha 在端侧运行多智能体协同系统（如 Harness 决策框架），无需依赖昂贵云端 API，适合打造低成本、低延迟的家居或具身智能产品。对于企业采购决策者：此前因高频 Token 消耗而搁置的主动式智能体方案（如 7×24 小时客服、无人巡检）可能重新进入预算考虑。4B 模型带来的推断成本量级缩减，使“用 AI 替代人力”在财务模型上更具说服力。对于创作者：目前公开信息显示，该模型尚未面向普通消费者发布，但如果未来开放 API 或本地部署，创作者可借助其认知推理能力提升视频脚本的逻辑性、游戏 NPC 的自主决策质量等。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 产品落地节奏：新程 Alpha 目前仅披露了群体智能任务中的效果，具体商业化产品（如 API 定价、SDK 支持）尚未公开，需关注其是否会在近期开放给开发者社区。2. 参数扩展路径：明日新程团队正在训练 8B 版本，若 4B 已对标 GPT-5.4，8B 的能力边界可能进一步挤压千亿模型在部分场景的应用，需关注其后续评测数据。3. 行业跟进：Karpathy 的“认知核心”方向已获验证，苹果、谷歌等公司是否会在端侧模型上跟进类似设计，并影响其 Siri 或 Gemini Nano 的产品路线，是衡量该路线市场规模的关键信号。

来源：Readhub · AI

苹果渴求的端侧 AI 杀出黑马：首个认知模型诞生，4B 打平 GPT-5.4！