
苹果渴求的端侧 AI 杀出黑马:首个认知模型诞生,4B 打平 GPT-5.4!
一句话看懂:一家中国 AI 公司“明日新程”(Nextie)推出了名为“新程 Alpha”的 4B 参数端侧认知模型,在群体智能任务中效果与 GPT-5.4 等千亿级模型持平。这标志着行业开始从“堆参数”转向“减知识、留认知”的技术路径,可能显著降低 AI 推理的算力成本和门槛。
事件核心:发生了什么
明日新程发布了行业首个被定义为“认知模型”的产品——新程 Alpha。该模型仅有 4B 参数,但通过将知识记忆与认知能力解耦,强化泛化和抽象思考能力,在辩论、反思、投票等多智能体群体智能任务中,输出质量可对标千亿参数级别的大模型。更重要的是,该模型支持端侧部署,可直接在 MacBook 或具身智能设备上运行,实现 24 小时不间断、低成本的推理。此前,Andrej Karpathy 在访谈中曾预言将模型知识剥离后,仅保留 1B 参数的“认知核心”即可实现高效类人思考。今日新程 Alpha 的落地,意味着这一方向从理论走向了产品。
为什么重要
此次事件对 AI 行业有双重结构意义。第一,算力成本正在成为 AI 大规模商业化的硬约束。亚马逊内部因算力开销飙升而关停 AI 排行榜,部分公司单日推理成本已达亿元量级。新程 Alpha 用 4B 参数打平千亿效果,直接改变了 GPU 成本营收比(GPU Cost / Revenue)这一关键指标,使得模型部署的经济模型从“烧算力”转向“烧电力”。第二,它解锁了“主动式”(Proactive)智能体场景。在传统响应式模式下,每触发一次推理消耗一次 Token,而端侧认知模型能 24 小时自主决策,无需用户命令,使机器人、家庭助理等应用的商业可行性大幅提升。OpenAI 近期投资的多智能体公司 Isara 估值已达 6.5 亿美元,侧面验证了这一赛道的价值。
对用户/开发者/创作者的影响
对于开发者:降低了构建复杂 AI 应用的算力门槛。开发者可以利用新程 Alpha 在端侧运行多智能体协同系统(如 Harness 决策框架),无需依赖昂贵云端 API,适合打造低成本、低延迟的家居或具身智能产品。对于企业采购决策者:此前因高频 Token 消耗而搁置的主动式智能体方案(如 7×24 小时客服、无人巡检)可能重新进入预算考虑。4B 模型带来的推断成本量级缩减,使“用 AI 替代人力”在财务模型上更具说服力。对于创作者:目前公开信息显示,该模型尚未面向普通消费者发布,但如果未来开放 API 或本地部署,创作者可借助其认知推理能力提升视频脚本的逻辑性、游戏 NPC 的自主决策质量等。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 产品落地节奏:新程 Alpha 目前仅披露了群体智能任务中的效果,具体商业化产品(如 API 定价、SDK 支持)尚未公开,需关注其是否会在近期开放给开发者社区。2. 参数扩展路径:明日新程团队正在训练 8B 版本,若 4B 已对标 GPT-5.4,8B 的能力边界可能进一步挤压千亿模型在部分场景的应用,需关注其后续评测数据。3. 行业跟进:Karpathy 的“认知核心”方向已获验证,苹果、谷歌等公司是否会在端侧模型上跟进类似设计,并影响其 Siri 或 Gemini Nano 的产品路线,是衡量该路线市场规模的关键信号。
来源:Readhub · AI


