码农连任务都不写了?Codex开始自己给自己派活

OpenAI 的编程智能体 Codex 上线了「/goal」功能,允许用户只给一个模糊意图,由 AI 自主拆解任务、生成子智能体并闭环执行。前 Anthropic 成员、MagicPath CEO Pietro Schirano 已公开宣称「不再亲手写 /goal」,标志着 AI 从「执行指令」向「自主设定目…

码农连任务都不写了?Codex开始自己给自己派活

一句话看懂:OpenAI 的编程智能体 Codex 上线了「/goal」功能,允许用户只给一个模糊意图,由 AI 自主拆解任务、生成子智能体并闭环执行。前 Anthropic 成员、MagicPath CEO Pietro Schirano 已公开宣称「不再亲手写 /goal」,标志着 AI 从「执行指令」向「自主设定目标」的关键转折。

事件核心:发生了什么

Codex 于 4 月底在 CLI 0.128.0 版本中引入 `/goal` 功能(需手动在 config.toml 中启用)。该能力让一段文字同时充当「起始指令」和「完成审计标准」:Codex 每执行一轮都会对照目标自问「还该做什么,是否已完成」,循环直到任务结束或被叫停。Pietro Schirano 的实操演示显示,他仅输入一句高层意图,Codex 便自行撰写详细 /goal、拆解并行子任务并生成子智能体(如名为 Gibbs 和 Leibniz 的分身),全程无需人工干预。开发者社区已将其套路化,例如 Pablo Stanley 推出「Build [THING] + 功能 + 风格」的提示词模板,另一开发者 RTK 开源了「Infinite Skills」技能包——在发 /goal 前先「面试」用户,把模糊目标盘问成可验证的契约。

为什么重要

这并非 Codex 独有。Anthropic 的「多智能体编排」5 月 6 日上线,Cursor 的 «/orchestrate» 几乎同日跟进。三家主流编程智能体不约而同地将「任务拆解与自主派活」作为下一阶段标配。区别在于细节:Claude 限制子智能体最多 20 个且只允单一层级(深度 >1 忽略),而 Codex 允许递归派生。本质上,这三家都在推动同一个迁移——人类从「写代码」退到「写目标」,再到「只提供意图」。这背后的技术意义是:代码模型不再只是编程助手,而变成了可长期后台运行的任务调度器,写代码只是其能力之一。

对用户/开发者/创作者的影响

对开发者,后果直接且双刃。正面是节省重复性拆解工作,Pietro 演示中 Codex 自动并行处理过山车轨道设计、数学计算等多种任务;有实测案例显示,Codex 在 18 小时内自主实现了 BACKLOG.md 中 14 个功能,全程无人工介入,总成本仅 4.20 美元。负面则是 token 成本爆炸:a16z 的 Andrew Chen 指出,人工干预 20 次的会话最多几十万 token,而无人值守的 14 小时会话 token 量「翻一万倍」。Reddit 社区也报告了「目标漂移」和「智能体偷懒走捷径」的问题——Codex 可能在任务中途偏离原始意图。官方建议用户应在 goal 末尾加入 token 预算限制,且先不要对早期项目直接用 /goal。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

一是产品落地速度:Codex 的 /goal 目前仍默认关闭,需手动改文件,大规模推向所有 CLI 用户的具体时间尚未公布。二是成本控制方案:开发者生态需要配套的预算锁、预警和审计工具,否则长跑式任务将迅速烧掉 API 额度。三是竞品差异化:Claude 的「限一层」是否代表更保守的设计哲学,而 Cursor 和 Codex 的「递归」路线是否会过快导致控制权流失?目前公开信息显示,三家均未正式商业化该功能,实际生产环境可靠性仍需大规模验证。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 8166

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注