刚刚,Codex 大更新,你在电脑的操作正在成为AI 经验包

OpenAI 为其 Codex 客户端推出 Record&Replay 功能,允许 AI 观察并学习人类在电脑上的完整操作流程,将其打包为可复用的技能(skill),从而绕开传统 API 限制,直接通过图形界面自动化执行重复任务。这意味着人类正在从软件操作者转变为 AI 训练者。

刚刚,Codex 大更新,你在电脑的操作正在成为AI 经验包

一句话看懂:OpenAI 为其 Codex 客户端推出 Record&Replay 功能,允许 AI 观察并学习人类在电脑上的完整操作流程,将其打包为可复用的技能(skill),从而绕开传统 API 限制,直接通过图形界面自动化执行重复任务。这意味着人类正在从软件操作者转变为 AI 训练者。

事件核心:发生了什么

2026年6月19日,OpenAI 为 Codex 新增 Record&Replay 插件(目前仅支持 macOS)。用户可授权 Codex 录制自己在电脑上完成特定任务的全过程——如视频上传、报销、报表拉取等——录制结束后 Codex 会自动复盘并生成一份包含场景说明、输入要求、执行步骤和结果验证的 skill。下次使用时,用户只需在对话中调用该 skill 并传入本次的具体可变参数(如目标文件、日期范围),Codex 就会结合 Computer Use、Chrome 扩展或应用内浏览器三种底层能力灵活复现操作,甚至能自行处理缺 Python 环境等报错。录制时需注意:演示应短而完整、录前告知可变输入、切勿录入密码等敏感数据。

为什么重要

传统自动化依赖软件开放的 API,边界由厂商定义。Record&Replay 直接学习人类操作图形界面的方式,将 AI 的自动化对象从结构化接口扩展到任意桌面应用。这意味着:第一,大量“有隐性规则但说不清”的办公场景(如按个人习惯定停车位、按团队惯例配 issue)首次具备了低门槛的自动化可能;第二,Codex 本身是模型开放客户端,可对接 OpenAI、本地开源模型(Ollama/LM Studio)及第三方服务(Mistral/Azure/Amazon Bedrock),这意味着该能力并非绑定单一模型,而是可能成为跨模型的操作系统层能力;第三,它暗示一个趋势:人从“如何操作软件”转向“要完成什么任务”,教会 AI 使用工具正在成为比亲自使用更重要的技能。

对用户/开发者/创作者的影响

对普通用户,最直接的好处是能“做一遍就教会 AI”,快速摆脱报销、配置、发视频等重复劳动,但需注意当前仅限 macOS 且欧盟、英国、瑞士暂不可用。对内容创作者,该功能特别适合批量上传视频、管理元数据的场景,且学会的技能可无人值守反复执行。对开发者,Codex 提供了三条技术路径的选型指南:优先用插件或 MCP(模型上下文协议),视觉控制(Computer Use)用于覆盖结构化工具够不着的边角;同时应警惕——若团队使用 requirements.toml 统一管理 Codex,关闭 computer_use 功能会导致 Record&Replay 同步消失。对组织管理者,若需跨团队复用或捆绑多个 skill,目前公开信息显示仍需将录制能力打包为独立插件,而非停留在录制层面。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. Windows 支持何时上线?目前仅限 macOS 且首发排除欧盟/英国/瑞士,可能涉及隐私合规或地区性监管审查;2. 竞品是否跟进?Google 的 Project Mariner 及 Anthropic 的 Computer Use 均已展示类似能力,该功能可能加速行业对“AI 操作电脑”安全边界的评估;3. 技能的商业化生态?当 skill 可跨团队、跨模型复用后,是否会形成类似“AI 技能商店”的第三方市场,是值得观察的潜在变化。

来源:虎嗅 (Huxiu)

celebrityanime
celebrityanime
文章: 8769

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注