[程序员] Codex 可以在 Mac 锁屏时操控电脑了

[程序员] Codex 可以在 Mac 锁屏时操控电脑了

[程序员] Codex 可以在 Mac 锁屏时操控电脑了

一句话看懂:开发者利用 OpenAI Codex 与 macOS 自动化工具联动,实现 AI 在 Mac 锁屏状态下直接执行桌面操作。这展示了大模型从“文本问答”向“系统控制”延伸的可能性,但也引发了安全性争议。

事件核心:发生了什么

据 V2EX 社区开发者分享,其通过配置让 OpenAI 的 Codex 模型能够控制 Mac 电脑的 UI 操作,即使在屏幕锁定状态下,AI 也能模拟鼠标点击、键盘输入等行为。该方案利用了 macOS 的辅助功能(Accessibility)权限和 AppleScript 脚本,将 Codex 的代码生成能力与系统级自动化结合,形成一个可运行指令的“AI 助手”。开发者公开的演示显示,AI 能直接打开浏览器、填写表单、运行终端命令,且操作全程无需解锁屏幕。

为什么重要

这一实践突破了传统 AI 助手“只能聊天、不能动手”的边界。此前 Codex、GPT-4 等模型主要被用于生成代码片段或回答问题,而此次尝试将其与系统脚本打通,意味着大模型开始直接接管底层操作系统的输入层。从行业角度看,这反映了“AI Agent”理念的加速落地——模型不再仅仅是工具,而是具备执行能力的操作主体。同时,它也暴露出当前系统安全模型的空白:锁屏状态下给予 AI 完整 GUI 控制权,是否符合用户预期的安全边界,成为软件安全领域的新命题。

对用户/开发者/创作者的影响

  • 开发者:获得了低门槛的“AI 操作桌面”技术路径,可以基于 macOS 自带工具链(如 AppleScript、Quick Actions)快速构建自动化工作流。但需警惕辅助功能权限被滥用导致的远程控制风险。
  • 普通用户:如果此类技术产品化,未来可能实现“语音/文字指令让 Mac 自动完成文件整理、邮件发送”等高频操作,无需手动点按。然而,这也意味着用户必须信任 AI 系统拥有最高操作权限,隐私泄露风险显著提升。
  • 创作者:可借助该能力实现“AI 批量处理素材、自动渲染导出”等复杂流程,尤其在 Mac 成为主要创作工具的视频、设计领域,效率提升潜力明显。

值得关注的后续

  • 安全机制是否跟进:Apple 是否会收紧辅助功能权限的调用限制,或要求 AI 操作时强制弹窗确认,将直接影响该方案的可用性和合规性。
  • 产品化进度:目前该功能仍为开发者个人项目,是否有第三方团队将其打包为“Mac 锁屏 AI 助手”应用推向市场,价格和订阅模式如何设计,是观察重点。
  • 竞品跟进:微软 Copilot 和 Google Gemini 已在 Windows/ChromeOS 上尝试类似系统级控制,此次 macOS 用例或引发跨平台 AI Agent 的军备竞赛,开源方案如 Ollama+Claude API 的组合也可能随之出现。
GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

来源:V2EX (创意工作者社区)

celebrityanime
celebrityanime
文章: 3443

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注