
一句话看懂:OpenAI 发布了专用于网络安全的“满血版”GPT-5.5-Cyber 模型和 Codex Security 插件,旨在大规模自动修复漏洞。但几乎同一时间,Codex 被曝出存在一个导致 SSD 硬盘被快速写入数据、可能一年内烧穿硬盘的严重日志 Bug,引发开发者广泛关注。
事件核心:发生了什么
北京时间 6 月 14 日,OpenAI 正式发布 GPT-5.5-Cyber(完整版),这是其迄今最强的网络安全专用模型。在 CyberGym 基准测试中,该模型获得 85.6% 的高分,超过普通版 GPT-5.5(81.8%)和 Claude Opus 4.7(73.1%)。同期发布的还有集成到 Codex 工作流中的 Codex Security 插件,可提供开箱即用的漏洞扫描、威胁建模、攻击路径追踪和自动补丁生成。OpenAI 同时宣布启动“修补地球”(Patch the Planet)计划,首批已有 cURL、Go、Python 等 30 多个开源项目加入。然而,就在同一天,有 GitHub 开发者披露,Codex 在流式传输和长任务运行中,会以约 5MB/s(峰值 16MB/s)的速度向本地 SQLite 日志文件疯狂写入 TRACE 日志,预计一年写入量达 640TB,足以在一年内耗尽一块消费级 SSD 的写入寿命。该问题自今年 4 月已在 GitHub 上多轮反馈,OpenAI 研究员随后回应称已修复并建议用户升级至最新版本。
为什么重要
这次事件凸显了 AI 安全能力的两面性。一方面,GPT-5.5-Cyber 在漏洞追踪、补丁生成等任务上大幅超越对手,显示出专用模型在特定领域(如网络安全)的巨大潜力,可能改变漏洞修复的效率和规模——从人海战术转向机器速度。另一方面,Codex 日志问题暴露了 AI 原生工具在运行时可能产生的“次级破坏”:一款声称修补地球安全的产品,自身却可能烧毁开发者的硬件。这不仅影响产品信誉,也提醒行业:AI 系统在带来安全收益的同时,其底层设计(如日志策略)必须经受住生产环境的严苛考验。OpenAI 的“破晓”战略,即把模型能力通过 Cisco、CrowdStrike 等近 30 家安全合作伙伴输送给组织,也因这一事故面临信任挑战。
对用户/开发者/创作者的影响
对使用 Codex 的开发者而言,需要立即检查本地 ~/.codex/logs_2.sqlite 日志文件的写入行为,并尽快通过 npm 或 bash 安装脚本升级至最新 Codex 版本,以修复该日志 Bug。长期来看,在开发环境中使用 AI 代码助手时,建议定期监控磁盘 I/O 和 SSD 健康状况,避免因后台写入导致硬件寿命缩短。对于企业采购者,评估 Codex Security 插件时不仅应关注其安全能力,还需将其运行时资源消耗(如日志写入量)纳入部署规划。对 AI 行业观察者而言,这是一个典型的“工具背叛使用意图”案例:技术的副作用可能以意想不到的方式反噬其使用者。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
三个观察点值得跟进:第一,OpenAI 是否真的彻底修复了日志写入问题,后续是否会引入更精细的日志分级或用户可控的日志写入策略;第二,“修补地球”计划中,首批 30 多个开源项目(如 cURL、Go、Python)的实际补丁质量人工验证率如何,能否解决低质量误报问题;第三,竞争对手(如 Anthropic)是否会借此事件主张其模型在“负责任开发”上的优势,或加速推出类似的网络安全专用模型。
来源:36氪 · 24小时热榜
![[Bug]: RPC call to sample_tokens timed out. Qwen3.5-397B-A17B](https://www.chat-gpts.plus/wp-content/uploads/2026/06/35496-ef53c44d-768x403.jpg)

