[程序员] codex 最近 2 天巨卡, 思考 5 分钟

一句话看懂：据 V2EX 用户反馈，OpenAI 旗下的图像生成与编程模型 Codex 在近两天出现严重卡顿、思考时间长达 5 分钟、甚至 502 错误等问题，同时伴有“降智”现象，大量用户转向备用模型，表明大模型大规模推理时算力瓶颈已经显现。

事件核心：发生了什么

从上周日开始（即 2026 年 5 月 24 日前后），Codex 服务稳定性骤降。直连用户反映文字产出变为“一个字一个字往外蹦”，而通过中转服务 sub2api 时，模型“思考”过程直接卡住长达 5 分钟，且时好时坏。有用户在办公室遭遇降智（模型回答质量明显下降），回到家庭网络后恢复正常，暗示问题与节点负载或网络链路高度相关。多名用户表示收到了 502 Bad Gateway 报错，且一次性消耗 token 的额度（limit）比以往更频繁出现。与此同时，部分用户已切换至 GPT-5.3-codex 等备用模型，官方论坛社区也已出现关于 GPT-5.5 版本降质的集中投诉。

为什么重要

这一现象暴露了当前主流闭源大模型在推理阶段算力供给的脆弱性。Codex 作为面向开发者和创意工作者的专用模型，被重度用户用于持续生成代码、图像或多轮交互，其卡顿和降智直接反映了 OpenAI 在承载高并发实时推理时算力资源的不足。用户猜测的“算力来回转让”、“额度重置节奏加快”本质上是模型提供商在有限 GPU 集群下动态分配资源的策略。这与传统 API 服务不同：模型推理不是静态带宽，而是高计算成本的计算资源竞争。目前公开信息显示，OpenAI 尚未正式回应此问题，但信任与用户体验的损害已经开始。

对用户/开发者/创作者的影响

对重度使用者而言，依赖单个模型存在明显风险：工作流可能因 5 分钟的“思考”而中断。用户必须准备备用模型（如 GPT-5.3、DeepSeek），或使用支持负载均衡的中转服务。对开发者来说，token 消耗速度的异常加快意味着实际使用成本可能超出预算，且限流阈值不可预测。对于内容创作者来说，图像生成任务（Codex 可支持视觉创作）卡顿将导致创作流程中断。综合来看，这次事件提醒所有依赖闭源模型 API 的团队：应该将“模型降智”或“服务不可用”纳入产品应急预案，并保持可切换的备选模型方案。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，OpenAI 是否会像过往一样快速修复该问题，还是转向通过限制用量或提价来缓解算力压力。第二，这一事件是否会加速开发者对开源模型（如 DeepSeek 等）的迁移，毕竟开源模型可在本地部署，不受中央算力调配影响。第三，社区对模型“降智”和“额度异常”的情绪是否会带来更广泛的质量监管讨论，甚至推动模型性能透明化的要求。

来源：V2EX (创意工作者社区)

[程序员] codex 最近 2 天巨卡, 思考 5 分钟