![[程序员] codex 最近 2 天巨卡, 思考 5 分钟](https://www.chat-gpts.plus/wp-content/uploads/2026/05/ai_cover_5-728.jpg)
[程序员] codex 最近 2 天巨卡, 思考 5 分钟
一句话看懂:据 V2EX 用户反馈,OpenAI 旗下的图像生成与编程模型 Codex 在近两天出现严重卡顿、思考时间长达 5 分钟、甚至 502 错误等问题,同时伴有“降智”现象,大量用户转向备用模型,表明大模型大规模推理时算力瓶颈已经显现。
事件核心:发生了什么
从上周日开始(即 2026 年 5 月 24 日前后),Codex 服务稳定性骤降。直连用户反映文字产出变为“一个字一个字往外蹦”,而通过中转服务 sub2api 时,模型“思考”过程直接卡住长达 5 分钟,且时好时坏。有用户在办公室遭遇降智(模型回答质量明显下降),回到家庭网络后恢复正常,暗示问题与节点负载或网络链路高度相关。多名用户表示收到了 502 Bad Gateway 报错,且一次性消耗 token 的额度(limit)比以往更频繁出现。与此同时,部分用户已切换至 GPT-5.3-codex 等备用模型,官方论坛社区也已出现关于 GPT-5.5 版本降质的集中投诉。
为什么重要
这一现象暴露了当前主流闭源大模型在推理阶段算力供给的脆弱性。Codex 作为面向开发者和创意工作者的专用模型,被重度用户用于持续生成代码、图像或多轮交互,其卡顿和降智直接反映了 OpenAI 在承载高并发实时推理时算力资源的不足。用户猜测的“算力来回转让”、“额度重置节奏加快”本质上是模型提供商在有限 GPU 集群下动态分配资源的策略。这与传统 API 服务不同:模型推理不是静态带宽,而是高计算成本的计算资源竞争。目前公开信息显示,OpenAI 尚未正式回应此问题,但信任与用户体验的损害已经开始。
对用户/开发者/创作者的影响
对重度使用者而言,依赖单个模型存在明显风险:工作流可能因 5 分钟的“思考”而中断。用户必须准备备用模型(如 GPT-5.3、DeepSeek),或使用支持负载均衡的中转服务。对开发者来说,token 消耗速度的异常加快意味着实际使用成本可能超出预算,且限流阈值不可预测。对于内容创作者来说,图像生成任务(Codex 可支持视觉创作)卡顿将导致创作流程中断。综合来看,这次事件提醒所有依赖闭源模型 API 的团队:应该将“模型降智”或“服务不可用”纳入产品应急预案,并保持可切换的备选模型方案。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,OpenAI 是否会像过往一样快速修复该问题,还是转向通过限制用量或提价来缓解算力压力。第二,这一事件是否会加速开发者对开源模型(如 DeepSeek 等)的迁移,毕竟开源模型可在本地部署,不受中央算力调配影响。第三,社区对模型“降智”和“额度异常”的情绪是否会带来更广泛的质量监管讨论,甚至推动模型性能透明化的要求。


