AI 数据中心永远不够用？半导体史上最大 IPO 背后：Cerebras CEO 揭秘 AI 芯片军备竞赛的真相与未来

一句话看懂：AI 芯片公司 Cerebras 于 2026 年 5 月完成半导体史上最大 IPO，融资超 55 亿美元。其 CEO Andrew Feldman 在访谈中核心观点是：AI 基础设施需求远超供给，并非泡沫；算力短缺将持续，HBM 内存是关键瓶颈；而推理速度将直接定义产品价值。

事件核心：发生了什么

Cerebras 以颠覆性的晶圆级芯片（Wafer-Scale Engine）闻名，此次 IPO 以 185 美元开盘、收于 311 美元。Feldman 在访谈中分享了多个关键判断：OpenAI 领先的核心原因在于 Sam Altman 提前一两年锁定算力与电力；当前 HBM 内存仅由三星、美光、SK 海力士供应，价格已涨四五倍，美光毛利率达 80%-85%，短缺难以在几年内缓解；Cerebras 因不使用 HBM 而采用片上 SRAM，具备结构性成本与供应优势。

为什么重要

Feldman 的观点直接挑战了市场对 AI 泡沫的普遍担忧。他指出历史上泡沫是基建超前于需求，而当前“需求远超供给”的局面恰恰相反。此外，他认为云计算市场正在分层：AWS、Azure 的合规与全栈生态对多数企业仍有价值，但对于只需低价算力的细分市场，其附加服务反而成为成本，市场会自然分化。在推理速度方面，他认为“速度就是产品”，Cerebras 的 token 输出速度比竞争对手快 15 倍，且差距会扩大，行业不会走向单纯的价格战。

对用户/开发者/创作者的影响

对开发者和企业用户而言，推理速度的提升意味着更流畅的 AI 体验，复杂问题的解决时间有望大幅缩短，而非停留在简单的文字生成。对于企业采购，HBM 的持续短缺和价格高企将推高使用 NVIDIA 等 GPU 的算力成本，开发者可能需要更多关注非 HBM 架构（如 Cerebras）或开源模型（如中国的 Kimi K2、DeepSeek、千问等）的落地成本。Feldman 还特别指出，企业 AI 落地当前最大阻力来自安全与法务部门，他们因缺乏合同先例而倾向拒绝新技术，这需要行业形成共识与标准。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Cerebras 上市后获得公开市场融资，其能否利用资金扩大产能并赢得更多大客户（如 OpenAI 的巨型订单），是验证其差异化路线能否规模化落地的关键。第二，HBM 产能扩张需新建 40 亿美元工厂并耗时五年，短期内短缺难以缓解，这将持续影响 GPU 供应和定价，开发者在选择模型部署方案时需关注成本变化。第三，中国开源模型进步显著，但闭源前沿模型仍领先，未来可能形成“前沿闭源+开源降本”的混合模式，影响企业技术选型和开发者生态。

来源：Readhub · AI

AI 数据中心永远不够用？半导体史上最大 IPO 背后：Cerebras CEO 揭秘 AI 芯片军备竞赛的真相与未来