
AI 数据中心永远不够用?半导体史上最大 IPO 背后:Cerebras CEO 揭秘 AI 芯片军备竞赛的真相与未来
一句话看懂:AI 芯片公司 Cerebras 于 2026 年 5 月完成半导体史上最大 IPO,融资超 55 亿美元。其 CEO Andrew Feldman 在访谈中核心观点是:AI 基础设施需求远超供给,并非泡沫;算力短缺将持续,HBM 内存是关键瓶颈;而推理速度将直接定义产品价值。
事件核心:发生了什么
Cerebras 以颠覆性的晶圆级芯片(Wafer-Scale Engine)闻名,此次 IPO 以 185 美元开盘、收于 311 美元。Feldman 在访谈中分享了多个关键判断:OpenAI 领先的核心原因在于 Sam Altman 提前一两年锁定算力与电力;当前 HBM 内存仅由三星、美光、SK 海力士供应,价格已涨四五倍,美光毛利率达 80%-85%,短缺难以在几年内缓解;Cerebras 因不使用 HBM 而采用片上 SRAM,具备结构性成本与供应优势。
为什么重要
Feldman 的观点直接挑战了市场对 AI 泡沫的普遍担忧。他指出历史上泡沫是基建超前于需求,而当前“需求远超供给”的局面恰恰相反。此外,他认为云计算市场正在分层:AWS、Azure 的合规与全栈生态对多数企业仍有价值,但对于只需低价算力的细分市场,其附加服务反而成为成本,市场会自然分化。在推理速度方面,他认为“速度就是产品”,Cerebras 的 token 输出速度比竞争对手快 15 倍,且差距会扩大,行业不会走向单纯的价格战。
对用户/开发者/创作者的影响
对开发者和企业用户而言,推理速度的提升意味着更流畅的 AI 体验,复杂问题的解决时间有望大幅缩短,而非停留在简单的文字生成。对于企业采购,HBM 的持续短缺和价格高企将推高使用 NVIDIA 等 GPU 的算力成本,开发者可能需要更多关注非 HBM 架构(如 Cerebras)或开源模型(如中国的 Kimi K2、DeepSeek、千问等)的落地成本。Feldman 还特别指出,企业 AI 落地当前最大阻力来自安全与法务部门,他们因缺乏合同先例而倾向拒绝新技术,这需要行业形成共识与标准。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Cerebras 上市后获得公开市场融资,其能否利用资金扩大产能并赢得更多大客户(如 OpenAI 的巨型订单),是验证其差异化路线能否规模化落地的关键。第二,HBM 产能扩张需新建 40 亿美元工厂并耗时五年,短期内短缺难以缓解,这将持续影响 GPU 供应和定价,开发者在选择模型部署方案时需关注成本变化。第三,中国开源模型进步显著,但闭源前沿模型仍领先,未来可能形成“前沿闭源+开源降本”的混合模式,影响企业技术选型和开发者生态。
来源:Readhub · AI


