同样是算力巨头,为什么华为死磕英伟达,AMD 却 “躺平看戏”?

同样是算力巨头,为什么华为死磕英伟达,AMD 却 “躺平看戏”?

一句话看懂:华为昇腾系列在AI算力领域与英伟达全面正面竞争,而AMD虽有性能强劲的MI355X芯片,却选择只做推理市场、放弃大模型训练赛道。这背后是生存之战与商业博弈的两种逻辑。

事件核心:发生了什么

在AI算力竞赛中,华为和AMD走出了截然不同的路径。华为持续推出昇腾系列芯片,最新产品950DT虽然单卡算力仅为英伟达B300的七分之一,但通过自研灵衢高速互联和HCCL集群技术,在万卡集群总算力、成本和功耗上实现超越,总成本仅为英伟达集群的三分之一。华为的目标明确:正面替代英伟达。

另一边,AMD最新旗舰AI芯片MI355X在硬件上并不弱——FP8算力达2500 TFLOPS,显存288GB,单卡价格约30万元,性价比极高,性能远超华为昇腾950DT,可以直接对标英伟达H100。但AMD CEO苏姿丰公开表示,AI市场足够大,不需要打败英伟达,分蛋糕就够了。AMD只聚焦推理和中小模型市场,不去碰英伟达最核心的超大模型训练赛道。

为什么重要

这一分化反映了AI算力市场两种根本不同的竞争策略。华为的选择是“没有退路”:因美国芯片管制,国内AI大模型、智算中心面临断供风险,昇腾必须扛起国产算力自主可控的使命。华为从硬件到软件(CANN软件栈),再到兼容CUDA语法、支持PyTorch直接迁移,打造全链条自研生态,不留给外部卡脖子的空间。

AMD则完全是另一种商业逻辑:作为美国本土企业,没有断供压力;同时业务分散,既要与英特尔竞争CPU市场,又要做游戏显卡,算力研发投入只有英伟达的五分之一,根本无力也不必要去死磕CUDA生态和集群技术。CUDA经过20年积累,全球开发者默认使用,迁移成本极高,AMD的ROCm+HIP工具只能兼容85%的CUDA代码,剩下15%需要大量重写调试,超大模型训练基本玩不转。

对用户/开发者/创作者的影响

对国内AI公司和开发者来说,华为昇腾的坚持意味着一个值得长期押注的国产算力选项。虽然单卡性能与英伟达有差距,但集群成本和性价比优势明显,且软件生态正在快速完善,PyTorch代码可以直接迁移,降低了切换门槛。对于主要做推理和中小模型的企业,AMD的芯片是一个价格友好的选择,尤其适合微软、谷歌、Meta等有需求的大客户,但在大模型训练场景下,CUDA生态的绑定效应依然牢不可破。

值得关注的后续

首先,华为昇腾能否持续完善集群技术和软件生态,在更大规模训练场景下与英伟达真正二分天下,是需要观察的关键。其次,AMD是否会调整策略,在训练市场投入更多资源,取决于其在推理市场能否获得足够利润和市场份额。最后,美国芯片管制政策的进一步变化,将直接影响华为昇腾的技术迭代节奏和国内AI产业的整体算力供给。

来源:juejin

celebrityanime
celebrityanime
文章: 2861

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注