同样是算力巨头，为什么华为死磕英伟达，AMD 却 “躺平看戏”？

同样是算力巨头，为什么华为死磕英伟达，AMD 却 “躺平看戏”？

一句话看懂：华为昇腾系列在AI算力领域与英伟达全面正面竞争，而AMD虽有性能强劲的MI355X芯片，却选择只做推理市场、放弃大模型训练赛道。这背后是生存之战与商业博弈的两种逻辑。

事件核心：发生了什么

在AI算力竞赛中，华为和AMD走出了截然不同的路径。华为持续推出昇腾系列芯片，最新产品950DT虽然单卡算力仅为英伟达B300的七分之一，但通过自研灵衢高速互联和HCCL集群技术，在万卡集群总算力、成本和功耗上实现超越，总成本仅为英伟达集群的三分之一。华为的目标明确：正面替代英伟达。

另一边，AMD最新旗舰AI芯片MI355X在硬件上并不弱——FP8算力达2500 TFLOPS，显存288GB，单卡价格约30万元，性价比极高，性能远超华为昇腾950DT，可以直接对标英伟达H100。但AMD CEO苏姿丰公开表示，AI市场足够大，不需要打败英伟达，分蛋糕就够了。AMD只聚焦推理和中小模型市场，不去碰英伟达最核心的超大模型训练赛道。

为什么重要

这一分化反映了AI算力市场两种根本不同的竞争策略。华为的选择是“没有退路”：因美国芯片管制，国内AI大模型、智算中心面临断供风险，昇腾必须扛起国产算力自主可控的使命。华为从硬件到软件（CANN软件栈），再到兼容CUDA语法、支持PyTorch直接迁移，打造全链条自研生态，不留给外部卡脖子的空间。

AMD则完全是另一种商业逻辑：作为美国本土企业，没有断供压力；同时业务分散，既要与英特尔竞争CPU市场，又要做游戏显卡，算力研发投入只有英伟达的五分之一，根本无力也不必要去死磕CUDA生态和集群技术。CUDA经过20年积累，全球开发者默认使用，迁移成本极高，AMD的ROCm+HIP工具只能兼容85%的CUDA代码，剩下15%需要大量重写调试，超大模型训练基本玩不转。

对用户/开发者/创作者的影响

对国内AI公司和开发者来说，华为昇腾的坚持意味着一个值得长期押注的国产算力选项。虽然单卡性能与英伟达有差距，但集群成本和性价比优势明显，且软件生态正在快速完善，PyTorch代码可以直接迁移，降低了切换门槛。对于主要做推理和中小模型的企业，AMD的芯片是一个价格友好的选择，尤其适合微软、谷歌、Meta等有需求的大客户，但在大模型训练场景下，CUDA生态的绑定效应依然牢不可破。

值得关注的后续

首先，华为昇腾能否持续完善集群技术和软件生态，在更大规模训练场景下与英伟达真正二分天下，是需要观察的关键。其次，AMD是否会调整策略，在训练市场投入更多资源，取决于其在推理市场能否获得足够利润和市场份额。最后，美国芯片管制政策的进一步变化，将直接影响华为昇腾的技术迭代节奏和国内AI产业的整体算力供给。

来源：juejin

同样是算力巨头，为什么华为死磕英伟达，AMD 却 “躺平看戏”？