巨量显存怪兽现身：英特尔全新AI推理GPU硬件谍照全球曝光

一句话看懂：科技爆料者公开了英特尔下一代数据中心AI推理GPU“Crescent Island”的高清硬件谍照。该产品最大亮点是支持高达160GB板载显存，采用20颗LPDDR5X颗粒，主要面向风冷服务器市场，预计2026年下半年交付。

事件核心：发生了什么

根据曝光的PCB谍照，英特尔即将推出的AI推理GPU“Crescent Island”在硬件规格上显露出几个关键特征。首先，该显卡采用了PCIe Gen5+金手指设计，背面预留了12V-2×6电源接口，以支持高负载稳定供电。最引人注目的配置是：PCB板上密集排布了20个LPDDR5X显存焊盘，理论最大显存容量可达到160GB，远超目前多数AI推理加速卡。在供电方面，该卡配备了15相核心供电和3相显存供电，并预留了BMC管理芯片及侧面USB-C调试接口的位置。

该产品基于英特尔最新的Xe3P微架构，原生支持FP8和MXFP4等先进数据类型。按照官方产品路线图，Crescent Island主要定位于风冷服务器市场，已计划在2026年下半年向大型云服务商和企业客户供货。

为什么重要

160GB级超大显存的出现，将直接改变AI推理市场的硬件竞争格局。目前，大模型推理部署中，显存容量是制约模型大小与并发量的关键瓶颈。英特尔此举意味着在推理侧，它试图用“容量换时间”的策略来冲击现有市场：更高的显存带宽（来自LPDDR5X）和更大容量，能让用户在单卡上运行更大规模或更多并发的大语言模型，从而降低整体TCO（总拥有成本）。同时，Xe3P微架构加对FP8/MXFP4的原生支持，说明英特尔在推理计算精度与性能之间做了针对性优化，目标是为主流大模型推理工作负载提供一种成本更可控的替代方案。

对用户/开发者/创作者的影响

对于部署大模型推理服务的开发者和企业，如果Crescent Island能够顺利量产并达到预期性能，直接意味着在同等参数量的模型推理场景下，单机可承载的并发请求数有望提高，或者原本需要多卡分布式部署的模型（如700亿参数级别）可能在一张卡上完成离线推理或小批量部署，从而简化服务器架构与运维成本。对于普通用户，这类专用推理硬件若被云服务商采用，长期来看可能间接降低大模型API调用的计费价格。对于AI应用开发者，更多的硬件选择意味着云平台上的推理加速实例将增加多样性，开发者应关注其开放生态兼容性与软件栈（如OpenVINO或PyTorch）的适配情况。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，量产版本的实际功耗和散热表现。160GB显存加上充裕的供电相数，意味着散热设计压力较大，风冷方案能否在实际数据中心环境下长期稳定运行是落地关键。第二，英特尔的软件生态与主流AI框架（如PyTorch、TensorFlow）的适配成熟度。硬件规格亮眼但若推理栈迁移成本过高，则会削弱竞争力。第三，竞品是否会快速跟上显存竞赛。当前AMD Instinct MI系列和NVIDIA的Hopper/Blackwell架构在推理显存配置上各有取舍，Crescent Island若在性价比上占据优势，可能加速AI推理硬件从“以训练为重”向“推理专用化”的分化。

来源：AIbase

巨量显存怪兽现身：英特尔全新AI推理GPU硬件谍照全球曝光