
巨量显存怪兽现身:英特尔全新AI推理GPU硬件谍照全球曝光
一句话看懂:科技爆料者公开了英特尔下一代数据中心AI推理GPU“Crescent Island”的高清硬件谍照。该产品最大亮点是支持高达160GB板载显存,采用20颗LPDDR5X颗粒,主要面向风冷服务器市场,预计2026年下半年交付。
事件核心:发生了什么
根据曝光的PCB谍照,英特尔即将推出的AI推理GPU“Crescent Island”在硬件规格上显露出几个关键特征。首先,该显卡采用了PCIe Gen5+金手指设计,背面预留了12V-2×6电源接口,以支持高负载稳定供电。最引人注目的配置是:PCB板上密集排布了20个LPDDR5X显存焊盘,理论最大显存容量可达到160GB,远超目前多数AI推理加速卡。在供电方面,该卡配备了15相核心供电和3相显存供电,并预留了BMC管理芯片及侧面USB-C调试接口的位置。
该产品基于英特尔最新的Xe3P微架构,原生支持FP8和MXFP4等先进数据类型。按照官方产品路线图,Crescent Island主要定位于风冷服务器市场,已计划在2026年下半年向大型云服务商和企业客户供货。
为什么重要
160GB级超大显存的出现,将直接改变AI推理市场的硬件竞争格局。目前,大模型推理部署中,显存容量是制约模型大小与并发量的关键瓶颈。英特尔此举意味着在推理侧,它试图用“容量换时间”的策略来冲击现有市场:更高的显存带宽(来自LPDDR5X)和更大容量,能让用户在单卡上运行更大规模或更多并发的大语言模型,从而降低整体TCO(总拥有成本)。同时,Xe3P微架构加对FP8/MXFP4的原生支持,说明英特尔在推理计算精度与性能之间做了针对性优化,目标是为主流大模型推理工作负载提供一种成本更可控的替代方案。
对用户/开发者/创作者的影响
对于部署大模型推理服务的开发者和企业,如果Crescent Island能够顺利量产并达到预期性能,直接意味着在同等参数量的模型推理场景下,单机可承载的并发请求数有望提高,或者原本需要多卡分布式部署的模型(如700亿参数级别)可能在一张卡上完成离线推理或小批量部署,从而简化服务器架构与运维成本。对于普通用户,这类专用推理硬件若被云服务商采用,长期来看可能间接降低大模型API调用的计费价格。对于AI应用开发者,更多的硬件选择意味着云平台上的推理加速实例将增加多样性,开发者应关注其开放生态兼容性与软件栈(如OpenVINO或PyTorch)的适配情况。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,量产版本的实际功耗和散热表现。160GB显存加上充裕的供电相数,意味着散热设计压力较大,风冷方案能否在实际数据中心环境下长期稳定运行是落地关键。第二,英特尔的软件生态与主流AI框架(如PyTorch、TensorFlow)的适配成熟度。硬件规格亮眼但若推理栈迁移成本过高,则会削弱竞争力。第三,竞品是否会快速跟上显存竞赛。当前AMD Instinct MI系列和NVIDIA的Hopper/Blackwell架构在推理显存配置上各有取舍,Crescent Island若在性价比上占据优势,可能加速AI推理硬件从“以训练为重”向“推理专用化”的分化。
来源:AIbase
![[Codex] 求靠谱的 codex 拼车渠道](https://www.chat-gpts.plus/wp-content/uploads/2026/05/ai_cover_5-525-768x403.jpg)

