​亚马逊 SageMaker AI 推出兼容 OpenAI API 的实时推理端点

​亚马逊 SageMaker AI 推出兼容 OpenAI API 的实时推理端点

​亚马逊 SageMaker AI 推出兼容 OpenAI API 的实时推理端点

一句话看懂:亚马逊在2026年5月为SageMaker AI实时推理端点新增了OpenAI兼容API路径,开发者只需更改一行URL即可接入自家GPU实例上的模型。这一更新降低了从OpenAI切换到自有托管模型的成本,对正在平衡灵活性、安全性和成本的企业AI团队是直接利好。

事件核心:发生了什么

近日,亚马逊SageMaker AI宣布开放了一个/openai/v1路径,用户使用OpenAI SDK、LangChain或Strands Agents等工具时,仅需将端点URL指向该路径,即可调用SageMaker AI上托管的所有模型——包括通用Llama、微调Mistral以及小型分类模型。新流量无需使用AWS的SigV4签名方案进行客户端定制或代码重写,认证简化为Bearer Token模式,SageMaker Python SDK中内置了Token生成工具。此外,同一端点可托管多个推理组件,实现多模型统一调度。

为什么重要

这一更新实质上是AWS在模型托管服务与OpenAI生态之间架起了一座桥梁。过去,开发者从OpenAI迁移到自建推理环境时,需要修改大量客户端代码、重写认证逻辑,甚至替换框架。如今SageMaker AI主动兼容OpenAI API格式,意味着企业可以在自有GPU实例上复用OpenAI生态的工具链,直接在推理侧保留数据隐私和控制权,同时避免锁定单一模型提供商。对AWS而言,此举提高了其云上推理服务的吸引力,也向市场传递出“托管平台应向下兼容主流API”的新竞争信号。

对用户/开发者/创作者的影响

对AI应用开发者而言,影响最直接:现有基于OpenAI SDK开发的应用可以零修改迁移至自建SageMaker端点,尤其适合需要调用多个模型(如通用问答+垂直领域模型)的复杂代理场景。对企业技术采购团队来说,意味着不必在“使用OpenAI API的便捷”与“使用自有算力的安全可控”之间做取舍,推理成本也可能有所下降。对创作者和内容团队而言,短期影响不大,但如果代理应用利用此功能调用多个定制模型,可能会带来更复杂的多步推理体验。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

目前公开信息显示,该功能支持单模型端点和推理组件端点两种部署方式,用户可托管多个模型通过同一OpenAI端点访问。值得关注的是:其一,新端点的计费模式是否与标准SageMaker推理相同,有无额外费用;其二,其他云厂商(如Google Cloud的Vertex AI、Azure AI)是否会快速跟进发布类似的OpenAPI兼容方案;其三,OpenAI自身是否会调整SDK或认证机制,以应对这种“兼容性竞争”。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 3278

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注