
一句话看懂:Elon Musk 近日透露,其最新的大型语言模型 Grok 4.5 已开始在 SpaceX 和特斯拉内部进行小范围私测,该模型基于 1.5 万亿参数的 V9 版本,并引入了编程工具 Cursor 的数据进行针对性训练,整体性能已接近甚至在某些维度超越 Anthropic 的 Claude Opus。
事件核心:发生了什么
根据 Musk 在社交平台上的披露,Grok 4.5 的早期评估数据显示其能力已逼近 Anthropic 旗下的旗舰模型 Claude Opus。该模型技术基座是参数量达 1.5 万亿的 V9 版本。为了提升在代码编写和复杂任务处理方面的准确性,开发团队在后续训练中专门加入了流行 AI 编程工具 Cursor 的数据。目前,团队正通过强化学习(RL)持续优化模型,并同步完善配套的“Grok Build”测试基准,以确保其在各种压力测试下的稳定性。
为什么重要
这一进展传递出几个明确信号。首先,xAI 正在加速从实验室模型向真实世界复杂场景的跃迁,将 SpaceX 和特斯拉这类拥有严苛工程环境的公司作为首批试验场,有助于快速发现模型在实际部署中的短板。其次,Musk 同时宣布 SpaceX 将在今年剩余时间内维持“每月发布一个新模型”的高迭代频率,所有模型都将从零训练。这种密集的研发节奏,预示着大型模型领域的竞争将从单纯的参数比拼转向高频次的技术竞赛,对 Google、Anthropic 等现有玩家构成直接压力。
对用户/开发者/创作者的影响
对于开发者而言,Grok 4.5 引入 Cursor 训练数据的做法,意味着模型在代码生成和调试方面的能力有望显著提升,这可能为开发者提供一个有别于 Claude 和 GPT 系列的新选择。对于普通用户,更强的逻辑能力和更高频率的模型更新,意味着未来 Grok 应用(如 X 平台上的 AI 助手)将更快获得新的交互能力。然而,目前尚不清楚 Grok 4.5 的公开 API 时间表及定价策略,开发者需关注其是否会以免费或低成本方式开放,以吸引生态建设。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Grok 4.5 是否会在年内面向公众发布,以及其推理成本是否会因采用 1.5 万亿参数模型而过高。第二,引入 Cursor 数据后,模型在编程领域的实际表现能否在权威基准测试中被客观验证,并形成对现有代码助手(如 GitHub Copilot)的竞争。第三,马斯克承诺的“每月一新模型”能否兑现,以及这种高强度迭代是否会引发模型质量或安全方面的风险,是行业观察者需要持续跟进的重点。
来源:AIbase


![[酷工作] 北京,内推,小米,AI 基建架构师/研发效能工程师。组内直推,hc5+](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_1-1030-768x403.jpg)