直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

南洋理工大学、商汤研究院和大连理工大学联合发布了原生多模态大模型NEO-ov,完全摒弃传统视觉编码器,让大模型直接从原始像素学习语言。在空间智能等任务上,它甚至超越了依赖编码器的竞品,证明“端到端”路线不仅可行且已具备竞争力。

南洋理工大学、商汤研究院和大连理工大学联合发布了原生多模态大模型NEO-ov,完全摒弃传统视觉编码器,让大模型直接从原始像素学习语言。在空间智能等任务上,它甚至超越了依赖编码器的竞品,证明“端到端”路线不仅可行且已具备竞争力。

Aether AI 提出“因果世界模型”技术路线,让 AI 从单纯预测“接下来发生什么”转向理解“为什么发生”并模拟干预后果,首攻 Physical AI 机器人推理层。这不仅是一次架构创新,更直接挑战了当前大模型依赖统计相关性的固有边界。

在2026年MWC上海开幕式上,中国移动董事长陈忠岳宣布公司将构建一体化算力网,布局超大规模智算中心,并提出了从“离身智能”到“内身智能”的智能形态三阶段演进框架。这明确透露出中国移动正从传统通信运营商向AI基础设施服务商转型,其算力网络布局将对AI训练和推理的成本、效率产生直接影响。

高通在2026年6月的汽车技术与合作峰会上,展示多款基于骁龙8775(Flex平台)的量产舱驾融合车型,并推出面向智能体时代的“车端人工智能Claw生态计划”。这意味着高通正从传统的“智能座舱芯片供应商”转向“物理AI基础计算层”的构建者,其技术能力和商业潜力需要被市场重新评估。

追觅科技澄清其汽车业务负责人离职传闻,微信开启原生AI助手“小微”小范围测试,苹果与特斯拉核心供应商塔塔电子遭遇超630GB数据泄露。三者分别反映了跨界AI硬件公司的组织调整、超级App内嵌AI助手的落地进展,以及AI供应链安全面临的现实挑战。

Google DeepMind 的 Gemini 预训练主管 Vlad Feinberg 在一场播客中曝光了模型训练的真实面貌:5 人团队在硅谷和巴黎两地倒班、不眠不休 40 天,才让 Gemini 2.0 上线。与此同时,他指出了当前 AI 行业最稀缺的能力——不是发论文,而是踏实解决算力与工程落地的“脏活…

受全球AI芯片需求预期调整及部分龙头企业财报不及预期影响,亚洲科技股近期持续下挫,市场担忧此前的AI算力投资热潮可能进入冷却阶段。投资者正重新评估AI基础设施投入的回报周期。

《经济学人》6月23日报道指出,美国各地对数据中心建设的反对声音日益高涨,从电力供应、土地审批到社区抵制,正在成为制约AI算力扩张的关键瓶颈。如果这一趋势持续,不仅会推高AI训练和推理成本,还可能延缓下一代大模型的部署节奏。

美国数据中心建设正遭遇电力供应紧张、审批周期拉长及社区反对等多重逆风,可能拖慢大模型训练和推理的算力部署节奏,进而给整个 AI 热潮的推进速度带来实质性风险。

苹果在 macOS 27 Beta 2 中快速封堵了一条允许用户绕过候补名单直接启用新版 Siri AI 的终端命令,但 Reddit 网友随即发现另一种通过“图乐园”生成图片并提交反馈来加速解锁的方法。这反映出苹果对 Siri AI 的测试上线采取了严格的分批控制策略。