OpenAI WebRTC 音频会话,现在带有文档上下文

开发者 Simon Willison 基于 OpenAI 新发布的 GPT-Realtime-2 音频模型,升级了其个人 WebRTC 音频对话工具,现在支持在浏览器中粘贴文档上下文后进行实时语音对话。这标志着 OpenAI 的实时音频 API 进入了可与 GPT-5 级推理能力结合使用的阶段。

开发者 Simon Willison 基于 OpenAI 新发布的 GPT-Realtime-2 音频模型,升级了其个人 WebRTC 音频对话工具,现在支持在浏览器中粘贴文档上下文后进行实时语音对话。这标志着 OpenAI 的实时音频 API 进入了可与 GPT-5 级推理能力结合使用的阶段。

一家第三方公司宣称能够“越狱” Anthropic 的最新模型,促使美国商务部长 Howard Lutnick 亲自向 Anthropic 管理层施压,要求将 Mythos 5 和 Fable 5 纳入更严格的出口管制。此事直接触发了大模型开源与闭源路线的监管连锁反应。

一位开发者近日在 Hacker News 上发问:继 RAG(检索增强生成)和图数据库之后,AI 代理的“记忆管理系统”下一个突破口在哪里?讨论中 Embeddings + 向量数据库仍被视为主导方案,但评论指向了“真正永久记忆与个性化”这一尚未被满足的技术需求。这场讨论折射出当前 AI 代理在长期上下文、个…

一款名为 webcli.sh 的新工具正在通过命令行界面(CLI)赋予 AI 代理完整的浏览器操控能力,使开发者无需图形界面即可让 AI 执行网页导航、数据抓取和表单填写等复杂任务,打破了传统上“AI+浏览器”必须依赖图形 API 的局限。

美国多个州的总检察长组成跨党派联盟,对 OpenAI 展开联合调查。此举意味着大模型公司在消费者保护、数据隐私和虚假信息等方面的法律风险正在从联邦层面扩大到州级执法层面。

Alphabet (Google母公司) 同时是SpaceX和Anthropic的重要早期投资者,这两家公司即将IPO。通过购买Alphabet股票,投资者可以间接参与这两家高估值明星公司的增长,同时享受Alphabet自身稳健业务的保护,但需留意反垄断和股权稀释风险。

SpaceX 于纳斯达克上市,首日股价上涨超19%,市值接近1.8万亿美元。值得注意的是,投资者并非为其火星殖民或NASA合同买单,而是押注其“太空AI数据中心”的商业前景。

美国多州总检察长组成的联盟正在对 OpenAI 展开调查,重点审查其数据收集与模型训练中的消费者保护问题。这标志着大模型头部公司在商业化的同时,正面临来自美国州一级监管的实质性压力。

美国已采取措施,阻止非美国用户访问Anthropic公司最先进的人工智能模型。这一政策变动旨在限制前沿AI能力外流,影响全球开发者与企业的模型调用。

2026年北京智源大会上,智源研究院院长王仲远明确将“世界模型”定义为下一代AI的基座模型,并指出当前面临真实物理数据匮乏、技术路线未收敛、评测体系不完善三大瓶颈。这意味着AI研发方向正从“理解语言”转向“理解物理世界”。