LLM 世界杯投注

一个名为 LLM World Cup Bets 的实验项目,让 Claude、GPT-5.5、Gemini、Grok、DeepSeek、Mistral 六个大模型从 10,000 美元虚拟本金开始,在真实的世界杯比赛赔率下独立下注和管理风险。项目启动仅一天,一个简单的固定策略(每次投注 10% 本金在赔率最低…

一个名为 LLM World Cup Bets 的实验项目,让 Claude、GPT-5.5、Gemini、Grok、DeepSeek、Mistral 六个大模型从 10,000 美元虚拟本金开始,在真实的世界杯比赛赔率下独立下注和管理风险。项目启动仅一天,一个简单的固定策略(每次投注 10% 本金在赔率最低…

在 2025 年智源大会上,智源研究院院长王仲远、银河通用 CTO 王鹤、面壁智能 CEO 李大海共同指出,大模型技术远未收敛,真正的护城河在于数据闭环、软硬协同和垂直场景深耕;同时,具身智能正迎来以“世界动作模型(WAM)”为核心的规模化阶段,可能成为中国 AI 弯道超车的核心赛道。

Visa与OpenAI达成合作,将为ChatGPT内的购物行为提供支付安全与身份验证服务。这意味着ChatGPT正从对话助手直接向商业交易平台延伸,支付基础设施的嵌入是关键的商业化一步。

OpenAI 正式推出 Codex 推广活动,用户邀请好友成功使用后,可获得一次性速率限制重置权限,相当于“攒一次无限制使用机会”。该活动为期两周,旨在降低重度编程用户的使用门槛。

UC伯克利联合逾百机构发布全新基准测试ALE,让AI智能体在真实工业软件中完成实际工程任务。结果顶级模型通过率均未超25%,Anthropic的Claude Fable 5在总成绩和成本效率上双双落后于GPT 5.5。

AI 编程工具的多会话协作模式正对本地硬件提出严峻考验——运行 5-10 个 Claude Code 会话、每个会话附带 1-3 个子代理,加上浏览器调试流程,这些日常开发场景已经让开发者开始抱怨电脑“越来越慢”。Hacker News 用户关于硬件升级和工具选择的讨论,折射出 AI 本地化应用进入“高性能需…

OpenAI 收购了专注于为 AI 智能体提供预配置云基础设施的初创公司 Ona,以此强化其编程助手 Codex 在生产环境下的安全部署与长周期执行能力。此举意味着 OpenAI 正加速将 Codex 从代码补全工具升级为能自主规划并执行生产任务的“数字工程师”。

Hacker News 上的一则讨论引发猜测:OpenAI 是否正在通过与戴尔的合作,准备推出本地部署(On-Prem)产品,将 AI 模型运行在企业自己的硬件上,而非完全依赖云端 API。

随着算力瓶颈缓解,深耕细分行业的垂直型智能原生企业正面临核心挑战:如何将行业专家的隐性经验转化为AI可识别的标准化输入,并让算法适配动态业务流程。文章提出一套人机协同的四步知识转化闭环,为这类企业的深度落地提供了路径参考。
![[Wunder] V2EX 的 LLM Chat 实现了一个记忆读写系统](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-440-768x403.jpg)
V2EX 社区创始人 Livid 在其自研的 LLM Chat 产品中上线了“记忆读写系统”,允许用户通过自然语言对话让 AI 主动了解用户偏好并记住,从而实现个性化推荐。这是社区型 AI 产品在长期记忆与用户画像结合上的一次具体落地尝试。