标签： GPT-4

AI 资讯

LLM 世界杯投注

一个名为 LLM World Cup Bets 的实验项目，让 Claude、GPT-5.5、Gemini、Grok、DeepSeek、Mistral 六个大模型从 10,000 美元虚拟本金开始，在真实的世界杯比赛赔率下独立下注和管理风险。项目启动仅一天，一个简单的固定策略（每次投注 10% 本金在赔率最低…

celebrityanime
2026年 6月 12日

AI 资讯

智源大会圆桌：大模型没有终局，具身智能可能是中国的 AlphaGo 时刻

在 2025 年智源大会上，智源研究院院长王仲远、银河通用 CTO 王鹤、面壁智能 CEO 李大海共同指出，大模型技术远未收敛，真正的护城河在于数据闭环、软硬协同和垂直场景深耕；同时，具身智能正迎来以“世界动作模型（WAM）”为核心的规模化阶段，可能成为中国 AI 弯道超车的核心赛道。

celebrityanime
2026年 6月 12日

AI 资讯

Visa将通过与OpenAI的合作，为ChatGPT上的购物者提供安全支付服务

Visa与OpenAI达成合作，将为ChatGPT内的购物行为提供支付安全与身份验证服务。这意味着ChatGPT正从对话助手直接向商业交易平台延伸，支付基础设施的嵌入是关键的商业化一步。

celebrityanime
2026年 6月 12日

AI 资讯

OpenAI开启Codex推广活动，邀请好友即可重置使用额度

OpenAI 正式推出 Codex 推广活动，用户邀请好友成功使用后，可获得一次性速率限制重置权限，相当于“攒一次无限制使用机会”。该活动为期两周，旨在降低重度编程用户的使用门槛。

celebrityanime
2026年 6月 12日

AI 资讯

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

UC伯克利联合逾百机构发布全新基准测试ALE，让AI智能体在真实工业软件中完成实际工程任务。结果顶级模型通过率均未超25%，Anthropic的Claude Fable 5在总成绩和成本效率上双双落后于GPT 5.5。

celebrityanime
2026年 6月 12日

AI 资讯

Ask HN: 你使用的是哪种电脑来运行人工智能编程工具？

AI 编程工具的多会话协作模式正对本地硬件提出严峻考验——运行 5-10 个 Claude Code 会话、每个会话附带 1-3 个子代理，加上浏览器调试流程，这些日常开发场景已经让开发者开始抱怨电脑“越来越慢”。Hacker News 用户关于硬件升级和工具选择的讨论，折射出 AI 本地化应用进入“高性能需…