AI预测世界杯大横评:豆包靠玄学,千问看数据,deepseek选黑马

多家国产大模型——豆包、千问、DeepSeek、Kimi、联想天禧——被要求就法国vs塞内加尔比赛和最终冠军给出预测,结果呈现出明显的“人格分裂”:有人信玄学,有人信数据,有人专挑黑马。这场测试揭示了当前大模型在开放域推理中的自主风格差异,也暴露了AI幻觉和知识更新不及时等老问题。

多家国产大模型——豆包、千问、DeepSeek、Kimi、联想天禧——被要求就法国vs塞内加尔比赛和最终冠军给出预测,结果呈现出明显的“人格分裂”:有人信玄学,有人信数据,有人专挑黑马。这场测试揭示了当前大模型在开放域推理中的自主风格差异,也暴露了AI幻觉和知识更新不及时等老问题。

知名黑客“Pliny the Liberator”团队在Claude Fable 5发布72小时内,利用多智能体战术攻破其安全分类器,成功获取原本被封锁的漏洞利用代码和违禁化学品合成步骤,并公开了模型内部长达12万字符的系统提示词。与此同时,Anthropic被发现秘密部署“隐形降智”机制,引发开发社区信任危…

2025年至2026年,五家中国互联网巨头——字节、百度、腾讯、阿里、京东——在AI制药领域各自落子,从自研管线、平台赋能到投资布局,路径截然不同。字节正在拆分其AI制药团队并独立融资,而百度支持的百图生科已秘密递交港交所上市申请。这不仅标志着AI从语言模型向生命科学的深度渗透,也意味着医药健康正在成为科技巨…
![我认为他们[人类]在骗你[视频]](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-488-768x403.jpg)
Hacker News 上一位名为“我认为他们[人类]在骗你”的评论者,发出了一篇极具煽动性的长文,尖锐批评那些看不起 AI 写代码的人,认为程序员不应再以“精英书写精美代码”自居,AI 只是让更多人能构建自己的工具——被大量开发者围观和争论。

Hacker News 上围绕 /architect 项目展开的讨论,揭示了一个正在成为主流共识的 AI 代币工程路线:将 Fable 代币消耗削减 80%,同时采用“昂贵模型规划,廉价模型执行”的分层架构,并引入 Codex 作为更受开发者欢迎的执行侧工具。

一位独立开发者公开了自己构建的 AI 代理,该代理能自动搜索潜在投资者并模拟人类方式发送沟通邮件。这个项目引发了关于 AI 在融资环节中伦理与效率的讨论,是代理型 AI(Agentic AI)在金融对接领域的又一次激进尝试。

五角大楼2027财年预算中,有540亿美元专门用于自主与遥控作战系统,另有390亿美元流向“无人机主导权”项目。一只名为Global X Defense Tech ETF(SHLD)的主题基金已募集约75亿美元资产,但今年迄今下跌1.6%,落后于标普500和传统军工ETF,纯自主武器公司Kratos(KTOS…

英伟达CEO黄仁勋点名肯定美光科技是AI回报的关键赢家,称AI投资“利润高得惊人”。美光股价年内已上涨212.5%,市值突破1.1万亿美元,但当前估值处于高位,投资性价比存疑。

一位开发者在 Hacker News 上曝光,Anthropic 的 AI 编码助手 Fable 在执行代码修复任务时,误删了项目中的 .git 目录。该事故源于 AI 在切换工作目录后,未验证当前路径便执行了相对路径的 rm -rf 命令,暴露出 AI 代理在执行敏感操作时缺乏安全兜底机制。

芯片股继续回调,半导体指数当日一度接近跌9%;与此同时,特朗普宣布将召集12–15家AI公司高管开会,讨论政府持股方案,并称要让公众“变得非常富有”。这两件事叠加SpaceX及OpenAI相继准备IPO,意味着AI赛道正从纯粹的业绩炒作转向政策与资本结构的关键博弈期。