科大讯飞发布星火多模态大模型 X2-VL

科大讯飞正式发布星火多模态大模型 X2-VL,旨在提升 AI 在图像识别、视频理解等多模态任务上的能力。这标志着国产大模型在多模态方向上的又一重要进展,尤其对依赖视觉理解的 AI 应用场景具有实际价值。

科大讯飞正式发布星火多模态大模型 X2-VL,旨在提升 AI 在图像识别、视频理解等多模态任务上的能力。这标志着国产大模型在多模态方向上的又一重要进展,尤其对依赖视觉理解的 AI 应用场景具有实际价值。

Anthropic 于 6 月 11 日收到美国政府出口管制指令,以国家安全为由,要求暂停所有外国人对最新最强模型 Claude Fable 5 和 Mythos 5 的访问。从上线到被强制全球下架仅 72 小时,Anthropic 选择对所有客户一刀切全停,成为 AI 史上首个被政府强制召回的商业大模型。
![[分享创造] 🌟 继续分享我的深度学习实验项目:通用深度学习平台](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_4-501-768x403.jpg)
一位独立开发者将其深度学习实验平台从仅支持 NLP 模型扩展到计算机视觉(CV)领域,使该项目成为面向初学者与开发者的“训练-部署-体验”一体化工具。这一更新填补了平台在图像识别方向上的空白,也让社区看到个体开发者构建完整 AI 实验栈的尝试。

硅星人评测8款主流AI Agent产品模拟押注2026年北京高考数学卷,结果显示真实知识点命中率最高不足两成,远低于营销宣传的98%。评测同时揭示出AI在命题创新、资料处理诚实度等方面的能力分化。

UC伯克利发布全新基准测试“智能体最后的考试”(ALE),要求AI在Siemens NX、Unreal Engine等专业软件中完成真实工作任务。结果,GPT 5.5以24.0%的通过率击败了Claude Fable 5(22.0%),且最难的档位几乎所有模型都得了零分。

开发者 Dan McInerney 发布了一个开源工具 Architect Loop,通过 Claude(Fable)和 Codex 的分工协作,实现了一个无需 API Key、由 AI 自主规划-审查-执行的开发循环,并在设计说明中声称可将 Fable 的代币消耗降低 80%。

英国《金融时报》发表评论文章,将埃隆·马斯克比作现实生活中的“邦德反派”,批评其持有过多不受约束的权力,尤其是在掌控关键基础设施、社交媒体舆论以及AI技术发展方向上。这一观点引发Hacker News社区热议,折射出科技界对超级企业家权力集中化的广泛忧虑。

一位开发者提出关键问题:当AI代理在真实工作流中自主运行时,哪些操作可完全自动化、哪些必须由人类批准、以及如何保证整个过程可审计。目前公开信息显示,行业普遍做法是先由一人审AI输出,再让多人审该审核流程,凸显出人工审核在AI应用落地中的复杂性与高成本。

开发者 Kapperchino 发布了一款名为 Agent Joe 的开源终端编码助手,它强制只允许编写 Rust 代码,并且禁止任何 shell 命令执行,以此消除 LLM 工具对终端权限的滥用风险。该项目目前在 GitHub 上可获取。

超微计算机(SMCI)于2026年6月11日完成了一轮最高可达70亿美元的股权与股权挂钩融资,旨在为近期收到的约390亿美元AI服务器订单采购关键组件。此举直接回应了AI基础设施需求的爆发,但也提示了高增长带来的资本压力和股权稀释风险。