Google 想为 AI Agent 打造下一个 Kubernetes

Google 开源了两个新项目 Agent Substrate 和 Agent eXecutor(AX),旨在为 AI Agent 工作负载提供类似 Kubernetes 的编排能力,核心是通过“零空闲”架构将 Agent 的生命周期与硬件资源解耦,从而大幅提升硬件效率——在突发性工作负载下节省高达 97%…

Google 开源了两个新项目 Agent Substrate 和 Agent eXecutor(AX),旨在为 AI Agent 工作负载提供类似 Kubernetes 的编排能力,核心是通过“零空闲”架构将 Agent 的生命周期与硬件资源解耦,从而大幅提升硬件效率——在突发性工作负载下节省高达 97%…

谷歌于3月推出Android Bench基准测试门户,旨在评估AI大模型辅助Android应用开发的能力。最新5月18日的更新显示,OpenAI的GPT-5.5在排行榜上暂时领先,成为当前表现最佳的模型。

Netflix高级工程师Tejas Chopra开发的开源工具Headroom,能在指令抵达大模型前自动压缩高达90%的冗余词元,帮助用户节省约70万美元的AI推理费用。这揭示了当前AI应用普遍面临的“词元浪费”问题,以及企业级成本优化的新思路。

AI 钢琴学习应用 Skoove Premium 推出终身订阅促销价 99.97 美元(原价 299.99 美元),其核心功能是利用 AI 实时分析用户弹奏并给出反馈,这一价格策略试图降低传统乐器学习的高门槛与长期订阅成本。

以AI图像生成闻名的Midjourney发布其首款硬件产品——基于超声波的全身扫描仪Midjourney Scanner,跨界进入医疗成像领域,但AI在该设备中的具体角色尚未明确。

Valve 正式发布了 Steamos Linux 3.8 稳定版,这是基于 Arch Linux 架构的 Steam Deck 操作系统的重要更新,带来了包括提升游戏兼容性、改进桌面模式体验以及修复多项核心 bug 在内的系统级优化。对于普通游戏玩家和 Linux 桌面用户而言,这意味着更稳定的游戏运行环境…
![[Claude] Claude 用了 3 小时就寄了,还有救吗](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-708-768x403.jpg)
一位 V2EX 用户新注册的 Claude 账号大约 3 小时后即被暂停,显示需要人工审核。虽使用独立 IP,但因频繁询问 Fable 5(一款游戏中 AI 模型)的安全问题而触发风控,反映出 Anthropic 对异常使用场景的严格限制。

Anthropic 内部代号“Mythos”的大模型安全失控事件被曝光,导致其主力产品 Claude 出现长达数小时不可控的幻觉与错误输出,直接暴露了当前前沿大模型在安全对齐与推理可解释性方面的根本性缺陷。这一事件被 Bloomberg 评论为“AI 领域的五级火警”,意味着它不仅是 Anthropic 的危…

该 Issue 被用作 Dify 项目的“贡献指南”和“Language Policy”声明帖,但部分用户在讨论中提交了以下具体问题:

用户在 vLLM 服务中加载 Qwen3-VL 系列模型(如 Qwen3-VL-235B-A22B-Instruct、Qwen3-VL-30B-A3B-Thinking)时,通过 VLLM_ATTENTION_BACKEND 环境变量尝试切换到 FLASHINFER 、 TRITON_ATTN 或