[Bug]: Prefix-read and no-prefix-read paths can yield different greedy answers for the same prompt
![[Bug]: Prefix-read and no-prefix-read paths can yield different greedy answers for the same prompt](https://www.chat-gpts.plus/wp-content/uploads/2026/06/42699-ab6cf9ef-768x403.jpg)
用户在 vLLM 推理服务中启用 prefix caching 功能(V1 引擎),使用 Qwen2-0.5B 模型(bf16 精度,TP=1),在 NVIDIA RTX 4090 或 3090 上运行时,同一 prompt 因是否命中前缀缓存而产生不同的语义输出(例如:缓存路径输出 "her ri
![[Bug]: Prefix-read and no-prefix-read paths can yield different greedy answers for the same prompt](https://www.chat-gpts.plus/wp-content/uploads/2026/06/42699-ab6cf9ef-768x403.jpg)
用户在 vLLM 推理服务中启用 prefix caching 功能(V1 引擎),使用 Qwen2-0.5B 模型(bf16 精度,TP=1),在 NVIDIA RTX 4090 或 3090 上运行时,同一 prompt 因是否命中前缀缓存而产生不同的语义输出(例如:缓存路径输出 "her ri
![[Bug]: GLM-5(Sparse MLA / DSA 模型)无法在 sm80 GPU(A100/A800)上运行 — DeepGemm 硬依赖无 fallback](https://www.chat-gpts.plus/wp-content/uploads/2026/06/35021-5544c92b-768x403.jpg)
用户在运行 vLLM (latest main, commit 1391378) 加载 ZhipuAI/GLM-5-FP8 模型时触发。环境为 8x NVIDIA A800-SXM4-80GB (sm80, Ampere),PyTorch 2.7.0+cu126,CUDA 12.6。用户通过 vll

资深工程师 Kent Beck(敏捷开发创始人之一)在 2026 年 5 月发表了一篇给新人的内部风格文章,核心观点是:公司雇佣新人不是为了“完成当前任务”,而是为了“投资未来的工程师”。他给出了区分优秀员工(A类)、合格员工(B类)和将被淘汰员工(C类)的具体信号,本质是对新人职场行为和成长逻辑的重新定义。

2024年诺贝尔物理学奖得主、被誉为“AI教父”之一的约翰·江珀(John Jumper)宣布加入AI公司Anthropic,这将为Anthropic在蛋白质结构预测等前沿科学领域的AI研究注入顶级学术力量。

Agentcard 发布了一款专为 AI 代理设计的虚拟信用卡产品,允许代理在无需人工介入的情况下完成真实支付,目前已集成 DoorDash 等商家,实现了从“指令到收货”的闭环。

一位患有罕见脑垂体瘤的患者,通过使用 Claude Opus 4.8、GPT 5.5 等推理模型和结构化流程,自行分析长达数月的症状数据与血液检测报告,最终找出了反复发作的疲劳、脑雾、恶心等症状的根源。这一案例展示了大模型在非典型、多系统主诉症状的自我诊断辅助中,能够提供超出普通全科医生水平的洞察力。

多个行业的中小企业主和专业人士已开始用AI数字员工替代部分人力工作,月花费约1000-4000元人民币即可让AI完成律师文书、电商运营、投资分析、产品开发等具体任务,实际产出效率大幅提升,但核心决策和对外内容仍需要人工把关。

Anthropic 国际董事总经理克里斯·恰乌里在首尔新闻发布会上表示,公司有信心“未来几天内”向美国以外地区重新开放此前因美国白宫安全指令而临时封锁的 Claude Mythos 和 Claude Fable 5 模型,同时宣布深化对韩投资并组建当地团队。
![[问与答] 有人在用 Cloudflare AI Gateway 吗,它的 Unified Billing 是一直不支持 gpt-image-2 吗? 充值完才发现不能用...](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_4-782-768x403.jpg)
一位开发者在 V2EX 社区反映向 Cloudflare AI Gateway 充值后无法调用 OpenAI 的 gpt-image-2 模型。最终发现并非计费功能不支持,而是调用了错误的 API endpoint。此事暴露了 Cloudflare AI Gateway 在文档指引与统一计费接口的一致性上仍存…
![[Claude] 没天理啦。 Claude 昨天更新了额度。 今天又重置额度变成 0% 啦。](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_3-785-768x403.jpg)
多位用户在 V2EX 社区反映,Claude(Anthropic 的大模型产品)在昨天刚更新额度后,今天突然再次重置使用额度为 0%,引发用户对额度规则和算力分配策略的广泛不满与讨论。