[Bug]: Gemma4 Tool Parser: Intermittently Missing `function.name` in Streaming Mode
![[Bug]: Gemma4 Tool Parser: Intermittently Missing `function.name` in Streaming Mode](https://www.chat-gpts.plus/wp-content/uploads/2026/06/45449-acacc055-768x403.jpg)
在 vLLM 服务中部署 google/gemma-4-31B-it 模型,使用 gemma4 工具解析器(tool parser),通过 OpenAI 兼容 API 发送流式聊天补全请求(stream=True),设置 tool_choice="auto" 和 chat_template_kwar
![[Bug]: Gemma4 Tool Parser: Intermittently Missing `function.name` in Streaming Mode](https://www.chat-gpts.plus/wp-content/uploads/2026/06/45449-acacc055-768x403.jpg)
在 vLLM 服务中部署 google/gemma-4-31B-it 模型,使用 gemma4 工具解析器(tool parser),通过 OpenAI 兼容 API 发送流式聊天补全请求(stream=True),设置 tool_choice="auto" 和 chat_template_kwar
![[Bug]: [NIXL] Hetero TP assertion fails when tp > num_kv_heads (GQA replication)](https://www.chat-gpts.plus/wp-content/uploads/2026/06/45330-d23a2d45-768x403.jpg)
用户在运行 vLLM (版本 0.21.0) 的分离式推理 (disaggregated inference) 时,使用 NixlConnector 作为 KV 连接器,并配置了非同等的 TP 大小 (例如 Prefill TP=8, Decode TP=16,或 TP=8 对 TP=16)。问题触

GIF和表情包内容平台Klipy获得谷歌AI Futures Fund等资方380万美元融资,押注AI技术将推动“微梗”(micro memes)和GIF内容在消息应用、社交平台中大规模爆发,其创始人此前创立的类似平台Tenor曾于2018年被谷歌收购。

Anthropic 于 6 月 17 日发布了 Claude Code v2.1.181,这是一次以修复 Bug 和提升稳定性为主的更新,同时加入了少量用户可直接感知的新功能,包括新的设置语法、移动端通知抑制和 macOS 沙箱权限改进。

Hacker News 上发起了一场关于 AI 记忆系统与实践工作流的深度讨论,开发者们正在探索如何让大模型突破上下文窗口限制,实现真正持久、可检索的动态记忆,而不仅仅是依赖长上下文的“伪记忆”。

SpaceX在上周上市后,于2026年6月16日宣布以600亿美元全股票交易收购AI编程初创公司Cursor。这笔交易旨在加强其AI分支xAI的竞争力,直接挑战Anthropic和OpenAI在AI编程领域的地位。

一款名为 Tablething 的桌面数据库客户端上线,支持连接14种主流数据库,用户可自备AI API密钥(BYOK)用自然语言查询数据,所有数据本地存储,免费使用。

Reyn 是一款始终在后台运行的 Mac 桌面 AI,通过持续记录屏幕内容构建私人工作日志,并能回答关于过去工作的问题——所有数据处理都在本地完成,不向云端发送任何屏幕数据。目前已开放 Waitlist 预约。

欧盟网络安全局(ENISA)将于本周四与AI公司Anthropic举行会晤。这表明欧盟正在从网络安全角度,对前沿AI模型展开具体的合规审查与风险评估,而非仅停留在框架讨论阶段。

苹果CEO库克确认,由于AI服务器需求导致存储芯片短缺和价格暴涨,苹果产品将涨价。这将直接影响消费者购买成本,并进一步推高整个消费电子市场的价格中枢。