[Bug]: Gemma4-31B-it deployed on vLLM cannot process images in tool message
![[Bug]: Gemma4-31B-it deployed on vLLM cannot process images in tool message](https://www.chat-gpts.plus/wp-content/uploads/2026/06/41452-f7e27533-768x403.jpg)
用户在 vLLM 上部署 Gemma4-31B-it 模型,通过 OpenAI 兼容 API( /v1/chat/completions )发送包含图片的 tool message 请求时,服务端返回 HTTP 500 Internal Server Error。环境为 Ubuntu 24.04 +
![[Bug]: Gemma4-31B-it deployed on vLLM cannot process images in tool message](https://www.chat-gpts.plus/wp-content/uploads/2026/06/41452-f7e27533-768x403.jpg)
用户在 vLLM 上部署 Gemma4-31B-it 模型,通过 OpenAI 兼容 API( /v1/chat/completions )发送包含图片的 tool message 请求时,服务端返回 HTTP 500 Internal Server Error。环境为 Ubuntu 24.04 +
![[Bug]: [DeepSeek-V4-Flash][MTP] CUDA invalid argument during profile_run with DP4 + EP + MegaMoE on B_00](https://www.chat-gpts.plus/wp-content/uploads/2026/06/45099-8bfd8616-768x403.jpg)
在 vllm serve 启动 DeepSeek-V4-Flash 模型时,使用 --speculative-config '{"method":"mtp","num_speculative_tokens":1}' 或 num_speculative_tokens=3 ,并配合 --data-par

由于原文链接返回 404 错误,目前无法直接获取原始新闻内容进行解读。这说明该链接可能已失效或内容被移动,提醒我们在追踪 AI 信息时需关注链接的时效性和稳定性。

2026年上半年,网友利用AI图像和视频生成技术,将多个二次元游戏角色(如《鸣潮》的菲比、《妮姬》的doro)二创为Q版“电子女儿”,形成一个跨IP的二创养娃社群,背后反映出当代年轻人对无压力、纯粹情感陪伴的深层需求。

一项针对程序员和创意工作者的调查发现,频繁使用 AI 辅助工具(如代码补全、图像生成)正在削弱用户的核心技能,尤其是在问题拆解、调试和判断生成结果质量方面。这引发了关于“AI 依赖”是否会导致长期技能退化的讨论。

Anthropic 最强模型 Fable 5 发布仅三天即因美国政府出口管制而被限制访问;中国 AI 智能体 Manus 被 Meta 收购后遭监管叫停,正重组或赴港上市。两件事共同揭示:当 AI 能力足够强,就会被重新定义为战略资产,创业者必须学会“管控释放出去的能量”。

剑桥大学博士生Jacques Cornwell在《自然》期刊提出了一套阅读科学论文的七步批判性框架,旨在帮助研究者从被动接收信息转向主动评估数据质量。这套方法对依赖AI总结论文的科研用户提出了重要警示——深度分析不应外包。

《幻兽帕鲁》开发商 Pocketpair 明确表示不会使用生成式 AI 制作内容,核心理由是“玩家不想要”。其发行主管更指出,生成式 AI 可能只是行业泡沫,即便大公司用它“节省时间”,这种趋势也未必持久。

一款完全免费的 AI 图像升级器今日在 Product Hunt 上线,其核心卖点是利用客户端 WebGPU 模型执行,无需上传文件到服务器,实现 100% 本地隐私处理。

Cloudflare 推出 wrangler deploy --temporary 命令,允许任何用户(包括 AI 代理)在无需注册的情况下创建临时 Worker 部署,存活 60 分钟后自动过期,并可在此期间认领为永久帐户。此举大幅降低了开发者试用与预览的门槛,但也引发了滥用风险讨论。