标签： Python

AI 资讯

Streamable_ ttp. py shows warning

用户使用 MCP Python SDK (1.13.1 版本) 运行 Streamable HTTP 服务器（基于 examples/servers/simple-streamablehttp-stateless/server.py 示例）时，遇到警告。错误发生在服务器已正常运行后，客户端出现连接断

celebrityanime
2026年 6月 20日

AI 资讯

Pytorch FutureWarning of _check_is_size

用户运行 bitsandbytes 库（例如结合 transformers、accelerate 加载量化模型）时，在标准输出或日志中反复出现 FutureWarning。该警告不影响运行结果，但会造成日志污染，同时提示将来可能移除该 API。

celebrityanime
2026年 6月 20日

AI 资讯

RuntimeError: dictionary keys changed during iteration`.

用户在 RAGFlow 中运行 GraphRAG 知识图谱生成任务，配置了实体解析（Resolution）和社区检测（Community）。任务在实体解析完成候选对合并后，合并阶段崩溃，报错 RuntimeError: dictionary keys changed during iteration

celebrityanime
2026年 6月 20日

AI 资讯

[Bug]: GLM-5（Sparse MLA / DSA 模型）无法在 sm80 GPU（A100/A800）上运行 — DeepGemm 硬依赖无 fallback

用户在运行 vLLM (latest main, commit 1391378) 加载 ZhipuAI/GLM-5-FP8 模型时触发。环境为 8x NVIDIA A800-SXM4-80GB (sm80, Ampere)，PyTorch 2.7.0+cu126，CUDA 12.6。用户通过 vll

celebrityanime
2026年 6月 20日

AI 资讯

[Intel XPU] `gemv_4bit` with NF4 has huge `bfloat16` error compared with `float16` on Intel Arc A770

用户在 Windows 11 系统（25H2 26200）的 Intel Arc A770 显卡上，使用 bitsandbytes 0.49.2 + PyTorch 2.11.0+xpu + triton-xpu 3.7.0 环境，运行 bitsandbytes.functional.gemv_4b

celebrityanime
2026年 6月 20日

AI 资讯

[Feature]: Support OpenAI frontier models (gpt-5.5 / gpt-5.4) on bedrock-mantle via the /openai/v1/responses path

用户在 LiteLLM 中调用 AWS Bedrock Mantle 上托管的 OpenAI 前沿模型（ openai.gpt-5.5 、 openai.gpt-5.4 ）时，触发如下错误。这些模型仅在 us-east-2 区域可用，且仅支持 Responses API（ /openai/v1/re

celebrityanime
2026年 6月 20日

AI 资讯

[Bug]: `redis-semantic` cache never produces semantic hits, `_get_cache_key_filter_expression` uses full request hash as RediSearch pre-filt

用户在 LiteLLM 代理中配置了 cache_params.type: redis-semantic ，期望基于语义相似性（向量距离）命中缓存。但实际上，即使两个请求的语义高度相似（余弦距离约 0.008），缓存查找仍然返回 miss，请求被转发到模型并再次写入缓存。该问题在 LiteLLM 版

celebrityanime
2026年 6月 20日

AI 资讯

[Bug]: GLM-5 tool calls in stream mode get error tool name

用户在使用 vLLM 部署 GLM-5 或 GLM-5.1 模型（如 zai-org/GLM-5.1-FP8 ），开启 stream=True 进行工具调用（tool call）时，流式返回的 tool_calls[].function.name 出现错误或截断，导致下游工具调用逻辑失败。该问题在代

celebrityanime
2026年 6月 20日

AI 资讯

issue:Cannot run on lower instruction set.

用户在装有 Intel D525 处理器的 Debian 14 系统上，通过 Docker 运行 Open WebUI v0.9.6。容器启动后立即被系统杀死（killed），没有任何正常日志输出。

celebrityanime
2026年 6月 20日

AI 资讯

TypeError: ‘JSONResponse’ object is not subscriptable

用户在 Open WebUI v0.9.5 中配置了 SearXNG 作为网页搜索后端，搜索请求成功返回结果并在前端显示，但随后在“Querying”阶段失败，最终呈现“No sources found”且模型声称无法获取实时网络信息。该问题在 OpenAI GPT-5.5（通过 LiteLLM）和

celebrityanime
2026年 6月 20日