bug(python-sdk): Langchain base tool handled errors are considered like successful outputs

用户在使用 Langfuse Python SDK 集成 LangChain 回调管理器时,创建了一个继承 BaseTool 并设置了 handle_tool_error = True 的 LangChain 工具。当工具抛出 ToolException 时,LangChain 正确调用了 on_t

用户在使用 Langfuse Python SDK 集成 LangChain 回调管理器时,创建了一个继承 BaseTool 并设置了 handle_tool_error = True 的 LangChain 工具。当工具抛出 ToolException 时,LangChain 正确调用了 on_t

用户在使用 Langfuse Python SDK( langfuse.langchain.CallbackHandler )与 LangChain 结构化工具(如通过 @tool 装饰器定义的工具)时,在 Langfuse UI 中发现工具观测的输入字段显示的是原始 Python 字典字符串(例如
![[Bug]: MCP Gateway returns hardcoded `serverInfo.name = "litellm-mcp-server"` for every `/mcp/{alias}` endpoint](https://www.chat-gpts.plus/wp-content/uploads/2026/06/29800-abdeaae3-768x403.jpg)
用户在 LiteLLM 代理的 config.yaml 中配置了多个 mcp_servers (如 Grafana、Home Assistant、N8N 等),并通过 /mcp/{alias} 端点访问每个服务器。MCP 客户端(如 VS Code MCP 选择器、MCP Inspector、Fas

用户在 Langfuse 4.x 版本中,通过 OpenInference Claude Agent SDK 探针( openinference-instrumentation-claude-agent-sdk )将多 Agent 工作流的追踪数据通过 OTel 协议导入 Langfuse。典型场景

用户通过 Docker 部署 RAGFlow (v0.17.1 slim) 后启动服务,发现日志中 Elasticsearch 和 Infinity 均连接失败,最终无法登录 Web 页面。报错集中在 Infinity 客户端尝试连接远程 Thrift 端口 (23817) 时出现 TimeoutE
![[Question]: Why does reranking need to recalculate the scores for vector search and full-text search?](https://www.chat-gpts.plus/wp-content/uploads/2026/06/7784-f56cea63-768x403.jpg)
用户在使用 RAGFlow 进行检索增强生成(RAG)时,从数据库中通过向量搜索和全文搜索获取了一批数据后,观察到 rerank 阶段(在 Python 脚本中)重新计算了分数,而没有直接使用数据库原始分数。用户质疑这种重算行为可能破坏基于原始相关性的排序,从而降低查询准确性。
![[Bug]: Missing supports_assistant_prefill on AWS Bedrock Claude 3.x entries in model_prices_and_context_window.json](https://www.chat-gpts.plus/wp-content/uploads/2026/06/30863-5a8096d3-768x403.jpg)
用户在 LiteLLM SDK(Python 包,版本 v1.89.2)中加载 model_prices_and_context_window.json 模型配置时,发现多个 AWS Bedrock 上的 Claude 3 条目缺少 supports_assistant_prefill 字段。任何依

该 Issue 发生在自托管(Self Hosted Docker)环境的 Dify 1.0.0 中,用户使用默认代码解析工具(Code Parser Tool),结合 qwen-max 模型,调用策略设置为 FunctionCalling 时触发了该错误。

在 transformers 5.x (如 5.12.0)中,用户定义了一个自定义的 PreTrainedModel 子类(非内建架构),通过 save_pretrained() 保存后,使用 from_pretrained() 重新加载。加载后的模型权重变成随机值,但 from_pretraine

用户在使用 Hugging Face Transformers 库中的 Flex Attention 机制( --attn-type flex_attention )并启用静态缓存( --use-static-cache )运行 Qwen/Qwen3-4B 模型推理时触发。具体操作包括执行 run_