标签： LLM

AI 资讯

Compile bug: SIGILL running `llama-cli` on RISCV SiFive P550

用户在 SiFive Premier P550 机器（RISCV64 架构）上编译 llama.cpp （提交 6b80c74f2853 ），编译成功后执行 llama-cli --version 立即崩溃，表现为 SIGILL 。编译时使用了 -DGGML_VULKAN=1 -DGGML_ZFH=

celebrityanime
2026年 6月 14日

AI 资讯

ImportError: AnthropicOutputConfig since May 28

用户在使用 vLLM nightly Docker 镜像（ vllm/vllm-openai:nightly ）启动推理服务时，引擎初始化（编译、预热、CUDA graph 捕获）均正常完成，但 build_app() 在注册 Anthropic API 路由器时抛出 ImportError 异常，

celebrityanime
2026年 6月 14日

AI 资讯

[Bug]: DiffusionGemma structured JSON outputs fail with xgrammar FSM rejection

用户在 Docker 镜像 vllm/vllm-openai:pr45163-a275a28e-dgemma-fullpy 中运行 vLLM v0.22.1rc1.dev332+g2c9c07c85，使用 vllm serve 命令加载 nvidia/diffusiongemma-26B-A4B-i

celebrityanime
2026年 6月 14日

AI 资讯

ImportError: print(“Missing dependency: pip install jsonschema ollama”)

用户在使用 Ollama 的 /api/chat 接口，通过 format 参数传递 JSON Schema 要求模型输出结构化数据（如函数调用、用户信息生成）时，返回的 content 字段为空数组 [] ，不符合 Schema 的约束（要求至少 1 个元素）。

celebrityanime
2026年 6月 14日

AI 资讯

让克劳德成为一名化学家

Hacker News 上的一篇讨论揭示了 AI（如 Claude）在化学合成规划中的能力与巨大局限——写出合成路线只占实际工作的10%，从理论到实验室操作之间存在着 AI 目前难以跨越的鸿沟。

celebrityanime
2026年 6月 14日

AI 资讯

机器词的人类路由器

一篇在 Hacker News 上引发热议的文章尖锐批评了“用 AI 代写”的行为，认为这并非工具赋能，而是作者主动放弃思考与表达责任，将写作变成了“机器词的转发器”，最终拉低了公共内容的质量。

celebrityanime
2026年 6月 14日

AI 资讯

[Bug]: cumem_tag sleep/wake corrupts cross-rank PP broadcast (TP+PP, varied prompts) → cudaErrorIllegalAddress

在 vLLM 中启用 --sleep-mode-backend=cumem_tag ，配置 TP=2, PP=2（4 个 worker）部署，使用 AWQ-INT4 量化模型（如 cyankiwi/Qwen3.6-27B-AWQ-BF16-INT4 ），通过 /sleep 和 /wake_up 接口

celebrityanime
2026年 6月 14日

AI 资讯

RuntimeError: Model does not support EAGLE3 interface but aux_hidden_state_outputs was requested

用户在 ROCm MI355X 平台上使用官方推荐的 vllm/vllm-openai-rocm:minimax-m3 Docker 镜像（sha256: e8071a526942ec2798f17363501c7ef62eeb7f7c21ba0fb5144bd36c74569ead）加载 Mini