Compile bug: SIGILL running `llama-cli` on RISCV SiFive P550

用户在 SiFive Premier P550 机器(RISCV64 架构)上编译 llama.cpp (提交 6b80c74f2853 ),编译成功后执行 llama-cli --version 立即崩溃,表现为 SIGILL 。编译时使用了 -DGGML_VULKAN=1 -DGGML_ZFH=

用户在 SiFive Premier P550 机器(RISCV64 架构)上编译 llama.cpp (提交 6b80c74f2853 ),编译成功后执行 llama-cli --version 立即崩溃,表现为 SIGILL 。编译时使用了 -DGGML_VULKAN=1 -DGGML_ZFH=

用户在使用 vLLM nightly Docker 镜像( vllm/vllm-openai:nightly )启动推理服务时,引擎初始化(编译、预热、CUDA graph 捕获)均正常完成,但 build_app() 在注册 Anthropic API 路由器时抛出 ImportError 异常,
![[Bug]: DiffusionGemma structured JSON outputs fail with xgrammar FSM rejection](https://www.chat-gpts.plus/wp-content/uploads/2026/06/45436-40f4f255-768x403.jpg)
用户在 Docker 镜像 vllm/vllm-openai:pr45163-a275a28e-dgemma-fullpy 中运行 vLLM v0.22.1rc1.dev332+g2c9c07c85,使用 vllm serve 命令加载 nvidia/diffusiongemma-26B-A4B-i

用户在使用 Ollama 的 /api/chat 接口,通过 format 参数传递 JSON Schema 要求模型输出结构化数据(如函数调用、用户信息生成)时,返回的 content 字段为空数组 [] ,不符合 Schema 的约束(要求至少 1 个元素)。

Hacker News 上的一篇讨论揭示了 AI(如 Claude)在化学合成规划中的能力与巨大局限——写出合成路线只占实际工作的10%,从理论到实验室操作之间存在着 AI 目前难以跨越的鸿沟。

一篇在 Hacker News 上引发热议的文章尖锐批评了“用 AI 代写”的行为,认为这并非工具赋能,而是作者主动放弃思考与表达责任,将写作变成了“机器词的转发器”,最终拉低了公共内容的质量。
![[Bug]: cumem_tag sleep/wake corrupts cross-rank PP broadcast (TP+PP, varied prompts) → cudaErrorIllegalAddress](https://www.chat-gpts.plus/wp-content/uploads/2026/06/45519-fa9d4f9d-768x403.jpg)
在 vLLM 中启用 --sleep-mode-backend=cumem_tag ,配置 TP=2, PP=2(4 个 worker)部署,使用 AWQ-INT4 量化模型(如 cyankiwi/Qwen3.6-27B-AWQ-BF16-INT4 ),通过 /sleep 和 /wake_up 接口

用户在 ROCm MI355X 平台上使用官方推荐的 vllm/vllm-openai-rocm:minimax-m3 Docker 镜像(sha256: e8071a526942ec2798f17363501c7ef62eeb7f7c21ba0fb5144bd36c74569ead)加载 Mini

2026年6月,SourceHut 创始人 Drew DeVault 发布了 Vim Classic 8.3,这是第一个明确拒绝使用生成式 AI 工具开发的 Vim 长期支持分支,旨在为反对 AI 辅助开发的用户提供一个“干净”的编辑器版本。

开发者 ptobey 在 GitHub 上开源了 local-memory-mcp ,一个为 Claude、ChatGPT 等 AI 助手提供持久记忆层的本地服务。它通过本地向量搜索(ChromaDB)让 AI 跨会话记住用户偏好和上下文,无需云端、订阅或账户,所有数据保留在本地机器上。