celebrityanime

加入于: 2026年 4月 1日
文章: 9974

AI 资讯

相比「开源模型」，「前沿模型」溢价类似「奢侈品包包」！德银：这可能导致市场重估 AI

德意志银行最新研报指出，前沿AI模型与开源模型之间存在巨大的“成本鸿沟”——前者单任务成本约为后者的65倍，但对日常90%的普通任务而言，两者表现几乎相当。这一“奢侈品式”的定价逻辑，可能在头部AI公司转向按量计费后，引发一场比2025年“DeepSeek时刻”更持久的结构性市场重估。

celebrityanime
2026年 6月 20日

AI 资讯

Compile bug: out-of-tree build fails to provision UI assets: ENOENT: no such file or directory, mkdir ‘/src/tools/ui/node_modules’

用户使用 CMake out-of-tree 构建方式编译 llama.cpp，将源代码挂载为只读目录 $srcdir ，并在独立的构建目录中运行 cmake 和 make 。配置启用了 LLAMA_BUILD_UI=ON 且 LLAMA_USE_PREBUILT_UI=OFF ，构建过程中需要从源

celebrityanime
2026年 6月 20日

AI 资讯

Misc. bug: .`llama-server` starts on wrong port

用户在 Linux aarch64 系统上运行 llama-server （版本 9439, built with GNU 16.1.1）时，未指定 --port 参数，预期默认端口为 8080，但访问 http://127.0.0.1:8080/app 返回 404 错误。用户推测 llama-s

celebrityanime
2026年 6月 20日

AI 资讯

马斯克 SpaceXAI 为微软 Word / Excel / PowerPoint 推 Grok 扩展，AI 提升生产力

SpaceXAI 于 6 月 19 日面向微软 Office 三件套推出 Grok 扩展，用户可在 Word、Excel 和 PowerPoint 中通过侧边栏对话式指令完成文档生成、数据分析和幻灯片制作。这是 Grok 从对话模型向生产力工具深度整合的关键一步。

celebrityanime
2026年 6月 20日

AI 资讯

广东：将依托省开源鸿蒙适配中心，推进多行业示范应用和规模化适配

广东省政府正式发文，明确依托省级开源鸿蒙适配中心，在制造业、能源、交通等多行业推动开源鸿蒙系统的规模化应用与适配，旨在加速国产基础软件生态落地，降低对单一技术路线的依赖。

celebrityanime
2026年 6月 20日

AI 资讯

AI 最紧瓶颈！存储的影响已扩展至宏观经济，加剧整体通胀

德意志银行最新报告指出，AI 对高带宽存储（HBM）的结构性需求正严重挤压传统存储产能，导致存储芯片从周期性商品变为影响宏观经济通胀的关键变量。2025年全球存储市场营收创下2230亿美元新高，但供应缺口预计2027年前难以弥合。

celebrityanime
2026年 6月 20日

AI 资讯

花钱雇 AI 当同事，我的生意怎么样了？

多位中小企业主和专业人士正在用 AI Agent 工具替代或补充人力，通过定制“技能”和工作流，将重复性劳动交给数字员工完成。这些实践表明，AI 已从对话工具进化为可独立处理客服、文案、代码、数据分析等任务的“同事”，但核心决策仍需人类把关。

celebrityanime
2026年 6月 20日

AI 资讯

AI 账单飙升？Netflix 工程师开源项目 Headroom 爆火，号称可节省 60%-95% 词元消耗量

Netflix 高级工程师 Tejas Chopra 开源了一款名为 Headroom 的 Token 压缩工具，通过在 AI 应用和大模型之间插入透明压缩层，可将 Token 消耗降低 60%-95%，累计已为用户节省约 70 万美元成本。该项目近日在国内外开发者社区迅速走红，GitHub 星标已接近 4…

celebrityanime
2026年 6月 20日

AI 资讯

[Bug]: Prefix-read and no-prefix-read paths can yield different greedy answers for the same prompt

用户在 vLLM 推理服务中启用 prefix caching 功能（V1 引擎），使用 Qwen2-0.5B 模型（bf16 精度，TP=1），在 NVIDIA RTX 4090 或 3090 上运行时，同一 prompt 因是否命中前缀缓存而产生不同的语义输出（例如：缓存路径输出 "her ri

celebrityanime
2026年 6月 20日

AI 资讯

[Bug]: GLM-5（Sparse MLA / DSA 模型）无法在 sm80 GPU（A100/A800）上运行 — DeepGemm 硬依赖无 fallback

用户在运行 vLLM (latest main, commit 1391378) 加载 ZhipuAI/GLM-5-FP8 模型时触发。环境为 8x NVIDIA A800-SXM4-80GB (sm80, Ampere)，PyTorch 2.7.0+cu126，CUDA 12.6。用户通过 vll

celebrityanime
2026年 6月 20日