DeepSeek-R1 的开放复制

Hugging Face 的 Open R1 项目仅完成了第一步——发布了一个名为 Mixture-of-Thoughts 的推理数据集并复现了蒸馏版模型,但并未真正重现 DeepSeek-R1 的完整训练流程。社区指出,当时 DeepSeek“开放”实为有限开放,关键细节被遗漏。

Hugging Face 的 Open R1 项目仅完成了第一步——发布了一个名为 Mixture-of-Thoughts 的推理数据集并复现了蒸馏版模型,但并未真正重现 DeepSeek-R1 的完整训练流程。社区指出,当时 DeepSeek“开放”实为有限开放,关键细节被遗漏。

杰夫·贝索斯创立的AI公司Prometheus在成立仅七个月后,以410亿美元估值完成120亿美元融资,核心卖点是打造“人工通用工程师”(Artificial General Engineer),能将设计到建造的流程压缩10倍以上。目前该公司尚未推出任何产品。

HolaClaw 发布了 Token Studio,一个完全在浏览器本地运行的 LLM 令牌计数与成本估算工具。它通过加载各模型真实分词器,让用户在不联网上传文本的情况下,对比 GPT-5、Claude Opus、Gemini Pro 等主流模型的 token 消耗与费用。这对依赖 API 的开发者与内容创作…

开发者 TheWinci 在 GitHub 上开源了 Mimirs,一个为 AI 编码代理提供持久化本地内存的 MCP(模型上下文协议)服务器。它通过在本地索引项目代码并建立语义搜索和交叉会话记忆,将单次查询的 token 消耗从 38 万降至 9.1 万(降幅 76%),且无需 API Key、云服务或 D…

一位来自科技行业内部员工的投稿揭露,其所在公司在财务紧张、裁员降薪的背景下,仍斥巨资投入AI咨询、培训与许可证,但所有内部LLM试点项目均以失败告终;员工汇报的所谓“成功用例”包括与ChatGPT闲聊、用AI查询午餐菜单等荒谬场景。这并非孤例,而是AI在企业落地中“成本高昂、效果存疑、方向跑偏”的缩影。

甲骨文2026年6月11日股价暴跌12%,市值蒸发约720亿美元,原因是其宣布在本财年投入约700亿美元用于AI数据中心建设,并计划通过新增400亿美元债务和股权融资来填补资金缺口,远超市场预期的资本开支引发了投资者对现金流和回报率的严重担忧。

杰夫·贝索斯联合创立的AI公司Prometheus完成120亿美元B轮融资,估值达410亿美元,正式走出隐身模式。其核心目标是打造“通用人工智能工程师”,让AI从头到尾设计并落地复杂物理产品,例如喷气发动机。

AI 云算力公司 CoreWeave 完成了其首笔以欧元计价的垃圾债券发行,标志着这家以 GPU 租赁为核心业务的公司开始从欧洲市场筹集资金。此举不仅反映 AI 基础设施投资的高资金需求,也表明全球资本对“算力出租”这一商业模式的价值认可正在扩散。

xAI 于 2026 年 6 月 11 日宣布 Grok Build 插件市场进入 Beta 测试阶段,首批上线的插件包括 MongoDB、Vercel、Sentry、Cloudflare 和 Chrome DevTools。这意味着 Grok 模型正式从对话助手向开发者工具平台化转型,AI 助手开始直接介入…

GitHub 与微软安全与 AI 的 Agent Offense 团队合作,在秘密扫描的验证环节引入基于 LLM 的上下文推理,将误报率降低了 75.76%,显著提升了开发者对安全告警的信任度。