AI 制造 AI:面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

AI 制造 AI:面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

AI 制造 AI:面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

一句话看懂:面壁智能与清华大学、OpenBMB 社区联合发布了 ForgeTrain——全球首个完全由 AI 编写、零人类代码介入的生产级大模型训练框架。该框架已在华为昇腾芯片上成功完成新一代模型 MiniCPM5-1B 的预训练,且后者的综合性能在全球同尺寸模型中排名第一。

事件核心:发生了什么

5 月 27 日,面壁智能正式开源了 ForgeTrain 框架。根据官方信息,ForgeTrain 的全部代码均由 AI 生成,没有人类直接参与编程。该框架已在华为昇腾芯片上运行,并成功预训练了面壁智能的新一代模型 MiniCPM5-1B。评测显示,该模型在 AA 榜单上位列 2B 参数规模以下 Top 1,综合性能领先于全球同尺寸竞品。面壁智能同步开源了完整的 ForgeTrain 框架代码,以及 Agent Harness——一套用于复现该框架制造过程的工具链,包含评测标准、测试规约和智能体编排方案。

为什么重要

ForgeTrain 的发布打通了“AI 写框架 → 国产芯片运行 → 训练出领先 AI 模型”的完整闭环。这一突破的意义在于:一是验证了 AI 能够自主编写生产级训练框架,且产出效果优于人工编写的同类系统,这在大模型开发工具链的自动化方向上是一个具体进展;二是在国产芯片(华为昇腾)上完成了验证,减轻了对海外高端算力的依赖,对国内 AI 生态的自主可控有实际推动作用;三是开源策略降低了行业复现门槛,其他团队可以基于 Agent Harness 复现这一过程,加速技术扩散。

对用户/开发者/创作者的影响

对于大模型训练从业者和开发者来说,ForgeTrain 提供了一个由 AI 自生成、且经过生产验证的框架选择,可以直接用于国产芯片环境,降低了底层的适配和优化成本。对于需要部署小型端侧模型(如手机、浏览器)的应用开发者,MiniCPM5-1B 的领先表现意味着可以在更低的算力条件下获得更好的模型效果。普通用户的直接感知可能有限,但这一技术路径若能持续落地,未来模型推理成本、国产硬件兼容性都可能受益。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,ForgeTrain 是否会被更多第三方团队采用并报告复现结果,这将决定它能否从“首个案例”发展为行业实践。第二,面壁智能是否会将这一自生成框架的能力持续迭代,例如扩展到更大规模模型或其他国产芯片平台。第三,竞品(如其他国产大模型厂商)是否会在训练框架层面跟进类似的自动化策略,或在开源社区中形成竞争与分化。

来源:IT之家 (ITHome)

celebrityanime
celebrityanime
文章: 3981

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注