分类: AI 资讯

使用高级融合内核提高 MoE 训练吞吐量

使用高级融合内核提高 MoE 训练吞吐量

NVIDIA 发布了针对 MoE(混合专家)模型的自定义融合内核,通过将多个计算步骤合并为单一内核,可带来 1.3 到 2 倍的算子级加速,在 DeepSeek-V3 预训练场景中实现 8% 的端到端性能提升,在 GPT-OSS 预训练场景中提升达 93%。

五分钟到清华,一座楼里的AI创业众生相

五分钟到清华,一座楼里的AI创业众生相

北京五道口AI原点社区聚集了从单人创业到估值百亿的AI公司,这里既有疯狂社交以缓解“FOMO焦虑”的逐浪者,也有埋头研发但难以招到清华毕业生的创业者,折射出当前AI创业圈中狂热与结构性困境并存的真实生态。

Can’t edit Skills in 2.2.4 anymore

Can't edit Skills in 2.2.4 anymore

用户在 Windows 系统上运行 LobeChat Desktop App (Electron) v2.2.4,通过 Settings → Skills 进入技能管理,但发现无法找到或编辑自定义技能。此前在 2.2.4 之前的版本中,用户可以通过 Skill Store → Custom 标签页编