标签: ChatGPT

使用高级融合内核提高 MoE 训练吞吐量

使用高级融合内核提高 MoE 训练吞吐量

NVIDIA 发布了针对 MoE(混合专家)模型的自定义融合内核,通过将多个计算步骤合并为单一内核,可带来 1.3 到 2 倍的算子级加速,在 DeepSeek-V3 预训练场景中实现 8% 的端到端性能提升,在 GPT-OSS 预训练场景中提升达 93%。

五分钟到清华,一座楼里的AI创业众生相

五分钟到清华,一座楼里的AI创业众生相

北京五道口AI原点社区聚集了从单人创业到估值百亿的AI公司,这里既有疯狂社交以缓解“FOMO焦虑”的逐浪者,也有埋头研发但难以招到清华毕业生的创业者,折射出当前AI创业圈中狂热与结构性困境并存的真实生态。

17岁高中生做了个假AI,上线一个月获2.8亿次访问

17岁高中生做了个假AI,上线一个月获2.8亿次访问

17岁的印度高中生Mihir Maroju在2月上线了一款名为“Your AI Slop Bores Me”的网站,其核心并非真实AI,而是让用户互相扮演AI回复问题。上线一个月即获得超过2500万独立访客和2.8亿次访问,几乎零成本运营。这个项目精准捕捉了大众对AI生成低质量内容(AI Slop)的审美疲劳…

Radical Numerics 正在开发直接从生物数据中学习的人工智能模型,并筹集了由 Emergence Capital 领投的 5000 万美元种子资金(Natalie Breymeyer/Axios)

Radical Numerics 正在开发直接从生物数据中学习的人工智能模型,并筹集了由 Emergence Capital 领投的 5000 万美元种子资金(Natalie Breymeyer/Axios)

Radical Numerics 获得 5000 万美元种子轮融资,由 Emergence Capital 领投,正在研发一种能够直接从生物数据(如基因序列、蛋白质结构)中学习的新型 AI 模型,试图绕过传统大模型依赖海量文本或图像数据的训练路径。