标签: 算力

使用高级融合内核提高 MoE 训练吞吐量

使用高级融合内核提高 MoE 训练吞吐量

NVIDIA 发布了针对 MoE(混合专家)模型的自定义融合内核,通过将多个计算步骤合并为单一内核,可带来 1.3 到 2 倍的算子级加速,在 DeepSeek-V3 预训练场景中实现 8% 的端到端性能提升,在 GPT-OSS 预训练场景中提升达 93%。

17岁高中生做了个假AI,上线一个月获2.8亿次访问

17岁高中生做了个假AI,上线一个月获2.8亿次访问

17岁的印度高中生Mihir Maroju在2月上线了一款名为“Your AI Slop Bores Me”的网站,其核心并非真实AI,而是让用户互相扮演AI回复问题。上线一个月即获得超过2500万独立访客和2.8亿次访问,几乎零成本运营。这个项目精准捕捉了大众对AI生成低质量内容(AI Slop)的审美疲劳…

Radical Numerics 正在开发直接从生物数据中学习的人工智能模型,并筹集了由 Emergence Capital 领投的 5000 万美元种子资金(Natalie Breymeyer/Axios)

Radical Numerics 正在开发直接从生物数据中学习的人工智能模型,并筹集了由 Emergence Capital 领投的 5000 万美元种子资金(Natalie Breymeyer/Axios)

Radical Numerics 获得 5000 万美元种子轮融资,由 Emergence Capital 领投,正在研发一种能够直接从生物数据(如基因序列、蛋白质结构)中学习的新型 AI 模型,试图绕过传统大模型依赖海量文本或图像数据的训练路径。

曲柄GPT

曲柄GPT

Hacker News 上一款名为“CrankGPT”的产品因其过度使用滚动动画和复杂交互设计而非内容本身,引发了技术社区对 AI 产品界面设计趋势的激烈批评,同时该产品底层的技术文档显示其模型在树莓派 5 上可运行。

我的 Homelab 人工智能开发平台

我的 Homelab 人工智能开发平台

一位开发者分享了他通过自建 Homelab(家庭实验室)搭建 AI 开发平台的经验,核心是将 Opencode 与 Forgejo 代码托管平台整合,实现通过 Issue 指令自动生成 Pull Request 的工作流。这一实践揭示了一条与“堆算力”不同的本地 AI 落地路径:注重工具链集成与模型调优,而非…

英伟达入局华尔街 AI 融资热潮

英伟达入局华尔街 AI 融资热潮

英伟达宣布通过发行债券筹集至少 200 亿美元,这是其自 2021 年以来首次重返债券市场。此举并非因为缺钱,而是反映了 AI 基础设施投资规模已达到空前水平——即便是行业最大受益者,也需要借助资本市场为这场“算力军备竞赛”储备资金。

[推广] 阿里腾讯华为火山国内国际站 AWS/GCP 全部 7 折 CDN4000/P Ai 模型低至 2 折

[推广] 阿里腾讯华为火山国内国际站 AWS/GCP 全部 7 折 CDN4000/P Ai 模型低至 2 折

一条来自 V2EX 社区的推广帖显示,国内主要云服务商包括阿里云、腾讯云、华为云、火山引擎,以及海外 AWS、GCP 等平台均以 7 折及更低折扣提供云资源;其中 AI 模型调用价格低至 2 折,AWS 全球 CDN 加速低至 1 折(3500 美元/月),旨在吸引有批量采购需求的开发者和企业客户。