[问与答] 好奇 LLM 厂商是怎么给模型定价的
![[问与答] 好奇 LLM 厂商是怎么给模型定价的](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_1-569-768x403.jpg)
V2EX 社区用户发起了一个关于大模型定价逻辑的讨论,核心问题是大模型厂商如何计算每百万 tokens 输出的成本。两位社区用户从硬件利用率、推理性能与队列控制等角度给出了技术性解释,揭示了当前 AI 推理服务商业化中成本结构与定价模型之间的直接关系。
![[问与答] 好奇 LLM 厂商是怎么给模型定价的](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_1-569-768x403.jpg)
V2EX 社区用户发起了一个关于大模型定价逻辑的讨论,核心问题是大模型厂商如何计算每百万 tokens 输出的成本。两位社区用户从硬件利用率、推理性能与队列控制等角度给出了技术性解释,揭示了当前 AI 推理服务商业化中成本结构与定价模型之间的直接关系。

Hacker News 上出现了一篇引发广泛讨论的观点文章,直指当前依赖大规模数据中心运行大语言模型(LLM)的模式正面临严峻挑战。文章认为,云端的 LLM 如同“血钻”——为了支撑其运行,数据中心大量消耗干旱地区的水资源并持续制造噪音,而这种高环境成本的模式不可持续,预示着基于云的大模型商业热潮可能走向终结…
![[分享发现] [自制小工具分享] AI 老照片修复站上线,送点小礼物给大家 🎁](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-551-768x403.jpg)
开发者独立上线了AI老照片修复网站 AI Photo Restoration ,通过积分制提供免费预览和付费高清下载功能,目前面向V2EX社区用户赠送积分以收集反馈。

SpaceX 在 S-1 招股书中披露,到 2030 年已签合约的现金承诺高达约 2350 亿美元,而 IPO 募资额只有 500 至 750 亿美元,扣除 200 亿美元强制性债务偿还后,净可用资金仅 300 至 500 亿美元,资金缺口高达募资额的 3 到 5 倍。这一问题在单一财务章节中无法看清,只有将…

企业老板对AI的非理性狂热正在倒逼员工无效使用AI,导致算力成本飙升、工作效率不升反降。同时,AI能力已变相成为招聘和绩效的硬性指标,形成一场“为了用AI而用AI”的职场内耗。

拥有近20年投资经验的远镜创投前投资人金戈,于2025年2月联合清华教授莫一林创立具身智能公司“灵御智能”,并在一年内完成了四轮融资,第五轮即将完成。这揭示了风险投资人才向AI创业一线大规模流动,以及具身智能赛道当前融资的极高热度。

行业首个针对 AI 智能体(Agent)的硬件基准测试 AA-AgentPerf 出炉,NVIDIA Blackwell 架构的 GB300 显卡在同功耗下性能是上代 H200 的 20 倍,而 AMD 当前最强显卡 MI355X 在该测试中表现落后,主要因优化尚处早期。

本文通过回顾电气化、铁路和互联网等通用技术革命的规律指出,AI 像电气化一样,大概率会经历“基础设施建设”和“应用落地”两轮资本泡沫,而非单次涨跌。当前 AI 应用集中在编程和视觉等浅层替换,真正的生产率爆发可能还需要数年至数十年。

华人女VC王康曼管理的3C AGI基金,因早期投资AI芯片公司Cerebras和Groq获得数十倍回报,如今正将投资重心转向太空AI算力基础设施。她认为,随着SpaceX大幅降低发射成本,太空将取代部分地面数据中心,成为下一代推理型算力的核心基地。

富国银行首席股票策略师Ohsung Kwon近日警告,随着AI实验室削减补贴、代币使用成本飙升,依赖AI支出增长的超大规模科技股面临显著风险。该行已从4月的看多立场转为“坚定中性”,认为市场此前的“糖反弹”已经结束。