标签: Gemini

[问与答] 好奇 LLM 厂商是怎么给模型定价的

[问与答] 好奇 LLM 厂商是怎么给模型定价的

V2EX 社区用户发起了一个关于大模型定价逻辑的讨论,核心问题是大模型厂商如何计算每百万 tokens 输出的成本。两位社区用户从硬件利用率、推理性能与队列控制等角度给出了技术性解释,揭示了当前 AI 推理服务商业化中成本结构与定价模型之间的直接关系。

基于云的 LLM 淘金热即将结束

基于云的 LLM 淘金热即将结束

Hacker News 上出现了一篇引发广泛讨论的观点文章,直指当前依赖大规模数据中心运行大语言模型(LLM)的模式正面临严峻挑战。文章认为,云端的 LLM 如同“血钻”——为了支撑其运行,数据中心大量消耗干旱地区的水资源并持续制造噪音,而这种高环境成本的模式不可持续,预示着基于云的大模型商业热潮可能走向终结…