Show HN: 浏览器内置的真实 LLM 令牌计数器和成本估算

一句话看懂：HolaClaw 发布了 Token Studio，一个完全在浏览器本地运行的 LLM 令牌计数与成本估算工具。它通过加载各模型真实分词器，让用户在不联网上传文本的情况下，对比 GPT-5、Claude Opus、Gemini Pro 等主流模型的 token 消耗与费用。这对依赖 API 的开发者与内容创作者来说，意味着可以提前精确控制推理成本。

事件核心：发生了什么

Token Studio 于近期上线，定位为浏览器端的轻量级工具。用户只需粘贴文本，即可看到不同模型家族（如 GPT-5 使用 o200k_base 分词器）的实时 token 分解、上下文窗口占用率以及预估费用。工具本身约为 6.4 MB 的一次性加载，所有计算均在本地完成，不上传任何数据。当前可对比的模型包括 OpenAI 的 GPT-5、Anthropic 的 Claude Opus 和 Google 的 Gemini Pro 等。作者强调“计数来自每个模型真实的分词器”，成本与上下文窗口数据作为估算参考，可能因模型版本而有所变化。

为什么重要

Token 计费是大模型 API 调用中最不透明的环节之一。不同模型采用不同的分词算法（如 GPT-5 用 o200k_base，Claude 可能用不同的 BPE 变体），同样的输入文本在不同模型中的 token 数量差异巨大，直接导致成本大幅波动。此前，开发者要么依赖 API 提供商返回的统计，要么使用第三方估测工具，但后者往往基于近似算法，精确度有限。Token Studio 将真实分词器引入浏览器，在用户侧完成推理前的成本预测，这意味着开发者可以在编码阶段就准确评估预算、优化提示词长度，避免因 token 预估偏差导致 API 账单超支。从行业角度看，这一做法也降低了模型选择的信息不对称，让用户能更理性地对比各家定价。

对用户/开发者/创作者的影响

对普通用户而言，该工具帮助他们理解为何同样的输入文本在不同的 AI 聊天或写作服务中收费不同——本质是 token 计数规则的差异。对开发者来说，Token Studio 的价值更为直接：在调用 API 之前，即可在开发环境中集成该工具，自动化地检查提示词 token 长度和预估成本，从而优化系统提示和上下文管理。对内容创作者或用 AI 进行长篇写作的群体，它提供了可量化的 token 消耗反馈，有助于控制每次生成的费用。不过，目前工具仅支持文本输入，尚未提及对多模态或图像 token 的处理。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，工具是否提供 API 接口或嵌入方式，让开发者直接在自己的工作流中调用，将决定其生态扩展速度。其次，Google、Anthropic 等公司是否会在官方控制台中集成类似功能，或推出更精确的分词器本地化方案，值得持续跟踪。最后，Token Studio 的估算定价是否基于各模型最新一级价格（如 GPT-5 的输入/输出费率差别），其更新频率和透明度也是用户验证其可靠性的关键。目前公开信息显示，该工具为一次性加载的网页应用，未来是否开源或推出浏览器扩展版本，尚未披露。

来源：holaclaw.ai

Show HN: 浏览器内置的真实 LLM 令牌计数器和成本估算

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

高盛表示，这是人工智能基础设施领域的下一个重大趋势，增长潜力可达9倍。以下3只股票值得买入，以把握这一价值1540亿美元的机遇。

GLM-5.2：可能是最强大的纯文本开源权重大语言模型

钉钉事件背后的残酷真相：AI越提效，我们越累

发表回复取消回复