清华系团队给大模型织了一张“智能算力电网”

一句话看懂：清华系创业公司是石科技（成立于2021年，源自国家超级计算无锡中心团队）发布了“国产TOKEN调优工厂”，通过异构算力池化与推理优化，可将单位Token成本降低40%、吞吐量提升30%-50%，旨在解决国产AI芯片闲置、算力效率低下的行业痛点。

事件核心：发生了什么

是石科技创始人闫博文（1993年出生，清华大学计算机系博士后）带领团队，打造了一套名为“TOKEN调优工厂”的算力调度与推理优化平台。其核心机制类似于“智能算力电网”：将NVIDIA GPU、昇腾、昆仑芯、天数、太初、瀚博半导体等异构国产芯片统一接入资源池，通过智能调度、弹性扩缩容，以及CUDA Kernel算子级优化、PagedAttention内存优化、连续批处理、推测解码等全维度推理加速技术，实现算力的标准化输出。实测数据显示，同等算力条件下吞吐量提升30%-50%，单位Token成本降低40%，服务可用性达到99.9%。

为什么重要

当前国产AI芯片面临“能用不好用”的困境：产能虽有提升，但生态不全、适配困难、推理优化门槛高，导致大量国产卡闲置空转。是石科技的方案不是又一个算力转租平台，而是从底层重构算力的“变现路径”——将闲置的异构算力转化为稳定、低成本的标准化Token产能。这直接回应了AI落地中最实际的问题：Token能否被稳定、便宜、规模化地生产出来。如果方案规模化落地，可能加速中国AI产业从堆参数转向工业化推理生产，降低对特定GPU的依赖。

对用户/开发者/创作者的影响

对企业级用户和AI应用开发者：可以直接采用“插电即用”的算力服务，无需手动适配多款国产芯片、优化推理框架，大幅缩短部署周期。Token成本降低40%意味着AI应用（如对话系统、内容生成、图像生成）的运营成本显著下降，尤其是高频调用场景。对硬件采购决策者：国产芯片不再只是“备胎”，而是可以在统一调度下投入生产，可能影响企业未来的算力采购策略。对创作者：通过API使用大模型时，底层算力效率的提升可能间接改善响应速度和费用结构。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，该方案的实际落地案例和数据尚待更多客户验证，尤其是横向对比同等场景下的成本与延迟表现。第二，国产芯片生态（昇腾、昆仑芯等）的开发者工具链是否进一步开放，以配合这类统一调度平台。第三，类似的技术路线的竞品（如其他超算团队孵化的算力平台）是否跟进，将影响国产算力池化市场的竞争格局。目前公开信息显示，是石科技目标是“建成中国最大、技术最先进的国产TOKEN调优工厂”，但大规模商用时间和定价策略尚未公布。

来源：量子位 · 每日最新

清华系团队给大模型织了一张“智能算力电网”