
清华系团队给大模型织了一张“智能算力电网”
一句话看懂:清华系创业公司是石科技(成立于2021年,源自国家超级计算无锡中心团队)发布了“国产TOKEN调优工厂”,通过异构算力池化与推理优化,可将单位Token成本降低40%、吞吐量提升30%-50%,旨在解决国产AI芯片闲置、算力效率低下的行业痛点。
事件核心:发生了什么
是石科技创始人闫博文(1993年出生,清华大学计算机系博士后)带领团队,打造了一套名为“TOKEN调优工厂”的算力调度与推理优化平台。其核心机制类似于“智能算力电网”:将NVIDIA GPU、昇腾、昆仑芯、天数、太初、瀚博半导体等异构国产芯片统一接入资源池,通过智能调度、弹性扩缩容,以及CUDA Kernel算子级优化、PagedAttention内存优化、连续批处理、推测解码等全维度推理加速技术,实现算力的标准化输出。实测数据显示,同等算力条件下吞吐量提升30%-50%,单位Token成本降低40%,服务可用性达到99.9%。
为什么重要
当前国产AI芯片面临“能用不好用”的困境:产能虽有提升,但生态不全、适配困难、推理优化门槛高,导致大量国产卡闲置空转。是石科技的方案不是又一个算力转租平台,而是从底层重构算力的“变现路径”——将闲置的异构算力转化为稳定、低成本的标准化Token产能。这直接回应了AI落地中最实际的问题:Token能否被稳定、便宜、规模化地生产出来。如果方案规模化落地,可能加速中国AI产业从堆参数转向工业化推理生产,降低对特定GPU的依赖。
对用户/开发者/创作者的影响
对企业级用户和AI应用开发者:可以直接采用“插电即用”的算力服务,无需手动适配多款国产芯片、优化推理框架,大幅缩短部署周期。Token成本降低40%意味着AI应用(如对话系统、内容生成、图像生成)的运营成本显著下降,尤其是高频调用场景。对硬件采购决策者:国产芯片不再只是“备胎”,而是可以在统一调度下投入生产,可能影响企业未来的算力采购策略。对创作者:通过API使用大模型时,底层算力效率的提升可能间接改善响应速度和费用结构。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,该方案的实际落地案例和数据尚待更多客户验证,尤其是横向对比同等场景下的成本与延迟表现。第二,国产芯片生态(昇腾、昆仑芯等)的开发者工具链是否进一步开放,以配合这类统一调度平台。第三,类似的技术路线的竞品(如其他超算团队孵化的算力平台)是否跟进,将影响国产算力池化市场的竞争格局。目前公开信息显示,是石科技目标是“建成中国最大、技术最先进的国产TOKEN调优工厂”,但大规模商用时间和定价策略尚未公布。
来源:量子位 · 每日最新


