两部门发文布局人工智能计量能力建设

一句话看懂：市场监管总局与国家发改委联合印发《人工智能计量体系和能力建设指引（2026版）》，首次系统性地将“计量”这一基础科学手段引入AI领域，旨在为算法和数据建立可测量、可比较、可追溯的标准体系。此举直接针对AI行业长期存在的“黑箱”与“数据荒”两大痛点。

事件核心：发生了什么

据经济参考报5月28日报道，市场监管总局与国家发改委联合发布《人工智能计量体系和能力建设指引（2026版）》。这份文件的核心是围绕AI计量能力建设，重点解决两大行业痼疾。首先，针对算法“黑箱”与决策可解释性差的问题，部署了AI系统内部状态监测与表征等关键技术攻关，目标是通过建立可靠的计量标准，让AI系统的性能实现“可测量、可比较、可追溯”。其次，聚焦“数据荒”难题，明确将构建具有最高计量特性的数据集、标准参考数据集和测试数据集，建立基础资源共享机制，打破行业数据壁垒，为AI算法训练和评测提供精准的“粮草”。文件还提出推动计量技术深度融入智能制造、智慧医疗、智慧交通等14个重点领域，并计划建设一批人工智能计量技术研发应用中心。

为什么重要

这一政策的意义在于为AI行业提供了“度量衡”。过去，不同大模型厂商在宣传自家模型时，往往使用自有或不同的测试基准，导致性能对比缺乏统一标尺。用户和开发者难以客观判断不同API、不同开源模型之间的真实差异。此次发文相当于由国家力量为AI性能的评测设立准入门槛和统一标准，这将直接影响到行业的竞争格局——从依赖营销话术转向依赖可验证的量化指标。同时，建立参考数据集和共享机制，能够降低中小开发者和企业获取高质量训练数据的成本，缓解数据壁垒带来的生态割裂问题。此外，文件覆盖智慧医疗、智能制造等14个垂直领域，意味着未来的AI应用落地，尤其是在医疗诊断、自动驾驶等高风险场景中，将必须通过严格的计量校准和安全性验证，这为技术商用划定了更清晰的合规边界。

对用户/开发者/创作者的影响

对于普通用户，这意味着未来使用AI工具（如医疗辅助诊断、智能客服、内容生成）的可靠性和安全性将得到更强的保障，特别是涉及健康、出行等关键决策的场景。对于开发者和企业，影响更为直接：一方面，API调用方在选择大模型时，可以参考国家统一的计量标准进行横向比较，筛选出性能最优的模型；另一方面，若自身产品涉及上述14个重点领域，未来可能需要配合国家计量中心的测评，将合规成本纳入研发计划。对于AI应用开发者和创作者，高质量参考数据集的开放共享，有助于降低模型微调和功能开发的门槛，尤其是在垂直行业数据的获取上。不过，目前公开信息显示，相关技术标准细则和数据集的具体类型尚未公布，开发者需留意后续的政策落地动态。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，政策落地的具体时间表和首批评测标准细则是什么，这将直接影响企业产品迭代节奏。第二，由两部门发起的计量技术研发应用中心将如何运作，是否会与主流开源模型（如LlaMA、GPT系列）的评测体系对接。第三，在智慧医疗、自动驾驶等高风险领域，计量标准是否会先于产品上市成为强制要求，从而改变部分企业“先上线、后优化”的策略。

来源：Readhub · AI

两部门发文布局人工智能计量能力建设