得物推荐 AI Harness：从“狂野代码”到“按目标生产”｜AICon上海

一句话看懂：得物技术专家将在 AICon 上海分享其推荐系统 AI Harness 体系，核心解决 AI 生成代码在复杂生产环境中“能跑不能用”的问题，通过一套工业级“围栏”将 AI 协作从“野生”状态转变为标准化、可审计、可回滚的生产流程。这标志着大模型在关键业务系统（如电商推荐）中的落地，正从实验性代码生成迈向工程化管控。

事件核心：发生了什么

在 6 月 26-27 日于上海举办的 AICon 2026 大会上，得物资深技术专家白忠魏将发表题为《得物推荐 AI Harness —— 从“狂野代码”到“按目标生产”》的演讲。白忠魏拥有 15 年以上互联网经验，曾负责淘宝首页、搜索、推荐及内容体系。他将在会上详细介绍得物为应对 AI 代码质量不确定性问题而构建的一整套 Harness 体系。

该体系的核心是贯穿推荐系统生命周期的 7 阶段护栏（Harness Guardrails），覆盖从 PRD 拆解、技术方案评审、开发沙箱调试、单测验证、联调 Mock、上线自动熔断，到效果复盘与 Bad Case 回流的全流程。例如在代码上线阶段，系统可在 Beta 集群实现毫秒级熔断，拦截内存泄漏与指标偏移。在架构层面，得物采用了“Highway（高速公路）与 ATV（越野模式）”的混合反思架构，前者应对 80% 的高频重复业务，后者处理 20% 的长尾复杂 Case，并通过“记忆层”将成功经验自动固化为新流程。

为什么重要

该实践的价值在于，它直面了 AI 工程化中最棘手的“可信执行”问题。目前公开信息显示，得物推荐系统面临极大规模、AP 架构复杂以及调参“黑盒”等挑战。如果将 AI 写的代码直接投入如此复杂的生产环境，极易引发线上事故。Harness 体系提供了一套可复用的“生产安全围栏”，让 AI 生成代码不再是“碰运气”，而是像传统软件工程一样具备契约、断言、隔离和回滚能力。这对于正在尝试用大模型重构核心业务流程（如搜索、推荐、广告）的企业具有重要的参考意义，尤其在解决“AI 采纳率低”和“迭代周期失控”这两个痛点方面提供了量化方法和架构参考。

对用户/开发者/创作者的影响

对推荐系统开发者而言，这意味着工作流将从“手工写代码、手工调参”转向“AI 在围栏内自动生成、人类审核与监控”。得物的实践表明，通过 Harness 可以提升需求交付周期渗透率和链路 AI 采纳率，同时缩短迭代时长。对于企业技术决策者，这提供了一个评估 AI 工程化成熟度的具体案例：是否拥有“人机共识”的评审关卡、是否具备毫秒级熔断能力、是否实现了 Bad Case 的自动复盘回流。对于普通用户，这套体系旨在减少 AI 代码故障带来的业务异常（如推荐结果突然变差或服务崩溃），提升在线服务的稳定性。