Nat. Commun. | 临床 AI 中的「遗忘偏差」：医疗记录缺失如何制造算法不公平

一句话看懂：一项发表在《自然·通讯》上的研究发现，当AI系统应患者要求“遗忘”其医疗记录后，模型对不同族裔和医院群体的预测公平性会显著下降。研究者提出了“公平遗忘”框架，在删除数据的同时抑制算法歧视，首次为GDPR下的隐私权与公平性冲突提供了技术方案。

事件核心：发生了什么

由牛津大学等机构组成的团队系统评估了“机器遗忘”对临床AI公平性的影响。实验涉及COVID-19快速筛查、院内死亡预测和休克预测四个真实世界数据集（CURIAL、eICU、MIMIC-IV）。结果显示，现有遗忘方法如SCRUB在删除1%至10%病历后，不同族裔和医院间的预测差异显著扩大，且性能出现“灾难性遗忘”，AUROC明显下降。研究者提出的公平遗忘（FU）框架，通过Gram-Schmidt正交化将“遗忘”“保持性能”“减少偏见”三个目标的梯度相互独立，避免了优化方向冲突。该框架在保护隐私（成员推断攻击AUROC接近理想值）的同时，将不同亚组间的等机会差异（EO）和人口均等差异（DP）降至低于完全重新训练模型的水平，且不破坏模型对关键临床特征（如血红蛋白）的解释能力。

为什么重要

GDPR确立的被遗忘权要求AI系统从已部署模型中删除特定数据，但主流机器遗忘研究只关注“如何删除”，忽视了删除行为对模型认知分布的扭曲。该研究首次量化了这种“遗忘偏差”：删除少数族裔或特定医院数据后，模型会放大对其他群体的刻板印象。这直接挑战了“隐私保护优先”的合规逻辑——实践中，医院若只机械执行删除请求，可能反而违反反算法歧视法规。FU框架的价值在于证明“公平遗忘”不是零和博弈，通过梯度层面的干扰抑制，可以在一个模型中同时满足两条法规要求。目前该技术已在多中心数据集上验证，但尚未覆盖回归任务、罕见病预测及联邦学习场景。

对用户/开发者/创作者的影响

对医疗AI开发者而言，需要意识到“隐私删除”不再是简单的数据过滤。在构建训练与遗忘模块时，若不加入公平性约束，模型在迭代过程中可能对少数群体越来越不可靠。对医院IT采购方来说，评估AI系统时不仅要看诊断准确率，还应要求供应商提供“遗忘后公平性”测试报告。对于关注伦理的创作者，该研究提供了一个明确的批判框架：未来的通用数据保护规范不应只强调“遗忘权”，还需配套“遗忘审计”机制。由于FU框架计算开销低于完全重训练，其梯度正交化的设计思路可能被借鉴到其他敏感领域（如金融授信、招聘筛选）中的合规AI部署中。

值得关注的后续

第一，该框架是否能在更复杂的国家多医院网络中得到验证，尤其是存在系统性医疗资源不均的环境。第二，GDPR执法机构是否会采纳“遗忘偏差”作为新的合规检查点，要求企业证明删除操作未引入新歧视。第三，目前FU仅处理单次遗忘，若进行多轮遗忘操作（如每天删除数百条记录），梯度正交化是否仍能维持稳定性，目前公开信息尚未给出明确数据。

来源：Readhub · AI