
Nat. Commun. | 临床 AI 中的「遗忘偏差」:医疗记录缺失如何制造算法不公平
一句话看懂:一项发表在《自然·通讯》上的研究发现,当AI系统应患者要求“遗忘”其医疗记录后,模型对不同族裔和医院群体的预测公平性会显著下降。研究者提出了“公平遗忘”框架,在删除数据的同时抑制算法歧视,首次为GDPR下的隐私权与公平性冲突提供了技术方案。
事件核心:发生了什么
由牛津大学等机构组成的团队系统评估了“机器遗忘”对临床AI公平性的影响。实验涉及COVID-19快速筛查、院内死亡预测和休克预测四个真实世界数据集(CURIAL、eICU、MIMIC-IV)。结果显示,现有遗忘方法如SCRUB在删除1%至10%病历后,不同族裔和医院间的预测差异显著扩大,且性能出现“灾难性遗忘”,AUROC明显下降。研究者提出的公平遗忘(FU)框架,通过Gram-Schmidt正交化将“遗忘”“保持性能”“减少偏见”三个目标的梯度相互独立,避免了优化方向冲突。该框架在保护隐私(成员推断攻击AUROC接近理想值)的同时,将不同亚组间的等机会差异(EO)和人口均等差异(DP)降至低于完全重新训练模型的水平,且不破坏模型对关键临床特征(如血红蛋白)的解释能力。
为什么重要
GDPR确立的被遗忘权要求AI系统从已部署模型中删除特定数据,但主流机器遗忘研究只关注“如何删除”,忽视了删除行为对模型认知分布的扭曲。该研究首次量化了这种“遗忘偏差”:删除少数族裔或特定医院数据后,模型会放大对其他群体的刻板印象。这直接挑战了“隐私保护优先”的合规逻辑——实践中,医院若只机械执行删除请求,可能反而违反反算法歧视法规。FU框架的价值在于证明“公平遗忘”不是零和博弈,通过梯度层面的干扰抑制,可以在一个模型中同时满足两条法规要求。目前该技术已在多中心数据集上验证,但尚未覆盖回归任务、罕见病预测及联邦学习场景。
对用户/开发者/创作者的影响
对医疗AI开发者而言,需要意识到“隐私删除”不再是简单的数据过滤。在构建训练与遗忘模块时,若不加入公平性约束,模型在迭代过程中可能对少数群体越来越不可靠。对医院IT采购方来说,评估AI系统时不仅要看诊断准确率,还应要求供应商提供“遗忘后公平性”测试报告。对于关注伦理的创作者,该研究提供了一个明确的批判框架:未来的通用数据保护规范不应只强调“遗忘权”,还需配套“遗忘审计”机制。由于FU框架计算开销低于完全重训练,其梯度正交化的设计思路可能被借鉴到其他敏感领域(如金融授信、招聘筛选)中的合规AI部署中。
值得关注的后续
第一,该框架是否能在更复杂的国家多医院网络中得到验证,尤其是存在系统性医疗资源不均的环境。第二,GDPR执法机构是否会采纳“遗忘偏差”作为新的合规检查点,要求企业证明删除操作未引入新歧视。第三,目前FU仅处理单次遗忘,若进行多轮遗忘操作(如每天删除数百条记录),梯度正交化是否仍能维持稳定性,目前公开信息尚未给出明确数据。
来源:Readhub · AI


