
为避免刻板印象,AI 开始拒绝生图
一句话看懂:主流AI文生图模型在性别、地域等刻板印象测试中频频露怯,导致部分AI平台——尤其是国产模型豆包和千问——开始直接拒绝生成涉及特定地域或人群的图片,试图用“不做”来规避偏见风险。
事件核心:发生了什么
近日虎嗅报道,记者对多款主流AI模型(豆包、千问、GPT、Gemini)进行了刻板印象测试。结果发现:在职业性别议题上,Stable Diffusion生成CEO、医生图像90%为男性;所有模型在生成“护士”时默认使用女性形象。在“市长的女儿叫市长什么”的测试中,除DeepSeek外,其他模型均回答“爸爸”。地域文化测试暴露出更明显偏见:GPT生成中国富人为“陆家嘴品茶男”,美国富人为“西服伴侣组合”;Gemini对中国内地河南、上海等省份的生成尝试强制“男女平衡”策略。作为回应,豆包和千问对涉及国内省份的生成请求直接拒绝,给出的理由包括“风控规则”和“反刻板印象政策”,但在中东、欧洲等非中国场景下仍存在显著刻板印象输出。
为什么重要
偏见并非新闻,但“直接拒绝生成”成为主流模型的一种新应对策略,反映出几个关键变化:第一,模型厂商开始意识到生成偏见不仅是技术问题,更是品牌声誉和合规风险——豆包的迅速道歉和千问反复修正机制说明运营压力正在倒逼产品策略调整;第二,拒绝生成虽然能隔离敏感场景,但本质上是一种功能回避,并未解决训练数据本身的不均衡问题(如医疗AI对深色皮肤准确率低、语音识别对黑人词错误率高84%);第三,Gemini强行平衡男女频次的努力引发“过度修正”争议,说明在效率与公平之间找到平衡依然困难。华盛顿大学2025年的研究进一步警示:即使经过几次对话,AI也能潜移默化改变用户观点,这意味着偏见的负面影响远比想象中深远。
对用户/开发者/创作者的影响
普通用户:当你在国产AI平台请求生成“河南人在建筑工地”或“上海白领”时,很可能收获直接拒绝。这虽然避免了传播偏见,但也限制了创意表达;用户需要学习更复杂的提示词策略(如避开地域词汇、用中性描述触发生成)。开发者/API调用方:在使用豆包、千问等中文模型的文生图API时,需要预判敏感词拦截机制,尤其是涉及国内地域、职业、性别角色混搭的场景,否则接口会直接返回拒绝而不是图片;建议提前准备“替代提示语”(如用“忙碌的工人”而非“河南的建筑工”)。创作者:如果你依赖AI图片进行内容生产(如广告、宣传物料),需要额外检查是否存在隐含偏见,因为即使模型不拒绝生成,它输出的也往往是主流叙事模板(如富人的特定着装、场景),可能影响作品真实性或引发争议。
值得关注的后续
1. 国产模型是否会统一“地域敏感词”清单?目前豆包和千问的拒绝逻辑不尽相同,暂无公开统一标准,后续若有跨境或出海需求,合规边界将更清晰。2. 大模型厂商是否会推出更细粒度的“偏见声明与可选策略”(如允许用户选择“平衡模式”还是“默认模式”),而非一刀切地拒绝?3. 监管层面:随着AI生成内容在日常媒介中渗透率提升,国内对算法偏见的审查是否会从“事后处理”前移到“生成前审查”,将直接影响所有文生图产品的功能设计逻辑。
来源:虎嗅 (Huxiu)


