我用 Gemini 的 AI 头像工具克隆了自己。结果让我感到不安

一句话看懂：Google 在 Gemini 应用中推出了基于其 Omni 视频模型的 AI 头像（Avatar）功能，用户只需几分钟就能创建自己的数字克隆，并生成 10 秒的 AI 视频。Wired 记者实测后认为，效果虽然有些混乱，但真实感强到令人不安。

事件核心：发生了什么

Google DeepMind 将 AI 头像功能嵌入 Gemini 应用，面向每月 20 美元的 AI Pro 订阅用户开放。记者在试用中，仅用约 5 分钟便完成了头像设置：在光照良好的房间里，按照手机摄像头指示读出数字并左右转动头部，一个名为“Reece 2.0”的数字克隆便生成了。他测试了两个 10 秒视频，一个要求 AI 在旧金山多洛雷斯公园山顶为恐龙唱生日歌，另一个要求在海湾大桥下冲浪。生成结果中，背景的公园实景和远处地标清晰可辨，人物嘴部动作和体态也高度逼真，但存在咬字重复、服饰不合逻辑（冲浪时穿全身牛仔）、物品凭空出现等明显瑕疵。值得注意的是，Google 目前仅允许成人用户用自己形象生成视频，而 OpenAI 此前曾允许用户选择是否允许他人使用其形象生成视频。

为什么重要

这一功能标志着 AI 视频生成从“生成虚拟角色”向“克隆真人形象”迈出了实质性一步。Omni 模型在保持人物一致性和场景真实感上取得了进展，尤其在地理位置还原方面——Google 利用自身地图数据让视频背景精确对应实际地标。同时，这也引发了关于深度伪造和肖像权的激烈讨论。虽然 Google 声称将安全置于首位，并表示“在阻止有害内容的同时不过度干预良性使用”，但一旦这项工具大规模开放，非自愿深度伪造视频的制作成本将大幅降低。这或是目前主流平台中，首个直接向消费者提供个人 AI 视频形象生成的工具。

对用户/开发者/创作者的影响

普通用户需要注意，个人肖像即将快速进入“可生成可编辑”的 AI 时代。用户在设置头像时的着装也会影响生成结果，拍摄时穿戴的衣服很可能出现在后续生成的视频中。对于内容创作者，这一工具有望降低真人出镜的门槛，创作者仅用文字提示就能让自己“出现在”任何场景中。但对于开发者而言，当前生成效果仍不稳定，视频中存在明显的人工痕迹和逻辑错误，不适合直接用于专业级别的内容生产。同时，高速使用会让用户很快达到每 5 小时重置一次的使用上限，说明算力消耗和成本控制仍是瓶颈。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Google 是否会开放 API，让第三方应用也能调用 Omni 视频模型和头像功能，这决定了该能力能否进入更广泛的开发者生态。第二，围绕肖像权的合规问题将逐渐浮出水面，尤其是当用户投诉生成内容涉及他人形象时，平台如何界定责任和善后。第三，OpenAI、Meta 等竞品是否会推出类似功能，以及消费者愿意为制作“自己的 AI 视频”支付多少费用，都是判断 AI 虚拟形象市场是否可持续的关键指标。

来源：Wired AI

我用 Gemini 的 AI 头像工具克隆了自己。结果让我感到不安