我用 Gemini 的 AI 头像工具克隆了自己。结果让我感到不安

我用 Gemini 的 AI 头像工具克隆了自己。结果让我感到不安

我用 Gemini 的 AI 头像工具克隆了自己。结果让我感到不安

一句话看懂:Google 在 Gemini 应用中推出了基于其 Omni 视频模型的 AI 头像(Avatar)功能,用户只需几分钟就能创建自己的数字克隆,并生成 10 秒的 AI 视频。Wired 记者实测后认为,效果虽然有些混乱,但真实感强到令人不安。

事件核心:发生了什么

Google DeepMind 将 AI 头像功能嵌入 Gemini 应用,面向每月 20 美元的 AI Pro 订阅用户开放。记者在试用中,仅用约 5 分钟便完成了头像设置:在光照良好的房间里,按照手机摄像头指示读出数字并左右转动头部,一个名为“Reece 2.0”的数字克隆便生成了。他测试了两个 10 秒视频,一个要求 AI 在旧金山多洛雷斯公园山顶为恐龙唱生日歌,另一个要求在海湾大桥下冲浪。生成结果中,背景的公园实景和远处地标清晰可辨,人物嘴部动作和体态也高度逼真,但存在咬字重复、服饰不合逻辑(冲浪时穿全身牛仔)、物品凭空出现等明显瑕疵。值得注意的是,Google 目前仅允许成人用户用自己形象生成视频,而 OpenAI 此前曾允许用户选择是否允许他人使用其形象生成视频。

为什么重要

这一功能标志着 AI 视频生成从“生成虚拟角色”向“克隆真人形象”迈出了实质性一步。Omni 模型在保持人物一致性和场景真实感上取得了进展,尤其在地理位置还原方面——Google 利用自身地图数据让视频背景精确对应实际地标。同时,这也引发了关于深度伪造和肖像权的激烈讨论。虽然 Google 声称将安全置于首位,并表示“在阻止有害内容的同时不过度干预良性使用”,但一旦这项工具大规模开放,非自愿深度伪造视频的制作成本将大幅降低。这或是目前主流平台中,首个直接向消费者提供个人 AI 视频形象生成的工具。

对用户/开发者/创作者的影响

普通用户需要注意,个人肖像即将快速进入“可生成可编辑”的 AI 时代。用户在设置头像时的着装也会影响生成结果,拍摄时穿戴的衣服很可能出现在后续生成的视频中。对于内容创作者,这一工具有望降低真人出镜的门槛,创作者仅用文字提示就能让自己“出现在”任何场景中。但对于开发者而言,当前生成效果仍不稳定,视频中存在明显的人工痕迹和逻辑错误,不适合直接用于专业级别的内容生产。同时,高速使用会让用户很快达到每 5 小时重置一次的使用上限,说明算力消耗和成本控制仍是瓶颈。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Google 是否会开放 API,让第三方应用也能调用 Omni 视频模型和头像功能,这决定了该能力能否进入更广泛的开发者生态。第二,围绕肖像权的合规问题将逐渐浮出水面,尤其是当用户投诉生成内容涉及他人形象时,平台如何界定责任和善后。第三,OpenAI、Meta 等竞品是否会推出类似功能,以及消费者愿意为制作“自己的 AI 视频”支付多少费用,都是判断 AI 虚拟形象市场是否可持续的关键指标。

来源:Wired AI

celebrityanime
celebrityanime
文章: 3338

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注