Project Genie与谷歌街景合作推出交互式世界

Project Genie与谷歌街景合作推出交互式世界

Project Genie与谷歌街景合作推出交互式世界

一句话看懂:Google DeepMind 宣布将“Project Genie”与谷歌街景打通,用户可以通过自然语言或图像提示,基于真实街景位置生成并走入可交互的 3D 世界。这标志着 AI 生成内容从“看图”走向“可探索的虚拟空间”,且首次直接绑定真实地理数据。

事件核心:发生了什么

根据 Google DeepMind 在 X 上发布的信息,Project Genie 是一个基于图像生成模型的交互式世界创建工具,其最新能力是与谷歌街景深度集成。用户不再需要手动搭建场景,只需在谷歌街景中定位一个具体地点(例如巴黎的某条街道或某处自然景观),AI 就会基于该位置的实景图像,自动生成一个风格一致且可自由漫游的 3D 环境。这一过程不依赖专业建模软件,也不需要对物理渲染引擎进行复杂配置。

目前公开信息显示,Project Genie 仍处于演示或早期测试阶段,尚未公布正式的产品上线日期或 API 开放计划。但 DeepMind 明确展示了从真实街景数据到可交互世界的完整生成链路,这意味着 AI 世界生成模型已从虚构场景扩展到真实地点复现。

为什么重要

这项合作改变了几个关键的技术和商业逻辑。第一,它打破了 AI 世界生成与物理世界之间的信息壁垒。此前大多数 AI 生成世界模型(如基于文本到 3D 的工具)依赖用户提供语言描述或概念图,生成的场景往往缺乏现实参照,导致地理与尺度失真。Project Genie 直接复用谷歌街景的海量实景数据,使 AI 输出的环境具备真实世界的视觉和空间参照系。第二,它降低了“空间交互”的创作门槛。开发者或普通用户不需要学习 Unity 或 Unreal Engine,只需要一个街景位置和一段提示,就能获得一个可自由移动的探索环境。第三,对谷歌自身而言,这意味着街景这个积累了十几年的地理数据资产,有了新的变现和产品化路径——从静态图片浏览升级为动态的 AI 游乐场。

对用户/开发者/创作者的影响

对普通用户,最直接的体验是“云旅行”概念升级:未来可能在谷歌地图或街景中看到一个按钮,点击就进入一个由 AI 自动美化或风格化后的可交互版地点,例如把现实街道变成像素游戏场景或动画风格。对游戏和教育类开发者,Project Genie 提供了一个极低成本的 3D 场景生成管线,做虚拟导览、历史重现或地理教学应用时,不需要从头制作模型,只需接入街景地点与提示文案。对 AI 应用公司,这意味着世界生成模型的竞争将进入“数据资源之争”,谁能拿到更大量、更高质量的真实地理图像(而非合成数据),谁就能做出更真实、更可用的产品。图像生成模型的能力在这里也从“做一张图”扩展为“做一整个世界”,对算力和推理架构的要求会进一步上升。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,产品落地时间。Google DeepMind 目前没有公布正式版发布时间,如果 Project Genie 成为谷歌地图或 Android 系统的一个组件,将对以 Roblox、Minecraft 为代表的用户生成内容平台构成直接竞争。第二,数据隐私与合规。街景图像包含大量用户面部、车牌和个人信息,AI 在生成世界时是否会重新暴露这些内容至关重要。第三,竞品跟进。Meta、微软、以及多家初创公司(如 World Labs、Decart)都在布局 AI 世界生成,谷歌这次用真实地理数据做差异化,竞争格局可能会加速分化。第四,开源与否。DeepMind 过往部分项目未开源,若 Project Genie 保持闭源,独立开发者在生态中的话语权会受限。

来源:X:Google DeepMind (@GoogleDeepMind)

celebrityanime
celebrityanime
文章: 3558

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注