Project Genie与谷歌街景合作推出交互式世界

一句话看懂：Google DeepMind 宣布将“Project Genie”与谷歌街景打通，用户可以通过自然语言或图像提示，基于真实街景位置生成并走入可交互的 3D 世界。这标志着 AI 生成内容从“看图”走向“可探索的虚拟空间”，且首次直接绑定真实地理数据。

事件核心：发生了什么

根据 Google DeepMind 在 X 上发布的信息，Project Genie 是一个基于图像生成模型的交互式世界创建工具，其最新能力是与谷歌街景深度集成。用户不再需要手动搭建场景，只需在谷歌街景中定位一个具体地点（例如巴黎的某条街道或某处自然景观），AI 就会基于该位置的实景图像，自动生成一个风格一致且可自由漫游的 3D 环境。这一过程不依赖专业建模软件，也不需要对物理渲染引擎进行复杂配置。

目前公开信息显示，Project Genie 仍处于演示或早期测试阶段，尚未公布正式的产品上线日期或 API 开放计划。但 DeepMind 明确展示了从真实街景数据到可交互世界的完整生成链路，这意味着 AI 世界生成模型已从虚构场景扩展到真实地点复现。

为什么重要

这项合作改变了几个关键的技术和商业逻辑。第一，它打破了 AI 世界生成与物理世界之间的信息壁垒。此前大多数 AI 生成世界模型（如基于文本到 3D 的工具）依赖用户提供语言描述或概念图，生成的场景往往缺乏现实参照，导致地理与尺度失真。Project Genie 直接复用谷歌街景的海量实景数据，使 AI 输出的环境具备真实世界的视觉和空间参照系。第二，它降低了“空间交互”的创作门槛。开发者或普通用户不需要学习 Unity 或 Unreal Engine，只需要一个街景位置和一段提示，就能获得一个可自由移动的探索环境。第三，对谷歌自身而言，这意味着街景这个积累了十几年的地理数据资产，有了新的变现和产品化路径——从静态图片浏览升级为动态的 AI 游乐场。

对用户/开发者/创作者的影响

对普通用户，最直接的体验是“云旅行”概念升级：未来可能在谷歌地图或街景中看到一个按钮，点击就进入一个由 AI 自动美化或风格化后的可交互版地点，例如把现实街道变成像素游戏场景或动画风格。对游戏和教育类开发者，Project Genie 提供了一个极低成本的 3D 场景生成管线，做虚拟导览、历史重现或地理教学应用时，不需要从头制作模型，只需接入街景地点与提示文案。对 AI 应用公司，这意味着世界生成模型的竞争将进入“数据资源之争”，谁能拿到更大量、更高质量的真实地理图像（而非合成数据），谁就能做出更真实、更可用的产品。图像生成模型的能力在这里也从“做一张图”扩展为“做一整个世界”，对算力和推理架构的要求会进一步上升。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，产品落地时间。Google DeepMind 目前没有公布正式版发布时间，如果 Project Genie 成为谷歌地图或 Android 系统的一个组件，将对以 Roblox、Minecraft 为代表的用户生成内容平台构成直接竞争。第二，数据隐私与合规。街景图像包含大量用户面部、车牌和个人信息，AI 在生成世界时是否会重新暴露这些内容至关重要。第三，竞品跟进。Meta、微软、以及多家初创公司（如 World Labs、Decart）都在布局 AI 世界生成，谷歌这次用真实地理数据做差异化，竞争格局可能会加速分化。第四，开源与否。DeepMind 过往部分项目未开源，若 Project Genie 保持闭源，独立开发者在生态中的话语权会受限。

来源：X：Google DeepMind (@GoogleDeepMind)

Project Genie与谷歌街景合作推出交互式世界