
得场景者得AI天下,出行赛道跑出了一家值得关注的数据玩家
一句话看懂:如祺出行在2025年财报中披露,其AI数据业务板块营收达1.6亿元,同比增长487.4%,成为公司增长最快的板块。这家出行平台正将日常运营中采集的真实物理世界交互数据,加工成训练具身智能、世界模型所需的“黄金”数据集,初步验证了“业务即采集”模式的商业化路径。
事件核心:发生了什么
2026年5月,如祺出行首次对外完整披露了其AI数据资产及能力版图。公司已在广州、上海、重庆、沈阳等城市部署超300辆搭载激光雷达、高精度惯导等传感器的智能驾驶数据采集车,这些车辆在提供出行服务的同时合规采集数据,日均产出约1600小时、130TB的多模态数据。其数据资产涵盖标注数据、行为数据、合成数据及多模态训练数据集四大类,客户包括腾讯、小马智行、理想、火山引擎、百度智能云、广汽集团等头部企业。如祺数据的服务已从智能驾驶扩展至具身智能、大模型、消费电子、医疗等领域。
为什么重要
业内观点认为,训练世界模型、具身智能所需的真实物理世界交互数据,供需缺口可能接近十万倍。传统从互联网爬取静态图片视频、实验室仿真或众包采集的方式,难以满足对“决策—行动—反馈”完整因果链条数据的需求。如祺出行的模式在于:出行服务是天然的高频、多模态、闭环交互场景,每辆采集车在完成运人服务的同时,同步记录“驾驶员操作—车辆响应—环境反馈”的数据,边际采集成本被大幅摊薄。其自研OCC自动化标注算法可减少90%人工标注时间、交付准确率超98%,合成数据模块能补充雨、雾、雪等长尾场景。这使得出行平台从单一服务商,升级为AI理解物理世界的数据入口和底层基础设施。
对用户/开发者/创作者的影响
对AI模型开发者和具身智能团队而言,这意味着不再需要从零搭建采集车队和标注管线,可以直接获取经过深度加工的标准化数据集与工具链,降低物理世界数据的使用门槛。对大模型应用开发者来说,如祺数据的多模态训练数据集可直接用于垂类微调,加速在自动驾驶、机器人、车后服务等场景的落地。对关注企业采购的技术负责人来说,需要评估这种“数据集+全栈能力”的服务模式,是否比自建数据工厂更具成本效益。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,如祺数据的采集网络能否从目前的300余辆车、4个城市扩展至全国甚至海外,规模直接决定了数据多样性和稀缺场景覆盖率。第二,腾讯、火山引擎等云计算厂商作为客户,是否会进一步与如祺数据合作推出“数据+算力”打包方案,降低AI训练的整体门槛。第三,具身智能在车后服务场景(如洗车、换电、维保)的真实服务闭环是否落地,将检验其数据能力从驾驶向更广泛物理世界泛化的可行性。
来源:量子位 · 每日最新


