估值 820 万美元的“数据矿工”：Human Archive 如何在印度挖掘机器人训练“金矿”

一句话看懂：硅谷初创公司 Human Archive 完成了 820 万美元融资，通过在印度雇佣零工经济工人佩戴摄像头和传感器采集日常生活数据，来训练 AI 实验室的机器人。这一模式引发了关于隐私、合规和商业模式的广泛争议。

事件核心：发生了什么

Human Archive 近期宣布获得 820 万美元融资，投资方包括 Wing Venture Capital、Y Combinator，以及来自 OpenAI、Nvidia、Google 和 Meta 的高管与研究人员个人。该公司核心业务是收集所谓的“第一人称视角”视频数据：为印度家政、清洁等零工平台的工人配备头戴式 RGB-D 摄像头、触觉手套和动作捕捉服，在工人提供服务时同步录制包括运动轨迹、触觉压力、深度信息和视频在内的多模态数据。目前，Human Archive 已在多个地点部署了超过 1000 台头戴设备和 50 多套复合传感器终端。公司通过为同意数据采集的用户提供服务费折扣来驱动数据收集，工人则可额外获得约每小时 1 美元的报酬。尽管公司强调数据已完成匿名化和面部模糊处理，但印度电子与信息技术部（MeitY）已开始审查其“知情同意”机制是否合规。

为什么重要

通用机器人（Physical AI）竞赛的核心瓶颈正从算力转向高质量的真实世界行为数据。OpenAI、Figure 等公司加速将人形机器人引入家庭和工厂，而机器人模仿人类日常工作的能力，强烈依赖大规模、多场景的“第一人称数据集”。Human Archive 的商业模式实际上是在“零工劳动”和“机器人基础设施”之间搭建数据桥梁：用低廉的劳动力成本，获取 AI 实验室急需的、标注精细的空间感知和触觉数据。若该模式跑通，将极大降低机器人训练数据的获取门槛，并可能催生一个专门服务于“物理 AI”的数据采集产业链。但与此同时，其强依赖欠发达地区劳动力且易引发隐私冲突的扩张方式，也暴露了这一新兴领域在法律和伦理层面上的灰色地带。

对用户/开发者/创作者的影响

对 AI 开发者和机器人公司而言，这意味着出现了一个新的高质量数据源选项，可以低成本补充物理世界行为数据，尤其是家庭服务场景下的多模态数据。对于从事数据标注、AI 训练平台构建的开发者来说，这是一个值得关注的数据流通模式创新。对于普通用户，尤其是印度等发展中国家的消费者和零工工人，直接的影响是隐私权益面临考验：虽然服务费打折有吸引力，但个人生活场景被持续录制、上传和用于商业 AI 训练，可能引发对“数据是主动贡献还是被动剥削”的讨论。对于政策制定者和合规从业者，这一案例将成为判断“众包数据采集”边界的重要参考。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Human Archive 与印度本土家政平台 Urban Company、Pronto 的公开对抗如何处理，是否会被迫调整市场策略。第二，印度 MeitY 的合规审查结果，可能为全球类似数据采集活动设立先例。第三，公司计划拓展东南亚和美国市场，在这些地区将面临更严格的隐私法规（如 GDPR、CCPA），现有数据采集方案能否通过当地法律审核，将直接决定其商业模式能否规模化复制。

来源：AIbase

估值 820 万美元的“数据矿工”：Human Archive 如何在印度挖掘机器人训练“金矿”