
一句话看懂:原本定位为区块链 IP 所有权网络的 Story Protocol,在累计筹集 1.4 亿美元后更名为 Data Foundation,转向为 AI 训练数据建立链上注册表,旨在解决 AI 训练数据的来源追溯和所有权确认问题。
事件核心:发生了什么
据 CoinDesk 报道,Story Protocol 宣布更名为 Data Foundation,并调整其核心使命:从管理数字 IP 所有权,转向构建一个基于区块链的 AI 训练数据注册表。该项目此前已累计融资 1.4 亿美元,投资者包括 a16z 等知名风投。新的 Data Foundation 将专注于创建一个公开可查的链上账本,记录哪些数据集被用于训练特定的 AI 模型,以及数据的原始来源和授权状态。这一变化发生在 AI 行业因训练数据版权纠纷频发的背景下,许多创作者和版权方要求大模型公司公开其训练数据来源。
为什么重要
当前 AI 大模型的训练过程高度依赖海量数据,但数据来源的透明度极低。主流闭源模型如 OpenAI 的 GPT 系列和 Anthropic 的 Claude,在训练数据的构成上对外披露有限,导致版权侵权诉讼频发。Data Foundation 试图从基础设施层面介入:通过区块链的不可篡改特性,为每一份训练数据建立“数字指纹”和所有权记录。如果这一注册表获得主流 AI 开发者的采纳,它可能成为衡量模型合规性的新标准,迫使 AI 训练从“黑箱数据”转向“可追溯数据”。对于区块链行业而言,这也意味着从纯金融叙事向 AI 基础设施的实用转型。
对用户/开发者/创作者的影响
对创作者(包括文字作者、图像创作者、音乐人):Data Foundation 的注册表一旦运行,创作者可以在链上注册自己的作品作为训练数据,并追踪哪些 AI 模型使用了这些数据。这为后续的授权谈判或版权索赔提供了可核查的证据链,减少了维权的举证成本。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对 AI 开发者(大模型公司、开源社区):如果 Data Foundation 的注册表成为行业标准,开发者在训练模型前需要查询并合规获取数据授权。短期内,这会增加数据清洗和合规流程的成本;但长期看,可有效降低因数据侵权导致的诉讼风险和法律不确定性。
对普通用户:影响较为间接。如果更多模型采用可追溯数据训练,用户未来使用的 AI 产品在生成内容时,可能会遇到更清晰的“数据来源声明”,例如“本回答基于已授权的公开语料生成”。
值得关注的后续
第一,落地验证:目前 Data Foundation 仅公布了更名和方向调整,尚未发布可用的注册表产品或合作案例。需要观察其是否能在 2026 年下半年推出测试网,并与至少一家主流大模型公司达成数据上链合作。
第二,监管适配:欧盟、美国与中国都在推进 AI 训练数据的监管立法。Data Foundation 的技术方案能否被监管机构认可为“有效合规工具”,决定了其商业价值上限。
第三,竞品动向:市场上已有多个项目(如 Near AI、Filecoin 的 AI 数据协议)试图解决类似问题。Data Foundation 如何利用其 1.4 亿美元资金和原有开发者网络建立护城河,是决定其能否跑出来的关键。
来源:Techmeme


