No data found. Please verify arguments (train_data_dir must be the parent of folders with images

用户在 Windows 系统下使用 Kohya SS 进行 LoRA 训练(或 DreamBooth 训练),运行 train_network.py 脚本时报错。常见于用户将 train_data_dir 参数直接指向了存放图片的文件夹(例如 C:/images/118_DPITW ),而没有指向包

No data found. Please verify arguments (train_data_dir must be the parent of folders with images

No data found. Please verify arguments (train_data_dir must be the parent of folders with images

快速结论:此报错通常在 Kohya SS 训练 LoRA 或 DreamBooth 模型时出现,原因是 --train_data_dir 指向了包含具体图片的子文件夹,而不是包含图片子文件夹的父目录。优先检查 train_data_dir 路径层级是否正确。

问题场景

用户在 Windows 系统下使用 Kohya SS 进行 LoRA 训练(或 DreamBooth 训练),运行 train_network.py 脚本时报错。常见于用户将 train_data_dir 参数直接指向了存放图片的文件夹(例如 C:/images/118_DPITW),而没有指向包含该文件夹的父目录(例如 C:/images)。

报错原文

ERROR    No data found. Please verify arguments (train_data_dir must be the parent of folders with images) / 画像がありません。引数指定を確認してください(train_data_dirには画像があるフォルダではなく、画像があるフォルダの親フォルダを指定する必要があります)
train_network.py:212

原因分析

根据 Issue 中的讨论,Kohya SS 的训练脚本要求 train_data_dir 必须是包含训练图像子文件夹的父目录,而不是直接指向图片文件所在的文件夹。例如:
– 正确:--train_data_dir="C:/images/"(其子文件夹为 C:/images/118_DPITW,内含图片)
– 错误:--train_data_dir="C:/images/118_DPITW"(直接指向图片文件夹)
此外,如果文件夹名称中不包含数字重复次数(例如 118_ 中的 118 表示重复次数),脚本也会忽略该目录并报出 ignore directory without repeats 警告,最终导致 0 训练图像。

环境排查

  • Kohya SS 版本:至少确认到 2024-01 前后版本(Issue 关闭时的 commit)
  • 操作系统:Windows(此 Issue 中为 Windows,含 C:\ 路径)
  • 训练脚本:train_network.py(也可参考 train_db.py
  • 依赖:Linux/WSL 用户无需额外环境确认

解决步骤

  1. 调整 train_data_dir 参数路径:
    确保 --train_data_dir 指向 父目录,即包含数字重复次数子文件夹的上级文件夹。
    例如:若图片位于 C:/images/img/118_DPITW/,则应设置为 --train_data_dir="C:/images/img/",而不是 C:/images/img/118_DPITW/
  2. 检查子文件夹命名规范:
    确保图片所在子文件夹的名称以 重复次数_ 开头(例如 118_DPITW),否则脚本会提示 ignore directory without repeats 并跳过该目录。
  3. 优先级验证(可优先尝试):
    如果使用 GUI 版本,请在“Image folder”字段中选择父目录(即包含多个数字子文件夹的上级目录),而不是具体图片文件夹。

验证方法

修改路径后重新运行训练命令,如果日志中显示 N train images with repeating(N > 0)且不再出现 No data found 错误,则问题已解决。建议先使用 --debug 参数(如果可用)查看脚本的目录扫描过程。

参考来源

bmaltais/kohya_ss #1725

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

celebrityanime
celebrityanime
文章: 8538

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注