bug: LLM-as-a-Judge evaluator creates two scores for the same target observation in a single job execution

用户在使用 Langfuse 自托管部署(Enterprise Edition)时,配置了 LLM-as-a-Judge 评估器,并设置为在实时传入的 GENERATION 类型观察上运行。当应用追踪中包含多个 GENERATION 观察时,评估器对每一个目标观察都创建了两个分数记录,而不是预期的单








