
一句话看懂:里约热内卢市政府旗下IT公司IplanRIO发布的大模型Rio-3.5-Open-397B,被开发者社区质疑并非自研微调版本,而是对两个已有开源模型(Nex-N2 Pro和Qwen3.5-397B-A17B)进行加权合并的结果,其中约60%权重来自一周前发布的Nex-N2 Pro。
事件核心:发生了什么
2025年,里约热内卢市政IT公司IplanRIO发布了名为Rio-3.5-Open-397B的大型语言模型,并宣称其为“本土自研”的Qwen3.5微调版本,在基准测试中表现优于同类开源模型。然而,Hacker News上的讨论明确指出,该模型实际上是一个加权合并模型——约60%权重来自Nex-N2 Pro(该模型仅早于Rio约一周发布),约40%来自Qwen3.5-397B-A17B。目前,IplanRIO尚未对质疑做出公开回应。
为什么重要
这一事件暴露了当前开源大模型生态中的几个关键问题:首先,模型发布方宣称的“自研”或“微调”可能与实际技术构成存在显著偏差,尤其是当模型通过加权合并而非全新训练或微调获得时;其次,加权合并技术虽能快速提升基准测试成绩,但容易模糊模型原创性边界,给开源社区的可信度带来挑战;最后,它提醒行业参与者,在缺乏第三方审计或完整训练/合并日志的情况下,开发者社区的表态和社区审查(如Hacker News)依然是验证模型真实来源的重要防线。
对用户/开发者/创作者的影响
对于普通用户和技术团队,这一案例说明:在选用开源模型时,不应仅依赖官方发布的测试分数或“本土自研”等标签,最好要求模型发布方提供完整的训练数据、微调方法及合并权重信息。对于开发者而言,如果计划在商品或服务中集成类似模型,需要警惕基准测试结果可能来自合并而非真正的性能提升——合并模型在某些任务上表现优异,但在其他场景下可能存在未公开的退化或偏见问题。对于AI内容创作者和评测机构,应优先关注模型的透明度和可复现性,而非单一分数。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. IplanRIO是否会公开回应质疑,并补充发布模型合并权重、训练日志或微调代码?这将直接影响该模型在开源社区中的信任度。
2. 该事件是否会促使更多开源模型发布方公开合并细节或采用更严格的审计流程?如Hugging Face等平台可能加强对合并模型的标签审核。
3. Nex-N2 Pro的开发者团队(nex-agi)是否会主动发声,厘清该模型与Rio-3.5-Open-397B之间的技术关系?这可能影响两个模型生态的后续合作或竞争。
来源:hackernews


