事实性幻觉率降至3.3%!百川智能将发布新一代医疗大模型Baichuan-M4

事实性幻觉率降至3.3%!百川智能将发布新一代医疗大模型Baichuan-M4

事实性幻觉率降至3.3%!百川智能将发布新一代医疗大模型Baichuan-M4

一句话看懂:百川智能在清华大学学术论坛上发布了新一代医疗大模型Baichuan-M4,将事实性幻觉率压至3.3%,并在HealthBench等三个权威医疗榜单上排名第一。基于该模型的AI家庭医生“百小医”即将上线,计划深度整合微信生态,让家庭健康管理在群聊中完成。

事件核心:发生了什么

5月26日,百川智能创始人兼CEO王小川在清华大学“AI医疗新范式”学术论坛上正式亮相了新一代医疗大模型Baichuan-M4。该模型的核心技术突破在于百川自主研发的“事实感知强化学习算法”,将裸模型的事实性幻觉率降至3.3%——这一数值在医疗AI场景中意味着很大程度解决了此前“胡说八道”的临床运用障碍。

在模型能力验证上,Baichuan-M4在HealthBench、HealthBench Hard以及HealthBench Professional三大医疗权威榜单中均取得第一,官方称其综合医疗能力已超越GPT-5.5、Opus 4.7及DeepSeek-V4-Pro等主流旗舰模型。在落地合作方面,百川已与北京儿童医院、中国医学科学院肿瘤医院、上海交大附属瑞金医院等三家顶级医院开展临床研究。

为什么重要

医疗大模型的核心瓶颈始终是“幻觉”导致的不安全用药与误诊风险。Baichuan-M4将事实性幻觉率压缩到3.3%,意味着AI在辅助诊断、药物咨询等场景下的可信度有了本质提升。在模型排名上超越多家海外旗舰产品,也表明国产医疗垂直大模型在具体领域的能力已具备国际竞争力。更重要的是,百川并未只做模型,而是基于微信生态推出“百小医”家庭医生产品,其切入方式——将企业微信拉入家庭群、自动建立健康档案并识别群聊中的用药风险——提供了一条低门槛、高粘性的家庭医疗AI落地路径。

对用户/开发者/创作者的影响

对于普通用户来说,通过微信添加企业微信“百小医@百川家庭医生”并拉入家庭群,即可让AI自动识别聊天内容中的体检单、用药史、症状描述等健康信息,并主动提醒复诊与用药。这意味着未来的AI不再需要用户单独打开App,而是在日常聊天中即可完成基础的慢病管理与健康监测。对于开发者而言,目前公开信息显示百川已开放部分医院临床接口,后续是否会提供公开API或开发者工具,仍需关注官方公告。对于医疗AI行业的内容创作者,这种“群聊AI”的产品形态可能成为新的信息分发与健康科普入口。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 产品落地节奏:AI家庭医生“百小医”的具体上线时间尚不明确,何时面向普通消费者开放是核心观察点。2. 临床监管风险:在微信生态中处理个人健康数据,涉及数据隐私与医疗信息合规问题,产品能否通过相关审核将影响推广范围。3. 竞品跟进:幻觉率的显著下降可能会推动百度文心、阿里通义等仍专注通用路线的医疗合作方,加快发布医疗专用模型或家庭健康产品。

来源:AIbase

celebrityanime
celebrityanime
文章: 3876

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注