
一句话看懂:患者带着AI生成的结论涌进诊室,反而增加了医生沟通负担。百川智能发布Baichuan-M4医疗增强大模型,通过多轮追问、证据锚定和病程记忆,尝试让通用AI真正进入医疗决策环节。
事件核心:发生了什么
2026年6月18日,百川智能发布了医疗增强大模型Baichuan-M4,并同步升级了C端产品“百小医”。M4引入了SCAN-bench 2.0多轮问诊体系,在动态问诊评测中初诊得分79.0、复诊74.7,长上下文临床记忆得分86.9,较上一代M3提升21.1分。它还将复杂医学指南拆解为1000余个可复用临床决策单元,循证引用精度达90.0,显著高于GPT-5.5的54.7。目前,百小医已在中国医学科学院肿瘤医院、首都医科大学附属北京儿童医院、上海交通大学瑞金医院等机构进行临床测试,患者群内27天6944条对话中安全性达99.6%。
为什么重要
当前通用大模型被大量用于健康咨询,但缺乏多轮追问和证据溯源能力,导致患者对模型结论过度依赖,医生反而需要在门诊中花更多时间澄清误判。M4的突破在于将医疗AI从“单点问答”推向“诊疗过程参与”:它能连续追问10轮锁定风险、锚定每句结论的出处、并在多次对话中记住患者完整病程。这绕开了“通用模型不适合医疗”的行业共识,证明通过结构性重构,大模型有能力承担诊室外连续照护角色,形成“医生诊断+AI跟踪”的双医模式。
对用户/开发者/创作者的影响
对普通用户:百小医这类产品能主动识别家庭群聊中的健康线索,例如通过“走一圈就喘”的随口对话结合病史提醒心功能风险,并在患者就医后自动衔接试管外管理。对开发者:M4的Harness调度架构允许模型自主决定何时追问、何时检索证据、何时调出病史,降低了医疗AI产品的二次开发门槛。对创作者:医疗科普内容可借助M4的循证引擎确保引用准确,避免常见模型“甩文献但内容对不上”的问题。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
首先,百川智能是否会开放M4的API或模型权重给第三方开发者,决定其生态扩展速度。其次,百小医在更多医院群和家庭场景中的长期留存率、误判率等真实世界数据有待进一步披露。最后,监管部门是否会对这类“主动健康提醒”提出新的合规要求,将影响C端产品的推广节奏。
来源:量子位 · 每日最新


