AI看病成为医患新包袱？补上「多轮追问」，通用AI才迈得过医疗关

一句话看懂：患者带着AI生成的结论涌进诊室，反而增加了医生沟通负担。百川智能发布Baichuan-M4医疗增强大模型，通过多轮追问、证据锚定和病程记忆，尝试让通用AI真正进入医疗决策环节。

事件核心：发生了什么

2026年6月18日，百川智能发布了医疗增强大模型Baichuan-M4，并同步升级了C端产品“百小医”。M4引入了SCAN-bench 2.0多轮问诊体系，在动态问诊评测中初诊得分79.0、复诊74.7，长上下文临床记忆得分86.9，较上一代M3提升21.1分。它还将复杂医学指南拆解为1000余个可复用临床决策单元，循证引用精度达90.0，显著高于GPT-5.5的54.7。目前，百小医已在中国医学科学院肿瘤医院、首都医科大学附属北京儿童医院、上海交通大学瑞金医院等机构进行临床测试，患者群内27天6944条对话中安全性达99.6%。

为什么重要

当前通用大模型被大量用于健康咨询，但缺乏多轮追问和证据溯源能力，导致患者对模型结论过度依赖，医生反而需要在门诊中花更多时间澄清误判。M4的突破在于将医疗AI从“单点问答”推向“诊疗过程参与”：它能连续追问10轮锁定风险、锚定每句结论的出处、并在多次对话中记住患者完整病程。这绕开了“通用模型不适合医疗”的行业共识，证明通过结构性重构，大模型有能力承担诊室外连续照护角色，形成“医生诊断+AI跟踪”的双医模式。

对用户/开发者/创作者的影响

对普通用户：百小医这类产品能主动识别家庭群聊中的健康线索，例如通过“走一圈就喘”的随口对话结合病史提醒心功能风险，并在患者就医后自动衔接试管外管理。对开发者：M4的Harness调度架构允许模型自主决定何时追问、何时检索证据、何时调出病史，降低了医疗AI产品的二次开发门槛。对创作者：医疗科普内容可借助M4的循证引擎确保引用准确，避免常见模型“甩文献但内容对不上”的问题。