百川智能发布M4 模型,实现“真人医生”式主动问诊

百川智能联合清华大学团队发布医疗增强大模型Baichuan-M4,在权威医疗评测HealthBench中超越GPT-5.5,核心变化是从被动问答转向主动问诊,并引入全程记忆与证据锚定技术,提升了AI在临床决策中的安全性与可用性。

百川智能发布M4 模型,实现“真人医生”式主动问诊

一句话看懂:百川智能联合清华大学团队发布医疗增强大模型Baichuan-M4,在权威医疗评测HealthBench中超越GPT-5.5,核心变化是从被动问答转向主动问诊,并引入全程记忆与证据锚定技术,提升了AI在临床决策中的安全性与可用性。

事件核心:发生了什么

2026年6月23日,百川智能与清华大学研究团队正式发布了新一代医疗增强大模型Baichuan-M4。在HealthBench医疗评测中,该模型拿下了三个子榜单以及Hard与Professional类别的第一名,其医疗专业能力被评价为超越GPT-5.5。

相比传统AI辅助诊断的“一问一答”模式,M4最大的变化在于交互方式:它能模拟真实医生的诊断逻辑,主动对患者进行追问,而非被动等待用户提供所有信息。此外,模型引入了“全病程记忆”功能,可整合历史病历、多轮问诊记录、化验指标趋势和用药反馈,确保在多轮对话中保持对患者完整病史的理解,避免重复采集信息。在临床安全性方面,M4采用了“证据锚定”技术,每一条医疗结论都能精确匹配到权威医学论文或临床指南中的具体段落,证据引用准确率达到90.0。

为什么重要

医疗AI此前长期困于“百科式回答”的局限,无法像真正医生那样通过追问和推理完成诊断。Baichuan-M4将主动问诊能力嵌入模型,配合全程记忆与证据链跟踪,等于在技术层面将AI从“工具”提升为“协作型临床助手”。这不仅是对百川智能自身技术路线的一次落地检验,也直接拉高了医疗大模型的行业基准——尤其在证据准确率这一关键安全指标上,90.0的成绩让后续竞品必须拿出更高的标准才能竞争。同时,超过GPT-5.5的成绩表明,在垂直领域进行深度定制和增强,依然可以超越通用超大模型。

对用户/开发者/创作者的影响

对于普通用户和患者,这意味着未来在AI医疗平台上的咨询体验将更接近真实问诊:AI会主动追问症状细节、回顾既往病史,而不是只做一次性的信息回答。对于医疗领域的AI应用开发者,M4的主动问诊和长上下文记忆功能提供了新的API交互范式,可以直接用于搭建在线预问诊、慢病管理、用药随访等产品。对于医疗内容创作者和知识库建设者,证据锚定技术提出了更严格的内容引用要求——未来的医疗AI将更依赖权威文献,而非泛化的互联网语料。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Baichuan-M4是否会以API形式开放给第三方医疗机构或开发者使用,以及定价策略如何,将直接影响该技术的普及速度。第二,在“主动问诊”和“证据锚定”两个技术维度上,其他医疗AI公司(如阿里、腾讯、科大讯飞)是否会快速跟进,形成新一轮技术追赶。第三,监管层面:具备主动对话能力的医疗AI产品是否需要额外的医疗器械认证或伦理审查,目前尚不明确,需关注后续政策动向。

来源:AIbase

celebrityanime
celebrityanime
文章: 9606

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注