
通义千问升级“拍照问健康”:能圈图、懂推理,三甲医生实测认可
一句话看懂:2026年5月27日,阿里通义千问 App 的“拍照问健康”功能迎来重大升级,新增了医学图像圈选、多指标综合推理和透明化推理过程展示。经北京协和医院等三家三甲医院医生实测,AI 的分析思路获得了专业认可,标志着健康助手从简单的指标读取向辅助诊断方向迈出了关键一步。
事件核心:发生了什么
阿里系大模型应用通义千问 App 于2026年5月27日正式宣布其“拍照问健康”功能升级。新版本突破了传统仅识别文本(OCR)的局限,实现了“医学图像理解”与“临床推理”能力。
具体功能包括三项核心更新:视觉圈选,AI 能像医生一样在用户上传的化验单或病灶照片上,通过箭头或圆圈直接标注出异常区域;综合推理,不再是孤立解读单个指标,而是结合年龄、性别及多项指标进行排他性分析,例如能判断青少年碱性磷酸酶(ALP)升高属于生理性而非病理性;过程透明化,系统会自主引用医学知识库,并向用户展示“识别-标注-推理”的完整逻辑链条。
在专业验证方面,来自北京协和医院、友谊医院和北京大学人民医院的三位资深医生,使用该功能对“13岁儿童腹痛”、“疑似脂肪肝”、“荨麻疹伴白细胞升高”、“下巴皮疹”等病例进行了测试。医生们认为,通义千问的分析方式(如排除胆道问题、区分生理与病理升高)具备“诊断鉴别意识”,能有效减少因误读指标引发的用户焦虑。
为什么重要
此次升级的意义在于其技术路线和产品逻辑的转变。以往大多数“拍照问药”或“体检报告解读”依赖光学字符识别(OCR)提取文字后匹配数据库,本质是“查找答案”。而通义千问此次引入的视觉圈选与多指标推理,表明大模型正在从“信息检索”过渡到“临床思维模拟”,即尝试理解医学影像的视觉语义,并进行符合医学逻辑的推理决策。
对于 AI 健康赛道而言,这验证了“大模型+视觉理解+知识库检索”组合在严肃医疗场景(非替代问诊)中的可行性。阿里通过三甲医生的实测背书,试图建立专业信任度,此举可能推动更多医疗健康类 AI 应用从“工具”升级为“助理”,并促使竞品(如腾讯觅影、百度灵医等)加速跟进类似的多模态推理能力。
对用户/开发者/创作者的影响
对普通用户而言,该功能降低了看懂化验单和皮肤问题的门槛,尤其在区分“正常波动”与“需要警惕的异常”方面更智能,可作为就医前的参考工具。但需注意,目前公开信息显示,该功能定位仍是“辅助参考”,不能替代医生诊断。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对开发者或医疗机构而言,阿里展示了将视觉大模型、知识图谱与大语言模型推理能力结合的技术范式,提供了开发类似“AI 辅助预检”产品的参考路径。对于健康科普类内容创作者,可利用该功能的“透明化推理”特点,制作更直观的“AI 如何分析体检报告”的内容,但其生成的分析逻辑仍需人工审核把关。
值得关注的后续
1. 能力边界与免责问题:AI 在复杂病症、罕见病或急诊情况下的误判率如何?阿里是否会推出医患责任豁免条款或使用提示,值得留意。2. 数据隐私与合规:用户上传的医疗影像与检查单数据如何存储、脱敏及使用,监管是否会对此类“拍照诊断”功能出台细则要求?3. 竞品跟进与生态扩展:百度、腾讯等拥有医疗数据与 AI 能力的公司是否会快速推出类似功能?该功能是否会向医疗健康 App 开放 API 接口,形成新的服务生态?
来源:AIbase
![[程序员] codex 最近 2 天巨卡, 思考 5 分钟](https://www.chat-gpts.plus/wp-content/uploads/2026/05/ai_cover_5-728-768x403.jpg)

