Jiamin Yin¹,Kee Yuan Ngiam²,³,Sharon Swee-Lin Tan⁴,Hock Hai Teo⁴
(1. Department of Management Science and Engineering, Renmin Business School, Renmin University of China;2. Department of Surgery, National University Hospital;3. Department of Biomedical Informatics, Yong Loo Lin School of Medicine, National University of Singapore;4. Department of Information Systems and Analytics, School of Computing, National University of Singapore)
编者按:
随着临床人工智能(AI)系统在医学诊断中的应用不断扩展,一个关键问题日益突出:AI不仅要“给出建议”,更要在合适的时间嵌入医生的工作流程。本文聚焦AI建议呈现时机对医生诊断质量的影响,比较了三种诊断流程:医生先独立判断、再接收AI建议的“事后建议”(ex post advice);医生在阅读病例时同步接收AI建议的“事前建议”(ex ante advice);以及不提供AI建议的对照条件。研究发现,AI建议的呈现时机显著影响诊断准确性与信心—准确性校准,其中“事后建议”模式表现最佳。这一发现表明,在高风险医疗场景中,AI系统的价值不只取决于算法性能,也取决于其与人类专业判断之间的协作顺序。
在医学诊断过程中,医生通常需要收集病史、体征、检查结果等信息,并形成一个或多个可能诊断。AI系统可作为“第二意见”辅助医生判断,但如果AI建议过早出现,医生可能会受到AI输出的锚定影响,将其视为病例信息的一部分,而不是需要被审慎评估的外部建议。相反,如果医生先形成初步诊断,再接收AI建议,则更可能将AI作为对自身判断的补充与检验,从而激发更深入的认知加工。
为检验这一问题,作者在新加坡医院开展了一项受控实验,邀请55名急诊与普外科医生诊断18个真实急诊腹痛病例。病例围绕急性阑尾炎及其鉴别诊断展开,包含不同典型程度的临床表现。实验中的AI诊断支持系统可预测患者患急性阑尾炎的概率,并通过高亮关键临床特征提供可解释性依据。研究采用“出声思考”(think-aloud)方法记录医生诊断过程,从而分析医生如何阅读病例、形成诊断假设以及理解AI推理依据。
实验结果显示,接受AI辅助的医生整体上比未接受AI辅助的医生诊断更准确,但不同呈现方式之间存在明显差异。“事后建议”组的诊断准确性和校准表现均优于“事前建议”组和对照组;“事前建议”虽然也能提升部分准确性,但未能显著改善医生的过度自信问题。换言之,AI并非只要被加入流程就能最大化提升诊断质量,其介入时间会改变医生的信息处理方式。
机制分析进一步表明,“事后建议”之所以更有效,是因为它促使医生更充分地处理临床信息。相比“事前建议”组,“事后建议”组医生会评估更多关键临床特征,也会考虑更多替代诊断假设。同时,他们更频繁地对AI的推理依据表达赞同或质疑,说明其并非被动接受AI输出,而是在主动审查AI建议。这种更深层次的认知参与,使医生更能区分正确与错误的AI建议,尤其是在AI建议与医生初始判断不一致时,若AI依据具有说服力,医生更可能从中获益。
研究还发现,“事后建议”模式下,AI建议不仅提高了最终诊断准确性,也改善了诊断校准,即医生对自己诊断正确性的信心水平更接近实际准确性。这对于临床安全具有重要意义,因为诊断错误往往不仅来自知识不足,也可能来自对错误判断的过度自信。通过让医生先形成独立判断,再引入AI建议,系统可以在保留专业自主性的同时,帮助医生重新审视证据与假设。
不过,作者也指出该研究存在一定局限。首先,实验样本量有限,且研究场景集中于急性腹痛病例,未来需要在更多疾病领域和真实临床环境中验证。其次,“事后建议”虽然提升了诊断质量,但可能需要更多时间,这在高负荷临床场景中可能影响效率。因此,未来AI工作流程设计需要在诊断质量、时间成本和临床可操作性之间取得平衡。
总体而言,本文的核心贡献在于将AI医疗研究的重点从“AI是否准确”推进到“AI应如何/何时嵌入医生的工作流程”。研究表明,在人机协同诊断中,AI建议最好被设计为医生独立判断之后的第二意见(消除锚定偏见),而不是过早进入医生的信息处理过程。这一发现为临床AI系统部署、人机协同流程设计以及高风险决策场景中的AI治理提供了重要启示。
资料来源:
根据Jiamin Yin等人于2025年发表在 Management Science,题目为《Designing AI-Based Work Processes: How the Timing of AI Advice Affects Diagnostic Decision Making》的文章缩写整理而成。原文链接:https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2022.01454
(本文责任编辑:蒋新宇)