患者是一名 39 岁女性,来到波士顿贝斯以色列女执事医疗中心急诊室。 她的左膝已经疼了好几天了。 前一天,她发烧102度。 现在已经过去了,但她仍然感到发冷。 而且她的膝盖又红又肿。
诊断结果是什么?
最近一个闷热的星期五,住院医师梅根·兰登医生向一屋子的医学生和住院医师讲述了这个真实的案例。 他们聚集在一起学习一项非常棘手的技能——如何像医生一样思考。
“医生不擅长教导其他医生我们如何思考,”内科医生、医学历史学家、贝斯以色列女执事活动的组织者亚当·罗德曼博士说。
但这一次,他们可以向专家寻求帮助来进行诊断——GPT-4,这是 OpenAI 公司发布的最新版本的聊天机器人。
人工智能正在改变医学实践的许多方面,一些医疗专业人员正在使用这些工具来帮助他们进行诊断。 哈佛医学院附属教学医院贝斯以色列女执事院的医生决定探索如何使用和滥用聊天机器人来培训未来的医生。
像罗德曼博士这样的导师希望医学生能够利用 GPT-4 和其他聊天机器人进行类似于医生所说的路边咨询——当他们把同事拉到一边并询问对疑难病例的意见时。 这个想法是使用聊天机器人,就像医生互相寻求建议和见解一样。
一个多世纪以来,医生一直被描绘成收集线索并利用它们找到罪魁祸首的侦探。 但经验丰富的医生实际上使用不同的方法——模式识别——来找出问题所在。 在医学上,这被称为疾病脚本:医生根据他们知道或亲眼见过的类似病例,将体征、症状和测试结果放在一起,讲述一个连贯的故事。
罗德曼博士说,如果疾病脚本没有帮助,医生就会转向其他策略,比如为可能适合的各种诊断分配概率。
半个多世纪以来,研究人员一直在尝试设计计算机程序来进行医学诊断,但没有真正成功。
医生说 GPT-4 不同。 “它将创造出与疾病脚本非常相似的东西,”罗德曼博士说。 他补充道,这样一来,“它与搜索引擎有着根本的不同。”
Rodman 博士和 Beth Israel Deaconess 的其他医生已向 GPT-4 询问疑难病例的可能诊断。 在一个 学习 上个月在医学杂志《美国医学会杂志》上发表的文章中,他们发现,在《新英格兰医学杂志》上发表的每周诊断挑战中,它比大多数医生做得更好。
但是,他们了解到,使用该程序是一门艺术,也存在陷阱。
该医疗中心内科住院医师项目主任克里斯托弗·史密斯博士表示,医学生和住院医师“肯定正在使用它”。 但是,他补充道,“他们是否学到任何东西还是一个悬而未决的问题。”
令人担忧的是,他们可能会依赖人工智能进行诊断,就像依赖手机上的计算器做数学题一样。 史密斯博士说,这很危险。
他说,学习包括尝试解决问题:“这就是我们保留东西的方式。 学习的一部分就是奋斗。 如果你将学习外包给 GPT,那么这种挣扎就消失了。”
会上,学生和居民分成小组,试图弄清楚膝盖肿胀的病人出了什么问题。 然后他们转向 GPT-4。
这些小组尝试了不同的方法。
人们使用 GPT-4 进行互联网搜索,类似于使用 Google 的方式。 聊天机器人列出了可能的诊断列表,包括创伤。 但当小组成员要求它解释其推理时,机器人感到失望,它解释说,“创伤是膝盖受伤的常见原因。”
另一组想到了可能的假设,并要求 GPT-4 进行验证。 聊天机器人的列表与该组的列表一致:感染,包括莱姆病; 关节炎,包括痛风,一种涉及关节晶体的关节炎; 和创伤。
GPT-4 将类风湿性关节炎列为最有可能的疾病,尽管它在该小组的名单上并不靠前。 教练后来告诉大家,这名患者不太可能患有痛风,因为她很年轻,而且是女性。 类风湿性关节炎也可能被排除,因为只有一个关节发炎,而且只发炎了几天。
作为路边咨询,GPT-4 似乎通过了测试,或者至少同意学生和居民的观点。 但在这次练习中,它没有提供任何见解,也没有提供疾病脚本。
原因之一可能是学生和居民使用该机器人更像是搜索引擎,而不是路边咨询。
讲师们表示,为了正确使用该机器人,他们首先需要告诉 GPT-4 类似的话:“你是一名医生,正在为一位患有膝盖疼痛的 39 岁女性看病。” 然后,他们需要列出她的症状,然后再要求诊断,并跟进有关机器人推理的问题,就像对待医疗同事一样。
讲师们表示,这是利用 GPT-4 威力的一种方法。 但同样重要的是要认识到聊天机器人可能会犯错误并产生“幻觉”——提供没有事实依据的答案。 使用它需要知道它何时是错误的。
“使用这些工具并没有错,”该医院的内科医生拜伦·克罗博士说。 “你只需要以正确的方式使用它们。”
他给小组做了一个类比。
“飞行员使用 GPS,”克罗博士说。 但是,他补充说,航空公司“对可靠性有非常高的标准。” 他说,在医学领域,使用聊天机器人“非常诱人”,但也应该适用同样的高标准。
“这是一个很好的思想伙伴,但它并不能取代深厚的心理专业知识,”他说。
治疗结束后,导师透露了患者膝盖肿胀的真正原因。
事实证明,这是每个小组都考虑过的一种可能性,也是 GPT-4 提出的。
她患有莱姆病。
奥利维亚·艾利森贡献了报道。