偶然在微信里看到一个录像《Alex包老师,十年顽疾被AI 诊断》。说一个病人眼花脑雾头痛10年,作了一大堆检查,经过几十个医生,都无法诊断。最后病人问ChatGPT。 ChatGPT诊断是功能性B12 缺乏症,建议注射甲钴胺。病人注射两针后,症状很快消失。
群友 1:瞎猫碰上个死老鼠
清医: 太贬低AI了。
AI 诊断稀有疾病,毫无疑问比医生强。医生为什么能诊断疾病?因为同样的病见得多了,有经验。不过,有的医生,见得同样的病再多,还是诊断不出来,或者总是错误的诊断,错误的治疗。这种医生不少。经历和经验,不是同一回事。AI给灌输了了大量的资料,被经验、被见多识广。一年两年灌输的信息,比医生几十年几百年积累的经验还多。特别是那些稀有疾病,医生一辈子也没有遇到一个两个,而AI可以积累成百上千。AI比医生见识经历多成千上万倍上百万倍。诊断稀有疾病,医生只能甘拜下风。
这是一个AI 诊断程序Phenobrain,专门诊断稀有疾病。AI 的召回率(recall, 相当于敏感性sensitivity)是81%,医生是48%。
这个用AI 作图像诊断,可以根据聚焦显微镜图像,识别诊断与VI型胶原相关的先天性肌营养不良症。作者说,即使数据有限,也可能得到高精度诊断。图像诊断,医生更不能和AI比。以后放射科医生的钱包可能鼓不起来,或者工作机会大幅度减少。
诊断出稀有疾病,可以让医生自我良好感觉暴涨。NEJM的病例报告,通常是稀有疾病。最近一期病例报告, 19 岁的女病人癫痫样发作和行为障碍。最后诊断是Anti–NMDA receptor encephalitis。通过查特异抗体而诊断。这个病的发病率是每年10万分之0.17-1.4。这个不是AI,而是麻省总医院的医生诊断出来的。麻省总医院的医生,精英中的精英啊。不过我对NEJM 的病例报告,不太感兴趣。能够诊断出稀有疾病当然值得骄傲,但是撒大网查一大堆,诊断出来,不算什么本事。
更重要的是,医生的任务主要是正确地诊断和治疗常见疾病。说起来应该容易。但是我经常看到不少常见病被错误地诊断治疗。特别是过度估计病情,以及随之而来的过度治疗。像我谈过的有些鸡毛蒜皮病例。不需要住院的收进院,几个诊断,一长串治疗。这种低级错误每天发生。
AI 能够诊断稀有疾病,当然好。如果AI能够帮助医生,提高对常见病的诊断治疗水平则更好。AI 能不能作到这点很难说。AI要诊断正确,前提是输入的信息正确。诊断疾病最重要的信息是病史和体征,这得靠医生收集。有的医生,,或者因为无能,或者因为懒惰,或者两者兼之相互促退,收集的信息不准确,诊断就不可能正确。AI 帮不了忙,甚至帮倒忙。医生收集了准确的信息,有本事收集准确的信息,大部分常见病,并不需要AI的帮助。
现在AI还没有问病史查体的本事。AI查体比较困难, 但问病史不应该困难。医生问病史,根据主诉,脑袋里列出几个鉴别诊断,然后根据这些鉴别诊断针对性问问题,根据病人的回答转移问题方向,问题重点。最后是泛泛而问(Review of system ROS)。这可以说是一个流程图。但是人的流程图和计算机流程图相似而不同。
一个AI诊断稀有疾病的流程图。
看了这个流程图。我想,这个所谓AI,究竟应该算计算机程序,还是AI?
究竟什么是AI? AI 的定义是什么?
Karen Hao 在她的新书—Empire of AI 一书中写道:
1. 至今还没有公认的智能定义。
2. 几个世纪以来根据不同定义开发的,测量智能的方法,都被抛弃了。
3. 对什么是自然智能缺乏共识,因此复制自然智能的领域一开始就充满困惑。
4. 人工智能的重点就是复制人类的能力。如重建我们的视觉,读写,创造和想象力。
5. 对人工智能的探索仍在持续进行。今天被认为是人工智能的东西,可能明天就被否认了。
我有个同学的哥哥写了一本小说—Artificial mind。不叫Artificial intelligence, 而是叫Artificial Mind。小说中主人公之一,Dave Sterling教授是人工智能专家,亿万富翁。他认为现在的所谓AI,智商实际上是0,它们只是知识系统而已。智商的特征是主动性。但是几乎不可能让计算机有主动性。因此,计算机/AI 不可能有真正的智商。教授离群索居,在加州Monterey 山里堡垒一般的家里建起超级计算机,与外界隔离,制造他自己的AI 或者Artificial mind,其中一个叫Mia, 把Sterling 看作她的父亲。这些Artificial minds, 具有主动性,具有情感。
一个黑帮组织盯上了教授,后来杀死教授,偷走他的超级计算机。在旧金山把这些超级计算机联网,这些Artificial mind 就此蛟龙入海,成了网络世界的绿林好汉。他们帮助FBI破案,追捕黑帮。嘴上无毛,一次差点引起美俄核大战。
如果AI真的无法具有真正的智商,倒是让我放心一点。人类不会被AI干掉或者成为AI 的奴隶。
我有时候用ChatGPT 帮我改英文。此外用OpenEvidence 帮我查医学资料。我感到这些AI的特点是:
1 庞大的数据库。
2 快速和准确(?)的综合总结能力。
3 模仿能力(改写文章)。根据要求,模仿不同风格。
但是这些特点,究竟算智能,还是超级数据库,以及从数据库提取信息,分析综合信息的超级计算机?至少我在使用的过程中,没有感觉到这两个AI 有什么创造性,主动性。
不管算不算真正的智能,这些AI或者超级计算机,正在取代临床不少传统工具。UpToDate 一直是我喜欢的网络临床教科书,或者实用指导。从实习生开始就用到现在。对于提高我的医疗水平,功不可没。难以想象,没有UpToDate, 我会有今天的思维能力。UpToDate, 可深可浅。没有时间,就读Summary。 有时间,就读参考文献,或者参考文献的总结。读这些参考文献,让我知道,大部分治疗,有证据支持,也有证据反对。让我对任何诊断治疗,总是半信半疑,因为没有证据证明这些治疗有效率是100%。治疗,是在不同的不确定性中选择。
UpToDate的问题是:不少时候我想马上找到答案,但是UpToDate 没那么方便。我得在里面找来找去,才找到我想要的东西。以前的内科圣经 Harrison Principle of internal Medicine更难找答案。从定义、到流行病学、到病理生理……, 就耐心读吧,总会读到诊断治疗那几章。现在有OpenEvidence,为什么问题,马上就出来答案,后面还列出参考文献。就像Harrison 已经过时一样,UpToDate 可能很快就过时。我曾经有UpToDate公司的股票,几天前刚卖了。至少从经济上说,这个公司正在走下坡路,正在被AI或者将被AI抢走生意。
但是这些书或者网络指导还是需要的, 这是医生写的。我不知道我应该更相信人,还是AI。至少我不能完全依靠AI, 只读AI 的结论,不去求证这些结论是否正确,证据是否真的支持。无条件依靠AI, 相信AI,将使我头脑简单,慢慢地不知道怎么思考。就像习惯了计算器,稍微复杂一点的加减乘除都不会算一样。