正文

老钱:关于“样本池”的普测方法

(2020-05-26 00:29:30) 下一个

5/26/20130

老钱:关于“样本池”的普测方法
5/25/20



今天网上流转两篇文章,武汉千万人核酸检测,真实感染率曝光全民检测50万人已感染 武汉女斥政府脑残(视频)
 
武汉市的感染情况到底如何。这个问题不仅仅是武汉人关心,政府关心,也是全世界都很关心的问题。5月14日,武汉市掀起了“十日大会战任务”,要在10天之内,对全武汉的一千一百万人做一次核酸检测,彻底摸清武汉市的详细情况。


这么大的测试量,怎么能在十天完成。据说这是因为采取了混合样本池的方法。这个方法是英国科学家在《柳叶刀/Lancet》上发表的,为了提高大规模普查的效率和降低成本。
 
我思考了一下,想来做一个进一步理解和解释。
 
设想把一群人(比如说64人中的一半,32人)的每个人的采样样本混合在一起,成为一个样本池。因为32人的样品都搅合在一起了,只要其中有一个人是阳性,这个样本池整体就是阳性。如果检测结果是阴性,那么这个样本池里的任何一个人都必定是阴性。那么就不用对这32人一个一个地检测(但是仍然需要做了32个采样),而是仅一次测试就把这32个人都排除了。减少了31个测试。
 
对于剩下的另一半的32人呢?如法炮制。
 
再取一次16人的混合样本池,如果最好的结果是阴性。这16个人就一下子排除了。
第三次对剩下一半16人,做8人的混合样本池,最好的结果是阴性。这八个人就一次排除了。
第四次是对剩下8人,进行4人的混合样本池,最好的结果是阴性。这四个人就一次排除了。
第五次是对剩下4人,2人的混合样本池,如果是阴性。这两个人就排除了。
第六次,仅剩下最后两个人了。就要对每一个人都做测试。如果可能是3种。
两人都是阴性,那么这全部的64人就没有一人被感染!
如果一阴一阳,就是只有感染一人了;感染率就是1/64,即1.56%。
如果都是阳性,就是只有两人感染:感染率就是1/32,即3.12%。
 
这样的样本池法,最好的结果就是,对全部64人,采了64次样,但是仅仅做了7个测试,就完成了对全部64人的测试。每个人都必须被采样,这是必须的。但是,不是每一个人都需要做测试。最好的情况,就是只做了7次测试,就查清了64人。7/64,即是挨个检测的11%的检测量。
 
对于昂贵的耗料耗时耗人工的核酸检测来说,样本池法是非常有效,非常经济合算的。极大地降低了测试成本!
 
这样的样本池法,也叫做“二分法”。
 
上面是最幸运的情况。如果不幸呢?我们来看看“最不幸”的情况。
 
如果这个32人的“样本池”的测试结果是阳性,就必须对这个“样本池”里的人重新来一次采样和测试。可以一个人一个人的测试,找到具体谁是阳性,谁是阴性。不仅仅必须要对这32个人重新测试,还要对另一半的32人从头开始。
 
也可以,对这个阳性的“样本池”再来一次16人的混合样本池,最坏的结果是阳性。不仅仅必须对这16个人重新测试,还要对另一半的16人从头开始。
第三次是8人的混合样本池,最坏的结果是阳性。不仅仅必须对这8个人重新测试,还要对另一半的8人从头开始。
第四次是4人的混合样本池,最坏的结果是阳性。不仅仅必须对这4个人重新测试,还要对另一半的4人从头开始。
第五次是2人的混合样本池,如果结果是阳性。那么这最后四个人的每一个人都要采样测试。
 
这样的样本池法,最坏的结果就是,对全部64人,每一个人都被重复了4次采样和4次检测。一共采了256次样,做了256个测试。最终结果,最坏是64人都被感染了,百分之百的感染。最坏之下的最好的结果是,每个4人里只有一个人是阳性,另外3人都是阴性。就是四分之一,即25%的感染率。但是,仍然是要采256次样,做256个测试。
 
这样,样本池法反而增加了工作量,还不如64人,每一个人都测试一次了。
 
所以,样本池法的运用是有条件的,需要随机应变,灵活运用的。
 
而且,样本池太大了,可能降低了检测的灵敏度。我前面用的32人的样本池就太大了。这样“夸张”的样本池法,只是为了使得“减少测试量到11%”可以显易而见。如果32人中只有一个阳性的话,阳性的浓度立刻就降低到了1/32,很可能就检测不出来了。10人的样本池就会把一个阳性的浓度降低到1/10。多大的样本池是合适的呢?这就不是纸上谈兵,而应该从试验中总结出来。从微信上武汉大嫂的抱怨来看,在武汉的“大会战”中,是采用了10人的样本池。那个大嫂抱怨:“把我们十个人的样品不注名地放在一个容器里”。大嫂说,“那查个鬼啊!”。这是因为她不知道到样本池”的理论。
 
那么,我们就用10人“样本池”来分析。如果这个“样本池”是阴性,那么这10人就全部是阴性,就节约了9/10的测试量。如果是阳性呢,就要把这10人叫回来重新测试。
改为5人“样本池”,如果结果是阴性,这5个人都是阴性,不用再测试了。
对于其余5个人,一一测试,总测试量就是7次,7/10,也减少了3次。
如果再采取3人“样本池”,如果是阴性,这3人都是阴性,只要再分别测试剩下的两个人就完成了。这样的总测试量就是5次,减少了50%的工作量。
如果3人“样本池”是阳性,那么这5个人都要逐个测试。总工作量就是8次。8/10.
如果第一个5人“样本池”是阳性,就重复上面的分析,总测试量大约为50%到80%。因为他们有把握,剩下的5人应该全是阴性。因为,在决定采用“样本池”方法之前,他们已经做了前期试验,得到了平均感染率是5%。但是,为了避免漏侧,还是要对剩下的5人,做一个“样本池”测试。这样来,总测试量大约人人检测的为60%到90%。
 
到这里,我们要回过头来说,“武汉大嫂”的抱怨是完全正确的,即使采用样本池”方法,不可能把受测试的老百姓,反复的叫回来重新采样,更要被老百姓骂死了!一次采样的量必须够用测试3次。
 
所以,那个大嫂抱怨:“把我们十个人的样品不注名地放在一个容器里,那查个鬼啊!”。她是完全正确的。不管她懂不懂样本池”。
 
由此看来,样本池”的方法也只能用于第一步,顶多到第二步,到了4人“样本池”,就没有什么优越性了。
 
对于美国斯坦福大学研发出来的抗体快速检测来说,测试与采样基本上就是一件事儿。除了昂贵复杂的核酸检测,这样的混合样本池法,也就没有多少优越性了。
 
我不是生化医学领域里的人,只是一个工程师,只是有兴趣从简单算术来理解样本池”的理论。本文不谈如何政治问题,只是数学和逻辑。可能贻笑大方。欢迎专家批评指正。
 
 (全文到此结束)

[ 打印 ]
阅读 ()评论 (11)
评论
19428182 回复 悄悄话 A question, Why selected 50/50 but the Golden Section way?
balancedview 回复 悄悄话 你的想法考虑到很多实际情况。
根据我读到的有关文章,样本池是最多5到10个人,这样能保证每个人的血不会被过分稀释,使得病毒太少而被漏测,同时每个人最多测2次。
西风-西风 回复 悄悄话 赞好文,谢科普。
dqdeer 回复 悄悄话 在感染人数很少的情况下,效率肯定是很高的。瞎质疑就是和文中的大嫂一个水平?
charlie_us 回复 悄悄话 采用样本池的方法,可以把每个人的样本分成几份,拿第一份做第一遍测试,如果需要第二遍测试再取第二份,以此类推。不需要把人叫回来取第二,三次样。
大汉唐 回复 悄悄话 博主好象有些基本概念似是而非:大数据下的概率是很有效的,如果无症状感染者比例很低的话——根本不会有那么多重复测试的可能性
老_钱 回复 悄悄话 回复 '只愛一點點' 的评论 : 谢谢。
老_钱 回复 悄悄话 谢谢你们的讨论。
我理工男,对医学是外行。喜欢瞎琢磨。只是抛砖引玉。
显然你们都是行家。向你们学习了。谢谢了。
只愛一點點 回复 悄悄话 赞好文! 那篇公众号文章不够严谨,看看就好。 这种混合检测法是不是够可靠,我表示怀疑。
武胜 回复 悄悄话 你这不谈概率哪儿行,那个“全都是阳性”可能性有么?要知道这都是无症状人群,阳性可能百分比是个位数或更少,90%以上都是阴性。你说的最坏情况在超大样本下根本不可能发生。

同样楼下质疑的测试剂不准率也是可以定量的。关键是样本大,一定朝概率方向去。对每个人检测的准确度可以存疑,但总体结果不会错。
playnice 回复 悄悄话 说的很有道理。尤其在假阴率如此高的情况下,很可能测不出来。
登录后才可评论.