老钱的博客

我思故我在

首页文章列表博文目录

个人资料

老_钱 (热门博主)

给我悄悄话

博客访问：

老钱：关于“样本池”的普测方法

(2020-05-26 00:29:30) 下一个

（5/26/20，130）

老钱：关于“样本池”的普测方法

5/25/20

今天网上流转两篇文章，《武汉千万人核酸检测，真实感染率曝光》和《全民检测50万人已感染武汉女斥政府脑残(视频)》。

武汉市的感染情况到底如何。这个问题不仅仅是武汉人关心，政府关心，也是全世界都很关心的问题。5月14日，武汉市掀起了“十日大会战任务”，要在10天之内，对全武汉的一千一百万人做一次核酸检测，彻底摸清武汉市的详细情况。
。

这么大的测试量，怎么能在十天完成。据说这是因为采取了“混合样本池”的方法。这个方法是英国科学家在《柳叶刀/Lancet》上发表的，为了提高大规模普查的效率和降低成本。

我思考了一下，想来做一个进一步理解和解释。

设想把一群人（比如说64人中的一半，32人）的每个人的采样样本混合在一起，成为一个样本池。因为32人的样品都搅合在一起了，只要其中有一个人是阳性，这个样本池整体就是阳性。如果检测结果是阴性，那么这个样本池里的任何一个人都必定是阴性。那么就不用对这32人一个一个地检测（但是仍然需要做了32个采样），而是仅一次测试就把这32个人都排除了。减少了31个测试。

对于剩下的另一半的32人呢？如法炮制。

再取一次16人的混合样本池，如果最好的结果是阴性。这16个人就一下子排除了。
第三次对剩下一半16人，做8人的混合样本池，最好的结果是阴性。这八个人就一次排除了。
第四次是对剩下8人，进行4人的混合样本池，最好的结果是阴性。这四个人就一次排除了。
第五次是对剩下4人，2人的混合样本池，如果是阴性。这两个人就排除了。
第六次，仅剩下最后两个人了。就要对每一个人都做测试。如果可能是3种。
两人都是阴性，那么这全部的64人就没有一人被感染！
如果一阴一阳，就是只有感染一人了；感染率就是1/64，即1.56%。
如果都是阳性，就是只有两人感染：感染率就是1/32，即3.12%。

这样的“样本池”法，最好的结果就是，对全部64人，采了64次样，但是仅仅做了7个测试，就完成了对全部64人的测试。每个人都必须被采样，这是必须的。但是，不是每一个人都需要做测试。最好的情况，就是只做了7次测试，就查清了64人。7/64，即是挨个检测的11%的检测量。

对于昂贵的耗料耗时耗人工的核酸检测来说，“样本池”法是非常有效，非常经济合算的。极大地降低了测试成本！

这样的“样本池”法，也叫做“二分法”。

上面是最幸运的情况。如果不幸呢？我们来看看“最不幸”的情况。

如果这个32人的“样本池”的测试结果是阳性，就必须对这个“样本池”里的人重新来一次采样和测试。可以一个人一个人的测试，找到具体谁是阳性，谁是阴性。不仅仅必须要对这32个人重新测试，还要对另一半的32人从头开始。

也可以，对这个阳性的“样本池”再来一次16人的混合样本池，最坏的结果是阳性。不仅仅必须对这16个人重新测试，还要对另一半的16人从头开始。
第三次是8人的混合样本池，最坏的结果是阳性。不仅仅必须对这8个人重新测试，还要对另一半的8人从头开始。
第四次是4人的混合样本池，最坏的结果是阳性。不仅仅必须对这4个人重新测试，还要对另一半的4人从头开始。
第五次是2人的混合样本池，如果结果是阳性。那么这最后四个人的每一个人都要采样测试。

这样的“样本池”法，最坏的结果就是，对全部64人，每一个人都被重复了4次采样和4次检测。一共采了256次样，做了256个测试。最终结果，最坏是64人都被感染了，百分之百的感染。最坏之下的最好的结果是，每个4人里只有一个人是阳性，另外3人都是阴性。就是四分之一，即25%的感染率。但是，仍然是要采256次样，做256个测试。

这样，“样本池”法反而增加了工作量，还不如64人，每一个人都测试一次了。

所以，“样本池”法的运用是有条件的，需要随机应变，灵活运用的。

而且，“样本池”太大了，可能降低了检测的灵敏度。我前面用的32人的“样本池”就太大了。这样“夸张”的“样本池”法，只是为了使得“减少测试量到11%”可以显易而见。如果32人中只有一个阳性的话，阳性的浓度立刻就降低到了1/32，很可能就检测不出来了。10人的“样本池”就会把一个阳性的浓度降低到1/10。多大的“样本池”是合适的呢？这就不是纸上谈兵，而应该从试验中总结出来。从微信上武汉大嫂的抱怨来看，在武汉的“大会战”中，是采用了10人的“样本池”。那个大嫂抱怨：“把我们十个人的样品不注名地放在一个容器里”。大嫂说，“那查个鬼啊！”。这是因为她不知道到“样本池”的理论。

那么，我们就用10人“样本池”来分析。如果这个“样本池”是阴性，那么这10人就全部是阴性，就节约了9/10的测试量。如果是阳性呢，就要把这10人叫回来重新测试。
改为5人“样本池”，如果结果是阴性，这5个人都是阴性，不用再测试了。
对于其余5个人，一一测试，总测试量就是7次，7/10，也减少了3次。
如果再采取3人“样本池”，如果是阴性，这3人都是阴性，只要再分别测试剩下的两个人就完成了。这样的总测试量就是5次，减少了50%的工作量。
如果3人“样本池”是阳性，那么这5个人都要逐个测试。总工作量就是8次。8/10.
如果第一个5人“样本池”是阳性，就重复上面的分析，总测试量大约为50%到80%。因为他们有把握，剩下的5人应该全是阴性。因为，在决定采用“样本池”方法之前，他们已经做了前期试验，得到了平均感染率是5%。但是，为了避免漏侧，还是要对剩下的5人，做一个“样本池”测试。这样来，总测试量大约人人检测的为60%到90%。

到这里，我们要回过头来说，“武汉大嫂”的抱怨是完全正确的，即使采用“样本池”方法，不可能把受测试的老百姓，反复的叫回来重新采样，更要被老百姓骂死了！一次采样的量必须够用测试3次。

所以，那个大嫂抱怨：“把我们十个人的样品不注名地放在一个容器里，那查个鬼啊！”。她是完全正确的。不管她懂不懂“样本池”。

由此看来，“样本池”的方法也只能用于第一步，顶多到第二步，到了4人“样本池”，就没有什么优越性了。

对于美国斯坦福大学研发出来的抗体快速检测来说，测试与采样基本上就是一件事儿。除了昂贵复杂的核酸检测，这样的“混合样本池”法，也就没有多少优越性了。

我不是生化医学领域里的人，只是一个工程师，只是有兴趣从简单算术来理解“样本池”的理论。本文不谈如何政治问题，只是数学和逻辑。可能贻笑大方。欢迎专家批评指正。

(全文到此结束)

[ 打印 ]

[ 加入书签 ]

阅读 () ┆ 评论 (11)

19428182 2020-05-26 18:22:04 回复悄悄话 A question, Why selected 50/50 but the Golden Section way?

balancedview 2020-05-26 16:27:51 回复悄悄话你的想法考虑到很多实际情况。
根据我读到的有关文章，样本池是最多5到10个人，这样能保证每个人的血不会被过分稀释，使得病毒太少而被漏测，同时每个人最多测2次。

西风-西风 2020-05-26 16:12:57 回复悄悄话赞好文，谢科普。

dqdeer 2020-05-26 16:06:47 回复悄悄话在感染人数很少的情况下，效率肯定是很高的。瞎质疑就是和文中的大嫂一个水平？

charlie_us 2020-05-26 14:56:23 回复悄悄话采用样本池的方法，可以把每个人的样本分成几份，拿第一份做第一遍测试，如果需要第二遍测试再取第二份，以此类推。不需要把人叫回来取第二，三次样。

大汉唐 2020-05-26 13:53:21 回复悄悄话博主好象有些基本概念似是而非：大数据下的概率是很有效的，如果无症状感染者比例很低的话——根本不会有那么多重复测试的可能性

老_钱 2020-05-26 12:30:58 回复悄悄话回复 '只愛一點點' 的评论 : 谢谢。

老_钱 2020-05-26 12:29:24 回复悄悄话谢谢你们的讨论。
我理工男，对医学是外行。喜欢瞎琢磨。只是抛砖引玉。
显然你们都是行家。向你们学习了。谢谢了。

只愛一點點 2020-05-26 12:00:10 回复悄悄话赞好文！那篇公众号文章不够严谨，看看就好。这种混合检测法是不是够可靠，我表示怀疑。

武胜 2020-05-26 11:13:46 回复悄悄话你这不谈概率哪儿行，那个“全都是阳性”可能性有么？要知道这都是无症状人群，阳性可能百分比是个位数或更少，90%以上都是阴性。你说的最坏情况在超大样本下根本不可能发生。

同样楼下质疑的测试剂不准率也是可以定量的。关键是样本大，一定朝概率方向去。对每个人检测的准确度可以存疑，但总体结果不会错。

playnice 2020-05-26 09:07:53 回复悄悄话说的很有道理。尤其在假阴率如此高的情况下，很可能测不出来。

登录后才可评论.