58-61年三年死亡人数计算商讨
文章来源: 两只黄鹂2007-05-12 20:17:02
       为了能让大多数人更好地理解死亡人数计算中的错误推导,我决定先举一个例子。
       我们假设x年我国某地区有一个四口之家:父亲、母亲、儿子和女儿。
        x+1年,儿子娶了媳妇,变成五口之家。
        x+2年,儿子媳妇生了一个儿子,变成六口之家。
        x+3年,女儿出嫁,变成五口之家。
        x+4年,出了一点不幸,这个儿子得急病死了。变成了四口之家。
        x+5年,母亲因为伤心,再加上有点年纪,居然也病死了。变成了三口之家。 
        x+6年,媳妇改嫁。变成二口之家。
        x+7年,媳妇把儿子带走,变成了一口之家。 

       通过这个家庭人口的变动,我们可以看到,这个家庭非正常减员(病死)只有一个人,至多再加上他母亲算非正常减员二个人。

       但是如果我们不深入了解这个过程,只从统计数据研究非正常减员,按照某些人的计算方法,我们会得出以下结论: 
       这七年之中,全家从四人变成一人,死亡三人。
       这七年之中,如果按正常情况计算,人口增长20%(第一年增长25%,第二年增长20%)。 那么七年就应该增长到4*(1.2)^7=14,也就是说少增长10人--这里我除掉了重复计算,照某些人的算法,似乎应该是少增长13人。
       两个数据加起来,我们发现这个家庭因为疾病非正常减员13人,平均每年减员2人。 
      我们因此可以得出结论,这个家庭发生了一件极其可怕的瘟疫。 

       到了这里,我相信一部分人已经知道这个计算的错误了。但是有些人肯定会找理由说明这个例子的不合理之处,我就试着一一说明。 
       第一,他们可能会说一个家庭的情况和全国人口是不一样的。家庭的出嫁在全国人口的情况下是不存在的。 但是这里存在一个问题,我们并没有具体的三年困难时间的严格的人口统计数据。在三年困难期间,粮食紧缺的地方出现了大批人口的逃荒,这些人口就像出嫁一样,既不算在本省,也不算在逃荒地。即使我们把家庭的出嫁人口找回来,那种计算方法也会导致11人非正常减员的荒谬结论。 
       第二,他们可能说,全国人口的年龄分布是比较均衡的,这家死年轻人,那家死老年人,不可能永远出现死掉年轻人的非正常现象。 但是这里依然存在问题。首先我们本来就没有理由假定全国人口的年龄分布在每年没有波动, 这种波动本来就会导致每年的出生人数和死亡人数的不一致。 
      
       但这些不是根本问题,根本问题在于这种计算存在一个极大的数学错误。
       为什么呢?

      首先全国人口数的分布本来就不是连续函数,是跳跃性的函数,这种非连续函数是不能用线性插值得方法推算的。
      譬如说,y年某家人口3人,y+2年某家人口5人(生了双胞胎)。 我们能不能因此说y+1年这家人口是4人呢?这显然是错误的。y+1年这家人口可能依然是三人,或者已经是五人。 
 
      某些人更为致命的一个错误是,他们不但没有弥补这种非连续性函数线性插值的缺点,反而加大了这种错误。 
      为什么呢?

      我再举另外一个例子。 譬如有一座山,最高峰1000米,山脚下最低200米。由于地形分布是连续函数,我们完全可以得到这样一个结论,这种山必定存在600米的山腰。
       反过来说,如果有人说这座山最高峰1000米,还有一个山峰600米,那么一定存在海拔800米的山峰,这个结论就有可能是荒谬的。 理由在于,为了消除非连续函数,我们需要对它积分而不是微分,微分只会加剧函数的非连续性。 
      
       回到人口统计。一个家庭的人口分布不连续,如果还非得计算每年增长率,并且把每年增长率作为推算基础,实际上是做了一次微分,加剧了数字上的跳跃。 
       回到那个家庭,从三口之家变成五口之家,线性插值的误差不过是一个人, 3,4,5--问题不大。
       但是如果要算人口增长率,正常的结果是, y+1年的人口增长率是0%,y+2年的人口增长率是66%。?这里根本无法进行插值运算,不能说每年的人口增长率是33%.
       0、33、66--这组数字的差别就显得很突兀了。对比三年困难时间的数据统计,我觉得很多人的计算方法是非常不严谨的,很有可能又是不懂科学的一次浮夸风和大跃进。

     总结来说,他们的计算存在以下值得商榷的地方:
     第一,这几年根本不存在严格的人口统计。 
     
     第二,没有理由在承认饥荒的情况下依然用插值法计算人口增长率。 
     
     第三,好像没有人计算正常死亡率应该是多少。 
 
     第四,没有人考虑年龄分布以及生育波动。

     第五,没有人考虑统计误差。中国人的人口基数很大,误差1%就是六百万人口,够能让某些人痛心疾首了。

     第六,少生和饿死是完全不同的两个概念。譬如说,人类的性行为如果完全不采用避孕方法,我估计全球人数将在5000亿的量级,但没有理由说人类自己扼杀了5000亿的人口。

    总而言之,大饥荒在那三年确实存在,而且确实存在饿死以及营养不良造成的疾病死亡,存在个别地方因为人为治理粗暴不合理造成的灾情加剧的情况,但是简单的说成饿死“三千万”是非常不合理的说法。