两只黄鹂四条腿

大家好,小黄鹂博客开通了。
个人资料
正文

58-61年三年死亡人数计算商讨

(2007-05-12 20:17:02) 下一个
       为了能让大多数人更好地理解死亡人数计算中的错误推导,我决定先举一个例子。
       我们假设x年我国某地区有一个四口之家:父亲、母亲、儿子和女儿。
        x+1年,儿子娶了媳妇,变成五口之家。
        x+2年,儿子媳妇生了一个儿子,变成六口之家。
        x+3年,女儿出嫁,变成五口之家。
        x+4年,出了一点不幸,这个儿子得急病死了。变成了四口之家。
        x+5年,母亲因为伤心,再加上有点年纪,居然也病死了。变成了三口之家。 
        x+6年,媳妇改嫁。变成二口之家。
        x+7年,媳妇把儿子带走,变成了一口之家。 

       通过这个家庭人口的变动,我们可以看到,这个家庭非正常减员(病死)只有一个人,至多再加上他母亲算非正常减员二个人。

       但是如果我们不深入了解这个过程,只从统计数据研究非正常减员,按照某些人的计算方法,我们会得出以下结论: 
       这七年之中,全家从四人变成一人,死亡三人。
       这七年之中,如果按正常情况计算,人口增长20%(第一年增长25%,第二年增长20%)。 那么七年就应该增长到4*(1.2)^7=14,也就是说少增长10人--这里我除掉了重复计算,照某些人的算法,似乎应该是少增长13人。
       两个数据加起来,我们发现这个家庭因为疾病非正常减员13人,平均每年减员2人。 
      我们因此可以得出结论,这个家庭发生了一件极其可怕的瘟疫。 

       到了这里,我相信一部分人已经知道这个计算的错误了。但是有些人肯定会找理由说明这个例子的不合理之处,我就试着一一说明。 
       第一,他们可能会说一个家庭的情况和全国人口是不一样的。家庭的出嫁在全国人口的情况下是不存在的。 但是这里存在一个问题,我们并没有具体的三年困难时间的严格的人口统计数据。在三年困难期间,粮食紧缺的地方出现了大批人口的逃荒,这些人口就像出嫁一样,既不算在本省,也不算在逃荒地。即使我们把家庭的出嫁人口找回来,那种计算方法也会导致11人非正常减员的荒谬结论。 
       第二,他们可能说,全国人口的年龄分布是比较均衡的,这家死年轻人,那家死老年人,不可能永远出现死掉年轻人的非正常现象。 但是这里依然存在问题。首先我们本来就没有理由假定全国人口的年龄分布在每年没有波动, 这种波动本来就会导致每年的出生人数和死亡人数的不一致。 
      
       但这些不是根本问题,根本问题在于这种计算存在一个极大的数学错误。
       为什么呢?

      首先全国人口数的分布本来就不是连续函数,是跳跃性的函数,这种非连续函数是不能用线性插值得方法推算的。
      譬如说,y年某家人口3人,y+2年某家人口5人(生了双胞胎)。 我们能不能因此说y+1年这家人口是4人呢?这显然是错误的。y+1年这家人口可能依然是三人,或者已经是五人。 
 
      某些人更为致命的一个错误是,他们不但没有弥补这种非连续性函数线性插值的缺点,反而加大了这种错误。 
      为什么呢?

      我再举另外一个例子。 譬如有一座山,最高峰1000米,山脚下最低200米。由于地形分布是连续函数,我们完全可以得到这样一个结论,这种山必定存在600米的山腰。
       反过来说,如果有人说这座山最高峰1000米,还有一个山峰600米,那么一定存在海拔800米的山峰,这个结论就有可能是荒谬的。 理由在于,为了消除非连续函数,我们需要对它积分而不是微分,微分只会加剧函数的非连续性。 
      
       回到人口统计。一个家庭的人口分布不连续,如果还非得计算每年增长率,并且把每年增长率作为推算基础,实际上是做了一次微分,加剧了数字上的跳跃。 
       回到那个家庭,从三口之家变成五口之家,线性插值的误差不过是一个人, 3,4,5--问题不大。
       但是如果要算人口增长率,正常的结果是, y+1年的人口增长率是0%,y+2年的人口增长率是66%。?这里根本无法进行插值运算,不能说每年的人口增长率是33%.
       0、33、66--这组数字的差别就显得很突兀了。对比三年困难时间的数据统计,我觉得很多人的计算方法是非常不严谨的,很有可能又是不懂科学的一次浮夸风和大跃进。

     总结来说,他们的计算存在以下值得商榷的地方:
     第一,这几年根本不存在严格的人口统计。 
     
     第二,没有理由在承认饥荒的情况下依然用插值法计算人口增长率。 
     
     第三,好像没有人计算正常死亡率应该是多少。 
 
     第四,没有人考虑年龄分布以及生育波动。

     第五,没有人考虑统计误差。中国人的人口基数很大,误差1%就是六百万人口,够能让某些人痛心疾首了。

     第六,少生和饿死是完全不同的两个概念。譬如说,人类的性行为如果完全不采用避孕方法,我估计全球人数将在5000亿的量级,但没有理由说人类自己扼杀了5000亿的人口。

    总而言之,大饥荒在那三年确实存在,而且确实存在饿死以及营养不良造成的疾病死亡,存在个别地方因为人为治理粗暴不合理造成的灾情加剧的情况,但是简单的说成饿死“三千万”是非常不合理的说法。
[ 打印 ]
阅读 ()评论 (7)
评论
两只黄鹂 回复 悄悄话 回复艾丽思笔记的评论:
很有道理, 很有道理。

三分天灾,七分人祸。
这种说法是比较合理的。

如果没有政府,即使同样的天气状况,老百姓肯定不会弄到那样大的减产。

但是话说回来,政府在救灾中又起了很大的作用。没有各省粮食调动,情况更差。


这个最不好讲的人祸,说起来也是一笔糊涂账。
一来呢,很多地方政府的领导都是打仗出身,他们习惯的就是拍胸脯完成任务,毛泽东那时又非常强调三面红旗,多快好省。

但问题在于,下面出了问题不敢直接向毛泽东汇报这就不是完全毛泽东的错误了。

彭德怀提出批评的时候,并不是毛泽东一个人就把彭德怀否定的。
很多人为了强调他们的功劳不愿意接受彭德怀的说法也是其中很大的原因。

后来的问题在于有些基层干部越过了上级向政府告了状,这时毛泽东等人才发现了问题的严重,派了一些人去调查。

不得不承认, 他们比旧社会的官僚好多了,至少还知道下去调查,他们还有一些良心,知道死人是个错误。

但是在追究责任的问题上依然出现了问题。
刘少奇刚开始把责任是推给基层干部的,这样才出现了全国范围内的四清运动,其中也造成了很大的冤案。要知道很多地方的基层干部可没有造成典型地区那样大的人祸,但是刘少奇的四清显然犯了一刀切的错误。很多地方的基层干部在刘少奇派出的工作人员的鼓动和压力下被诬告,缺点放大。。。

后来呢,这个事情又有人越级向上报告,毛泽东知道了对刘少奇就很没有好感。

说实在的,毛泽东说:“没有无缘无故的恨”, 这句话大致还是不错的,除了向上爬的一部分人,文革中的争斗就是因为前面的运动产生了很多矛盾,即使刘少奇的下场也是因为他确实得罪了一些人。

所以说,中国的问题就在于很多人喜欢借着权威打击别人。
两只黄鹂 回复 悄悄话 回复艾丽思笔记的评论:
呵呵,你说得有点道理。


造成饥荒是错误,没有理由找借口。
不过数字上的量化很重要,否则就会被人认为不可信。

现代科学的基石不在于哲学,而在于数学,在于量化。
如果那个时代对于量化有更好的认识的话,就不会造成瞒产反瞒产跑步进入共产主义等口号式的行政命令了。
艾丽思笔记 回复 悄悄话 哼哼,才"有点道理"啊,我还觉着挺有道理的呢:)

这个数字的统计争论,让我想起南京大屠杀来,日本人就对中国提供的数字不相信,而我们又拿不出确切的数字统计来给他们看,唉!

我想那个时代不仅对量化没有认识,而且对"人","国家","政府"等概念没有真正的认识,那种政治愚昧几乎是必然的.
艾丽思笔记 回复 悄悄话 这篇好奇怪啊.

我不知道那几年究竟饿死了多少人,三千万是个非常恐怖的数字,即使是三百万,三万,也足够恐怖.具体数字的统计估计是很困难的,也许我们永远都不知道到底饿死了多少人.

可那有怎么样?(大规模的,小规模的)饿死人是一种罪恶,国家的罪恶,尤其当这个国家还同时宣称在为人民服务的时候,这是不可原谅的.
登录后才可评论.