加拿大各省正复工复课,社会上有了相对乐观的情绪。之前曾想对新冠疫情图做些说明,但觉得在令人不安的背景下,也许多一分期盼更好吧,事实怎样又能怎样呢?如今在心理相对宽松的氛围下,觉得可以探讨一下新冠疫情图中的数学背景,读懂它们也许会影响咱们当下的选择。况且Montreal的人们更擅长艺术和那些更形象的美好事物、对枯燥数字没太大兴趣。术业有专攻,作为曾经数学奥校的选手,在下愿为朋友们解释一下这些图背后的数字技巧。
一、为什么用半对数图,而非算术图?
这是4月9日加国发布的预测模型,注意它的纵轴,从1千到1万、10万、百万,横轴从第500例那天开始算,算术等距分布,这是半对数图。
从图上看,加国处于密集趋势带中,显示的似乎是个寻常走势。
喜欢问问题的朋友可能要想了:为什么Y轴要用对数坐标,而非通用的算术坐标呢?
这是因为半对数图有这样几个好处:
(1)运用于股票图时,上涨和下跌会产生相同的幅度。这个好处跟疫情图没多大关系,因为新冠确诊总人数是只会上升、持平而不会下降的曲线。即使有确诊者不幸故去,他的这一数值“1”也不会从总确诊人数中减去。
(2)适用于长期趋势。这个与疫情图也没什么关系。新冠传染性强,几天内感染人数就快速飙升,数据日新月异。图中显示的时间跨度不过是一个多月,40天而已,横格完全承载得下。正常屏幕看股票的5年日K线图都没有问题,何况新冠疫情的几十天走势呢~~
(3)简化数量级数字。“对数”概念由苏格兰人纳皮尔发明,有人赞之:“对数让计算时间缩短从而延长了天文学家的寿命”,伽利略说:“给我时间、空间和对数,我可以创造出整个宇宙”,跟阿基米德有一拼,都是马斯克这种心系外太空的奇侠……他们都在说对数图能将类似天文数字般量级的都体现在同一张纸上,无论多少级数都简化为代表级数的数字,视觉上不易引起恐慌……感受一下log10 =Lg,10的8次方是1个亿,而对数纵轴上只显示了8。
原先在证券领域时,刚入行那会儿很喜欢画图,在坐标纸上通过画一天天的K线图来感受一下参与者每天或惊喜或惊吓的心情,后来发现画出两三个月的行情后,算术坐标纸上根本就不够画的,画着画着K线就出去了,涨得太高或跌得太惨,只好再取张纸拼接上,拼来拼去的挺乱的。如果是在纵轴为对数坐标的纸上画,就不会有这个问题了,只要不飞到天上去,什么都画得下。
(4)随之而来的,因为弱化了绝对数字间的差异,半对数坐标上,各国的趋势看上去非常相似,虽然绝对数值上可能会相当迥异。
二、可以将半对数图近似看成加速度
咱们可以通过霍普金斯大学“全球疫情地图”上确诊人数的曲线,以它的半对数坐标、算术坐标图形的对比来感受一下差异。
上半部的图是半对数坐标图,横轴是等距的月份,纵轴从“1K”跃升到“1M”,也就是从“千”升到“百万”。1K离X轴近容易被误以为是原点,并不是,纵轴的原点仍然是“0”,只不过相比于1M,1000会更贴近于零而已,具体链接如下
对数相当于“降幂”,幂字不熟的朋友参照杨幂就知道发音了哈~~
几次方是升幂,对数相当于降幂,是指数的反操作。
在图的下半部分是算术坐标图,可以看到全球新冠感染总人数3月初曲线从X轴附近涨起来的时候有一小段曲线,之后的几十天内近似像是直线了。稍有些遗憾的是这个网站的线条画得有些太粗了,所以算术坐标下的曲线轨迹看得不是很清晰,这是它是为了鼠标在线上移动时可以看到当天的数据。这样粗线条的优点是即使那些年长的科学家,手有些抖的也能流畅地用鼠标滑过看到逐日的数据,而不用像京东网站登陆时拼图那一环节如此变态,即使严丝合缝也还得连拼几十遍也过不去。
通常这种部分曲线部分近似直线的主体是一次函数、二次函数的混合体,不排除夹杂影响因子小的高次函数。而它的规律可通过降幂来看它的近似加速度,就是哪些路段发展速度快,哪些路段发展速度慢,什么时候加速度降为0了,都显示在上半部分的半对数图中:三月之前,加速度呈快速上涨趋势,就是增加的速度在加速,在2月中上旬加速度减慢了,从3月中下旬开始,继续开始爬坡,增长速度越来越快,4月中下旬的时候,加速度虽略有减缓,但仍保持在稳定的加速中。
对照看加速度图(确诊人数半对数坐标图)和速度图(确诊人数算术坐标图)时有些概念需要澄清一下:
- 加速度为0时,速度会保持匀速上涨(加速度既没增也没减)
- 加速度刚刚由正的变为0再变为“负值”时,速度仍然在增长,加速度为“负”只是说明正在减速,但速度还未为0。
- 新冠感染人数图跟其他图有个明显区别,就是如前(1)所述,在算术坐标上,新冠感染总人数曲线最多就是横向向右打平,不可能向下。
为了更形象地解释如何配合着看,咱们先上一些图,之后再慢慢解释。
三、多国算术图、半对数图的共性 & 特性
下篇更精彩,未完待续~~