“九章”比超算快亿亿亿倍?错!错!错!
作者:徐令予 https://lingyu.blog/
中科大研制的“九章”的原型机和二号机的“量子优势”巳被否定,这一点基本上已成定论,详情请参考“亚伦森教授反戈一击 挑落“九章”量子霸权”一文。科学研究遭受挫折甚至失败亦属正常,批评质疑可以,责备非难就不必了。但是,九章团队某些人宣称【九章比超级计算机快亿亿亿倍】,实在错得太离谱、太低级。科研受挫可以理解,弄虚作假不能原谅!
“九章”比超算快“亿亿亿”倍?错!错!错!
一错,比较计算速度却没有公正的标准检测程序;
二错,比赛数据弄虚作假;
三错,比赛结果无法验证。
下面将分别对上述三个问题进行详细的分析,只要对 IT 和概率统计稍具常识的都不会有阅读困难,对错可自行判断,不当之处欢迎批评指正。
1)缺失公正的标准检测程序
如何比较两台计算机的快慢,相信只要稍有一点 IT 常识的都是一清二楚的。只需用中立的第三方提供的标准检测程序(Benchmark )在两台计算机上跑一下就可以了。俗话说,是骡是马,拉出来溜溜。
让我们看看2021年旗舰级智能手机的处理器对决,它们发生在高通公司的骁龙888与苹果公司的 A15 Bionic之间。为了比赛的公平和透明,釆用来自第三方的标准检测程序 GeekBench , 该程序运行时会命令处理器反复执行各种计算,然后让这两种处理器运行这个相同的程序,通过考核单位时间里它们各自完成的计算任务数量,就可对处理器的性能作出正确无误的科学判断。
“九章”宣称比世界上最快的超级计算机还要快“亿亿亿”倍,这个结论是如何得到的呢,难道也是通过运行中立的第三方提供的标准检测程序吗?完全错了。
“九章”与超算比快慢,从来就没用过第三方的标准检测程序,这样的标准检测程序根本也不存在,“九章”无法运行任何程序,它什么也算不来。“九章”其实只能做一件事,就是利用线性光学装置进行光子数釆样,通过釆样可以得到一条光子数的分布曲线,然而让超算通过求解复矩阵的Tor函数值得到相似的分布曲线(这个复矩阵由实验中的线性光学装置的参数决定),最后对这两种不同的方法的效率作些比较。其目的是检验是否存在这样的可能,让玻色釆样过程很难被经典计算机模似,这就是亚论森教授当年提出玻色采样理论的初心。
请注意,“九章”并不能直接求解Tor函数,所谓“九章”比超算要快“亿亿亿”倍,绝不代表“九章”在数值求解Tor函数时比超算要快“亿亿亿”倍,最多也只能说超算通过求解Tor函数模拟“九章”的采样过程效果不佳。说到底,“九章”本非计算机,它就是一个物理实验装置,这世上有许许多多的实验是很难用计算机精确有效地模拟的,否则还要实验做什么?
“九章”与超算比速度毫无意义,因为两者运行的过程完全不一样,最后得到的结果的精度、正确度也不一样,而且在整个过程中它们涉及的数据输入输出的时间也相差很大,忽视了这些因素比较快慢意义何在?运动员不在一个赛道上、甚至都不在同一赛场上,还会有公平的比赛吗?
而且用超算模似“九章”的釆样结果,谁规定非要求解Tor函数呢?事实上存在多种近似模拟算法,取得的分布曲线比“九章”更好也更快,因此“九章”比超算快“亿亿亿”是毫无科学依据的。
2)数据弄虚作假
即使我们退一步,全盘接受“九章”团队的评判标准,也是无法得出“亿亿亿”倍加速度这个结果的,因为他们在计算上犯了原则性错误。“九章”与超算比的是获取光子数分布曲线的快慢,按“九章”团队的计算,“九章”用200秒钟的釆样得到的结果,超算约需要 10^26秒,两者之比为10^24,这就是“亿亿亿”倍加速度的出处。
这里的计算有两个错误:
A) 超算其实是有更快的算法的,即使作精确的数值求解,也绝不需要10^26秒,至少可缩短9个数量级[1];
B) 超算通过数值求解获得分布曲线需要很长很长时间,这没错,但是超算得到的却是精确的理论分布曲线,“九章”200秒釆样得到的其实与理论分布相差十万八千里!这个错误是最致命的。
高斯玻色釆样的分布曲线上的每个点,对应的就是某种光子数出现的概率,而实验装置对某种光子数的有效样本数的采集过程,就是逐渐逼近这个概率的过程。
举过例子,抛硬币正反面朝上的概率各是二分之一,它们的概率可以通过抛硬币求得。向空中抛硬币N次,纪录硬币落地后正面朝上的次数M,M/N 即为硬币朝上的概率值,而N、M分别为釆样的样本数和有效样本数,因为该事件的概率为1/2,所以N不需要很大,抛个数十次硬币就可得到足够精度的概率值了。请注意,抛硬币和计数就是釆样过程。
假如抛相同的3个硬币求落地后全正面朝上的概率,那釆样的样本数至少要上百次以上才有意义。再假如求100个硬币落地全部正面的概率呢?那么用抛硬币这种采样方法求解概率,真不知要把硬币抛到哪年哪月!
从原理上来讲高斯玻色采样与抛硬币没有本质上的区别,高斯玻色釆样问题中矩阵P的Tor函数值,其均值随着矩阵的维数增加而快速指数下降。根据伯努利大数定理,对该概率分布采样所需要的样本数也会指数增加。对于使用有限采样频率的物理装置,即使采集到一个有效样本,都是一个指数复杂度问题。这是因为,经典采样时钟的频率有其物理极限,而所需样本数指数增加[2]。
对于光子数 N=45 的某个分布的概率(100维矩阵的Tor值)为1.44×10^-25,对于如此小的概率要想通过釆样获得有意义统计结果,“九章”实验200秒一共5千万次釆样是远远远远不够的,按照“九章”的釆样速度日日夜夜不间断工作,估计上百万年都不够!“九章”用区区200秒采样得到的数据与理论分布差了何止十万八千里,而超算通过数值求解得到的就是理论分布曲线,“九章”与超算怎么比?比什么?因此认定“九章”比超算快“亿亿亿”倍是大错特错。
3)结果无法验证
“九章”团队制造“亿亿亿”倍的轰动效应,他们公然弄虚做假的底气何在?其实这背后都是有预谋并作了精心策划的。他们充分利用了玻色釆样的缺陷,故意把实验设定于无法验证的区域之中,为弄虚做假找到了避风港。
玻色釆样结果难以验证一直是该方案的软肋,玻色釆样不仅求解困难,验证也同样困难。玻色釆样本身就不是一个 NP 问题(Non-deterministic Polynomial),通俗地说,玻色釆样无法在多项式时间内完成,但也无法在多项式时间内被验证。对玻色釆样结果的验证就是把釆样得到的分布与理论分布作比较,而得到理论分布的唯一途径就是用超算求解矩阵的Tor函数。换言之,超算对玻色采样的求解过程就是验证过程,它们本是同一回事,这是导致玻色采样领域乱象丛生的要害所在。
“九章”故意把实验的规模定在70个光子数以上,在这个区间之上用世界最快的超级计算机对Tor函数作数值求解至少需要上亿年甚至更久,这就意味着我们几乎永远无法得到相应的高斯玻色釆样的理论分布曲线。因而“九章”敢于拿200秒采样结果来糊弄人,因为谁也无法证伪。
对此,玻色釆样的理论创始人亚伦森教授还是有清醒的认识,在他的2014年理论奠基性论文中早已明确指出[3]:
“如果光子数 N 足够大以至于经典计算机不能解决玻色釆样,那么N可能也大得足以让经典计算机甚至无法验证量子计算机正在正确求解玻色釆样。”
“如果光子数可以用(比如)20 ≤ N ≤ 30 来实现我们的实验,那么一台经典计算机当然可以验证答案——但同时,人们将获得直接证据证明量子计算机可以有效地解决一个“有趣的难题” 问题,其中最著名的经典算法需要数百万次操作。”
可以肯定“九章”团队对亚伦森教授的这篇论文是烂熟于心,上面两段文字他们不会没有看到。但是他们的某些人却看到了可以弄虚作假的玄机。他们无视亚伦森的忠告,反其道而行之,把光子数 N 定在 70 以上,在这种区域里超算的数值求解几乎没有可能,当然也就得不到理论分布,验证就成为一句空话,而这正是“九章”团队想要的结果。
为了达到这个不可告人的效果,“九章”团队把亚伦森教授的忠告当作耳边风,不切实际地扩大实验装置的规模,反正他们也“不差钱”。
“九章”比超算快“亿亿亿”倍,这其中的每个亿都是假的,为了这三个假的“亿”化掉的人民币可能要上亿,这个亿却是真金实银,用一个真的亿换来三个假的亿,值不值?这要看问谁了,“九章”团队中的某些人为此名利双收,他们当然觉得太值了。
综上所述,宣称“九章”比超算快“亿亿亿”倍犯了三大错:比赛没有公正的标准检测程序;数据又严重造假;最后又无验证手段。这就像一个骗子要与专业赛跑运动员比速度,但是这个骗子根本不与那运动员出现在同一赛道上,骗子又偷跑、抢跑无所不用其极,最后又自己充当裁判,宣判自己大幅领先专业运动员,这种比赛结果毫无意义。
“九章”的量子优势被否定,这已经是学术界的主流观点,这也无需大惊小怪,毕竟科学研究受挫是常态,科研要允许犯错,适度的夸大和吹嘘乃属人之常情也可原谅。但是信誓旦旦地在大众媒体上宣称【九章比超级计算机快亿亿亿倍】真的是太侮辱国人的智商了。
2020年?的“九章”一号比超算快“一百万亿”倍,半年多以后的“九章”二号比超算快“亿亿亿”倍,听说又有“九章”三号在后头,不知还要快出多少个亿倍?通胀的势头绝对胜过埃塞俄比亚货币。
估计“九章”每年至少可以提速亿亿倍,照此趋势到了2030年,“九章”将比超算快“N个亿”倍,绝对成为人类科技史上无可匹敌的冠军。到时候诺贝尔物理学奖都不好意思发给“九章”团队,全世界的科技奖合作一处都可能配不上“九章”!这大概就是为什么2021年国家科学技术奖没有颁给“九章”的真正原因,因为实在配不上“亿亿亿”倍的伟大成就啊。
“亿”这个数词是中文特有的,很明显“亿亿亿倍”就是专门说给囯人听的,对歪果仁不会这么说,而且也不能这么说,因为“量子优势”的核心是比较计算复杂度,它与计算速度本非一回事。但是“九章“团队的某些人偏要在国内媒体上宣传快“亿亿亿倍”,为什么要专门欺骗自己的衣食父母呢?真不知他们安的是什么心。其实最让人反感的常常不是作假的内容,而是作假的动机。
再过几天就要与2021年告别。回望过去的一年,世界上有不少的科技成果让人叹为观止、记忆深刻,但真没有一项可与“九章”相比。中科大推出的光量子计算机比世界上最强的超级计算机还要快“亿亿亿”倍!此事无论是真还是假,都是破了世界纪录,它注定要被历史铭记,究竟是丰碑还是恥辱柱,就让后人评说吧。
参考资料
[1] The Boundary for Quantum Advantage in Gaussian Boson Sampling
[2] 内禀随机性是世界复杂度的来源吗?
[3]