2025年第一天,克里姆林宫网站刊载了俄罗斯总统普京的指示,要俄罗斯政府和最大银行“确保与中华人民共和国在人工智能领域的技术研发方面进一步合作。” (下图 KAOHOOINTERNATIONAL)换句话说,普京要求俄政府和最大的联邦储蓄银行通过“合作”来习中国大陆在AI领域的专长。估计普京的这一指示会让许多俄罗斯人,尤其是精英阶层人士汗颜。毕竟,联邦储蓄银行在俄罗斯人工智能领域处于领先位置。更重要的是,中华人民共和国自建国伊始,便是俄罗斯的前身苏联的小老弟,一直接受苏联的援助,在苏联的支持下发展壮大的。曾经有这么一句流传甚广的话“苏联的今天,就是我们(中国)的明天。”就在30多年前的20世纪90年代,俄罗斯的战斗机和驱逐舰还被中国军迷视为需要追赶的先进大杀器。要知道自沙俄以来,俄罗斯、前苏联和接替苏联的俄罗斯的人民 – 从普通老百姓到社会精英乃至皇亲国戚 – 都对自己生产的物品充满信心,除非同类物品来自西边:西欧和美国。可现在得屈尊向昔日压根儿瞧不上眼的小弟学习,你让曾经的老大哥情何以堪?但形势比人强。自己技不如人,美国西方又进行制裁,转向中国对俄罗斯来说不失为一项最好的选择。普京能如此谦恭地要俄政府和领先的企业学习中国大陆的人工智能还有一个原因,那就是美国人都承认中国大陆的AI优秀,且对中国人在AI领域取得突飞猛进的发展感到忌惮。
笔者曾在不久前讨论美中人工智能竞争的博文中提到,前谷歌董事长和首席执行官、前人工智能国家安全委员会主席施密特(Eric Schmidt)在哈佛大学和电视专访中均对中国大陆AI的迅猛发展势头大喊“狼来了。” 2024年12月下旬接受ABC的斯蒂芬诺普洛斯(George Stephanopoulos)采访时,施密特更警告美国政府和AI业界中国人正以“惊人的速度”赶上美国的领先AI技术。
施密特有理由对中国大陆在人工智能领域的进步感到压力 – 大陆AI公司深度求索2024年12月26日新发布的DeepSeek 3 大语言模型的性能与其竞争对手相当甚至更胜一筹,但成本更低,而且免费使用。CNBC的技术平台专题主持博萨(Deirdre Bosa 下图 CNBC)报道说,
基准测试结果显示DeepSeek 3 大语言模型与美国同类facebook的Llama3.1、OpenAI的ChatGPT4和Anthropic的Claude 3.5 Sonnet的表现难分伯仲,而DeepSeek 3在某些地方还胜过Llama3.1和ChatGPT4,如逻辑推理、数学能力、代码生成及软件工程能力等的细分领域(下图 huxiu)。
这里有必要进一步分析DeepSeek 3.0大语言模型的性能,以更好理解中国大陆在AI突破的重大意义。通过下面这张测试结果图表,可以发现DeepSeek 3.0(蓝柱)与Qwen2.5大模型(阿里巴巴的通义千问2.5)、Anthropic的Claude 3.5 Sonnet大模型、Meta的Llama3.1大模型、及OpenAI的ChatGPT4大模型之间的差距(下图 21jingji)。除了在英文(English)的6个子项,代码(Code)的2个子项和中文(Chinese)的1个子项外,DeepSeek 3.0在执行大多数任务时的表现都要优于其它大模型。当DeepSeek 3.0执行数学和程序编码时,它的表现更为突出,有时可以说是“遥遥领先”。如在执行数学任务时,无论是美国数学邀请赛(AIME 2024, MATH)和数学基准500题(MATH-500),还是中国北方数学奥林匹克(CNMO 2024),DeepSeek-V3都大幅超过了其他所有开源(Llama3.1和Qwen2.5)和闭源模型(Claude 3.5 Sonnet和ChatGPT4)。在编码测试中,DeepSeek 3.0也在7个子项中胜出5项(三哥要着急了,因为许多外包给三哥的基本编码任务,现在可由AI代行,且既快又省还清晰准确)。
尤其难能可贵的是,DeepSeek 3取得如此令人咂舌的突破,仅用了不到600万美元(官方文件说是557.6万美元),使用的是英伟达特供中国大陆的H800阉割版GPU芯片(下图 CNBC)。而Llama3.1和ChatGPT4则耗资上亿乃至几亿美元,使用的更是英伟达(当时)最强芯片。就这样,DeepSeek 3硬是仅用了2048块H800 GPU芯片,耗时2个月总计278万GPU小时取得了对其它主流大模型的赶超。与此相对照,Meta则用了3080万GPU完成对Llama3.1的训练。由于成本低,DeepSeek 3的使用费用也属最低之列 – 每100万Token(字)0.48美元,远低于主流大模型,质量却不相伯仲。DeepSeek 3这是要将AI的应用做成白菜价啊。英伟达对其GPU芯片有了危机感,因为DeepSeek 3通过数据和算法的优化,而非增加硬件算力(GPU芯片)的投入,就实现了较好的模型效果。当然,DeepSeek 3也有一些短板,如比其他主流大模型的响应时间要慢(约0.9秒)。DeepSeek 3的一个主要短板就是还不能创作图片,制作PPT等。此外,DeepSeek 3的上下文窗口为13万Token(字),要小于平均水平。这意味着当13万Token(字)用完时,用户得重新开启一个窗口,继续中段的工作。更通俗的说,一段问答对话或一项编码任务在进行中忽然中断了,因为13万Token(字)用完已耗尽。于是,得重新开启窗口以便完成对话或编码任务。盘古智库学术委员、未来实验室首席专家胡延平认为,DeepSeek 3体现了“非常中国”的工程能力,通过穿小路走捷径实现了追赶,但尚无底层原理创新。好吧,咱接着说说这与雷蒙多女士有何关系。
正是看到中国大陆在美国的严密封锁制裁下取得的惊人突破,对华科技制裁鹰派代表、即将卸任的商务部长雷蒙多(Gina Raimondo)对《华尔街日报》说,美国对中国大陆的半导体芯片封禁是“徒劳的”,出口管制只能暂时降低中国赶超美国的速度。(下图 X)她(雷蒙多)终于发现,“打败中国的唯一方法就是保持领先,…… 我们必须跑得更快,创新超逾他们。”
不在其位,不谋其政。在行将解甲归田之际,其言也善啊。笔者非常同意雷蒙多部长的话,并且在过去发出的多篇博文中均提倡美国高科技企业应当走良性循环的路 – 将已有的高科技产品高价出口到别的国家,再用获得的丰厚利润研发出更新更好的产品。美国得靠自身的真本事,靠不断创新来保持对包括中国大陆在内的世界领先。不思进取贪图享受生活又希望别人永远安于贫困落后,想要不付出努力或偷奸耍滑的躺赢,或许短时间内能行。但时间长了,乌龟都能超兔子,更别说本身就速度不慢、每年毕业那么多STEM专业的中国大陆了。为了美好生活,这些理工生的卷可是名闻遐迩。中国《易经》里有句话是这么说的:“天行健,君子以自强不息;地势坤,君子以厚德载物”。与中国大陆过招4年,咱雷蒙多部长算是悟透了。嗨,政府应当让我进入智囊团,或者某智库应收我入库 – 咱几年前就提出了商务部长刚刚认清的形势。(smile)
参考资料
胡延平. (2025). 胡延平:为什么DeepSeek-V3的火爆不宜过高评价? 新浪财经. 链接 https://finance.sina.cn/stock/ggyj/2025-01-02/detail-inecqsvs9677357.d.html?oid=%E7%9A%87%E5%86%A0%E7%99%BB3%E7%AE%A1%E7%90%86%E7%B3%BB%E7%BB%9F%E2%86%92TG%E5%BE%AE%E4%BF%A1hga1199%E2%86%925rIn&vt=4
Haski, P. (2025). DeepSeek 3: How China's New AI Is Challenging U.S. Tech Dominance. WORLDCRUNCH. 链接 https://worldcrunch.com/tech-science/deepseek-chatgpt-china-response
Mehrara, M. (2025). China and Russia forge major tech collaboration to challenge US. Newsweek. 链接 https://www.newsweek.com/china-russia-forge-major-tech-collaboration-challenge-us-2008502
Mowshowitz, Z. (2025). DeepSeek v3: The Six million dollar model. thezvi. 链接 https://thezvi.substack.com/p/deekseek-v3-the-six-million-dollar
Reuters. (2025). Putin orders Russian government and top bank to develop AI cooperation with China. 链接 https://www.reuters.com/technology/artificial-intelligence/putin-orders-russian-government-top-bank-develop-ai-cooperation-with-china-2025-01-01/