热闹的春节
(2025-01-31 10:31:01)
下一个
今年的春节可真是热闹啊,吃喝玩乐之余,如何评价DeepSheek的争辩,国内外的褒贬双方鏖战还在继续,这让我想起了张维迎曾对我国科技上的不端现象比喻说:牛顿花了30年时间才发现了万有引力,而我呢,花了3个月时间明白了万有引力,但如果我现在说,我用了3个月的时间,走完了牛顿30年才走的路,是不是有点好笑;而且,如果我再反过来嘲笑牛顿,那只能说明我真的太无知了。
风声是凤凰网的公众号,在大年初三的今天,读到刚发表的时评“DeepSeek是国运级的突破吗?....”,里面的一段话很有代表性,拷贝如下:
“质疑DeepSeek这种‘小快灵’的技术绽放,是否会如春节烟花般转瞬即逝,最终被美国AI企业的算力优势和技术封锁继续压不得动弹。
如果DeepSeek R1仅仅是一个从OpenAI模型中蒸馏现成数据,用中国企业擅长的工程优化来做一个廉价平替的工具,这种担忧并非没有道理。
但当我们看到DeepSeek放下种种顾虑,毅然而然选择了真正的开源时,实际上我反而对其未来充满了信心。”
这里有2个关键词:蒸馏,开源。先看“蒸馏”是个什么东东?查到维基百科:知识蒸馏,而百度百科尚未设有关条目。
维基百科:知识蒸馏是人工智能领域的一项模型训练技术。该技术透过类似于教师—学生的方式,令规模较小、结构较为简单的人工智能模型从已经经过充足训练的大型、复杂模型身上学习其掌握的知识。该技术可以让小型简单模型快速有效学习到大型复杂模型透过漫长训练才能得到的结果,从而改善模型的效率、减少运算开销,因此亦被称为模型蒸馏。
该条目有旁注:“本条目近期正在扩充或大幅编修。”,可见“知识蒸馏”是随着AI的兴起而有的新概念,还有待于完善,比如学生透过老师来学技术,是否要得到老师的同意,否则是否侵犯了知识产权?显然至今还未有规范,所以DeepSheek从OpenAI模型ChatGPT中蒸馏到的现成数据,应该是无可指责的。
美国现在虽气得跳脚,也只能待游戏规则完善之后再说了。其实美国的态度可以理解,因为在风声时评的这段话里,如果把中国和美国的位子对调一下,基于“政治正确”的立场,想必中国也会气得跳脚的。而在有新游戏规则之后,别说DeepSheek会主动停止从OpenAI蒸馏,就是美国,也必然会像卡我国芯片脖子一样,再签署禁令,先先就堵住了DeepSheek获取知识的渠道,不过那都是下一步的将来式了。
那么,什么又是“开源”呢?维基百科:开源软件,又称开放源代码软件,是源代码可以任意获取的计算机软件,这种软件的版权持有人在软件协议的规定下保留一部分权利,并允许用户学习、修改以及以任何目的向任何人分发该软件。百度百科:开源程序,被非营利软件组织注册为认证标记,并对其进行了正式的定义,用于描述那些源码可以被公众使用的软件,并且此软件的使用、修改和发行也不受许可证的限制。
可见对“开源”的理解,两者没有原则性差别。DeepSeek正是开源的AI平台,在外行人看起来就像志愿者,是在出于好心做慈善一样,在争辩中总能占理;虽然“劫富济贫”的做法,总是没法令人人都满意。