在需要英雄的时候,中国本土出现了英雄。这次Deepseek崛起的特点是原创的群体几乎都沒有海外留学经历。Deepseek创办者是广东人梁文锋,他的本科和研究生来自浙江大学,这真是了不起,他是以前应用量化理论投资或抄股的年轻人。
这是浙大难得的好消息,当然也仅限制在技术层面,而不是科学创新,前不久刚出现浙大伪造剑桥录取信和顶尖浙大毕业生被MIT开除的丑闻。我曾经就周围教授作为例子比较过杜克和芝大毕业生的不同,发现后者思想和工作的深刻度比前者强很多。虽然样本不大,但是差别很明显。类比中国的大学,与杜克相似的就是比较虚的浙大,相当于芝大的中国大学是中国科大和华中科大。
主导Deepseek技术层面的关键人物是四川人和95后女生罗福莉,她是雷军想用千万雇用的人才。她的本科读的是北师大计算机系,从北大计算机硕士毕业后在工业界发展。令美国人担心的是,中国拥有源源不断的人才,中国培养工程师的数量是美国的几倍,他们到美国留学也多在STEM领域。那片土壤最大的困境是独裁的体制与思想的禁锢,所以我们对中国的启蒙努力仍然任重道远。
斯坦福本科和华大MD老爸:“今天股市血流成河。估计你我的401K 要打个对折201K了[憨笑]”。这家伙是500万美金的主,我才不会动摇长线投资呢,我们在6年多前冒险拿退休金出来买古董房,现在退休金早已经超过了当年的额度。
这些高科技很多是忽悠钱的,美国有点中国的竞争也是好事。Deepseek是站在OpenAI的巨人肩膀上,使用的是开源材料,从零到1仍然是个问题,况且中国的信息是封闭的,最终很难与美国竞争。美国在发射卫星和送人去太空方面也曾经落后于苏联,然后猛醒后才遥遥领先的。现代经济学有个理论,共产党国家如果人均GDP达到美国的30%,就会因为体制原因而回头,以前的苏联和现在的中国都是如此。
浙大青年才俊创办的Deepseek让硅谷和华尔街震颤,昨天创下近年来华尔街最大的降幅,英伟达昨日降了17%。我们当然最为关心的是自己的钱包,专门去查了403K的账户。自己的退休金在1月27日只是下了一点毛毛雨,证明基金的搭配能够抗拒股市的波动。
同济美国牛人:“连纵坐标都没有啊!你的401表现其实不好啊,即使让你高兴的这两天的涨幅也不大啊。你不给坐标,但坡度放在那,你唬得住牛人?”
我的回复:“不露声色[Chuckle]。学术机构叫403b,这上升曲线已经很好了,隐藏纵轴是不想露富。纵轴的scale没放,你无从评价起。你还要注意横纵,那里无法看出两天的变化”。
Deepseek将AI做成了白菜价,如果说英伟达以前存在泡沫,Deepseek也当然是泡沫之一。Deepseek R1的价格只是ChatGPT o1的价格的3%,你们说这如何让西方的相应产品生存?相应的非技术层面的西方规则会联合起来抗付Deepseek的产业化。现在Deepseek已经规定只有国内手机才能下载软件,因为需求量太大。
一旦做到白菜价就失去了逐利的研发动力,太阳能板是美国开创的,中国把它做成了白菜价,导致中国和美国都无人有兴趣研发使太阳能板更有效。从这些转换看,AI并不是什么大不了的高科技,似乎几个小孩就能撼动世界。华尔街几乎可以肯定是反应过度,绝对会纠偏的。
Deepseek只创立了18个月,中国事情是否吹牛很难说。他们声称只使用了2个月,在600万美元的投资下,制备出了对标OpenAI投资几十亿美元的ChatGPT o1的产品。效果已经接近,虽然还有些差距,人家毕竟是原创。
昨天导致英伟达缩水5890亿美元市值,黄仁勋的个人财产缩水200亿美元,黄的个人财产降至1036亿美元。总体Nasdaq降了3.1%或612点,昨天英伟达的崩溃是美国股票史上最大公司股票的单日降幅记录。与此同时,谷歌降4%,微软降2.14%, Oracle降14%,Tesla降2.3%。我在美国生活了30多年,从来没有见过一个外国公司的科研产品对美国股市产生如此重大影响的。
硅谷核心人物从小扎到微软总裁都盛赞Deepseek, 优秀的产品自证优秀。Scale AI总裁Alex Wang说了些华裔背景的话: “DeepSeek-V3展示给外界的教训是:在美国人休息时,中国人在工作,并以更便宜、更快、更强的产品迎头赶上”。这家伙当年从MIT退学还令老爸生气,现在为最年轻的美国亿万富翁,老爸也应该释怀了吧。
最先催生Deepseek热议的是硅谷风险投资家Marc Andreessen,他是川普参谋。他在社交媒体平台X上称赞了DeepSeek为“Sputnik moment”。Sputnik是1957年苏联发射的首颗人造卫星的名字,当年是苏联现在是中国在刺激美国。川普也就Deepseek发表谈话,认为是个wake-up call, 这也是好事,将激励美国人更加努力。Deepseek像Sputnik那样超过美国ChatGPT吗?还沒有。Deepseek是在开源的情况下的工程进步,相当大的渐进性的发展,不是从0到1的范式飞跃。我们不能说Deepseek是山寨,但是取名上山寨谷歌的DeepMind是很明显的。
Deepseek声称自己只使用了2000多个芯片,具体使用的哪家公司的芯片存疑,因为OpenAI需要上万的高端英伟达GPU才能达到ChatGPT o1的水准。中兴芯片虽然追赶美国的速度惊人,但是离英伟达显卡的质量还是有相当的距离。这就引出了一个关键的质疑,Deepseek到底使用了多少英伟达的芯片?什么型号的芯片?英伟达只能出口低端芯片给中国。媒体传言Deepseek拥有上万个英伟达芯片,马斯克附和这种说法,他也参与指控Deepseek在关键技术指标上扯谎。
要么是OpenAI过份夸张高端芯片在AI应用的重要性,要么是Deepseek在开源条件下成功突破了对高端芯片的依赖性,这里的真实性只有时间才能给出答案。应该也不难弄清楚,因为Deepseek是完全开源的,现在是硅谷那帮年轻人不睡觉的时候了。
自媒体称Deepseek将会全面引领,这是极其夸张的说辞,即使开源的东西也是美国的技术。如果应用到商业很大可能是会受专利保护的。完全开源会因为资金紧缺很难前行,还需要施法独立,才会有繁荣的商务。中国这些条件都不具备,没有人会与你玩。正如我说的,华尔街是反应过度,今天英伟达股票反弹了6%。
牛顿创立经典力学后,中学生就可以学,麦克斯维尔的电磁理论和爱因斯顿的相对论也是突破奇难,后人学起来容易。分子生物学创立遗传信息的中心法则经历了几十年,现在我的学生半天就学会了。以前美国是使用举国之力,耗费30亿美元和历时13年,才测定清楚了人类基因组的序列,现在精准医学可以只花1000美元就测序个人的全基因组。
没有Meta的开源,Deepseek什么都不是,中国人稍微好些就鼓足劲头吹牛,跟以前吹嘘的五G那样。中国人应该记住美军官员对中国军方高级将领参观五角大楼所说的话:be humble!
国内朋友称Deepseek是Deepsick, 因为即使通过模型Deepseek可以识别坦克人的照片,但是它们的后台不敢说那是发生在天安门广场。这就是我说的信息管制的问题,华尔街的那帮家伙不懂中文,只看到它便宜就sale off美国高科技股票。使用Deepseek的信息安全也会存在抖音般的问题,他们可能弄清你手机里的所有信息。恐怕同济美国牛人的毛粉和猫儿粉的言论也会受到关注,他经常传递韶山纪念的人山人海,这家伙也渲染过美国北卡著名病毒学家做gain of function实验。
朋友这样告诉我:“deepseek只能+86注册是因为方便监管和监控。这边所有app都是实名制,明白其中含义了吧。我一看这个就不用了,典型的智障,deepsick实至名归”。
我们上周末在硅谷核心区的韶山印象餐厅看见过大量的老中,我们还是需要听湾区工程师的点评,这些是清华校友和普林斯顿老爸在第一时间的分析:
“Deepseek 采用混合专家(Mixture-of-Experts,MoE)架构,创新之处主要包括细粒度专家细分和共享专家隔离,提升 MoE 架构的效率和性能。但是训练它需要高质量的数据。它提出之初就有人怀疑利用chatgpt的输出作为训练数据。所以有人对Deepseek提问你是谁,deepseek回答:我是chatgpt. openAI是真正的从零开始,利用原始数据和追求通用智能。Deepseek所谓训练量只有chatGPT的1/30是夸大了,因为没有计入获取高质量数据的成本。现在也有质疑deepseek故意缩小了它拥有的GPU卡数量和训练计算量。另外它的通用智能上限也不如从原始数据中生成的大模型高。再就是开源,拿训练好模型的用,当然可以。但要验证它的训练量,要花大量金钱,它现在不怕训练计算量的验证,就是因为有这个花费的高门槛。
“我的比喻就是openAI花了几十年学习研究归纳总结,学会了人类知识,写了一本教材叫chatGPT,然后deep seek拿来学了一年,当然也从别的地方搞了点复习资料习题集之类的。然后两个人一起去参加了一个考试,考了差不多的一个分数。然后deep seek的粉丝们说,你们openAI太笨了,花了几十年学的那点东西,我们一年就学的差不多了。我们多NB,我们已经直道超车,我们大国撅起了,你们要完蛋了。版权所有,欢迎转载…
“没有第一个吃螃蟹的,就没有后来的进步。不能因为有人花了大价钱搞出来,开源了,自己免费抄了,就说一开始就不需要花那么多钱。如果自己从无到有研发出来,那还可以这么claim. 比如starlink, 试验回收,花了几百亿,搞成了。开源了。然后中国一家公司,山寨了,只花了几亿也搞成了。不能吹自己比原创还NB。所以Meta开源是一个SB之举,跟当年Tesla开源一样,把自己的路堵了
“我就觉得很奇怪,deepseek 应该是用了Meta的开源llarma, 加以改进,达到了o1 的性能,就是山寨了一个。以后Meta不开源了,没得抄了,他还能用这么小的算力继续match别人的效果吗?别人花了大价钱训练出来的,开了源公布了,他自然就省算力了,这并不说明今后也不需要的大算力了。从inference来说,他的参数比别人少很多吗?如何不需大算力的?”
任何人(当然包括deep seek 自家)都可以在开源AI基础上搞二次开发。弄出的应用性产品可以做为不开源的商品收费的。
ChatGPT:
在人工智能(AI)领域,开源指的是将AI相关的技术、算法、代码等以公开的形式发布,允许开发者自由地查看、使用、修改和分发这些资源。 ?
开源在AI中的意义主要体现在以下方面:
1. 促进技术交流与合作:全球各地的开发者可以参与开源AI项目,贡献自己的智慧和力量,加速AI技术的发展。 ?
2. 降低开发成本:开源AI提供了现成的代码和算法,小型企业和创业公司可以在此基础上进行二次开发,节省研发费用。 ?
3. 提高技术透明度和可解释性:通过公开代码和算法细节,研究人员和开发者能够深入研究AI算法的内部机制,探索如何提高算法的可解释性。 ?
然而,开源AI也面临挑战,如知识产权保护、代码质量和安全性,以及伦理和社会影响等问题。 ?
总的来说,开源在AI领域的应用推动了技术的进步和普及,但也需要在法律、制度和伦理框架下谨慎推进,以确保其健康、可持续发展。
DeepSeek这件事并不是局限于技术领域的影响,而是改变了美国经济的投资走向,真正的影响会体现在几个月后,比如对401K的影响,市场从来都有个观望阶段,除非你是直接相关的领域。
中国这种把什么都做成白菜价的目的至少有两个,第一就是获得相应产业的规则制定权,因为市场不得不跟着走。DeepSeek用论文的方式公布了算法,理论上任何人都可以复制,但复制也就意味跟着走,而不是主导,你永远落后。AI模型需要时间训练,美国在这方面的时间是以年计,deepseek是以月计,因此即使使用同样的算法,赶上deepseek也是不容易。
而如果你不走复制的路,成本必然升高。如今硅谷在拼命读deepseek的论文,希望弄清deepseek的算法。
第二是因为你不得不继续创新才能挣大钱,也就不能把技术锁紧保险柜单凭垄断获利,这就客观上刺激了新技术的发展,而不是你这里说的那样没人继续发展。
这种模式是基于共享的理念,而不是垄断的概念,是中国人所谓不挣最后一块钱的概念的体现。
留有余地,中庸,是中国文化行为准则。
从5G开始获得产业规则和标准话语权,这次deepseek事件类似TikTok事件,都是有关话语权的问题。再有就是军事武器相关的,076和六代机都定义了新的标准和发展规则。尽管武器发展是各国的事情,但技术基于的规则基础是没有国界的,这就产生了某种制约关系。
中国把东西做成白菜价并不是白给了全世界,而是看长远。比如deepseek不仅开源,还是免费,这就让其他具备开发应用的国家具有了与美国一样的起点。因为电力供应能力的关系,世界上也就只有中国和美国有能力发展AI模型,其他国家连足够的电力都没有。
如今deepseek这个模型已经用在股市运作(其实已经出来一段时间了,何况其发起人是做对冲基金的),随着更多应用系统出现,就可以几何级数地提高这个模型的能力,更加领先。
东西一旦开源,也就没法制止,因为客观上已经不是你的,不属于你能控制的。这是deepseek的影响所在,尤其是还免费。
因此可预期deepseek会有新东西出来,否则不会有这种自信(免费也可以挣钱的自信)。
【微软的安全研究人员在去年秋天发现,他们认为与DeepSeek相关的个人通过OpenAI的应用程序接口(API)大量提取数据。据了解,软件开发者可以购买许可使用该API,将OpenAI的专有人工智能模型集成到他们自己的应用程序中。】