2018 (427)
2020 (127)
2022 (141)
2024 (99)
2025 (10)
我在2025展望贴里说到AI会有重大突破,成为真真的生产力,但没想到风暴来得这么快,中国杭州一家才一年的初创公司推出的deepseek 在周一如五级飓风重创全球科技股板块,有的跌幅曾高达近40%。据众多业内行家的专业测试,它的性能总体看齐chatgpt,几个领域譬如数学高于gpt,我自己试了试,速度太慢,没耐心做长的对话,以后再试,可能是服务器容量太小给挤爆了,据说还有大量网络攻击,和deepseek 大模型本身性能恐怕无关。
但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。
必须一提的是,deepseek虽然一时让科技股跳水,但从中长期来看,绝对是AI科技版的利好消息,AI界注入新血更具活力,更有竞争,不但是公司间的,也是不同技术间的,甚至还有方法论上的比较。
也有人说deepseek故意低报了图像处理器的使用数量以减少美国在这方面封锁的压力,可能(从图像处理器巨头英伟达股暴跌可见一斑),但它即使减少一半算能也是了不起的成就哦。觉得另一方面这也意味着deepseek 优化其算法的一个动因,这我得为咱中国人骄傲,精打细算苦干巧干是我们的美德哈,不是玩笑,我们看其公布的算法技术优化细节,精打细算苦干巧干还真挺好地概括了其特点,这以后再细说了。