老键脑电波

个人资料

老键

博客访问：

Deepseek 风暴

(2025-01-28 10:40:41) 下一个

我在2025展望贴里说到AI会有重大突破，成为真真的生产力，但没想到风暴来得这么快，中国杭州一家才一年的初创公司推出的deepseek 在周一如五级飓风重创全球科技股板块，有的跌幅曾高达近40％。据众多业内行家的专业测试，它的性能总体看齐chatgpt，几个领域譬如数学高于gpt，我自己试了试，速度太慢，没耐心做长的对话，以后再试，可能是服务器容量太小给挤爆了，据说还有大量网络攻击，和deepseek 大模型本身性能恐怕无关。

但技术性能还不是关键，科技进步总是后浪高过前浪，关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本，包括数量级减少的用于语言大模型学习的图像处理器数目和能耗，这是十分惊人的, 如chatgpt的早期版本，deepseek大方公开了源码，如果实力雄厚的大公司用资金，算力和人才杠杆撬动进一步开发，其成果将难以预料，其一；其二，它模型训练的廉价，极大降低了应用的门槛，譬如某家民间网调公司可以下载它的开码，适化后在一架laptop上就能训练特定领域的用户信息，而无需云计算。所以，虽然目前的deepseek 并不代表重大的生产力意义上的突破，但它打开的这扇窗，一下让人看到远得多宽得多的前景。

必须一提的是，deepseek虽然一时让科技股跳水，但从中长期来看，绝对是AI科技版的利好消息，AI界注入新血更具活力，更有竞争，不但是公司间的，也是不同技术间的，甚至还有方法论上的比较。

也有人说deepseek故意低报了图像处理器的使用数量以减少美国在这方面封锁的压力，可能（从图像处理器巨头英伟达股暴跌可见一斑），但它即使减少一半算能也是了不起的成就哦。觉得另一方面这也意味着deepseek 优化其算法的一个动因，这我得为咱中国人骄傲，精打细算苦干巧干是我们的美德哈，不是玩笑，我们看其公布的算法技术优化细节，精打细算苦干巧干还真挺好地概括了其特点，这以后再细说了。

[ 打印 ]

[ 加入书签 ]

阅读 ( ) ┆ 评论

目前还没有任何评论

登录后才可评论.