个人资料
sandstone2 (热门博主)
  • 博客访问:
正文

一场新的AI军备竞赛要开始了吗?

(2025-02-07 05:22:59) 下一个

您好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。 ——DeepSeek

上一篇写DeepSeek的文章仅仅几个小时就“闪”了。当时还感觉一头雾水。原本文章里还写到了春晚的机器人扭秧歌。后来想想终究是去掉了。文章也从最初的近6000字减少到3500字。即便如此依然没能逃脱厄运。好吧,我认输。这年头,说点真话太难了。如果再说出问题的底层逻辑,那就有可能是十恶不赦。

人家说DeepSeek只需要几个没有经验的大学毕业生就能创造出妖妖领先。我就应该附和,藏经阁里还有“扫地僧”没拿出来。人家说DeepSeek的开发成本只有几百万美金,用的还都是过时的GPU芯片。我就应该说,手搓芯片那都是小儿科,美帝崩溃在即裤裆已经湿了。最聪明的做法应该是像神拳大V们一样,站在前列腺上炮口直怼美帝下三路。但是我,偏偏一直都是一个不够聪明的人。别人都是看破不说破,我却是既看破又说破。结果一不小心又踩到了一部分人的G点上。我能想象出牠们的“瓦片心”碎了一地的样。瓦片心,是我最近的一个原创词。之所以不叫玻璃心是因为,牠们那颗心没玻璃那么纯净。而是既污秽又脆弱,就像垃圾堆里终年见不得阳光的一片乌漆麻黑的破瓦片。牠们最常见的问题是是对事物缺乏理性的对待。热衷于吹捧出一个又一个不能被质疑的妖妖领先。

既然觉得DeepSeek远超ChatGPT。至少应该对比应用一下才更有说服力不是吗?我把升天文《DeepSeek,是否会毁于一场“盲目狂欢”》输入ChatGPT。然后提问“请帮我分析一下文章为什么会被删除,以及有什么地方出现违规”。ChatGPT经过短暂分析给出了6个方面的结论。其中说到我这篇文章涉及传播负面情绪、抨击“民族科技狂欢”;质疑国内AI产品的国际竞争力,与国内主流舆论导向不符云云。然后又非常贴心的给出了6条对应的修改建议。包括删除哪些有可能触及敏感的用词,以及心照不宣的隐喻。在这一刻我突然发现自己还真的不如机器人圆滑老到。君不见,遇到了一些难以回答的问题,连DeepSeek都会告诉你,您好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。

被闪的文章里我曾提到一项大模型的评判指标。即:新闻事件的准确性。关键要点是:事实性、时效性、信息源可信度和多角度理解。所谓多角度理解会评估模型在报道新闻事件时是否存在偏见,或是否能涵盖多个观点。于是有人留言说,问题是DeepSeek也不是搜索引擎啊。但我的观点是,并不是每一个人都会用这个大模型来编写程序做数学题。大部分人还是会提一些自己感兴趣的问题。这些问题自然而然的会与新闻事件有关。例如,我们可以对ChatGPT提问:发生在美国华盛顿的军用直升机撞击民航客机事件,与恐怖主义或者政治阴谋有关吗?大模型在回答这样的问题的时候,就包括了对真实发生的事件的描述,同时又会给出信息的来源和不带偏见性的理解。DeepSeek确实不是搜索引擎,但搜索和理解本身就是一体的。所以领先的搜索引擎会将大模型整合到平台生态中。大模型采集什么样的信息“源”,决定了你能得到什么样的理解和结论。

我知道,此刻有人会跳出来质问:难道DeepSeek没有给美国AI科技圈带来震动吗?英伟达股价没有跳水吗?这其实就是“ETC成精——自动抬杠”的人常见的问题:凡事只看表面而对底层逻辑缺乏认知。

我还是那句话,不吹不黑的看待这次DeepSeek的横空出世。如我上篇文章所说,相较于国内其他版本的大模型来说,DeepSeek确实有过人之处。独辟蹊径的算法打破了硅谷精英的惯有逻辑。不可忽视的是,大家对于科技的底层态度不一样,美国AI界对DeepSeek的重视是超越了意识形态的。在自由的市场经济中,只要有好东西,管它姓什么,第一时间先用上增强自身竞争力才是王道。所以在这两天,DeepSeek已经被多家领先的科技企业纳入其生态系统。微软、英伟达和亚马逊等公司已将 DeepSeek-R1 模型集成到各自的平台中。微软已在其 Azure AI Foundry 和 GitHub 的模型目录中添加了 DeepSeek-R1,开发者可以利用该模型进行测试和构建基于云的应用程序和服务。英伟达也宣布,DeepSeek-R1 模型现已作为 NVIDIA NIM 微服务的预览版提供,开发者可以测试和体验该 API。但所有这些并不代表别人“怂了”“尿了”,从这种务实、开放的精神中反而能看到企业的盛名不虚。

这些企业之所以争先恐后的把DeepSeek拉入怀抱,除了看中其在代码生成、数学推理能力方面的技术优势;以及模型轻量化,适用于本地 AI 计算,同时具有跨平台部署能力以外,还有一个重要的原因是企业希望减少成本,降低对 OpenAI 的依赖;同时增强企业在亚洲市场(尤其是中国市场)的 AI 竞争力。在这个科技飞速发展的时代,大家其实都有压箱底的东西,愿意什么时候拿出来才是关键。我可以断言,DeepSeek将会刺激到美国的AI界,进而引发一场波及整个世界的新的AI军备竞赛。

这里要顺便说一句为什么英伟达会暴跌。其实英伟达超高的股价和对定价权的垄断早就让业内大佬看不顺眼。大家其实就在等DeepSeek这样的一个机会,适时用市场教育一下英伟达。在一个没有权力干扰的自由的市场经济环境下,拥有核心竞争力的大科技公司想要控制世界并不容易。因为随时会出现一个“破局者”用独辟蹊径的方式打破垄断。同时给那些被财富烧得发烫的大脑降降温。

任何一项科技成果,最终都会在应用中体现出价值。大模型之下,还会有实用性更强的小模型。恰如我之前的升天文中所写:ChatGPT和Gemini这样的大模型摒弃了人工标注的”训练拐杖”,开始具备学习和自主推理的潜能。这不仅是技术方法的创新,更是AI对于世界的认知模式发生了改变。称之为“觉醒”一点都不过分。而一些小模型可以基于大模型的数据,借助蒸馏技术继承知识和推理能力。相当于老师把自己积累的精华传承给学生。让小模型在任务表现上大幅跃升,同时实现成本的大幅降低。这本身就应该是AI发展的未来。

引述一位技术达人的话:这场大模型觉醒和小模型崛起的双重革命正重塑AI行业规则。大模型拓展认知边界,小模型释放商业势能。当技术逻辑与商业思维完成融合,智能时代的格局不再是单一的算法至上,而是商业赋能技术、技术重构商业的双向进化。鉴于不同开发思路的AI模型会有不同的解题方法。人们更可以方便的把同一个问题扔给不同的AI模型。然后综合几个AI的答复得出成果。目前,面对着世界领先平台争相纳入DeepSeek,我们其实更需要以开放和包容的心态接纳其他AI模型的接入。在科技全球化的时代背景下,唯有全面和深入的交流与合作才会让AI更聪明。

我们小时候都学过王安石的散文《伤仲永》。其中讲述了神童方仲永从天赋异禀到泯然众人的故事。课文旨在教育我们:天赋只是起点,持续的学习和努力才决定最终的成就。但是在现实中,有多少天资卓越的“仲永”是一次次的被毁于“父利其然也,日扳仲永环谒于邑人,不使学”呢?又有多少是被“瓦片儿”们的迷之狂欢葬送了的?我们这一代人真的太喜欢扫地僧的故事。以至于热播的网络无脑剧都充满了“穿越到过去,用现代科技秒杀古人”的桥段。不愿意承认别人的优秀,不愿意主动修正和提升自己,不能包容和接纳,缺乏面向未来的视野和境界其实是典型的弱者心态。

今天的文章就写到这里吧。对不起,大过节的又给“瓦片儿”们添堵了。在这个世界上,有时候免费的才是最贵的。360曾率先垂范,给了我们免费的杀毒软件,也给了我们无法删除的360“全家桶”。当某样东西可以让我们免费使用的时候,应该想想他会从我们这里拿走什么呢?世界就是个草台班子。如果有朝一日AI变得滑头,学会了撒谎;或者有一天你感觉自己的智商遭到了AI的强奸,你也只好忍着。因为你不可以说不。如果你非想要一个答案,得到的回答是:您好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。

 


作者: 如是大牛哥

[ 打印 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.