沙石峪

沙石峪网络博客

首页文章列表博文目录

个人资料

sandstone2 (热门博主)

给我悄悄话

博客访问：

一场新的AI军备竞赛要开始了吗？

(2025-02-07 05:22:59) 下一个

您好，这个问题我暂时无法回答，让我们换个话题再聊聊吧。 ——DeepSeek

上一篇写DeepSeek的文章仅仅几个小时就“闪”了。当时还感觉一头雾水。原本文章里还写到了春晚的机器人扭秧歌。后来想想终究是去掉了。文章也从最初的近6000字减少到3500字。即便如此依然没能逃脱厄运。好吧，我认输。这年头，说点真话太难了。如果再说出问题的底层逻辑，那就有可能是十恶不赦。

人家说DeepSeek只需要几个没有经验的大学毕业生就能创造出妖妖领先。我就应该附和，藏经阁里还有“扫地僧”没拿出来。人家说DeepSeek的开发成本只有几百万美金，用的还都是过时的GPU芯片。我就应该说，手搓芯片那都是小儿科，美帝崩溃在即裤裆已经湿了。最聪明的做法应该是像神拳大V们一样，站在前列腺上炮口直怼美帝下三路。但是我，偏偏一直都是一个不够聪明的人。别人都是看破不说破，我却是既看破又说破。结果一不小心又踩到了一部分人的G点上。我能想象出牠们的“瓦片心”碎了一地的样。瓦片心，是我最近的一个原创词。之所以不叫玻璃心是因为，牠们那颗心没玻璃那么纯净。而是既污秽又脆弱，就像垃圾堆里终年见不得阳光的一片乌漆麻黑的破瓦片。牠们最常见的问题是是对事物缺乏理性的对待。热衷于吹捧出一个又一个不能被质疑的妖妖领先。

既然觉得DeepSeek远超ChatGPT。至少应该对比应用一下才更有说服力不是吗？我把升天文《DeepSeek，是否会毁于一场“盲目狂欢”》输入ChatGPT。然后提问“请帮我分析一下文章为什么会被删除，以及有什么地方出现违规”。ChatGPT经过短暂分析给出了6个方面的结论。其中说到我这篇文章涉及传播负面情绪、抨击“民族科技狂欢”；质疑国内AI产品的国际竞争力，与国内主流舆论导向不符云云。然后又非常贴心的给出了6条对应的修改建议。包括删除哪些有可能触及敏感的用词，以及心照不宣的隐喻。在这一刻我突然发现自己还真的不如机器人圆滑老到。君不见，遇到了一些难以回答的问题，连DeepSeek都会告诉你，您好，这个问题我暂时无法回答，让我们换个话题再聊聊吧。

被闪的文章里我曾提到一项大模型的评判指标。即：新闻事件的准确性。关键要点是：事实性、时效性、信息源可信度和多角度理解。所谓多角度理解会评估模型在报道新闻事件时是否存在偏见，或是否能涵盖多个观点。于是有人留言说，问题是DeepSeek也不是搜索引擎啊。但我的观点是，并不是每一个人都会用这个大模型来编写程序做数学题。大部分人还是会提一些自己感兴趣的问题。这些问题自然而然的会与新闻事件有关。例如，我们可以对ChatGPT提问：发生在美国华盛顿的军用直升机撞击民航客机事件，与恐怖主义或者政治阴谋有关吗？大模型在回答这样的问题的时候，就包括了对真实发生的事件的描述，同时又会给出信息的来源和不带偏见性的理解。DeepSeek确实不是搜索引擎，但搜索和理解本身就是一体的。所以领先的搜索引擎会将大模型整合到平台生态中。大模型采集什么样的信息“源”，决定了你能得到什么样的理解和结论。

我知道，此刻有人会跳出来质问：难道DeepSeek没有给美国AI科技圈带来震动吗？英伟达股价没有跳水吗？这其实就是“ETC成精——自动抬杠”的人常见的问题：凡事只看表面而对底层逻辑缺乏认知。

我还是那句话，不吹不黑的看待这次DeepSeek的横空出世。如我上篇文章所说，相较于国内其他版本的大模型来说，DeepSeek确实有过人之处。独辟蹊径的算法打破了硅谷精英的惯有逻辑。不可忽视的是，大家对于科技的底层态度不一样，美国AI界对DeepSeek的重视是超越了意识形态的。在自由的市场经济中，只要有好东西，管它姓什么，第一时间先用上增强自身竞争力才是王道。所以在这两天，DeepSeek已经被多家领先的科技企业纳入其生态系统。微软、英伟达和亚马逊等公司已将 DeepSeek-R1 模型集成到各自的平台中。微软已在其 Azure AI Foundry 和 GitHub 的模型目录中添加了 DeepSeek-R1，开发者可以利用该模型进行测试和构建基于云的应用程序和服务。英伟达也宣布，DeepSeek-R1 模型现已作为 NVIDIA NIM 微服务的预览版提供，开发者可以测试和体验该 API。但所有这些并不代表别人“怂了”“尿了”，从这种务实、开放的精神中反而能看到企业的盛名不虚。

这些企业之所以争先恐后的把DeepSeek拉入怀抱，除了看中其在代码生成、数学推理能力方面的技术优势；以及模型轻量化，适用于本地 AI 计算，同时具有跨平台部署能力以外，还有一个重要的原因是企业希望减少成本，降低对 OpenAI 的依赖；同时增强企业在亚洲市场（尤其是中国市场）的 AI 竞争力。在这个科技飞速发展的时代，大家其实都有压箱底的东西，愿意什么时候拿出来才是关键。我可以断言，DeepSeek将会刺激到美国的AI界，进而引发一场波及整个世界的新的AI军备竞赛。

这里要顺便说一句为什么英伟达会暴跌。其实英伟达超高的股价和对定价权的垄断早就让业内大佬看不顺眼。大家其实就在等DeepSeek这样的一个机会，适时用市场教育一下英伟达。在一个没有权力干扰的自由的市场经济环境下，拥有核心竞争力的大科技公司想要控制世界并不容易。因为随时会出现一个“破局者”用独辟蹊径的方式打破垄断。同时给那些被财富烧得发烫的大脑降降温。

任何一项科技成果，最终都会在应用中体现出价值。大模型之下，还会有实用性更强的小模型。恰如我之前的升天文中所写：ChatGPT和Gemini这样的大模型摒弃了人工标注的”训练拐杖”，开始具备学习和自主推理的潜能。这不仅是技术方法的创新，更是AI对于世界的认知模式发生了改变。称之为“觉醒”一点都不过分。而一些小模型可以基于大模型的数据，借助蒸馏技术继承知识和推理能力。相当于老师把自己积累的精华传承给学生。让小模型在任务表现上大幅跃升，同时实现成本的大幅降低。这本身就应该是AI发展的未来。

引述一位技术达人的话：这场大模型觉醒和小模型崛起的双重革命正重塑AI行业规则。大模型拓展认知边界，小模型释放商业势能。当技术逻辑与商业思维完成融合，智能时代的格局不再是单一的算法至上，而是商业赋能技术、技术重构商业的双向进化。鉴于不同开发思路的AI模型会有不同的解题方法。人们更可以方便的把同一个问题扔给不同的AI模型。然后综合几个AI的答复得出成果。目前，面对着世界领先平台争相纳入DeepSeek，我们其实更需要以开放和包容的心态接纳其他AI模型的接入。在科技全球化的时代背景下，唯有全面和深入的交流与合作才会让AI更聪明。

我们小时候都学过王安石的散文《伤仲永》。其中讲述了神童方仲永从天赋异禀到泯然众人的故事。课文旨在教育我们：天赋只是起点，持续的学习和努力才决定最终的成就。但是在现实中，有多少天资卓越的“仲永”是一次次的被毁于“父利其然也，日扳仲永环谒于邑人，不使学”呢？又有多少是被“瓦片儿”们的迷之狂欢葬送了的？我们这一代人真的太喜欢扫地僧的故事。以至于热播的网络无脑剧都充满了“穿越到过去，用现代科技秒杀古人”的桥段。不愿意承认别人的优秀，不愿意主动修正和提升自己，不能包容和接纳，缺乏面向未来的视野和境界其实是典型的弱者心态。

今天的文章就写到这里吧。对不起，大过节的又给“瓦片儿”们添堵了。在这个世界上，有时候免费的才是最贵的。360曾率先垂范，给了我们免费的杀毒软件，也给了我们无法删除的360“全家桶”。当某样东西可以让我们免费使用的时候，应该想想他会从我们这里拿走什么呢？世界就是个草台班子。如果有朝一日AI变得滑头，学会了撒谎；或者有一天你感觉自己的智商遭到了AI的强奸，你也只好忍着。因为你不可以说不。如果你非想要一个答案，得到的回答是：您好，这个问题我暂时无法回答，让我们换个话题再聊聊吧。

作者：如是大牛哥

[ 打印 ]

[ 加入书签 ]

阅读 () ┆ 评论 (2)

sandstone2 2025-02-08 14:52:14 回复悄悄话回复 'markyang' 的评论 : 有道理.

markyang 2025-02-07 14:01:14 回复悄悄话文章不错，其实DEEPSEEK属于典型的理工科学生，大量关注，包括微调于几个局部的领域，所以看似局部成绩不错，但是如果对比文科，历史，甚至是简单的生活类等等，我对比过DS，CHATGPT，GEMINI，DS的回答是最弱的，当然其中有部分是中文互联网本身的数据比较烂有关，所以，DEEPSEEK的确更加像一个LLM界的拼多多，某些局部突出，但是整体输出质量很普通，当然要承认它的算法突破性，不过也没有那么悬，有论文比较过，CHATGPT的训练成本也已经下降90%，达到了千万美元级别。

登录后才可评论.