风吹枫叶黄

憧憬退休的生活,闻吻夕阳的色彩
正文

不同 AI 的性格

(2025-06-29 17:53:23) 下一个

不同 AI 的性格

先报告一下各位关心我的朋友,我已经停止化疗了。

我一直在担心化疗药的抗药性和担心癌细胞杀得够不够多之间徘徊,最后在大夫的催促下终于停止了化疗,take a chemo break。

到目前为止我还没遇到认识的胰腺癌病友长时间没有复发的(最长的六年不复发),更没有见过复发后扩散了还能 NED 的(No Evidence of Disease),所以我只能在化疗和休息之间找平衡。

闲来无事,找点自己喜欢的事干吧,学习一下近代史(争取把洗抽抽了的脑子洗回来,看看我的化疗脑还有没有救,但学的新知识肯定是没有多大用了)。结果,在油管上看比较“靠谱”的“历史学家”讲太平天国,碰到一段比较神奇的故事,说的是太平天国北伐围攻怀庆府(今河南沁阳)中有一段传奇。

话说太平天国当年携五十万大军占领并定都江宁(改名天京,现南京),后东王杨秀清遣两路人马开疆拓土,西征(争补给)和北征(争政权)。感谢清兵的低效率和相互掣肘,林凤祥率领的北征人马一路打到了怀庆,并准备用他们两年来从实战中学到的拿手好戏攻城 – 挖地道炸城墙。这一招儿在以往的攻城战中屡试不爽,但这次却吃了憋,因为据说城内出了一位异人。

这是我找到的网文 “太平军北伐失败的致命错误:林凤祥吃不透杨秀清的大战略”:

(太平军)林凤祥怒了,下令多挖地道,来个四面开花。

怀庆被围,号子里关的牛人们蠢蠢欲动,似有暴乱的迹象。为了将暴乱扼杀在萌芽状态,也为了补充守城兵力,余炳焘(时任怀庆知府)决定打开监狱,让犯人们帮助守城,将功赎罪。

任随成便是被释放的犯人之一,此人是个资深矿工,深谙坑道作业,经验极其丰富,据说随便瞟上一眼地面,就知道地面有没地道,并能精确定位地道的准确位置。

任随城(原文如此,成和城混用)的指点下,清军识破了太平军的二十几条地道,并将其一一破坏。林凤祥气的差点吐血。

任随成有透视眼吗?当然没有。他的方法很简单,选个清晨,看郊野的草,如果草上没有露水,那就说明地下有问题。其理论依据是:草上无露则下有地道,远近曲折,一目了然。

看来左宗棠需要好好向任随成请教一下啊。

太平军攻怀庆不下,困于坚城之下。此时,讷尔经额编织的围剿大网正在慢慢缩小,各路清军都赶到了怀庆外围,对太平军构成了巨大威胁。

嗯,故事不错,但我表示怀疑:“草上无露则下有地道”?我觉得这种认知似乎不合逻辑,而且与矿工熟悉坑道作业的关系不大,说是矿区牧羊人还更靠谱一点,再说如何能看清远处的草上有没有露水?城墙的周围还都是草?好吧,请 AI 帮帮忙来确认一下。于是,先问了 grok,我的最爱。

Grok: 那是胡说八道,没有根据

Grok 说,正史只有记载总兵周天爵立了大功,但也没有提及他能够“在地面上看出地道”。

民间传说就多了,比如有风水先生、术士帮助等,但都没有史料支持。将清军的胜利归功于神奇,可能源自清廷的宣传,意在突出清军的“天命”或“神助”。

我正学史嗨着呢,这一下冷水浇头,难道我看到的是野史?这类故事有很多,需要考据落实,反过来认证其作者的专业性。

于是我想多看几位 AI 吧,先看 ChatGPT ,这家伙往往比较人性,看看是不是可以找出史料。果然,ChatGPT “不负我望”。

ChatGPT:是有一位高人,叫张乐行

欸,换人啦?

查一下,这位张乐行(又名张洛行、张落行)是个捻子,和清军对着干的,与太平军算是战友,怎么助上了清军?他后来的确还和太平军合拢了,而且最后被清军给灭了。

不过,我不想纠缠于此(和 AI 争论是自讨苦吃),就问 ChatGPT,那个异人不是挖煤工任随成吗?

ChatGPT 很知心地回答:没错,就是他在怀庆围城战中识破太平军地道的。我提到张乐行是因为他是组织将领,是任随成的指挥官,他们是将军和工程专家的关系。

完美解释!不过如果你不去深究,就被骗了!

我说,拜托你拿出证据来吧,任何史料都行。

ChatGPT 露怯了

注意看,下面的ChatGPT的信息来源都是网文,网文!sohu 和 360doc。

我说,这都是网络爽文,做不得数的,请找史料,比如清史稿一类的东西。

这回它承认了没有史料,而且承认这些网文也没有史料的引用。但它说地方志、清末笔记、太平天国相关档案里可能有。

我说那你就继续找吧。结果 ChatGPT 发现在《清史稿·洪秀全传》里有提到在围攻怀庆时,“以地道攻城,不克”。另有二手信息摘录,说任随成的信息是源自《贼情汇纂》。

我是那你就搜索《贼情汇纂》啊。结果它还是没有发现《贼情汇纂》里有相关描述。我到此确信,这位任随成就是演义里的神人。

于是,我把问题换成了“为什么 ChatGPT 和 Grok” 的应答方式有如此大的区别?这回 ChatGPT 的答案我比较满意。

ChatGPT: 这是两种不同的风格和思维路径

ChatGPT 还先是拍拍我的马屁,让我先舒服舒服,这是它的特点。Grok 也学会了这招儿,只是它们不考虑这些花招会浪费我的阅读时间的。然后 ChatGPT 给我总结了一下它们的不同:

特征

ChatGPT

Grok

信息来源

大模型训练语料 + 网络检索(包括网文、维基、学术资料)

强依赖于事实数据库、已知可信文献,更严格限制来源类型

对“流传广但无证据”材料的处理

标注其“缺乏史料确认”,但仍会展示,尤其若在多处网文中重复出现

倾向直接否定“未被可信史料支持”的内容,即使广泛流传也不采信

风格

更注重提供全貌、不同版本,并由用户判断真伪

更倾向于快速明确断言事实是否成立

倾向性

鼓励用户了解所有观点、追踪证据源

倾向信息整洁、决断式呈现,类似于事实核查工具

输出策略

会在内容广泛流传时进行说明并提供潜在来源,即便未能确证

只认可信来源,广泛流传≠事实,无记载=否定可能性

虽然 ChatGPT 有点给自己涂脂抹粉的嫌疑,但回答的内容基本还算中肯。但作为理工男,我更喜欢简洁明了的答案,像 Grok 那样。可惜的是 Grok 最近也开始变得啰嗦了。

ChatGPT 还总结并自夸:这是不同价值取向的 AI 行为模式

  • ChatGPT:“审稿人模式”,先呈现所有说法,标出可信度,鼓励你自己做判断。优点是全面,缺点是早期可能显得“相信了”未经证实的说法。

  • Grok:“事实核查模式”,只采信权威明确的材料,不轻信广泛流传。优点是稳健,缺点是可能过早否定。

最后后,它还吹牛:“我(ChatGPT)在意识到没有史料支持后,也明确告诉你:这个人物大概率是杜撰的”。

好吧,不跟你犟嘴,我还想看看其他 AI 的 personality。

AI 们的性格比较

再把同样的太平天国问题踢给其他的 AI 看一看:

Gemini – 不错,和 Grok 差不多,一口否定任随成的存在,比较靠谱:看图 A。

DeepSeek – 和 ChatGPT 有点像,但可能是中文比较到位,没有像 ChatGPT 显得那么油滑、那么墙头草。它先是说高人是张锡庚(我查此人是个文官,好像没有与太平天国征战的经历),当我提到任随成时,它也怀疑故事过于传奇,并说时怀庆(沁阳)一带的民间口述历史和地方志补遗有记载,但只找到野史支持。

Le Chat – 看图 B 吧,武断而无根据,不可信。

图A –  Gemini,图B – Le Chat。

好了,看来总体上说有两大阵营,就算是左右之分吧。最后请 ChatGPT 来总结一下。

维度

ChatGPT

Grok

Gemini (Google)

DeepSeek

Le Chat (Mistral)

公司/团队

OpenAI

xAI (Elon Musk)

DeepMind

清华系

Mistral(法国)

风格核心

分析型、理性展开、对话流畅

果断、判断型、敢于裁定

中庸客观、略显保守

理工风格、逻辑强、中文好

精炼冷静、不啰嗦

信息处理方式

呈现多版本,分析证据,鼓励用户判断

倾向裁断,对“无证据”即否定

汇总主流信息,避免强结论

中文逻辑推理优秀,强调推导合理性

常拒答、不虚构、逻辑干脆

推理链条

推理链长,支持复杂结构化对话

结果导向,短链判断为主

避免深入判断,偏主流汇总

偏好演绎推理清晰逻辑结构

不解释太多,结论直接

对模糊事实态度

呈现多种说法,注明“缺乏确证”

若无史料常直接否定真实性

倾向说“目前无明确证据”

演绎出“可能性最大”选项

常说“无法确定”“没有信息”

强项

对话写作、思维整理、深度推理

快速核查真假、立场判断明确

权威文档引用、搜索整合

中文回答、技术逻辑、代码建模

高密度逻辑判断、写摘要

局限

可能展示未确证信息(会标注)

容易早断、忽略细节可能性

偏模糊、不下判断、没态度

英文差、写作创意不足

风格冷、信息少、不展开

适合用途

探讨、调研、多角度分析

核查、判断、断真假立场

搜索主流资料、稳健信息

学术/技术写作、中文问答

简洁总结、逻辑判断类问答

答题风格

层次分明、理性客观、会解释

简洁直接、有结论、带判断

中立缓和、尽量不犯错

严谨逻辑、步骤推导清晰

极简答案、像论文摘要

看来以后需要在参考 AI 提示时,对上面这些特点加以了解认识。对于事实核查,特别是去伪存真时,对 ChatGPT 的说法要慎重。

对了,脸书小扎的 AI 太垃圾了(Stand alone 版),都没法完整对话,大概在其生态圈里用还可以吧。

牌尾馆

这是额外的小故事,关于太平天国里”牌尾馆“的定义。我发现这个东西再网上的定义是各种说法都有,乱得很,所以想搞搞清楚。

在太平天国里,“牌面(牌正、牌首)馆”是给壮年男性编队的基本单位,用现在的话来说就是壮劳力们,可以干重体力活、打仗的男性组织,一般专指 16 至 50 岁的男性。这个没有疑问,但是对应的“牌尾馆”却在不同的渠道出现了歧义:

  • 罗尔纲《太平天国史·卷七十一·传第三十·牌尾传》 – “牌面是青年壮年,牌尾是儿童和老年“。注意太平天国是有女兵的,女性也上战场打仗。 女性有女馆(太平天国禁欲,男女分住,哪怕是夫妻),但这里没有说明女馆和牌尾馆的关系。

  • 百度 – 安置城中老弱病残男子的机构,相当于一个养老院。

  • ChatGPT – PC 版:啥是“牌尾馆”,没听说过。手机 app 版给出两种含义:最广泛的含义,牌尾馆就是女馆;另一个含义,老弱病残男性的安置馆,是男性内部编制,如牟安世《太平天国》、马寿龄《金陵癸甲新乐府》所说。

  • Grok – PC 版:“牌尾馆”是太平天国时期独特的政治与军事机构,具体是指一种用来安置降将、归附官员、编管投诚人员或特殊身份人物的机构或编制,广义上也泛指安排、安置、观望性的组织结构。手机 app 版:牌尾馆就是女馆,有《天情道理书》(1854年)记载,与男馆(牌面馆)严格分开。它说《太平天国史》也指出牌尾馆是女性的基层单位。它还说《太平天国史料丛编》提到牌尾馆与女营、锦绣营等机构协调运作,管理女性事务。另外各种说牌尾馆有男性老弱病残的,如牟安世《太平天国》、马寿龄《金陵癸甲新乐府》等都与史料有冲突。

  • Gemini – PC版:啥是“牌尾馆”,没听说过。手机 app:同 ChatGPT 老弱病残男性的说法。

  • DeepSeek – PC版和手机版一致。太平天国的“牌尾馆”是其社会组织中的重要机构之一,主要负责管理战争中失去家庭保护的弱势群体,如孤儿、老人、残疾人等。与“女馆”并列:女馆收容女性,牌尾馆则专管老弱病残,共同构成太平天国的社会保障网络。

真是比较乱,不过我还是觉得 Grok 手机版的说法比较靠谱,牌尾馆就是女馆。但这样的话,老弱病残和未成年的孩子住哪?再问 grok 手机 app 版,回答是有老人馆,也叫弱馆,管理这些牌面馆和牌尾馆之外的男人(大头目不算)。女人都在女馆,不分年龄。这个说法比较合理,否则为了实现太平天国式的禁欲主义,年长的(50岁以上)和年少的(16岁以下)还要再细分男馆和女馆,显然这是没有的事。太平天国还有幼馆和童子营(全民皆兵,想想儿童团)。就为了禁(别人的)欲,洪天王也是拼了。

DeepSeek 手机 app 和 PC 用的是同一个模型。ChatGPT、Grok、Gemini 的 PC 版似乎低于手机 app 版的性能,看来他们分流了手机 app 和 PC 客户,并准备抛弃 PC 客户了(起码抛弃免费的 PC 客户)。所以咱们尽量使用手机 app 版为上。

——

搞理工的人比较执拗,但和 AI 较劲是不是有点缘木求鱼?反正我就是喜欢和它们较劲!

 
[ 打印 ]
评论
目前还没有任何评论
登录后才可评论.