2012 (72)
2013 (74)
2014 (70)
2015 (55)
2016 (64)
2018 (67)
2019 (63)
“OpenAI”公司的人工智能语言逻辑对话软件“ChatGPT”推向社会之后,广受追捧(Good milk comes from happy cows, happy cows live in San Francisco, *_*)。 然后,“百度”公司推出了号称“原创”的百度语言逻辑对话软件,“文心一言”。
“一言”同学这个百度的“我也有”,让社会多一种服务款式是好事情,但是…..
百度的“文心一言”很快被使用者发现问题,比如,在输入“起重机”要求给出图片时,“一言”同学给出了一只鹤的形象。
熟悉中英文互换的朋友应该能从中了解,从“起重机”到“鹤”的误解,是经历了一个“中文至英文”的换能过程。于是,“文心一言”的“原创性”受到高度质疑,一种猜测是“一言”同学把ChatGPT类的英文版软件给加了个中文壳,经典的“山寨版”。
如果百度的“一言”是山寨产品,它不是山寨首例,连翘楚都算不上。山寨,或是说“土匪版”,是有基因的,“红色基因”的一部分,产于太祖时代。
早期一例是“红旗轿车”。
看图:
取自“香港周末报”的“一九六六年国庆画册”。
这个吗…….
单从外形看,“红色基因”的“红旗牌”,有没有其它基因?比如:
这是 Chrysler 1955 年的“礼模型”豪华车“Imperial”。
本老汉不是车痴,对除了自家车之外的其它车懂很少。看到前面“国庆献礼”的“红色基因”车能想到Chrysler的“帝国主义”车的可能为零。这款Chrysler的车,是当年把“红旗”三排座豪华轿车给“试制成功”的一位主要参与者在个人回忆中提到的,是从南斯拉夫驻北京大使馆流出来的一辆二手车,“试制成功”中将其全拆,然后照此车“逆向工程”。
这种“偷”,我是说山寨,*_*,当然不限于“红色基因”的厉害国。偷师的韩国车,过去20年,从车界笑话到现在走入世界车界主流。但光靠偷肯定没戏。这个“红旗牌”的故事,立项就是面子工程,为了领袖出场有面子,用演艺界的行话说,“剧团成立就是为了唱堂会”。产车25年,总共得车1500辆,平均每个月两辆车。在“市场”初立的1984年停产了。
这个“红色基因”的山寨特色,是无法否认的。太祖当年曾专题论过:
“山下旌旗在望……”-------山
“早已森严壁垒……”--------寨(文化的说)
连山寨的具体位置都说了“黄洋界上炮声隆”。
所以,“一言”同学的疑似山寨换壳,如被证实,只是那个太祖山寨基因的一种代传,不是例外而是意料之中。
“山寨成性”的一个附带产品是“原创廉价”,偷基因从“红旗牌”到“文心一言”不停,创意就全靠“亲自指挥,亲自部署”了。偶尔,也能山寨成为世界第一,比如“测核酸”,^_^。
后注:此文未经任何ChatGPT 注入。
世上本没有那么多贼,做贼的有义正词严,于是便养出这这许多贼来。
传人哥要谢谢机器五毛上T台免费作供。
但这里谈论的是特点,并不是比较优劣。
简单讲,因为中文具有的多义性和语意连带关系的复杂程度远远高于英文,因此同样的学习方式用在中文会远比用在英文复杂和难度大。
也就是因为AI在中文下对语言的理解是很难的,至少在现有技术下。这事情类似曾经的打字机的发明,中文打字键盘基本不可能。
这也预示在现有技术下,AI在理解中文的环境中还不能突破,或者任何一种类似的抽象性高特点的语言都会出现同样问题。
但这仅仅是一个阶段而已。
有一个与这事情相关的事情是很说明这类问题的,大概全世界人都不反对说中国人智商高,甚至搬出什么脑容积相对身高大一类的理论。
其实并不是因为脑容积大,而是中文的多义性导致人们必须有强烈的联系字义,抽象与实际化之间的迅速转换,这是中文的OO特点决定的,是中文的一个特点,但这种体现OO的语言扩展性也增大了语言的复杂程度。
你整天生活在这种环境下自然“聪明”。
人们一般说东亚人聪明,但实际上指的是中国人和日本人,并不是具有拼音文字或者语音文字特点的其他东亚人,比如越南人韩国人。
而中国人与日本人share同一种文字,文字都具有object oriented的特点。
对于这种文字理解的AI的设计是不同的。
至于山寨不山寨的,并不是什么丢人的事情,这本身就是学习的过程。如今在新能源技术上中国领先,也是经历了山寨学习的过程。Tesla决定恢复使用雷达,也是因为世界主流自动驾驶的成功,华为的技术。