个人资料
慕容青草 (热门博主)
  • 博客访问:
归档
正文

中译英对人工智能的挑战

(2016-11-16 15:37:57) 下一个

人工智能的一个热点话题是能否让机器象人一样地进行思考和学习。前一段时间的一个中译英的经历让我看到了这个问题的一个简化版:能否让机器象人一样地进行中译英。

不久前我将我的两篇中文哲学文章改写为英文,因为文章较长所以决定尝试不同于以往直接改写的习惯,而是一开始先偷懒用google translate来将我的原文直接译成英文,然后再改写。这样一来所得到的英文文章的词序基本是照搬我的中文文章的词序。结果发现google translate的中译英语句翻译功能显然还不够理想,除少数地方不需要修改之外,即便是不改变语序,所翻译的意思与原文也常相差较大甚至出现很多英语语法错误。

而语序不变及直译错误这两点中最大的问题恐怕还是语序的问题而不是直译语义错误及相关的语法错误问题,一来因为我的那两篇文章被google translate直译后的意思出入较大可能是因为哲学文章直译的难度较大因而不太容易翻译,而这又间接地导致了出现语法错误几率大的问题;二来随着人工智能的发展,估计这种直译的意思偏差及相应的语法错误可能会越来越少,毕竟这属于是通过扩大搜索的数据样本可以解决的问题。而要想解决因语序不变而带来的问题,恐怕就不那么容易,稍微深究一下或许会归结到机器是否能象人一样地学习和思考的问题。

这里有两点需要特别注意:首先,这里很重要的一点是,与小说和诗篇不同,哲学文章的意思的表达与它的可读性密切相关。一篇可读性差的文章不但可能让人很难理解(比如黑格尔的文章),而且可能因为它的语序的问题而造出对读者的误导。第二,之所以说中译英是简化版的机器能否象人一样思考的问题是因为在下面的讨论中可以看出,让机器象人一样地进行中译英的难点的根本之处在于让机器象人一样地理解原文的意思,而如果机器能够象人一样地理解原文的意思的话,它基本上就能象人一样地学习和思考了

以前因为英译中做的比较多,而把中文原文写成英文主要是改写自己的文章,因此不存在作为专业翻译的所讲究的“忠实原文”的顾忌,而是怎么顺怎么写。这次用google translate先翻译一下就发现中译英时如果为了忠实原文而完全按照原文的语序来翻译会出现这样几个大问题:

  1. 句子长短不妥。这主要是因为中文每个字是一个长度固定的独立体,一般两三个字最多四个字可以组成一个词,很多时候单个字就是一个词,但是英语单词的长度很不确定,从三个字母到十三个字母都是常见的,而在中译英的时候,每个中文单词对应的英文单词的长度是事先未知的,所以中文里本并不复杂的一句话直译成英文可能就会是跨越三四行的一个念起来很费劲的一句话,由于哲学文章的涵义复杂,一篇译文中这样的情况会很多。如果是人去翻译自然会将其分解开来或干脆将该句所在的前后文都重新整理,但是机器只会直译,这样译出的结果不但读起来很费劲,而且根本不会被任何出版物接受因为它读起来不像正常的英语。
  2. 与上面的1)相关的是句子及段落组分长短搭配失调。一个在中文里长度搭配很漂亮的句子或段落经过机器的直译之后其长短搭配可能非常混乱;
  3. 对于哲学文章来说,常会有些不言而喻的前提,而这些不言而喻的前提又常常是与所用的语言的文化背景密切相关的,当人进行这样的翻译时会想办法找到适合于目标语言环境的方式将原文中隐寓的意思表达出来,而机器的直译根本无法将原文所在的语言环境里不用说的意思表达出来。
  4. 与3)相应地,中英文环境下论述问题的习惯也不同。中文因为其语句的简短及象形字所具有的意义集成的特点使得人们容易先接受结论然后再看原因。而在英文中除非在结论与理由之间另加专门的修辞过渡,如果你先给结论再给理由别人会难以接受。但是,在直译的过程中,除非能让机器象人一样地理解原意,根本不可能让机器额外地加入过渡性的修辞或者干脆将结论与理由的次序颠倒过来,而只有人为的翻译才能做到这点。
  5. 虽然真人翻译别人文章时由于要尊重原文的表达一般不会轻易对段落顺序或段落内的语句顺序进行大的改动,但实际上由于前面1)2)3)提到的情况,很多时候将原文的段落顺序及段落内的语句顺序进行大手术才能不但更好地表达原文的意思而且在目标语言环境中的可读性也更高,因此在将自己的中文改写成英文时就可能常会进行这样的大幅度改动,而除非机器能象人理解原文意思,它是做不到这一点的。。。

 

所以,这次的中译英实践让我感到,如果机器能象人一样地进行中译英,真的就需要让它能象人一样地理解原文并熟悉原文语言及目标语言环境的文化背景才行。而英译中虽然会有类似的问题,但是严重性恐怕小得多,因为英文语句长而中文语句短而且中文语法相对简单。我本人做过很多英译中,基本上不需要对原文语序做什么调整就能读起来很顺。虽然我还从没用google translate做过英译中,但是我想如果没有语序调整的问题,而基本上只是词对词的直译,那么随着搜索的数据样本的增大,机器的英译中的水平还是应该比较容易提高的。所以,如果谁要选择翻译的职业,应该做好中译英的功夫,因为英译中的饭碗被机器抢走的可能性比较大J。。。

[ 打印 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.