暮色南山

海外华人对社会对时政对家庭的分析与反思
正文

人工智能,机器学习是有bias的

(2020-05-27 07:08:06) 下一个

现在的AI,ML,靠的是从已有的海量数据中学习,归纳,并取代人对未来数据进行判断处理。但训练数据来源和标注不见得是客观的,有些甚至有主观因素在里面。比如曾有例子说Google的人脸识别对白人比较精确,对其他人种就差一些,因为Google用的训练数据以白人为主。同样的还有youtube的censorship,如果WM大量举报某个他们不喜欢的攻击CCP的帖子,机器学习算法就会把那个帖子里的一些关键词加入自己算法当中,以后遇到类似的帖子就会自动屏蔽。相信这不是Youtube/Google故意为之,而是由ML算法的局限性决定。当然这些公司可以做弥补措施,加入额外过滤。但ML的特点是少数服从多数,多的经常出现的往往就被学习进去了。同样问题可能会出现在twitter,甚至将来的总统选举战中。中美对抗,这个阵地至关重要

[ 打印 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.