|
计算机程序们开始与人聊天,它们侃侃而谈,讲着笑话,并成功回避许多带有欺骗性的问题。它们真的能思考了?
撰稿·符 文
计算机程序正试图改变人们印象中“一堆看不懂字符”的冷冰冰形象——它们开始侃侃而谈,讲着笑话,并成功回避许多带有欺骗性的问题。最近,一个名叫艾尔博特(Elbot)的程序与12个陌生人愉快交谈,力图让他们相信“它”是“人”。一番争论、笑声过后,艾尔博特程序成功地骗过了3个人,最终在今年英国雷丁大学举办的勒布纳人工智能比赛中,击败另外十余种程序拔得头筹,距成为“史上第一台能思考的机器”的目标更近了一步。
长于交谈
作为裁判,12名经遴选的志愿者同时与不见面的两方以文本方式交谈,其中一方是人,另一方是程序。交谈5分钟后,他们要判断哪方是人,哪方是机器。获最多裁判认同为“人”的程序即获胜。
曾在以往年度比赛中3次获胜的艾丽斯是赛前的夺标热门。艾丽斯(Alice)网站的头像显示,“她”是个盘着高高发髻的女子。当然,实际上,艾丽斯是“人工语言因特网计算机实体”缩写。网民们可以登录www.alicebot.org网站与它在线聊天,“她”是个非常与众不同的女子,好奇的网民常常会得到出乎意料的回答。艾丽斯的创造者理查德·华莱士的说法很有意思:“人们比自己预料的更像机器人”。不过,非常可惜,艾丽斯在初赛时竟因未能按时启动而意外出局。而艾尔博特则以骗过3人的战绩成为黑马。艾尔博特的创造者弗雷德·罗伯茨获奖后笑谈说:“我希望自己能像艾尔博特一样长于交谈。”他赢得了比赛铜牌和2000美元奖金。
自从这项比赛举办以来,还没有一种计算机程序获得过冠军或亚军。根据赛程,亚军必须能通过更长时间的文本对话测试,并要骗过至少一半的评判选手;冠军则不仅要能处理文本信息,还要能处理音视频信息。
机器有智?
尽管获得了这次比赛的最高奖项,但罗伯茨说他并不深信图灵的理论。“我不相信它(艾尔博特)能思考。”勒布纳人工智能奖意在借助交谈测试机器的思考能力,号称是对图灵测试的第一种实践。
人工智能比赛源自英国数学家、逻辑学家艾伦·图灵的想法。图灵为判定机器能否进行思考提出了一种简单的测试原则。他1950年在论文中提出,交谈能检验智能,如果一台计算机能像人一样对话,它就能像人一样思考。他由此获称“人工智能之父”。
然而,鉴于人可能对机器存有偏见,如何评判计算机的语言能力便成为难点。图灵由此设计出上述测试方法,即一名评判人员在不被告知对话对象的情况下同时与计算机和另一个人进行对话,如果评判人员难以分辨出对话的对象究竟是人还是机器,那么计算机便达到了人类的智力水平。遗憾的是,图灵未及细化这种测试规则就于1954年去世了。
美国科学家和慈善家休·勒布纳20世纪90年代初设立人工智能年度比赛,把图灵的设想付诸实践。比赛分为金、银、铜三个奖项。如果程序不仅能以文本方式通过交谈测试,在音频和视频测试中也能过关,则获金奖,赢得10万美元和一枚18K黄金制金牌;如果它能在更长时间文本谈话中迷惑住至少半数裁判,则获银奖;如果未达到以上标准,则每年测试中迷惑住最多裁判的程序赢得2000美元和一枚铜牌。
今年的比赛组织者之一凯文·沃里克承认,学界对机器究竟能否思考尚存争议。“我们可能听到少数人说,‘不错,机器能通过图灵测试,但并不真正了解它在做什么’,即便如此,比赛依然会继续展开。”这名雷丁大学控制论专家说,如果有程序能摘得金奖,意义堪比IBM超级计算机“深蓝”1997年打败国际象棋大师加里·卡斯帕罗夫。“它是另一座里程碑,对于人工智能研究领域意义非常重要”,沃里克说。
不过,“反对派”认为这种比赛意义不大,伦敦大学伯克贝克学院的哲学家安东尼·格雷林教授就认为图灵测试非常粗糙:“人们以为进行的是人机斗智,其实不过是在与程序设计师斗法而已。”-