|
|
2008年勒布纳奖人工智能奖:电脑程序成功骗过3人 |
|
艾尔博特10月12日与12个陌生人交谈,力图让他们相信“它”是“人”。一番争论、笑声过后,这一电脑程序成功骗过3人,在今年人工智能比赛中拔得头筹,朝“成为史上第一台能思考的机器”目标更近一步。
猜猜我是谁
2008年勒布纳奖人工智能奖最后一轮比赛12日在英国雷丁大学展开。艾尔博特等6种软件程序击败另外7种程序,获得决赛资格。
作为裁判,12位经遴选的志愿者同时与不见面的两方以文本方式交谈,其中一方是人,另一方是程序。交谈5分钟后,他们要判断哪方是人,哪方是机器。获最多裁判认同为“人”的程序即获胜。
在以往年度比赛中3次获胜的艾丽斯是赛前夺标热门。艾丽斯网站的头像显示,“她”是名高盘发髻女子。实际上,艾丽斯(Alice)是“人工语言因特网计算机实体”缩写。网民可以登录网站与它在线聊天,回答常出乎意料。
谈及决赛,艾丽斯的创造者理查德·华莱士11日说:“这有点令人紧张。”他说,艾丽斯并非完全没机会骗过裁判,因为“人们比自己预料的更像机器人”。可惜艾丽斯因未能按时启动而意外出局,艾尔博特则凭借迷惑3人的战绩笑到最后。
机器测思维
“我希望自己能像艾尔博特一样长于交谈。”艾尔博特的创造者弗雷德·罗伯茨获奖后笑谈。他赢得2000美元和比赛铜牌。
勒布纳奖人工智能奖意在借助交谈测试机器的思考能力,号称是对图灵测试的第一种实践。
英国数学家艾伦·图灵1950年在论文中提出,交谈能检验智能。如果一台计算机能像人一样对话,它就能像人一样思考。他由此获称“人工智能之父”。
鉴于人可能对机器存有偏见,如何公正评判计算机语言能力成为难点。为此,图灵提出一种测试原则,即一名裁判人在不知对方具体身份前提下同时与一台计算机和一个人交换文本信息,如果他难以分辨哪方为机器,则计算机达到人类智能标准。图灵未及细化这种图灵测试规则,即于1954年去世。
美国明升体育app家兼慈善家休·勒布纳20世纪90年代初设立人工智能年度比赛,把图灵的设想付诸实践。比赛分为金、银、铜三等奖。如果程序不仅能以文本方式通过交谈测试,在音频和视频测试中也能过关,则获金奖,赢得10万美元和一枚18K黄金制金牌;如果它能在更长时间文本谈话中迷惑住至少半数裁判,则获银奖;如果未达到以上标准,则每年测试中迷惑住最多裁判的程序赢得2000美元和一枚铜牌。
期待“第一机”
从1991年首届比赛至今,尚无程序达到金奖或者银奖标准。
尽管得到铜奖,罗伯茨说他并不深信图灵的理论。“我不相信艾尔博特能思考。”作为艾尔博特的创造者,他打比方说,“如果你知道一种魔术秘密何在,明白它如何完成,它对你来说就不再神秘。”
本届比赛组织者之一凯文·沃里克承认,学界对机器究竟能否思考尚存争议。这名雷丁大学控制论教授说,如果有程序能摘得金奖,意义堪比国际商用机器公司(IBM)超级计算机“深蓝”1997年打败国际象棋大师加里·卡斯帕罗夫。
“机器”挺贫的 从眼睛颜色到金融危机
谈话记录显示,一些裁判为分清人与机器,就眼睛颜色乃至全球金融危机提出刁钻问题。
程序们也“兵来将挡”,能答则答,答不出就“躲”。譬如就当天天气状况,名为欧根·古斯特曼的程序回答:“当然是蓝天!”
参与决赛的程序还采取不同战术迷惑裁判。欧根经常提及“家乡敖德萨”和“住在美国的姨妈索尼娅”。名为克莱弗博特的程序用幽默调侃证明自己是“人”。
名为艾尔博特的程序则抛出挑衅性答案,有时甚至暗示自己就是机器,反而令裁判难辨真伪。譬如,回答“今天过得怎么样?”时,它说:“糟透了。今早我错把牛奶倒在早餐上,结果还没来得及吃,它就生锈了。我本应该倒油。”
艾尔博特的创造者弗雷德·罗伯茨说,艾尔博特遇到难以回答的问题时,会试图主导谈话,进而引开话题。艾尔博特最终靠成功迷惑3位裁判获胜。