免费信息发布

说出来你可能不信 但百度的AI真的已经学会举一反三了

来源:网络推荐 浏览:382次 时间:2017-04-01

知道怎么用刀子削苹果的人,几乎不需要指导也懂得如何削梨子、桃子等等;而学会了弹吉他的人,要弹尤克里里就不在话下……这些我们看起来理所当然、再简单不过的事情,对于如今在某些领域里已经超越人类的 AI 来说,却是天大的难题 。

那些让我们啧啧称奇的人工智能,虽然战绩辉煌,但它们只能说是“书呆子”,不懂得 举一反三、迁移知识 。好比说,你“教”会了 AI 如何削苹果,它最多给你削一个漂亮的、不断皮的苹果;你要是给它一个梨子,它可能就宕机了。

确定、完全信息、必须是限定范围的封闭问题,只有这些条件都齐全了,AI 才能发挥所长。不然只要稍微变换一下,它就只能“笨鸟先飞”、“勤能补拙”似的在无数次失败中寻找门路。为了让人工智能再聪明一点,百度 IDL 的徐伟、余昊男、张海超搭建了一个能让人工智能触类旁通的 AI 系统。

这个游戏看似简单,但对 AI 来说……

研究团队为这款 AI 搭建了一个简单的学习环境——2D 迷宫 XWORLD。在这个 7×7 的小空间里有随机分布的砖块和水果,AI 要根据给出的指令执行任务,或者回答系统提出的问题。

一些指令的例子:

请移动到苹果处

你能移动到红苹果那里吗?

请去到无花果右手边

你可以走到苹果和椰子中间吗?

一些问题的例子:

椰子在哪里?

你右下角的是什么?

苹果上面的物体是什么颜色?

这些问题是不是有一点白痴,如果是我们,漫不经心、不用脑子也能全部做对。但是这对于以往的 AI 系统来说,那可是让它们摸不着头脑的问题。

打个比方,传统的人工智能系统学会了“请移动到苹果处”这个任务后,他确实能在随意变换的迷宫中快速找到苹果。但是你要是把句子变成“你能移动到红苹果那里吗”,即使是同样一个任务,它也要再重新学习一遍,经过千万次的试错后,才明白“哦,原来又是让我找苹果啊”。如果你把搜查对象也换了的话,那就更不用说了,还是重头再来吧。

不过,百度这款结合了计算机视觉和自然语言处理技术的 AI,却能够从训练指令中学习语法,然后处理和回答新的指令及问题,并且正确率可达 90%。也就是说,百度的新人工智能已经具备一定的举一反三能力,别说是苹果、无花果,就算是在里面找地雷也难不倒它。

他们将这种能力称为“零样本学习”(Zero-Shot Learning Ability)。和依赖于超级庞大数据库的传统人工智能系统相比,百度这款 AI 的诞生可谓是一次里程碑似的进展。

给AI 请了个“小家教”

那么除了结合计算机视觉、自然语言处理这些技术之外,这个 AI 是怎么被“打通任督二脉”,学会触类旁通的呢?

那是因为徐伟他们给 AI 请了个“小家教”,采用了监督学习和强化学习相结合的深度学习技术。简单点说,系统里面有一个“小老师”,除了发出指令之外,还会根据 AI 的表现给予他们惩罚和奖励。就像我们小时候一样,老师奖励个小红花,我们就知道自己表现得不错,要继续保持;受到批评就意识到自己做错了,下次不敢再犯。

徐伟月初在学术研讨会上表示,现在机器和人还是有着非常大的差距,我们试图去拉近两者之间的距离。先从一个非常简单的学习场景开始,让机器像儿童一样,通过在环境中的互动去学习感知、行动、语言这样一些基本的能力。

这样的 AI 系统不再像以往的人工智能一样只知道赢赢赢、向目标冲冲冲,而是能够在系统“小老师”的指导下,自己总结经验,举一反三。或许在不久的未来,AlphaGo 也不再是只会分析、计算、下子,而是能总结出他自己一套下棋思路及策略,来“指导”我们了。

百度方面表示,接下来除了让 AI 在 XWORLD 中理解及处理更多、更复杂的指令之外,他们还会将它迁移到虚拟的三维空间中进行训练。希望以后可以把这种相对灵活的人工智能系统应用到实际环境中,制作出可灵活处理多任务的机器人。