说出来你可能不信但百度的AI真的已经学会举一反三了

知道怎么用刀子削苹果的人，几乎不需要指导也懂得如何削梨子、桃子等等;而学会了弹吉他的人，要弹尤克里里就不在话下……这些我们看起来理所当然、再简单不过的事情，对于如今在某些领域里已经超越人类的 AI 来说，却是天大的难题。

那些让我们啧啧称奇的人工智能，虽然战绩辉煌，但它们只能说是“书呆子”，不懂得举一反三、迁移知识。好比说，你“教”会了 AI 如何削苹果，它最多给你削一个漂亮的、不断皮的苹果;你要是给它一个梨子，它可能就宕机了。

确定、完全信息、必须是限定范围的封闭问题，只有这些条件都齐全了，AI 才能发挥所长。不然只要稍微变换一下，它就只能“笨鸟先飞”、“勤能补拙”似的在无数次失败中寻找门路。为了让人工智能再聪明一点，百度 IDL 的徐伟、余昊男、张海超搭建了一个能让人工智能触类旁通的 AI 系统。

这个游戏看似简单，但对 AI 来说……

研究团队为这款 AI 搭建了一个简单的学习环境——2D 迷宫 XWORLD。在这个 7×7 的小空间里有随机分布的砖块和水果，AI 要根据给出的指令执行任务，或者回答系统提出的问题。

一些指令的例子：

请移动到苹果处

你能移动到红苹果那里吗?

请去到无花果右手边

你可以走到苹果和椰子中间吗?

一些问题的例子：

椰子在哪里?

你右下角的是什么?

苹果上面的物体是什么颜色?

这些问题是不是有一点白痴，如果是我们，漫不经心、不用脑子也能全部做对。但是这对于以往的 AI 系统来说，那可是让它们摸不着头脑的问题。

打个比方，传统的人工智能系统学会了“请移动到苹果处”这个任务后，他确实能在随意变换的迷宫中快速找到苹果。但是你要是把句子变成“你能移动到红苹果那里吗”，即使是同样一个任务，它也要再重新学习一遍，经过千万次的试错后，才明白“哦，原来又是让我找苹果啊”。如果你把搜查对象也换了的话，那就更不用说了，还是重头再来吧。

不过，百度这款结合了计算机视觉和自然语言处理技术的 AI，却能够从训练指令中学习语法，然后处理和回答新的指令及问题，并且正确率可达 90%。也就是说，百度的新人工智能已经具备一定的举一反三能力，别说是苹果、无花果，就算是在里面找地雷也难不倒它。

他们将这种能力称为“零样本学习”(Zero-Shot Learning Ability)。和依赖于超级庞大数据库的传统人工智能系统相比，百度这款 AI 的诞生可谓是一次里程碑似的进展。

给AI 请了个“小家教”

那么除了结合计算机视觉、自然语言处理这些技术之外，这个 AI 是怎么被“打通任督二脉”，学会触类旁通的呢?

那是因为徐伟他们给 AI 请了个“小家教”，采用了监督学习和强化学习相结合的深度学习技术。简单点说，系统里面有一个“小老师”，除了发出指令之外，还会根据 AI 的表现给予他们惩罚和奖励。就像我们小时候一样，老师奖励个小红花，我们就知道自己表现得不错，要继续保持;受到批评就意识到自己做错了，下次不敢再犯。

徐伟月初在学术研讨会上表示，现在机器和人还是有着非常大的差距，我们试图去拉近两者之间的距离。先从一个非常简单的学习场景开始，让机器像儿童一样，通过在环境中的互动去学习感知、行动、语言这样一些基本的能力。

这样的 AI 系统不再像以往的人工智能一样只知道赢赢赢、向目标冲冲冲，而是能够在系统“小老师”的指导下，自己总结经验，举一反三。或许在不久的未来，AlphaGo 也不再是只会分析、计算、下子，而是能总结出他自己一套下棋思路及策略，来“指导”我们了。

百度方面表示，接下来除了让 AI 在 XWORLD 中理解及处理更多、更复杂的指令之外，他们还会将它迁移到虚拟的三维空间中进行训练。希望以后可以把这种相对灵活的人工智能系统应用到实际环境中，制作出可灵活处理多任务的机器人。

说出来你可能不信 但百度的AI真的已经学会举一反三了

推荐资讯

说出来你可能不信但百度的AI真的已经学会举一反三了