杨强教授PPT通俗易懂解密：如何在人工智能浪潮中少走弯路

来源：信息化顾问团

2016/10/10 9:57:02

近两年人工智能技术的研究与应用骤然增速，产业界，无论是身经百战的科技巨头，抑或是默默无闻的中小企业，都想要抓住这一难得的机遇，在业内崭露头角。但是，如何将人工智能与自身原始的商业模式相结合，实现产业创新，很多企业都还在“摸着石头过河”，难免遇到迷茫期。

分享到：新浪微博腾讯微博

本文关键字：杨强人工智能

在2016年GAIR大会上，杨强教授深入浅出地为大家分享了自己多年来的智慧与经验总结——人工智能要取得成功应当具备的五个必要条件，这五个条件将成为推动人工智能长足发展的动力源泉。

杨强，香港科技大学计算机与工程系教授,IEEE Fellow，IAPR Fellow,AAAS Fellow和ACM杰出科学家。，第四范式首席科学家、机器学习领域国际学术带头人，主要研究领域为机器学习、数据挖掘和自动规划。到目前为止，杨教授在学术研究中硕果累累，在人工智能和数据挖掘方面，已发表了超过了200篇的学术文章，还组织筹办了多个人工智能和数据挖掘的国际会议。

QQ截图20161010100602.png

当下人工智能在图像识别、语音识别和大规模的产品推荐方面取得了巨大的成功，那么人工智能的成功应用究竟取决于哪些条件？

为什么只在我们这个时代迎来了人工智能发展的高峰期？对于这两个备受关注的问题，杨教授从人工智能的科学与应用两个方面着手，娓娓道来。

人工智能的科学与应用——相辅相成

QQ截图20161010100701.png

人工智能技术的发展大体可以分为两个方面：人工智能的科学与人工智能的应用。

从科学层面谈及人工智能要回归到该研究领域最根本的问题：机器能够思维吗？这个问题最早起源于人工智能之父图灵，之后经过60多年的努力，计算机科学家及各行各业对人工智能感兴趣的人士都竞相研发计算能力更强的计算机，汇聚更多的数据，提出更高级的算法，致力于回答这个最基本、也是最重要的问题。

谈到应用层面，除去人工智能已经为我们的生活带来的便利，我们更关心它对人类未来生活将产生什么样的影响。要将人工智能技术成功地应用于商业领域，既要站在科学前沿，也要具备一定的商业头脑，两者兼备才能在商业浪潮中立于不败之地。

人工智能取得成功的五个必要条件

人工智能取得成功的五个必要条件.png

会上，杨教授言简意赅为我们分享了决定人工智能成功的五个必要条件：

清晰的目标（商业模式）

高质量的大数据（持续反馈）

清晰的问题定义和领域边界

懂人工智能的跨界人才（擅长应用和算法）

计算能力

首先，要有“清晰的目标”，即清晰的商业模式，这就好比游戏中明确规定何为赢，何为输，延伸到人工智能在商业领域的应用，即要确定明确的运行模式和运行目的。

其次，高质量的大数据资源是人工智能成功的核心条件。杨教授特别强调，高质量的数据要求收集到的数据能够具备持续性、反馈性，且反馈的方式与内容要与具体的算法相匹配。有人会觉得，在某个领域拥有了几千万个数据样本便具备从事人工智能的条件了，杨教授认为，这种观点是站不住脚的，原因如下：首先，已收集的数据样本可能无法与某个特定的算法相匹配；其次，所用到的算法可能不具备可持续性；最后，得到的反馈方式与内容不一定与期望相符。

第三，清晰的问题定义和领域边界。要求在应用人工智能技术时要对所遇到的问题有清晰的理解与定义，就像下棋一样，在有限定的领域里完成特定的行为操作。

第四，人工智能成功的核心竞争力在于懂人工智能的跨界人才（擅长应用和算法），即我们需要一个既精通人工智能，又在商界游刃有余的人才。当然，很多人会质疑：我们到哪里去找这样的人才？杨教授号召我们做生活中的有心人，善于关注身边会学习的人，着重培养其跨领域才能，这样的人才将具备把两个看似不同的垂直领域联系在一起的能力，在未来能够做出突出的成就。

最后，杨教授提出，强大的计算能力是人工智能技术在各领域成功应用的硬实力。在计算能力方面，我们有云计算、并行计算、GPU，这都为人工智能的发展奠定了坚实的基础。

人工智能已经取得的成就——强化学习与迁移学习

此外，杨教授提到，人工智能已经在机器学习领域已经取得了突出的成就，特别是在深度学习方面，此外，还特别强调了强化学习与迁移学习的应用前景。

QQ截图20161010100951.png

强化学习

杨教授讲到，强化学习的优点在于它不仅能够学习人的行为，而且能够更好地使用延迟反馈功能。以Google DeepMind采用的强化学习流程为例，我们可以将这个流程图理解为一个计算机内部的表达形式，一个矢量，这个矢量与我们得到的反馈信息相结合，将有助于改进我们采用的策略。流程图中的策略，简单来讲，就是我们平常的行为规划，工作规划，就好比游戏中的一个动作就对应一个策略，这个策略再返回来，产生一个新的界面，如此我们便能够进行持续学习。在这个循环过程中，我们只有到最后才能够获得反馈，称之为延迟的反馈。就好比我们投资一只股票，过了很长时间才知道收益如何。

QQ截图20161010101036.png

但是，这个循环暴露出强化学习的一个局限性：人们永远无法准确定义这个策略里的空间，我们称之为“状态空间”，即强化学习的结果具有不可预测性。说到这里，杨教授以Google DeepMind的第二个目标——端到端的深度学习为例。当该有的状态预先在学习器内表达好后，就形成了一种从输入端到输出端的端到端的深度学习模型，经过几百次的训练学习后，机器将能够学会如何更好地玩一个游戏。

QQ截图20161010101122.png

以下各个图对应不同游戏的学习效果。图中横轴表示随着游戏轮数越来越多，机器的自学习效果不断提升，直至达到上限。

QQ截图20161010101208.png

迁移学习

迁移学习是深度学习与强化学习的结合体，能够将适用于大数据的模型迁移到小数据上，实现个性化迁移，这样一来能够避免数据寡头的出现。

杨教授提出一点：

大数据设计出来的模型用于小数据上，它的副产品就是个性化。这就是迁移学习的目的。

运用迁移学习把在一个数据领域已经建立的非常好的模型，应用到另一个领域，这样既节省了资源，又能够节省时间，效果又好。

QQ截图20161010101251.png

杨教授谈到，我们人很自然就具备这种举一反三的迁移能力，比如我们学会骑自行车后，学骑摩托车就很简单了；会打羽毛球，再学打网球也就没那么难了。

在演讲中，杨教授总结了迁移学习的四种实现方式，每一种方式都很直观。

QQ截图20161010101305.png

第一种为样本迁移，就是在数据集（源领域）中找到与目标领域相似的数据，把这个数据放大多倍，与目标领域的数据进行匹配。样本迁移的特点是：1）需要对不同例子加权；2）需要用数据进行训练。

QQ截图20161010101423.png

第二种为特征迁移，就是通过观察源领域图像与目标域图像之间的共同特征，然后利用观察所得的共同特征在不同层级的特征间进行自动迁移。

QQ截图20161010101439.png

第三种为模型迁移，其原理时利用上千万的图象训练一个图象识别的系统，当我们遇到一个新的图象领域，就不用再去找几千万个图象来训练了，可以原来的图像识别系统迁移到新的领域，所以在新的领域只用几万张图片同样能够获取相同的效果。模型迁移的一个好处是我们可以区分，就是可以和深度学习结合起来，我们可以区分不同层次可迁移的度，相似度比较高的那些层次他们被迁移的可能性就大一些。

QQ截图20161010101449.png

第四种为关系迁移，比如社会网络，社交网络之间的迁移。

QQ截图20161010101501.png

迁移学习的最终目的就是实现AI for Everyone。比如我们利用一个由训练三万个的对话模式获得的大对话模型可以迁移到个人的小型对话中，这种基于强化学习所获取的个性化效果非常具有实用性，因为我们不用繁琐地问用户很多同样的问题。此外，杨教授在会上曾提到一个愿景——利用迁移学习，即使是自身没有条件获得大量训练数据的小公司也可以按照自己的需要应用大公司训练出来的模型，从而普及AI的应用，从而克服数据“寡头”现象。不论怎样，迁移学习是一种极具潜力的解决方案，将在未来大显身手。

运用“魔镜对话系统”实例阐释人工智能成功的五个必要条件

此外，杨教授用一个人工智能技术应用的热点——对话系统，清晰地阐明上述五个条件对人工智能技术发展所产生的推动性作用。

现有对话系统的应用原理

一般来讲，市场上现有的对话系统可以分为两类：闲聊类与功能类。

QQ截图20161010101517.png

在上图中，我们可以看到：60年代的Eliza与微软的小冰属于闲聊类对话系统，百度的小度与微软的Cortana介乎闲聊类与功能类之间，Facebook的M与HKUST最新的Magic Mirror系统属于功能类对话系统。杨教授讲到，我们大家应该都有体验，微软小冰很幽默，但是也只能止于闲聊；功能类对话系统则给我们的生活带来了很多便利，例如，我们打电话到酒店预定房间，在银行办理个人业务，不过，在一定程度上，目前的功能类对话系统依然存在一些不太便利的地方，例如，在使用过程中，我们要根据系统提醒依次按服务键，这可能导致用户体验下降。

从技术层面上进行分析，杨教授提到对话系统可以大致分为两种：基于原则的系统与基于学习的系统。最早的对话系统是基于原则的，有很多专家来制定这些规则，其优点在于准确性高，但是却难以扩展，与数据无关，对数据的灵敏度不高。此外，基于原则的对话系统的由于无法扩展，通常情况下不能应对不同的意外事件，所以现在大家关注较多的是基于机器学习算法研发的对话系统。

三层结构算法模型将为对话系统带来革新

杨教授透露说，香港科技大学实验室正在研究如何运用新技术来改进现有的对话系统。在大会上，杨教授向我们展示了一个三明治式的三层结构算法模型：

第一层是我们熟知的深度学习神经网络——递归深度神经网络（RNN）

第二层是一个策略学习器——强化学习（RL）

第三层是迁移学习（TL）

在演讲中，杨教授特别强调了强化学习（RL）中最难的阶段：人工智能机器人只能部分观察周围的世界，研究者用一个奇怪的名字来描述这种现象——基于部分观察的马尔可夫决策过程。迁移学习（TL），正如在前面讲到的，能够将一个已经做好的模型迁移应用到一个新的领域中。杨教授讲到，希望利用这样一个三层结构赋予对话系统以下功能，比如说闲聊、推荐、引导、提醒、学习，如果一个对话系统能够具备这些功能，它就像一个真人一样。

但是，如何达到这个目的呢？

QQ截图20161010101542.png

根据杨教授的观点，首先，对话系统应当具备基本的对话功能，即自然语言生成能力，这种能力主要依赖RNN来实现。

其次，我们需要一个策略，用这个策略引导对话的对象来完成一个特定的任务，即对话控制，主要通过RL实现。

最后，要实现个性化，满足用户不同的需求指令，主要依靠TL实现。

QQ截图20161010101554.png

为此，杨教授给我们提供了一个实例，香港科技大学现在和一个O2O的公司合作，用真是的数据训练这个对话系统，上图中绿色代表用户所提的问题，白色代表系统的回答，该系统的中文名字叫做“魔镜系统”，就是童话故事白雪公主里面的魔镜，当然这是一个好的魔镜。“魔镜系统”是个性化学习的一个实例。

在这个系统中，我们是把整个对话系统放置在一个机器人里面，让机器人通过语音的方式与用户对答，实际上，这个系统可以在手机上与人进行交流。杨教授的研究团队将“魔镜系统”与大家熟悉的一些对话系统作对比，下图中，绿色代表用户的问题，黄色是小冰的回答，可以看到相比之下，小冰的回答多富有调侃性，准确度很低，而之前“魔镜系统”的回答更容易满足用户的需求。此外，我们还可以看到siri（灰色）的回答很多都是“抱歉没有找到匹配”，因为siri是基于搜索的对话系统。

QQ截图20161010101606.png

杨教授表示，他们之所以对这种对话系统进行研究，归根到底是对背后的系统感兴趣，即我们在刚开始讲到的——人工智能成功的五个必备条件。在对该对话系统背后的原理进行剖析，可以发现，其研究团队具有很明确的目标，有很好的反馈，有不断到来的数据，有跨界人才，此外，和O2O公司有联络。

QQ截图20161010101621.png

谈及清晰的问题定义与领域边界这个必要条件，杨教授表示，我们不一定像在下围棋一样，要确定明确的边界，在这里我们可以考虑说当我们现在的谈话进行到这里时，到底离我们的目标还有多远，这就好像在下棋里面一样，我们对当前的盘面有一个估算，同时我们可以接着往下问不同的问题，就像我们下面要下的棋子一样，所以对话系统的问题定义与领域边界问题实质上与Alphago的思维很相像。

杨教授讲到，同深度学习、强化学习及迁移学习一样，这个三层结构算法模型也具有通用性。比如杨教授的学生就把这种模型应用到大家公认的很难的领域中——预测股市走势。下图所示为A股里面的某个股票，用过去十年的数据训练该模型。首先，运用数据之间的连接，产生不同的状态，让各个状态之间能够互相迁移。其次，不同状态之间将发生变化，我们运用用一个强化学习器模拟这种变化。最后。我们发现深度学习的隐含层里面会自动产生几百个状态，基本就能够对这十年来的经济状况做出一个很完善的总结。所以，运用这种三层结构算法模型可以很好地对股市走势作出预测，对此，我们也做了一些相关测试。

QQ截图20161010101633.png

杨教授表示，这个例子只是在金融领域的一个小小的试验。不过，一旦我们对一个领域有了透彻的了解，并掌握更多的高质量数据，就可以将人工智能技术迁移到这个领域来，在应用过程中对所遇到的问题作清晰的定义，最终能够实现通用型人工智能的目的。

总结

在演讲接近尾声时，杨教授对所讲的内容做出总结：通过同大家分享谷歌DeepMind的应用实例，讲解强化迁移学习和三层结构算法模型，及个性化学习，最终我们都要回归到人工智能成功的五个必要条件——清晰的商业模式（明确的目标）、高质量的大数据、清晰的问题定义和领域边界、懂人工智能的跨界人才及计算能力，这五个条件相互影响，缺一不可，是人工智能技术长足发展的动力机。

责编：畅享精灵