AIR008丨香港科技大学教授杨强：人工智能成功的几个必要条件

文章出处：kb平台官网人气：发表时间：2024-04-28 21:34

本文摘要：人工智能的两个研究分支：一个是科学，一个是应用于。在人工智能科学领域，人们仍然有个问题：机器思维吗？过去60年，计算机专家们仍然希望在问这个问题。而在人工智能应用于方面，研究人员探究的问题是它如何对人们产生起到和影响。杨强提及，AI的顺利具有5大必要条件：明晰的商业模式高质量的大数据明晰的问题定义和领域边间不懂人工智能的跨界人才，擅长于应用于和算法计算能力人工智能在机器学习和深度自学方面早已具有很高的成就。此外，另外一种技术正在开始应用于：增强自学。

kb平台官网

人工智能的两个研究分支：一个是科学，一个是应用于。在人工智能科学领域，人们仍然有个问题：机器思维吗？过去60年，计算机专家们仍然希望在问这个问题。而在人工智能应用于方面，研究人员探究的问题是它如何对人们产生起到和影响。杨强提及，AI的顺利具有5大必要条件：明晰的商业模式高质量的大数据明晰的问题定义和领域边间不懂人工智能的跨界人才，擅长于应用于和算法计算能力人工智能在机器学习和深度自学方面早已具有很高的成就。

此外，另外一种技术正在开始应用于：增强自学。增强自学某种程度需要自学人的不道德，还需要更佳的用于延后对系统功能。而之后人们能否发明者一种新的自学方法，能把大数据的模型在用作小数据身上，于是杨强提及了迁入自学。

迁入自学是把深度自学和增强自学变换在一起。三层结构算法系统目前嵌入式的对话系统还包括闲谈类和功能类。

而从技术上层面来讲，这种对话系统分为两种，第一种最先经常出现的是基于规则的系统，这些就像在符号领域，它的益处是很精确。但不存在的问题是很难拓展，对数据过于脆弱。

此外，它还无法应付很多有所不同的意外事件，所以学界注目的是机器学习的算法。而对于机器学习的算法，杨强指出深度自学之后的近期算法模型是一个三明治式的三层结构：第一层就是迭代的深度自学，在这之上的第二层有一个增强自学的自学器，而第三层就是迁入自学，它能把一个有数的模型迁入到一个新的领域。

迭代深度神经网络RNN（深度自学）增强自学RL迁入自学TL能否把一个成熟期的嵌入式对话系统算法模型用在其他领域？杨强现场戏一个把对话系统重复使用机器人反应，之后他提及，他的学生曾把这个系统应用于在了金融领域，用作股市预测。当人们一旦掌控某个领域，把它套用在其他领域就是迁入自学的起到。个性化迁入深度自学必不可少大数据，增强自学轻在对系统，但也必不可少大数据，而大数据必不可少大公司，当其他公司没大数据时，它们该怎么办？杨强明确提出一点大数据设计出来的模型用作小数据上，它的副产品就是个性化。

这就是迁入自学的目的。有了这套系统，如果换回在其他领域就没有适当搜集大量数据了，必要套用模型才可。

类似于人学会骑马自行车后，就差不多学会了骑摩托车。迁入自学分成两种：样本迁入，特征迁入。其在应用于场景中则如下：基于模型的迁入：如图像识别，训练万张覆以千万张。

相近度越大，迁入的概率大。社交网络之间的迁入：将千万人的大数据模型迁入到某个人身上。最后，杨强认为，人工智能有很多领域，到现在为止最顺利的一个领域就是机器学习，机器学习的一个基本概念就就是指数据里面常常反复的现象汇总学出规律，从而把现实中非常简单反复烦琐的工作给替代掉。

以下是杨强演说国史今天早上听得了十分精彩的报告，在这里我要跟大家共享有一些我个人的点子，特别是在是我们今天，大家都告诉人工智能有了很多的成就，我们能无法总结出有一点点经验，能供给我们后面的人来用于。首先我们看见人工智能特别是在在商业上有很多的成就，我们看见在图象识别，在语音辨识，还包括在大规模的产品引荐，我们今天每个人都是这些服务的品尝者，我们都获益于它。但是我们是不是想要过，这些人工智能的成就究竟来自哪些条件的符合，为什么这些成就十年以前二十年以前却没呢？所以我们下面要来问问这些问题。在问这些问题之前，我们首先要来区分人工智能的两个研究的分支，一个是人工智能的科学，人工智能的科学我们要追溯到它的鼻祖图灵回答的这个最关键最中心的问题：就是机器可以思维吗？六十多年的希望，大家都是计算机学家，各行各业都在朝着这个方面希望，我们建更加慢的计算机，我们聚在一起更好的数据，我们研究更加高级的算法，都是在企图问这样的问题。

今天人工智能的这些成就也就了机会让我们把它应用于在我们的生活当中，所以这又带给一个崭新的问题，就是我们如何需要去预测一个人工智能的技术，是不是需要产生它应当有的起到。我们都说道，如果它的应用面很广也是它顺利的一个标志。所以今天我想想想到人工智能在应用于方面究竟有哪些条件来抗拒它让它产生应当有的应用面。

在这里我要说一下，人工智能早已有的相当大的成就，比如机器学习，深度自学方面，但是在现在我们看见的一些端倪，早已给了我们很激动的理由，就是增强自学，增强自学某种程度需要自学人的不道德，而且需要尤其好的用于这种延后对系统，这种对系统可以延后在一个时间段上。明天我们能无法发明者一种新的自学方法，能让它在小数据上也能限于？这就是我下面要谈的迁入自学。所以我们也在这个角度来看，我们可以用于哪一种人工智能技术让它产生应当有的起到。提及增强自学，刚Michael Wooldridge教授说道到Deepmind，我也是Deepmind的粉丝，这是Deepmind的一个流程，我们仔细观察到流程以后，紧接着我们可以解读这是一个计算机内部的表达形式，一个适度，这个适度再加我们获得的对系统，就可以协助我们改良我们的策略，这个策略是什么呢？就是我们所说的平时我们做到不道德的规划，我们工作的规划，游戏里面的动作就对应着一个策略，这个策略又回到来，产生一个新的界面，我们仔细观察到这个界面又可以回来自学。

大家看一下，这里面很强的一点是这个对系统是大大给的，而且我们到起点的时候，我们才告诉我们究竟是赢家还是输家。我们在现实生活中是不是有很多这样的例子，是没用深度自学来自由选择的。

比如我们上一门课，只有考试的时候才告诉我们的成就，我们投资一支股票，过了很长时间才告诉效果怎么样，所以这是延后的对系统。但是这种自学有一个弱点，就是如果我们人为的来定义这个策略里面的空间，叫作状态空间的话，这个容许是十分大的，因为我们人总有一天以定不许，我们总有一天无法事前地预计这个世界不会再次发生什么，这里面有来了谷歌Deegming的第二个目标，就是末端到端的深度自学，该有的状态让在自学器内部传达好了，整个我们构成了从输出末端到输入端的末端到端的深度自学，我们经过几百轮的自学之后，自我学会了怎么更佳地玩一个游戏，这是当时的学习效果，每个图对应有所不同的游戏。

横轴是随着时间、随着游戏的轮数更加多，它的效果我们看见的是更加好，这和我们人的自学过程是一样的。我们说道这个人的自学效率就大大地提升，学习效果大大提高。我们总结一下，这些顺利来自于什么呢？我们可以首先看见它有十分明晰的目标，什么叫输掉什么叫赢，延后商业上也要有很强的目标。

其次必须高质量的大数据，这里我尤其要特别强调的是高质量，这个数据要持续地对系统，无法缴一次就完了，大大地抵达才能使得我们自学大大地提升。同时一定要有对系统，对系统的方式和内容和算法一定要给定。所以我们经常听见有一些人说道，我这个领域有了几千万样本的数据，一定可以做到人工智能，我要告诉他不一样，因为首先你那个样本不一定是针对这个算法搜集的，其次你的算法不一定持续获得，最后你的对系统不一定很好。第三是问题无法十分明确和模糊不清，定义一定要十分确切，确切到像对局一样，我们告诉什么时候边界就超过了。

另外一个是我们必须既不懂人工智能又不懂商业领域的人才，我们说道这样的人才到哪儿去找，从今天还是大家就注目身边擅于自学的人，侧重培育他，这样的人才能把两个几乎有所不同的横向领域连结在一起的人才是必不可少的。最后我要托的是计算能力，今天大家都有很强的计算能力，我们有云计算、并行计算、GPU，所以这个能力也是必不可少的。再行下面我要谈的是另外一个例子，今天我就用例子再行来之后阐释我刚谈的五个条件，这里我要谈，我们现在告诉对话系统是人工智能的热点，甚至有的公司出来说道对话系统，就是这种嵌入式的对话系统，有可能是下一个入口，下一个搜索引擎，我们再行不管这些商业的众说纷纭，我们来看一看现在我们市场上有的这些对话系统，我们可以大体把它们分两类，首先我们看见有很多是闲谈类的，我们大约很确切的小冰，很诙谐，但是也相接闲谈，还有一类是功能类，当我们打电话给酒店、航空公司，在谋求类似明确横向服务的时候，往往不会获益于这样一种功能型的对话。我们告诉在旋即以前，甚至很多的公司也有这种对话，但是它们的方式都是说道你要这个服务按1，要那个服务按2，我们感觉体验十分很差。

kb平台官网

从技术上来说，这种对话系统也分为两种，第一种最先经常出现的是基于规则，很多人专家来写出这些规则，这些就像在符号领域，它的益处是很精确的，但是很差的地方就是很难拓展，和数据牵涉到，对数据过于脆弱。另外有很多有所不同的意外事件都无法应付，所以现在大家较为注目的是机器学习的算法。

我们在香港科技大学的实验室里面也在展开研究，我们研究的一个主要目的是说道如果我们再行把人工智能往前引更进一步，在深度自学之后，究竟还有哪些技术是下一个热点，我们关心的是明天的技术，这里我要说的是我们有一个三明治式的一个三层结构：第一层就是我们熟悉的深度自学，这是一个迭代的深度自学；在这个之上，我们有一个策略的自学器，叫作增强自学的自学器，在这里我要特别强调的是增强自学里面最好的一部分是当人工智能的机器人它无法全部仔细观察周围的世界，不能部分仔细观察，所以这个有一个很怪的名字，叫作基于部分仔细观察的马尔可夫的决策过程，修改来说它是增强自学里十分无以的阶段。第三个就是迁入自学，它能让我们把一个作好的模型迁入到一个新的领域来，所以我们期望这样一个系统它能具备以下这儿功能，比方说闲谈、引荐、引领、警告、自学，这个我们看见如果它具备这些功能的话，它就像一个真人一样。怎么超过这样呢？我们首先要有基本的对话功能，就是深度自学的对话功能，其次我们要有一个策略，这个策略要能引领对话的对象去已完成一个任务。

最后我们要能构建个性化，我们最差需要切合用户，让用户跟它对话以后，这个体验实在十分好，十分简洁明了。怎么才能超过这一点，这就是我们的一些例子，比方说我们现在和一个O2O的公司合作，用现实的数据来训练这个系统，这个绿色的就是用户托的问题，白色的是系统，我们这个中文名字叫作“魔镜系统”，就是白雪公主里面的魔镜，当然这是一个好的魔镜。刚才的这个系统，它的展示，我们是把整个的对话系统给放在一个机器人的里面，让机器人通过语音跟我们问，实质上这个确实的系统是在手机上可以和人交流的。这里我要跟我们大家熟知的一些系统来做到较为，比方说小冰的话，左边是用户托的问题，绿色的，黄色这里是小冰的问，这是现实的一个图片。

我们看小冰虽然很嘲讽，我们也试着用siri来做到问，siri是基于搜寻，它很多的就是难过没寻找给定。我们这样一个系统之所以研究它，是我们对背后的系统感兴趣，所以有这样的应用领域，我们刚谈的几个条件，首先我们有很具体的目标，有很好的对系统，有大大来临的数据，然后我们也有跨界的人才，我们和O2O公司的联络。

另外这个问题最后我们是有十分具体的，不一定有具体的边界条件，使得我们最后把这个问题的传达就样子是在下围棋一样，因此我们这里面也可以考虑到说道我们现在谈话谈及这儿，究竟离我们的目标有多近，这就样子在对局里面我们有一个状态网络，我们对现在的状态有一个估计，同时我们可以往下问的有所不同的话，可以当作我们下面要下的棋子，所以这和阿尔法狗的思维有很相象的地方。有一个十分有意思的现象，就是这样一个三层的模型，我刚才谈的深度自学和增强自学还有迁入自学，这样一个模型是十分标准化的，对话领域是我们的限于场所，这样的模型把它放在几乎不一样的应用领域去它也能工作，这就是通用型的发展目标，比如我们有的学生就把它应用于在大家普遍认为很难的领域，就是股市大势的预测。这是A股里面的某个股票，我们拿过去好多年的数据，十年的数据做到训练，所有数据之间的相连，首先我们产生有所不同的状态，让这个状态之间需要相互迁入。

其次是状态和状态之间的变化，我们用一个增强自学来仿真，最后我们找到深度自学的说明了层里面它自动产生出来的几百个状态，基本就把这几年的经济状况给了一个很完备的总结，所以它可以给一个十分好的大势的南北，我们也做到了一些测试。这个例子当然是在金融领域的一个小的试验，所以我应当说道这个是我们有所保有的，但是我想要说道的事情是一旦我们对一个领域有了充足的理解，一旦这个领域充足的数据我们掌控了，我们就可以套用人工智能，刚谈的一个边界明晰的方法来解决问题它，以超过通用型的人工智能的目的。我下面要谈的，最后一个题目就是如何能做个性化，这里只不过有两个题目：一个是我个人就是有一个很反感的感觉，深度自学是必不可少大数据的，大数据又必不可少大公司，我们熟悉的一些大公司都是大数据的拥有者，我们有一些中型和小型公司没大数据，也没这个能力去获得大数据。

所以这里我说道像深度自学，它的红利来自于特征的挑选，特征的精确挑选又必不可少大数据，这些大数据只有富人才能获得。增强自学是把重点放到另一个角度，就是对系统，就是世界对系统的对系统，这个对系统可以延后，但是它的训练也必不可少大数据，也是一个富人的游戏。我们要超过世界上每一个人都可以中用人工智能，我们一定要做到这样的研究，就是如何能把一个大的模型，大数据训练出来的模型迁入到一个小数据的范围内，让它能在一个小数据上面也能起起到。

它还带给一个副产品，这个副产品就叫作个性化，也就是如果我们让一个产品需要有很强的用户感觉，用户体验，那么我们一定要超过个性化的效果，这个就是我们之所以做到迁入自学的目的。什么是迁入自学呢？就是我们在一个数据领域早已有了很好的领域创建了十分好的模型，我们换一个模型也能让它应用于，这样既节省了资源，又超过时间和效果的益处。所以这样的一个自学过程，把一个有数模型迁入到一个未知领域，就叫作迁入自学。所以我们人是自动地就不会做到这种举一反三的指控自学了，比如我们学会骑马自行车以后，我们又去学摩托车，找到很非常简单，我们踢球、学语言、学物理化学也有很多这样的例子。

迁入自学大家也有了将近十年的希望，也累积了大量的文献，这里我总结一下，通过几种有所不同的方式，我们可以超过迁入，每一种方式都是很直观的。第一种就是我们在数据集里面寻找跟目标领域相近的数据，把这个数据缩放多倍，这个叫作样本迁入，通过样本来超过迁入的目的。其次我们可以仔细观察到有些相近的特征，然后利用这些特征，在有所不同的层次的特征，来展开自动的迁入，这种叫作特征迁入。

然后我们还可以做基于模型的迁入，这是这样的一个工作。利用上千万的图象来训练一个图象识别的系统，我们遇上一个新的图象领域，我们就不必再行去找几千万个图象来训练了，我们就把原本的那个迁入到新的领域，所以在新的领域要用几万张图片就不够，某种程度可以获得很高的效果，这叫作模型迁入，模型迁入的一个益处是我们可以区分，就是可以和深度自学融合一起，我们可以区分有所不同层次可迁入的度，相近度较为低的那些层次他们被迁入的可能性就大一些。最后我们也可以通过关系来展开迁入，比方说社会网络，社交网络之间的迁入。

如果用了迁入自学，我刚才谈一个副产品就就是指很多人的大数据迁入到一个人的小数据上，这样可以超过一个效果，比方说我们仅有用一个用户的九个对话来训练这样的一个迁入自学的效果，从一个三万人获得的大模型迁入到一个人的小模型身上，这个效果在增强自学的基础上做到一起就尤其地得心应手，因为增强自学就使得我们需要把迁入的结果变为短路，就样子是在电路当中的短路，使得我们需要不必很烦琐的去回答用户很多某种程度的问题。对，刚有几个部分，只不过系统都没明确地去回答答案，它基本上就在问还是上一次那个答案吗？还是送往你家吗？这样就节省了很多，所以就是这样。

最后我就来再行总结一下，就是我刚谈的这几个必要条件，刚才我是通过荐第一个例子谷歌Deepmind，第二个是增强迁入自学，就是三层的结构，同时我谈了具备通用性、个性化的自学。这里我要再度特别强调一下我们总结的几个条件：一个是要有明晰边界的问题定义，一定要有持续大大的外部对系统，要有充足的计算资源、要有顶尖的数据科学家还要有充足质量的大数据。

原创文章，予以许可禁令刊登。下文闻刊登须知。

本文关键词：AIR008,丨,香港,科技,大学,教授,杨强,人工智能,kb平台官网

本文来源：kb平台官网-www.queserasera87.com

下一篇：没有了上一篇：松下陷入财务危机：将废除相机、光驱业务

AIR008丨香港科技大学教授杨强：人工智能成功的几个必要条件

推荐产品

同类文章排行

最新资讯文章