杨强:深度学习是富人的游戏 我要颠覆它
|
这个例子当然是在金融领域的一个小的试验,所以我应该说这个是我们有所保留的,但是我想说的事情是一旦我们对一个领域有了足够的了解,一旦这个领域足够的数据我们掌握了,我们就可以套用人工智能,刚刚讲的一个边界清晰的方法来解决它,以达到通用型的人工智能的目的。 我下面要讲的,最后一个题目就是如何能做到个性化,这里其实有两个题目:一个是我个人就是有一个很强烈的感觉,深度学习是离不开大数据的,大数据又离不开大公司,我们熟知的一些大公司都是大数据的拥有者,我们有一些中型和小型公司没有大数据,也没有这个能力去取得大数据。所以这里我说像深度学习,它的红利来自于特征的选取,特征的准确选取又离不开大数据,这些大数据只有富人才能得到。 强化学习是把重点放在另一个角度,就是反馈,就是世界对系统的反馈,这个反馈可以延迟,但是它的训练也离不开大数据,也是一个富人的游戏。我们要达到世界上每一个人都可以用到人工智能,我们一定要做这样的研究,就是如何能把一个大的模型,大数据训练出来的模型迁移到一个小数据的范围内,让它能在一个小数据上面也能起作用。它还带来一个副产品,这个副产品就叫做个性化,也就是如果我们让一个产品能够有很强的用户感觉,用户体验,那么我们一定要达到个性化的效果,这个就是我们之所以做迁移学习的目的。 什么是迁移学习呢?就是我们在一个数据领域已经有了很好的领域建立了非常好的模型,我们换一个模型也能让它应用,这样既节省了资源,又达到时间和效果的好处。所以这样的一个学习过程,把一个已有模型迁移到一个未知领域,就叫做迁移学习。所以我们人是自动地就会做这种举一反三的嫌疑学习了,比如我们学会骑自行车以后,我们又去学摩托车,发现很简单,我们打球、学语言、学物理化学也有很多这样的例子。迁移学习大家也有了将近十年的努力,也积累了大量的文献,这里我总结一下,通过几种不同的方式,我们可以达到迁移,每一种方式都是很直观的。第一种就是我们在数据集里面找到跟目标领域相似的数据,把这个数据放大多倍,这个叫做样本迁移,通过样本来达到迁移的目的。其次我们可以观察到有些相似的特征,然后利用这些特征,在不同的层次的特征,来进行自动的迁移,这种叫做特征迁移。然后我们还可以做到基于模型的迁移,这是这样的一个工作。利用上千万的图象来训练一个图象识别的系统,我们遇到一个新的图象领域,我们就不用再去找几千万个图象来训练了,我们就把原来的那个迁移到新的领域,所以在新的领域只用几万张图片就够,同样可以得到很高的效果,这叫做模型迁移,模型迁移的一个好处是我们可以区分,就是可以和深度学习结合起来,我们可以区分不同层次可迁移的度,相似度比较高的那些层次他们被迁移的可能性就大一些。最后我们也可以通过关系来进行迁移,比方说社会网络,社交网络之间的迁移。 如果用了迁移学习,我刚才讲一个副产品就是从很多人的大数据迁移到一个人的小数据上,这样可以达到一个效果,比方说我们仅用一个用户的九个对话来训练这样的一个迁移学习的效果,从一个三万人得到的大模型迁移到一个人的小模型身上,这个效果在强化学习的基础上做起来就特别地得心应手,因为强化学习就使得我们能够把迁移的结果变成短路,就好像是在电路当中的短路,使得我们能够不用很烦琐的去问用户很多同样的问题。 这里我给大家也展示一个例子。 对,刚刚有几个部分,其实系统都没有具体地去问答案,它基本上就在问还是上一次那个答案吗?还是送到你家吗?这样就节省了很多,所以就是这样。 最后我就来再总结一下,就是我刚刚讲的这几个必要条件,刚才我是通过第一个例子谷歌Deepmine,第二个是强化迁移学习,就是三层的结构,同时我讲了具有通用性、个性化的学习。这里我要再次强调一下我们总结的几个条件:一个是要有清晰边界的问题定义,一定要有持续不断的外部反馈,要有足够的计算资源、要有顶尖的数据科学家还要有足够质量的大数据。 我的讲演到此结束,谢谢大家! (编辑:PHP编程网 - 湛江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

