微软芮勇:计算机视觉已通过图灵测试 但路还很长
|
四个部分,两个输入,第一个是你问的问题是什么,你问的问题是说自行车的筐里面是什么,这是一句话,这是第一步。第二步是你同时还给计算机看一个图片,有个Image model,我们用深度学习的方式把两种不同的模式做两次之后,就知道和这个问题最有关的部分就在亮的这个部分,这就是和问题发生关系的地方。如果知道这个区域和这个问题发生关系就有很大的可能性知道答案。 还有更多的几个例子要跟大家分享,比如我们让计算机看这幅图片,问:在一片空旷的海滩上,两个蓝色的椅子中间那是什么物体?这是它答案的过程,第二层聚焦到伞,一把太阳伞。还有更多的例子,在一片泥泞的土路上,什么东西在拖着马车?答案是马在拖着马车。右边那个,筐的颜色是什么?答案是红色的。右下角这个女士戴着两只红色牛的角,答案是说红色的,它知道牛角的颜色是红色的。这些都是我们今天通过计算机视觉的方式达到问题的回答水平。 刚才回顾过去50年计算机视觉发展的历程,从最早的特征提取,有直线转角,直到说这是一个户外的场景,场景里面有人,到说这个图片里面这个人的名字是什么,到生成一句话来描述这个图片,到最后我刚才提到的Visual QA,还有很长的路要走,就是我们看到图能讲出一个故事来,这是我们今后要做的事情。 我今天的题目叫《计算机视觉从感知到认知的长征》,长征大家也知道,最早是从江西的瑞金开始长征的,很具有里程碑的事件就是遵义会议,最后很成功的走到陕甘边区,今天的计算机视觉也是一个长征,但还没有到达陕甘边区,今天2016年我们取得了很大的成就,很像遵义会议取得的成就,但今后还有很长的路要走,这就是长征的一部分,怎么样最后到达陕北,至少三个方向可以想。第一个是计算机学习算法的本身。今天“深度学习”这个词很热。今天因为有了好的算法,深度学习算得很成功。 第一块很重要的能让我们到达陕北的就是计算机学习算法。第二个就是我们需要一些计算机的科学家,我们也需要和一些垂直行业的朋友们一起来做这件事情,比如我们是和做金融的朋友们,就像上午杨强讲的,我们能预测股票市场。我们如果和懂医疗的朋友来做,可不可以做出更精准的医疗,如果和植物所的朋友来做这件事情,是不是可以做出一个用手机拍照任意的花,或者一个树,我就知道这个花叫什么名字,树叫什么名字,最早从哪里来?等等。我想说这个的目的就是除了机器学习的专家之外,还要和很多垂直行业领域的专家一起合作这件事情。 第三个,右下角这个圈我觉得也一样重要,我们需要高质量的数据,这三点如果我们都能做到了,机器学习算法本身的进步,我们和行业的专家们的合作和更多的数据的获取,我们就能从瑞金经过遵义到达陕北。 谢谢大家! (编辑:PHP编程网 - 湛江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

