中国版 Prisma 来了,我们今天再聊聊深度学习
群雄逐鹿大部分人之前推测 Prisma 会推出更多滤镜来变现,但在 Prisma 主创拜访过 Facebook 之后,爆出他们的下一步的计划是做视频。2016 年 7 月20 日,Prisma 创始人莫伊谢延科夫在 Facebook 官方账号上上传了一段 29 秒的音乐视频。这段视频的每一帧,都经过艺术风格渲染。
▲一段 Prisma 艺术效果视频。Prisma 已经在官方 Facebook 上发布了多个音乐视频。 然而,并不只有 Prisma 一家在转视频这个方向。 仅仅隔了 9 天,Prisma 的天使投资方、俄罗斯互联网巨头 Mail.Ru 公司副总裁安娜 · 阿塔莫诺娃(Anna Artamonova)在 Facebook 上宣布了 Prisma 直接竞品 Artisto 的发布。这是一款结合神经网络和人工智能技术的视频处理软件,可以为视频添加动态的艺术特效。虽然视频长度不能超过 10 秒,但名画风格的图像 “动起来” 确实赏心悦目。阿塔莫诺娃称这个视频软件只花了 8 天时间研发。
▲副总裁 阿塔莫诺娃接连在 Facebook 上发布 Artisto 制作的视频。 图片来源:https://www.facebook.com/artamonova/videos 在 Prisma 安卓版上线的第二天,俄罗斯最大社交网站 VKontakte 也推出了一款和 Prisma 类似的产品:Vinci,两者的功能和外观都非常相似。Vinci 不仅将图片加工时间缩短到了 2 秒钟,还快速开放了 iOS 与 安卓市场,并且覆盖到 Prisma 未能涉足的 Windows Phone 领域,成为 Windows Phone上第一个运用神经网络的软件。值得一提的是,社交网站 VKontakte 也是 Mail.Ru 的旗下产品。 截至到 2016 年 8 月 2 日,在俄罗斯 APP Store 免费榜上,Artisto 高居榜首,Vinci 位居第二,而 Prisma 则落到了第五的位置。
▲图片制作软件 Vinci 的界面展示。图片来源:http://mspoweruser.com/vinci-great-alternative-prisma-now-available-windows-mobile-devices/ 不仅仅是俄国人在想视频这件事,Deep Art 那三个德国人也瞄准了视频市场。前不久,Deep Art 官方网站放出了一段 demo,开始制作付费短视频。一段 720p的视频(最长五分钟)售价 249 欧元。 Deep Art 的产品高价位和慢速度,定位的是中高级市场。而在大众消费端,免费产品 Prisma,Vinci,Artisto 不论谁赢,都是俄罗斯互联网巨头公司 Mail.Ru 的胜利。与其说几款产品是在技术上较量,不如说这是互联网资本大鳄的强势布局。 然而,事实上深度学习在视频上还处于起步阶段,主要面临如下三个挑战:
除了我们盘点过的这些 “滤镜类应用”,深度学习在图像处理上应用还有很多。总的说来,深度学习图像应用按照过程可以分为两部分:输入与输出。
在图像识别的高准确度的基础上,深度学习能够完成更为复杂的任务。举个例子,如果说百度图片搜索、微博自动检测图片中的敏感词属于计算机理性认知层面应用的代表,那么像 Prisma 这样的应用就是在深度学习的帮助下,让计算机不仅可以理性识别,还能感性认知图片,理解图像的风格与内容关系。 这才是人工智能的意义所在。计算机感知能力的发展决定了机器世界能否真正建立自洽、完整的知识体系,最终实现对人类能力的替代、延伸和增强。 按领域内容,深度学习在图像中的应用分为:图像识别、分类、检测、搜索、特征提取和视频处理这几大类别。其中,人脸识别是突破最快的深度学习图像应用。早在 2014 年便有多个初创科技团队达到了逼近或者超越肉眼的识别率,如下图展示:
▲各公司利用自己的公开样本集测试,提交测试结果。结果显示,汤晓鸥教授团队研发的人脸识别产品 Deep ID 已经超越肉眼的识别率。其中,小横线上面是技术产品名,下面是团队名称。(深蓝制图) 这几家公司中,Facebook 已经将 Deepface 的成果整合到自家产品中了。如今,用户上传照片到 Facebook 账号,系统就能自动标注图中的每一个人。而旷视科技和以汤晓鸥教授为技术核心的 “商汤科技”,则主要为金融、安防等部门提供成熟的身份认证产品,客户包括支付宝、招商银行、反恐部队等。
▲商汤科技与旷视科技主要客户对比图(深蓝制图) Facebook 可能是这三家巨头中对深度学习图像应用最具有野心的大公司。据内部可靠消息,Facebook 或将在下周末(2016年8月底)将他们最新的研究成果代码开源。如果用一句最简单的话来形容 Facebook的新突破,叫做 “采用无监督学习让计算机无中生有,自己生成图片”。
▲三大互联网公司在深度学习上的布局一览。(深蓝制图) 在以往,人们让计算机去做图像生成采用的是监督式学习,即需要利用大量带标签的数据去训练人工神经网络,后者才能逐渐学会识别东西。比方说,给计算机看 1000 张猫的图片,看多了之后神经网络会逐步对猫建立模型并识别其他猫的图像。 但在今天,Facebook 采用的是无监督学习,让计算机自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本,并令观众信以为真。 Google 的 Deep Dream 是一个会画画的计算机。它自动识别图像,筛选出某些部分,进行夸张,以创造出一种迷幻效果。半年前,Deep Dream 于湾区举办了成功的画展。Deep Dream 模仿 500 年前文艺复兴时期的德国画家汉斯·荷尔拜(Hans Holbein)的笔触与绘画技巧,画出了一系列硅谷名人。每张画作足以让人们掏出几千美金来收藏。 然而,Deep Dream 的算法有时候会给人惊吓。如果它发现你的脸部线条有点像一只狗,于是它会把那一块区域画成一个完整的狗。“这就像吃了 LSD,计算机会出现幻觉。于是到处都是狗!” 一位来自 Google AI Lab 的员工说。
▲Google Day Dream 的画作。图画中不少区域被计算机处理成狗头、漩涡。 无论如何,计算机正在向我们展示它们自己的梦想。 参考文献: i, Gatys, Leon, Alexander S. Ecker, and Matthias Bethge. "Texture synthesis using convolutional neural networks." Advances in Neural Information Processing Systems. 2015. ii, Gatys, Leon, Alexander S. Ecker, and Matthias Bethge. "A neural algorithm of artistic style." arXiv preprint arXiv:1508.06576 (2015). ii, 王晓刚. "深度学习在图像识别中的研究进展与展望". 2015. iii, Venture Scanner. Artificial Intelligence Market Overview. 2016. iv, He, Kaiming, et al. "Deep residual learning for image recognition." arXiv preprint arXiv:1512.03385 (2015). (编辑:PHP编程网 - 湛江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |










