中国版 Prisma 来了，我们今天再聊聊深度学习

发布时间：2016-08-26 13:37:05 所属栏目：建站来源：深蓝DeeperBlue

导读：“为艺术爱好者打造的神奇手机 APP，让你的照片瞬间变换成艺术风格作品。不同于传统滤镜，深黑基于人工智能，每个风格都是由真正的艺术家训练、创作而成。只需轻轻点击，就

群雄逐鹿

大部分人之前推测 Prisma 会推出更多滤镜来变现，但在 Prisma 主创拜访过 Facebook 之后，爆出他们的下一步的计划是做视频。2016 年 7 月20 日，Prisma 创始人莫伊谢延科夫在 Facebook 官方账号上上传了一段 29 秒的音乐视频。这段视频的每一帧，都经过艺术风格渲染。

▲一段 Prisma 艺术效果视频。Prisma 已经在官方 Facebook 上发布了多个音乐视频。

然而，并不只有 Prisma 一家在转视频这个方向。

仅仅隔了 9 天，Prisma 的天使投资方、俄罗斯互联网巨头 Mail.Ru 公司副总裁安娜 · 阿塔莫诺娃(Anna Artamonova)在 Facebook 上宣布了 Prisma 直接竞品 Artisto 的发布。这是一款结合神经网络和人工智能技术的视频处理软件，可以为视频添加动态的艺术特效。虽然视频长度不能超过 10 秒，但名画风格的图像 “动起来” 确实赏心悦目。阿塔莫诺娃称这个视频软件只花了 8 天时间研发。

中国版 Prisma 来了，我们今天再聊聊深度学习

▲副总裁阿塔莫诺娃接连在 Facebook 上发布 Artisto 制作的视频。图片来源：https://www.facebook.com/artamonova/videos

在 Prisma 安卓版上线的第二天，俄罗斯最大社交网站 VKontakte 也推出了一款和 Prisma 类似的产品：Vinci，两者的功能和外观都非常相似。Vinci 不仅将图片加工时间缩短到了 2 秒钟，还快速开放了 iOS 与安卓市场，并且覆盖到 Prisma 未能涉足的 Windows Phone 领域，成为 Windows Phone上第一个运用神经网络的软件。值得一提的是，社交网站 VKontakte 也是 Mail.Ru 的旗下产品。

截至到 2016 年 8 月 2 日，在俄罗斯 APP Store 免费榜上，Artisto 高居榜首，Vinci 位居第二，而 Prisma 则落到了第五的位置。

中国版 Prisma 来了，我们今天再聊聊深度学习

▲图片制作软件 Vinci 的界面展示。图片来源：http://mspoweruser.com/vinci-great-alternative-prisma-now-available-windows-mobile-devices/

不仅仅是俄国人在想视频这件事，Deep Art 那三个德国人也瞄准了视频市场。前不久，Deep Art 官方网站放出了一段 demo，开始制作付费短视频。一段 720p的视频(最长五分钟)售价 249 欧元。

Deep Art 的产品高价位和慢速度，定位的是中高级市场。而在大众消费端，免费产品 Prisma，Vinci，Artisto 不论谁赢，都是俄罗斯互联网巨头公司 Mail.Ru 的胜利。与其说几款产品是在技术上较量，不如说这是互联网资本大鳄的强势布局。

然而，事实上深度学习在视频上还处于起步阶段，主要面临如下三个挑战：

第一，视频的数据处理量比图片更大，对计算能力的要求指数级增加;
第二，如何保持帧图像在时间轴上的信息一致性，而不是单独处理每一帧图像，也是难题;
第三，视频中的物体时刻在运动，如何追踪其在空间中的动态变化，研究员们还没找到好的方法。

除了我们盘点过的这些 “滤镜类应用”，深度学习在图像处理上应用还有很多。总的说来，深度学习图像应用按照过程可以分为两部分：输入与输出。

中国版 Prisma 来了，我们今天再聊聊深度学习

输入可以视作是 “机器视觉”，即机器内部建立起对图像的理解与认知——比如去判断图片中人像是不是本人，对图中物品进行分类等;
输出是进一步做出判断、决策，并触发行动，比如自动驾驶中通过分析摄像头采集到的道路信息，对控制系统下达加速、停车等指令。

在图像识别的高准确度的基础上，深度学习能够完成更为复杂的任务。举个例子，如果说百度图片搜索、微博自动检测图片中的敏感词属于计算机理性认知层面应用的代表，那么像 Prisma 这样的应用就是在深度学习的帮助下，让计算机不仅可以理性识别，还能感性认知图片，理解图像的风格与内容关系。

这才是人工智能的意义所在。计算机感知能力的发展决定了机器世界能否真正建立自洽、完整的知识体系，最终实现对人类能力的替代、延伸和增强。

按领域内容，深度学习在图像中的应用分为：图像识别、分类、检测、搜索、特征提取和视频处理这几大类别。其中，人脸识别是突破最快的深度学习图像应用。早在 2014 年便有多个初创科技团队达到了逼近或者超越肉眼的识别率，如下图展示：

中国版 Prisma 来了，我们今天再聊聊深度学习

▲各公司利用自己的公开样本集测试，提交测试结果。结果显示，汤晓鸥教授团队研发的人脸识别产品 Deep ID 已经超越肉眼的识别率。其中，小横线上面是技术产品名，下面是团队名称。(深蓝制图)

这几家公司中，Facebook 已经将 Deepface 的成果整合到自家产品中了。如今，用户上传照片到 Facebook 账号，系统就能自动标注图中的每一个人。而旷视科技和以汤晓鸥教授为技术核心的 “商汤科技”，则主要为金融、安防等部门提供成熟的身份认证产品，客户包括支付宝、招商银行、反恐部队等。

中国版 Prisma 来了，我们今天再聊聊深度学习

▲商汤科技与旷视科技主要客户对比图(深蓝制图)

Facebook 可能是这三家巨头中对深度学习图像应用最具有野心的大公司。据内部可靠消息，Facebook 或将在下周末(2016年8月底)将他们最新的研究成果代码开源。如果用一句最简单的话来形容 Facebook的新突破，叫做 “采用无监督学习让计算机无中生有，自己生成图片”。

中国版 Prisma 来了，我们今天再聊聊深度学习

▲三大互联网公司在深度学习上的布局一览。(深蓝制图)

在以往，人们让计算机去做图像生成采用的是监督式学习，即需要利用大量带标签的数据去训练人工神经网络，后者才能逐渐学会识别东西。比方说，给计算机看 1000 张猫的图片，看多了之后神经网络会逐步对猫建立模型并识别其他猫的图像。

但在今天，Facebook 采用的是无监督学习，让计算机自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本，并令观众信以为真。

Google 的 Deep Dream 是一个会画画的计算机。它自动识别图像，筛选出某些部分，进行夸张，以创造出一种迷幻效果。半年前，Deep Dream 于湾区举办了成功的画展。Deep Dream 模仿 500 年前文艺复兴时期的德国画家汉斯·荷尔拜(Hans Holbein)的笔触与绘画技巧，画出了一系列硅谷名人。每张画作足以让人们掏出几千美金来收藏。

然而，Deep Dream 的算法有时候会给人惊吓。如果它发现你的脸部线条有点像一只狗，于是它会把那一块区域画成一个完整的狗。“这就像吃了 LSD，计算机会出现幻觉。于是到处都是狗!” 一位来自 Google AI Lab 的员工说。

中国版 Prisma 来了，我们今天再聊聊深度学习

▲Google Day Dream 的画作。图画中不少区域被计算机处理成狗头、漩涡。

无论如何，计算机正在向我们展示它们自己的梦想。

参考文献：

i， Gatys， Leon， Alexander S. Ecker， and Matthias Bethge. "Texture synthesis using convolutional neural networks." Advances in Neural Information Processing Systems. 2015.

ii， Gatys， Leon， Alexander S. Ecker， and Matthias Bethge. "A neural algorithm of artistic style." arXiv preprint arXiv：1508.06576 (2015).

ii，王晓刚. "深度学习在图像识别中的研究进展与展望". 2015.

iii， Venture Scanner. Artificial Intelligence Market Overview. 2016.

iv， He， Kaiming， et al. "Deep residual learning for image recognition." arXiv preprint arXiv：1512.03385 (2015).

（编辑：PHP编程网 - 湛江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/4

首页

尾页

针对移动端转码问题给	选择短网址的好处是可
千万不要因为盲目追求	SEO的职业生涯从seo初