加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 湛江站长网 (https://www.0759zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

「高度」《人工智能标准化白皮书(2018)》发布(完整版)

发布时间:2018-04-01 19:31:07 所属栏目:大数据 来源:站长网
导读:副标题#e# 人工智能标准化白皮书 (2018 版) 指导单位:国家标准化管理委员会工业二部 编写单位:中国电子技术标准化研究院 二零一八年一月 ▌编写单位(排名不分先后) 中国电子技术标准化研究院 中国科学院自动化研究所 北京理工大学 清华大学 北京大学

图像理解是通过用计算机系统解释图像,实现类似人类视觉系统理解外部世 界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解,包括 图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等; 高层理解,根据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿态 估计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统, 如刷脸支付、智慧安防、图像搜索等。

(3)三维视觉

三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获 取的三维信息的科学。三维重建可以根据重建的信息来源,分为单目图像重建、 多目图像重建和深度图像重建等。三维信息理解,即使用三维信息辅助图像理解 或者直接理解三维信息。三维信息理解可分为,浅层:角点、边缘、法向量等; 中层:平面、立方体等;高层:物体检测、识别、分割等。三维视觉技术可以广 泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。

(4)动态视觉

动态视觉即分析视频或图像序列,模拟人处理时序图像的科学。通常动态视 觉问题可以定义为寻找图像元素,如像素、区域、物体在时序上的对应,以及提 取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方面。

(5)视频编解码

视频编解码是指通过特定的压缩技术,将视频流进行压缩。视频流传输中最 为重要的编解码标准有国际电联的 H.261、H.263、H.264、H.265、M-JPEG 和 MPEG 系列标准。视频压缩编码主要分为两大类:无损压缩和有损压缩。无损压 缩指使用压缩后的数据进行重构时,重构后的数据与原来的数据完全相同,例如 磁盘文件的压缩。有损压缩也称为不可逆编码,指使用压缩后的数据进行重构时, 重构后的数据与原来的数据有差异,但不会影响人们对原始资料所表达的信息产 生误解。有损压缩的应用范围广泛,例如视频会议、可视电话、视频广播、视频监控等。

目前,计算机视觉技术发展迅速,已具备初步的产业规模。未来计算机视觉 技术的发展主要面临以下挑战:一是如何在不同的应用领域和其他技术更好的结 合,计算机视觉在解决某些问题时可以广泛利用大数据,已经逐渐成熟并且可以 超过人类,而在某些问题上却无法达到很高的精度;二是如何降低计算机视觉算 法的开发时间和人力成本,目前计算机视觉算法需要大量的数据与人工标注,需 要较长的研发周期以达到应用领域所要求的精度与耗时;三是如何加快新型算法 的设计开发,随着新的成像硬件与人工智能芯片的出现,针对不同芯片与数据采 集设备的计算机视觉算法的设计与开发也是挑战之一。

3.1.6 生物特征识别

(编辑:PHP编程网 - 湛江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!