微软技术院士黄学东:掌握核心的语音语言技术,AI才有希望
|
黄学东:比如在Switchboard上,微软是第一个达到了媲美人类水平的,这说明在研究测试级上,微软的技术是很强大的。但那个还不够,因为训练数据是固定的,计算资源是无限的。在做产品的过程中,倒过来了,训练数据可以无限,计算资源有限,因此看问题的侧重点不太一样。还有落地场景的事情,像微软“耳听八方”的会议系统,这个是我们自己用计算机视觉和语言识别打造的一套新的解决方案,前人没有想到,也没有做到的事。 Q:大家会结合各自的定位把产品差异化做竞争,之前大家纯技术、纯研究方面的东西可能现在看差异化不会太明显吗? 黄学东:技术实力还是非常重要,人工智能会议系统它的技术要求远远超越了两个人的对话。真是像《封神演义》讲的耳听八方,很难的,根本顾不过来。我们的系统,它上面有一个360度的摄像头,就像九头鸟一样全看见了,会议室的东西都尽收眼底,下面还有7个麦克风的麦克风阵列,用的就是Speech Device SDK.看起来像“黑塔”的那个东西就是用微软现有的云,加上现有的DDK打造的一个人工智能落地的实例。微软的服务都在,但别人没有打造出这样的一套东西,我提供了开发工具,但是要打造一套像PPT这样的应用程序,还是需要很多的工作。 (编辑:PHP编程网 - 湛江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


