加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 湛江站长网 (https://www.0759zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 电商 > 正文

北京大学计算机系教授博士生导师崔斌:以机器学系统Angel支持大数据所带来的挑战

发布时间:2017-10-06 20:09:55 所属栏目:电商 来源:财经网
导读:副标题#e# 2017年9月27日,第二届大数据产业应用协同创新峰会于北京隆重召开。在会上,北京大学计算机系教授博士生导师崔斌发表了有关“支持大数据的分布式机器学习系统Angel”的演讲。 2017年9月27日,第二届大数据产业应用协同创新峰会于北京隆重召开。在

那其他的机器学习平台,当然也有很多。比方说像刚才提到过的像08:40(英),原来是08:42这么一个机器学习的系统,后来被苹果收购了,现在也不开源了。08:48(英)还做过一个也是集成服务器08:51(英)一个分布式机器学习系统。它是实验室做的,后来因为它开始也成立创业公司,融资了,它现在也不开源了。像微软他们开始做的一些系统,现在主要也是支持深度学习比较多的。另外一个09:10(英)也是一个开源的系统,它通常是针对梯度提升类的,所以它针对性比较强。当然09:19(英)这类系统,其实在市面外面很多大数据竞赛,参加的队伍很多人还是用这个去做蛮多的,因为它里面做了一些决策数,它很多它支持,它支持的很好,速度很快,也很容易用。最后一个09:32(英)最开始是酷狗它推出了,最后它慢慢变成了09:37(英),也支持,主要支持深度学习。

那我们跟系统大概做一些比较,其实可以发现,数据的那些系统它可能是比较适合于通用的大数据,不太适合机器学习的这种算法。然后图计算的系统呢,它比较适合抽象,能够抽象成稀疏图结构的这一类算法。然后深度学习系统它主要场景是用来计算一些密集性的应用,比如说10:04(英)他们性能会比较好。

然后通过做这些机器学习的算法我们做一些分析,我们可以发现,其实在分布式机器学习这个过程中,它的一个核心就是一个参数的共享。也就是说每次参数在不同的传递,不同的过程当中,你怎么把这个事情做好,是提升机器学习效率的一个关键。所以我们在设计这个系统的过程中,主要就是我们把想提供一些很好的参数共享的服务。然后能够在这个基础上,再来整合多类的机器学习系统。

好,接下来简单介绍一下,系统的介绍。系统介绍,我们系统的框架大概就是长这个样子,然后在客户端我们用来控制任务的运行。客户端也就是说用户你可以提交一个机器学习的任务,给这个系统,用来启动和停止任务,然后加载或存储模型。然后在这个11:01(英)结点,它就是作一些基本的控制。我来约定说我用什么样的数据、用什么样的参数,是不是要给它做一个分片,要做什么样的分啪,然后你去申请什么样的资源,对吧。还有管理整个系统执行的一个过程。然后在右上角那几个点,就是一个参数,参数服务器,你可以把参数进行分片,存在不同的服务器结点上面。下面就是所有的工作结点,根据你本地的数据,做一个运算。这些具体的我这里就不讲了。

(编辑:PHP编程网 - 湛江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读