加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 湛江站长网 (https://www.0759zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

2017校招数据分析岗笔试#92;/面试知识点总结

发布时间:2021-01-17 19:35:59 所属栏目:大数据 来源:网络整理
导读:副标题#e# 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。 尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是应该也抱着好的期望去找自己满意的呢? 最近笔试了很多家公司校招的数据分

短时间内处理大量数据,得到可行且效果较好的结果。

3)缺点:

  • 对于各类别样本数量不一致数据,信息增益偏向于那些具有更多数值的特征。

  • 易于过拟合。

  • 忽略属性之间的相关性。

3.支持向量机

支持向量机把分类问题转化为寻找分类平面的问题,并通过最大化分类边界点距离分类平面的距离来实现分类。

  • 可以解决小样本下机器学习的问题。

  • 提高泛化性能。

  • 可以解决文本分类、文字识别、图像分类等方面仍受欢迎。

  • 避免神经网络结构选择和局部极小的问题。

  • 缺失数据敏感。

  • 内存消耗大,难以解释。

  • 4.K近邻

    通过计算每个训练样例到待分类样品的距离,取和待分类样品距离最近的K个训练样例,K个样品中哪个类别的训练样例占多数,则待分类样品就属于哪个类别。

    2)优点 :

    适用于样本容量比较大的分类问题

  • 计算量太大

  • 对于样本量较小的分类问题,会产生误分。

  • 5.逻辑回归(LR)

    回归模型中,y是一个定型变量,比如y=0或1,logistic方法主要应用于研究某些事件发生的概率。

  • 速度快,适合二分类问题。

  • 简单易于理解,直接看到各个特征的权重。

  • (编辑:PHP编程网 - 湛江站长网)

    【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!