机器学习面试--一句话概括传统ML算法

机器学习过程主要包括:数据的特征提取、数据预处理、训练模型、测试模型、模型评估改进等几部分

传统机器学习算法主要包括以下五类:

  • 回归:建立一个回归方程来预测目标值,用于连续型分布预测
  • 分类:给定大量带标签的数据,计算出未知标签样本的标签取值
  • 聚类:将不带标签的数据根据距离聚集成不同的簇,每一簇数据有共同的特征
  • 关联分析:计算出数据之间的频繁项集合
  • 降维:原高维空间中的数据点映射到低维度的空间中

1 线性回归:找到一条直线预测目标值

2 逻辑回归:找到一条直线来分类数据

3 KNN:用距离度量最相近邻的分类标签

4 NB:选着后验概率最大的类为分类标签

5 决策树:构造一科熵值下降最快的分类树

决策树是一种树型结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶结点代表一种类别。采用的是自顶向下的递归方法,选择信息增益最大的特征作为当前的分裂特征。

6 SVM:构造超平面,分类非线性数据

7 k-means:计算质心,聚类无标签数据

8 关联分析

9 PCA降维:减少数据维度,降低数据复杂度

原文地址:https://www.cnblogs.com/ylHe/p/9367695.html

时间: 2024-07-31 00:38:21

机器学习面试--一句话概括传统ML算法的相关文章

一句话概括 各种排序算法

1  插入排序 直接插入排序:将一个记录插入到已排序的有序表中,得到一个新的有序表,记录数增1. 希尔排序:先将待排序的记录序列分成若干个子序列分别进行直接插入排序,待整个序列中的记录基本有序时,在对全体记录进行一次直接插入排序. 2 交换排序 冒泡排序:每一次冒泡都会使当前的最大记录被安置在最后一个记录的位置上. 快速排序:通过一趟排序将待排序序列分成独立的两个部分,其中一部分的关键字均比另一部分的关键字小,然后再分别对这两部分进行快速排序,直到整个序列有序. 3 选择排序 简单选择排序:每一

[Algorithm & Machine Learning]CAML机器学习系列1:深入浅出ML之Regression家族

声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 符号定义 这里定义<深入浅出ML>系列中涉及到的公式符号,如无特殊说明,符号含义均按下述定义解释: 符号 含义 \(x_j\) 第\(j\)维特征 \(x\) 一条样本中的特征向量,\(x=(1, x_1, x_2, \cdots, x_n)\) \(x^{(i)}\) 第\(i\)条样本 \(x_{j}^{(i)}\) 第\(i\)条样本的第\(j\)维特征 \(y^{(i)}\)

推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了

PS:文章主要转载自CSDN大神"黑夜路人"的文章:          http://blog.csdn.NET/heiyeshuwu/article/details/43483655      本文主要对机器学习进行科普,包括机器学习的定义.范围.方法,包括机器学习的研究领域:模式识别.计算机视觉.语音识别.自然语言处理.统计学习和数据挖掘.这是一篇非常好的文章,尤其感学原文作者~          http://www.thebigdata.cn/JieJueFangAn/1308

一文读懂机器学习,大数据/自然语言处理/算法全有了……

原文地址 http://www.open-open.com/lib/view/open1420615208000.html http://www.cnblogs.com/subconscious/p/4107357.html 引论 在本篇文章中,我将对机器学习做个概要的介绍.本文的目的是能让即便全然不了解机器学习的人也能了解机器学习.而且上手相关的实践.这篇文档也算是 EasyPR开发的番外篇.从这里開始.必须对机器学习了解才干进一步介绍EasyPR的内核.当然,本文也面对一般读者.不会对阅读有

90天,从Java转机器学习面试总结

前 言 辗转几年Java开发,换了几份工作,没一个稳定的学习.工作过程.中间也相亲几次,都是没啥结果.换工作频繁也严重打乱了和姑娘接触的节奏.糟心工作连着遇到几次,也怪自己眼光有问题. 2018也找了2次工作,中间有4.5个月没有工作.看了个世界杯,看了个亚运会.也怪自己这段时间一直是换工作.找工作,节奏太乱了.当然,节奏不乱也可能不会比现在好吧.谁说的准呢? Java转机器学习--为啥呢? 主要有以下三方面原因: 1.Java感觉遇到瓶颈.Spring.Mytatis.设计模式等等,源码看不动

机器学习面试问题总结

在此记录下常见的机器学习面试问题. 判别式模型和生成式模型的区别? 判别方法:由数据直接学习决策函数 Y = f(X),或者由条件分布概率 P(Y|X)作为预测模型,即判别模型. 生成方法:由数据学习联合概率密度分布函数 P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型. 由生成模型可以得到判别模型,但由判别模型得不到生成模型. 常见的判别模型有:K近邻.SVM.决策树.感知机.线性判别分析(LDA).线性回归.传统的神经网络.逻辑斯蒂回归.boosting.条件随机场

算法学习?挑战高薪的必经之路!让面试官满意的排序算法(图文解析)

让面试官满意的排序算法(图文解析) 这种排序算法能够让面试官面露微笑 这种排序算法集各排序算法之大成 这种排序算法逻辑性十足 这种排序算法能够展示自己对Java底层的了解 这种排序算法出自Vladimir Yaroslavskiy.Jon Bentley和Josh Bloch三位大牛之手,它就是JDK的排序算法--java.util.DualPivotQuicksort(双支点快排) 想看以往学习内容的朋友可以看我的GitHub:https://github.com/Meng997998/And

22种代码的坏味道,一句话概括

22种代码的坏味道,一句话概括: 假设一段代码是不稳定或者有一些潜在问题的,那么代码往往会包括一些明显的痕迹. 正如食物要腐坏之前,常常会发出一些异味一样. 我们管这些痕迹叫做"代码异味". 參考资料: http://blog.csdn.net/sulliy/article/details/6635596 http://sourcemaking.com/refactoring/bad-smells-in-code Code smells Duplicated Code --------

Python机器学习实战&lt;三&gt;:k-邻近算法

安装说明参考openssl源码文件夹下INSTALL.W32 step1 环境搭建 安装perl,Visual Studio 2008 下载Openssl最新版源码.我下的版本为OpenSSL-1.0.0g. step2 启动Visual Studio 2008 Command Prompt 运行bin\vcvars32 设置 环境变量 注意: 如遇反馈"此处不应该有/Microsoft",参考错误1. step3 VS命令行窗口cd至openssl源码文件夹 执行以下命令 $perl