机器学习面试--一句话概括传统ML算法

机器学习过程主要包括：数据的特征提取、数据预处理、训练模型、测试模型、模型评估改进等几部分

传统机器学习算法主要包括以下五类：

回归：建立一个回归方程来预测目标值，用于连续型分布预测
分类：给定大量带标签的数据，计算出未知标签样本的标签取值
聚类：将不带标签的数据根据距离聚集成不同的簇，每一簇数据有共同的特征
关联分析：计算出数据之间的频繁项集合
降维：原高维空间中的数据点映射到低维度的空间中

1 线性回归：找到一条直线预测目标值

2 逻辑回归：找到一条直线来分类数据

3 KNN：用距离度量最相近邻的分类标签

4 NB：选着后验概率最大的类为分类标签

5 决策树：构造一科熵值下降最快的分类树

决策树是一种树型结构，其中每个内部结点表示在一个属性上的测试，每个分支代表一个测试输出，每个叶结点代表一种类别。采用的是自顶向下的递归方法，选择信息增益最大的特征作为当前的分裂特征。

6 SVM：构造超平面，分类非线性数据

7 k-means：计算质心，聚类无标签数据

8 关联分析

9 PCA降维：减少数据维度，降低数据复杂度

原文地址：https://www.cnblogs.com/ylHe/p/9367695.html

时间： 2024-07-31 00:38:21

机器学习面试--一句话概括传统ML算法的相关文章

一句话概括各种排序算法

1 插入排序直接插入排序:将一个记录插入到已排序的有序表中,得到一个新的有序表,记录数增1. 希尔排序:先将待排序的记录序列分成若干个子序列分别进行直接插入排序,待整个序列中的记录基本有序时,在对全体记录进行一次直接插入排序. 2 交换排序冒泡排序:每一次冒泡都会使当前的最大记录被安置在最后一个记录的位置上. 快速排序:通过一趟排序将待排序序列分成独立的两个部分,其中一部分的关键字均比另一部分的关键字小,然后再分别对这两部分进行快速排序,直到整个序列有序. 3 选择排序简单选择排序:每一

[Algorithm & Machine Learning]CAML机器学习系列1：深入浅出ML之Regression家族

声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 符号定义这里定义<深入浅出ML>系列中涉及到的公式符号,如无特殊说明,符号含义均按下述定义解释: 符号含义 $x_j$ 第$j$维特征 $x$ 一条样本中的特征向量,$x=(1, x_1, x_2, \cdots, x_n)$ $x^{(i)}$ 第$i$条样本 $x_{j}^{(i)}$ 第$i$条样本的第$j$维特征 $y^{(i)}$

推荐文章：机器学习：“一文读懂机器学习，大数据/自然语言处理/算法全有了

PS:文章主要转载自CSDN大神"黑夜路人"的文章: http://blog.csdn.NET/heiyeshuwu/article/details/43483655 本文主要对机器学习进行科普,包括机器学习的定义.范围.方法,包括机器学习的研究领域:模式识别.计算机视觉.语音识别.自然语言处理.统计学习和数据挖掘.这是一篇非常好的文章,尤其感学原文作者~ http://www.thebigdata.cn/JieJueFangAn/1308

一文读懂机器学习，大数据/自然语言处理/算法全有了……

原文地址 http://www.open-open.com/lib/view/open1420615208000.html http://www.cnblogs.com/subconscious/p/4107357.html 引论在本篇文章中,我将对机器学习做个概要的介绍.本文的目的是能让即便全然不了解机器学习的人也能了解机器学习.而且上手相关的实践.这篇文档也算是 EasyPR开发的番外篇.从这里開始.必须对机器学习了解才干进一步介绍EasyPR的内核.当然,本文也面对一般读者.不会对阅读有

90天，从Java转机器学习面试总结

前言辗转几年Java开发,换了几份工作,没一个稳定的学习.工作过程.中间也相亲几次,都是没啥结果.换工作频繁也严重打乱了和姑娘接触的节奏.糟心工作连着遇到几次,也怪自己眼光有问题. 2018也找了2次工作,中间有4.5个月没有工作.看了个世界杯,看了个亚运会.也怪自己这段时间一直是换工作.找工作,节奏太乱了.当然,节奏不乱也可能不会比现在好吧.谁说的准呢? Java转机器学习--为啥呢? 主要有以下三方面原因: 1.Java感觉遇到瓶颈.Spring.Mytatis.设计模式等等,源码看不动

机器学习面试问题总结

在此记录下常见的机器学习面试问题. 判别式模型和生成式模型的区别? 判别方法:由数据直接学习决策函数 Y = f(X),或者由条件分布概率 P(Y|X)作为预测模型,即判别模型. 生成方法:由数据学习联合概率密度分布函数 P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型. 由生成模型可以得到判别模型,但由判别模型得不到生成模型. 常见的判别模型有:K近邻.SVM.决策树.感知机.线性判别分析(LDA).线性回归.传统的神经网络.逻辑斯蒂回归.boosting.条件随机场

算法学习？挑战高薪的必经之路！让面试官满意的排序算法（图文解析）

让面试官满意的排序算法(图文解析) 这种排序算法能够让面试官面露微笑这种排序算法集各排序算法之大成这种排序算法逻辑性十足这种排序算法能够展示自己对Java底层的了解这种排序算法出自Vladimir Yaroslavskiy.Jon Bentley和Josh Bloch三位大牛之手,它就是JDK的排序算法--java.util.DualPivotQuicksort(双支点快排) 想看以往学习内容的朋友可以看我的GitHub:https://github.com/Meng997998/And

22种代码的坏味道，一句话概括

22种代码的坏味道,一句话概括: 假设一段代码是不稳定或者有一些潜在问题的,那么代码往往会包括一些明显的痕迹. 正如食物要腐坏之前,常常会发出一些异味一样. 我们管这些痕迹叫做"代码异味". 參考资料: http://blog.csdn.net/sulliy/article/details/6635596 http://sourcemaking.com/refactoring/bad-smells-in-code Code smells Duplicated Code --------

Python机器学习实战<三>：k-邻近算法

安装说明参考openssl源码文件夹下INSTALL.W32 step1 环境搭建安装perl,Visual Studio 2008 下载Openssl最新版源码.我下的版本为OpenSSL-1.0.0g. step2 启动Visual Studio 2008 Command Prompt 运行bin\vcvars32 设置环境变量注意: 如遇反馈"此处不应该有/Microsoft",参考错误1. step3 VS命令行窗口cd至openssl源码文件夹执行以下命令 $perl