对监督学习和非监督学习的理解

监督学习:通过人为地输入带有标签的训练数据集,使计算机训练得到一个较为合适的模型,对未知标签的数据进行预测。常见的监督学习算法:回归和分类。

1.回归(Regression):通常有两个及以上变量,数据一般是连续的,通过训练集变量之间的关系得到一条模拟训练样本的曲线,对未知数据的因变量进行预测,其中包括线性回归和非线性回归。如房价与面积的问题,就是线性回归。

2.分类(Classfication): 通常用于预测某件事发生的概率,也是输入带有标签的训练集,数据一般是离散的,比如推测某人是否患有肺癌,通过样本训练,可以得到自变量(如是否有吸烟史,是否生活在雾霾地区)的权重,根据该权值可以根据危险因素预测他患肺癌的可能性。

非监督学习:由于在许多实际应用中,事先并不知道产生的数据的类别,也没有训练样本对应的类别,所以要从这些没有被标记的数据集学习分类器设计,通过数据之间的内在联系和相似性将他们分成若干类。非监督学习的方法主要有以下两类。

1.基于概率密度函数估计的直接方法:通过分解各个类别的概率密度函数,再将每个类别划分到特征空间,用贝叶斯决策方法设计分类器。

2.基于样本间相似度间接聚类方法:其中非迭代的分级聚类算法——把每一个样本都看成一个类别,给定两个样本相似度的计算方法,计算两个样本的相似度,把相似度最大的类进行合并,在计算新的类与类之间的相似度,直到把相似的所有样本合为一个类为止。

原文地址:https://www.cnblogs.com/feng-fengfeng/p/12041232.html

时间: 2024-11-01 22:25:42

对监督学习和非监督学习的理解的相关文章

Machine learning —Machine learning :分类和聚类,监督学习和非监督学习

印象笔记同步分享:Machine Learning-分类和聚类,监督学习和非监督学习

监督学习与非监督学习的区别

以下是摘抄自知乎上对监督学习与非监督学习的总结,觉得写得很形象,于是记下: 这个问题可以回答得很简单:是否有监督(supervised),就看输入数据是否有标签(label).输入数据有标签,则为有监督学习,没标签则为无监督学习 首 先看什么是学习(learning)?一个成语就可概括:举一反三.此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题 目,懂解题方法,因此考场上面对陌生问题也可以算出答案.机器学习的思路也类似:我们能不能利用一些训练数据(已经做过的题),

监督学习、 非监督学习、 半监督学习

在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning). 非监督学习(Unsupervised learning). 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类.非监督学习:直接对输入数据集进行建模,例如聚类. 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数. 一.监督

Machine Learning — 监督学习与非监督学习

斯坦福大学的Machine Learning课程(讲师是Andrew Ng)公开课是学习机器学习的"圣经",以下内容是听课笔记. 一.何谓机器学习 Machine Learning is field of study that gives computers the ability to learn without being explicitly programmed. 也就是说机器学习不需要制定具体的模型,而是让计算机根据庞大的数据量自己训练模型,与之相对的,例如CFD软件,是建立

监督学习和非监督学习

监督学习 利用标注好信息的样本,经过训练得到一个模型,可以用来预测新的样本 分类 当新来一个数据时,可以自动预测所属类型 应用 对于一幅遥感影像,对其中的部分水体,农田,建筑做好标记通过监督分类的方法得到其余水体.农田.建筑 分类相关的方法 支持向量机:寻找最大化样本间隔的边界 分类决策树 颜色 形状 状态进行分类回归 直线拟合(最小二乘法) 通过已有的训练数据学习一个模型,当新来一个面积数据时,可以自动预测出销售价格 回归的应用 人脸好看程度评分.通过标记分数的图片得出回归模型,输入新的图片就

监督学习与非监督学习

1.监督学习 是有特征和标签的,即便是没有标签的,机器也是可以通过特征和标签之间的关系,判断出标签.监督学习是通过训练让机器自己找到特征和标签之间的联系,在以后面对只有特征而没有标签的数据时可以自己判别出标签.相当于给定数据,预测标签.常见的有监督学习算法:回归分析和统计分类. 2.非监督学习 由于训练数据中只有特征没有标签,所以就需要自己对数据进行聚类分析,然后就可以通过聚类的方式从数据中提取一个特殊的结构.输入的数据没有标记,也没有确定的结果,只有特征,没有标签.无监督学习的方法分为两大类:

第五章 非监督学习

0 写在前面 前两天多看了两章一直都没更新,今天写的时候发现有些忘了,刚好捡起来回顾一下,近来也没什么事,兴趣来了就在图书馆泡一天看看自己喜欢的.再次重复下,这是第一遍,加之基础不好,明年才有可能出去实习,现在主要看看大概的知识框架,后续还会回头细看.扯远啦,步入正题. 相比于监督学习,非监督学习的输入数据没有标签信息,需要通过算法模型来挖掘数据内在的结构和模式.非监督学习主要包括两大类学习方法:数据聚类和特征变量关联. 1 K均值聚类 分类问题属于监督学习范畴,而聚类则是非监督学习.K-mea

有监督学习和无监督学习

有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测.这里,所有的标记(分类)是已知的.因此,训练样本的岐义性低. 无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识.这里,所有的标记(分类)是未知的.因此,训练样本的岐义性高.聚类就是典型的无监督学习 附: 机器学习中的方法或范式(paradigm)有很多种分类体系,例如从学习的方式分,有例子中学习.类比学习.分析学习等,但一般来说,现在研究得最多.被认为最有用

如何区分监督学习(supervised learning)和非监督学习(unsupervised learning)

监督学习:简单来说就是给定一定的训练样本(这里一定要注意,样本是既有数据,也有数据对应的结果),利用这个样本进行训练得到一个模型(可以说是一个函数),然后利用这个模型,将所有的输入映射为相应的输出,之后对输出进行简单的判断从而达到了分类(或者说回归)的问题.简单做一个区分,分类就是离散的数据,回归就是连续的数据. 非监督学习:同样,给了样本,但是这个样本是只有数据,但是没有其对应的结果,要求直接对数据进行分析建模. 比如我们去参观一个画展,我们完全对艺术一无所知,但是欣赏完多幅作品之后,我们也能