对监督学习和非监督学习的理解

监督学习：通过人为地输入带有标签的训练数据集，使计算机训练得到一个较为合适的模型，对未知标签的数据进行预测。常见的监督学习算法：回归和分类。

1.回归(Regression)：通常有两个及以上变量，数据一般是连续的，通过训练集变量之间的关系得到一条模拟训练样本的曲线，对未知数据的因变量进行预测，其中包括线性回归和非线性回归。如房价与面积的问题，就是线性回归。

2.分类(Classfication): 通常用于预测某件事发生的概率，也是输入带有标签的训练集，数据一般是离散的，比如推测某人是否患有肺癌，通过样本训练，可以得到自变量(如是否有吸烟史，是否生活在雾霾地区)的权重，根据该权值可以根据危险因素预测他患肺癌的可能性。

非监督学习：由于在许多实际应用中，事先并不知道产生的数据的类别，也没有训练样本对应的类别，所以要从这些没有被标记的数据集学习分类器设计，通过数据之间的内在联系和相似性将他们分成若干类。非监督学习的方法主要有以下两类。

1.基于概率密度函数估计的直接方法：通过分解各个类别的概率密度函数，再将每个类别划分到特征空间，用贝叶斯决策方法设计分类器。

2.基于样本间相似度间接聚类方法：其中非迭代的分级聚类算法——把每一个样本都看成一个类别，给定两个样本相似度的计算方法，计算两个样本的相似度，把相似度最大的类进行合并，在计算新的类与类之间的相似度，直到把相似的所有样本合为一个类为止。

原文地址：https://www.cnblogs.com/feng-fengfeng/p/12041232.html

时间： 2024-11-01 22:25:42

对监督学习和非监督学习的理解的相关文章

Machine learning —Machine learning ：分类和聚类，监督学习和非监督学习

印象笔记同步分享:Machine Learning-分类和聚类,监督学习和非监督学习

监督学习与非监督学习的区别

以下是摘抄自知乎上对监督学习与非监督学习的总结,觉得写得很形象,于是记下: 这个问题可以回答得很简单:是否有监督(supervised),就看输入数据是否有标签(label).输入数据有标签,则为有监督学习,没标签则为无监督学习首先看什么是学习(learning)?一个成语就可概括:举一反三.此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目,懂解题方法,因此考场上面对陌生问题也可以算出答案.机器学习的思路也类似:我们能不能利用一些训练数据(已经做过的题),

监督学习、非监督学习、半监督学习

在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning). 非监督学习(Unsupervised learning). 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类.非监督学习:直接对输入数据集进行建模,例如聚类. 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数. 一.监督

Machine Learning — 监督学习与非监督学习

斯坦福大学的Machine Learning课程(讲师是Andrew Ng)公开课是学习机器学习的"圣经",以下内容是听课笔记. 一.何谓机器学习 Machine Learning is field of study that gives computers the ability to learn without being explicitly programmed. 也就是说机器学习不需要制定具体的模型,而是让计算机根据庞大的数据量自己训练模型,与之相对的,例如CFD软件,是建立

监督学习和非监督学习

监督学习利用标注好信息的样本,经过训练得到一个模型,可以用来预测新的样本分类当新来一个数据时,可以自动预测所属类型应用对于一幅遥感影像,对其中的部分水体,农田,建筑做好标记通过监督分类的方法得到其余水体.农田.建筑分类相关的方法支持向量机:寻找最大化样本间隔的边界分类决策树颜色形状状态进行分类回归直线拟合(最小二乘法) 通过已有的训练数据学习一个模型,当新来一个面积数据时,可以自动预测出销售价格回归的应用人脸好看程度评分.通过标记分数的图片得出回归模型,输入新的图片就

监督学习与非监督学习

1.监督学习是有特征和标签的,即便是没有标签的,机器也是可以通过特征和标签之间的关系,判断出标签.监督学习是通过训练让机器自己找到特征和标签之间的联系,在以后面对只有特征而没有标签的数据时可以自己判别出标签.相当于给定数据,预测标签.常见的有监督学习算法:回归分析和统计分类. 2.非监督学习由于训练数据中只有特征没有标签,所以就需要自己对数据进行聚类分析,然后就可以通过聚类的方式从数据中提取一个特殊的结构.输入的数据没有标记,也没有确定的结果,只有特征,没有标签.无监督学习的方法分为两大类:

第五章非监督学习

0 写在前面前两天多看了两章一直都没更新,今天写的时候发现有些忘了,刚好捡起来回顾一下,近来也没什么事,兴趣来了就在图书馆泡一天看看自己喜欢的.再次重复下,这是第一遍,加之基础不好,明年才有可能出去实习,现在主要看看大概的知识框架,后续还会回头细看.扯远啦,步入正题. 相比于监督学习,非监督学习的输入数据没有标签信息,需要通过算法模型来挖掘数据内在的结构和模式.非监督学习主要包括两大类学习方法:数据聚类和特征变量关联. 1 K均值聚类分类问题属于监督学习范畴,而聚类则是非监督学习.K-mea

有监督学习和无监督学习

有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测.这里,所有的标记(分类)是已知的.因此,训练样本的岐义性低. 无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识.这里,所有的标记(分类)是未知的.因此,训练样本的岐义性高.聚类就是典型的无监督学习附: 机器学习中的方法或范式(paradigm)有很多种分类体系,例如从学习的方式分,有例子中学习.类比学习.分析学习等,但一般来说,现在研究得最多.被认为最有用

如何区分监督学习(supervised learning)和非监督学习(unsupervised learning)

监督学习:简单来说就是给定一定的训练样本(这里一定要注意,样本是既有数据,也有数据对应的结果),利用这个样本进行训练得到一个模型(可以说是一个函数),然后利用这个模型,将所有的输入映射为相应的输出,之后对输出进行简单的判断从而达到了分类(或者说回归)的问题.简单做一个区分,分类就是离散的数据,回归就是连续的数据. 非监督学习:同样,给了样本,但是这个样本是只有数据,但是没有其对应的结果,要求直接对数据进行分析建模. 比如我们去参观一个画展,我们完全对艺术一无所知,但是欣赏完多幅作品之后,我们也能

猜你喜欢

前端基本功—javascript 第三天

数组 array 声明数组使用数组使用的方法: 数组名[索引值]; 函数名(); 索引号是从0开始的. 0 1 2 3 4 5 ... 数组的长度数组名.l ...

如何调试分析Android中发生的tombstone

如何调试分析Android中发生的tombstone Android中较容易出现以下三类问题:Force close / ANR / Tombstone 前两者主要是查看当前的进程或者系统框架层的状态 ...

5.1舍罕王的失算

Q 直接看代码吧.再用pow()函数的时候要记住头文件#include<cmath> #include <iostream> #include <cmath> us ...

跟着老男孩学运维-基础篇-论目标的重要性

跟着老男孩学运维-论目标的重要性说起目标,可以说像是在大海中航向的方向,没有方向,就像没有目的的航行一样.自己就是一个列子,所以正好就这个机会,写下来,为自己以后做一个警戒,提醒自己,下面我先说说我 ...

python高级编程之选择好名称:pepe8和命名最佳实践

# # -*- coding: utf-8 -*- # # python:2.x # __author__ = 'Administrator' # my_list=['a','b','c','d'] ...

OC的协议

oc协议在Object-C中,委托和数据源都是由协议实现的.协议定义了一个类与另一个类进行沟通的先验方式. 它们包含一个方法列表,有些是必须被实现的,有些是可选的. 任何实现了必需方法的类都被认为符 ...

飞入购物车

1 <!DOCTYPE html> 2 <html xmlns="http://www.w3.org/1999/xhtml"> 3 <head> ...

数据结构——树

在网络层,互联网提供所有应用程序都要使用的两种类型的服务,尽管目前理解这些服务的细节并不重要,但在所有TCP/IP概述中,都不能忽略他们: 无连接分组交付服务(Connectionless Packe ...

mysql GROUP_CONCAT+ GROUP BY + substring_index获取分组的前几名

mysql方法来源于:http://www.cnblogs.com/jjcc/p/5896588.html ###在网上看到一篇,非常赞的方法比如说要获取班级的前3名,mysql就可以用GROUP_ ...

高斯消元模板

高斯消元: 其实就是用矩阵初等变换解线性方程组,只是他要求每次选取的主元一定要是最大值. 模板 #include <iostream> #include <stdio.h> # ...

TOJ 2596: Music Notes

2596: Music Notes Time Limit(Common/Java):1000MS/10000MS Memory Limit:65536KByteTotal Submit: 3 ...

Utils工具方法集插件详解

var Utils = function(){}; Utils.text = { stripTags: function (val) { return val.replace(/<\/?[^&g ...

c++封装的发邮件类CSendMail

项目需要做发邮件的功能,在网上找了一下代码,比较出名的SMailer编译不过(把那个Base64的encode拉到MailSender中实现就能过,但我搞不懂原来出错的原因,就不想用),另外找到了一个 ...

这是一份优秀的餐饮行业微信营销解决方案

国内最大的微信第三方开发商小猪CMS,旗下产品多用户微营销系统,内置300多项功能与应用,实现全行业覆盖.尤其是针对餐饮行业而开发的微餐饮应用,更是为餐饮实体商户提供了完美.专业的餐饮行业微营销解决方 ...

基于js全屏动画焦点图幻灯片

今天给大家分享一款基于js全屏动画焦点图幻灯片.这款焦点图内的内容以动画形式出现和消失.效果图如下: 在线预览源码下载实现的代码. html代码: <div class="sl ...

html5手机web app <input type="file" > 只调用图库，禁止调用摄像头？

<input type="file" accept="image/*"><input type="file" accept ...

面向工资编程

经常看我专栏的朋友知道,我很少写跟编程无关的话题. 很多人问过我一个问题,知道面向过程编程.面向对象编程,但你的"面向工资编程"是什么意思? 其实说来也惭愧,这个称号本来是程一仕 ...

c# 将窗体从一个project复制到另一个project

步骤 1 : 假设窗体名为 Form1 , 将 Form1.design.cs , Form1.cs , Form1.resx 三个文件copy 到目标文件夹 2 : 先 add existin ...

Thread.join()的使用

代码清单: package com.baidu.nuomi.concurrent; import java.util.concurrent.TimeUnit; /** * Created by son ...

更新日期 2015年8月5日 - Citrix桌面虚拟化平台交付推荐版本及相关hotfix

为了方便大家在使用Citrix产品时选择合适的版本及相应的hotfix补丁,特将相关内容整理如下,并不定期更新. 以下所有内容为个人经验分享,不代表任何Citrix官方建议. 目前Citrix桌面虚拟 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.