半监督学习有没有意义?

半监督学习的意义在于对比监督学习而言,半监督学习所利用的非标签样本是否能够提高我们的预测准确率。

平滑性假设:若两点x1和x2都位于高密度样本分布区域,且他们的‘距离’很久,那么理想的标签函数(label function)输出y1和y2也是相近的。反而言之, x1和x2位于低密度区域时,y1和y2应当不是很近。

聚类假设:若样本点是属于同一聚类,则他们很可能是属于同一种分类。聚类假设的另一种表述方式:决策面一般分布在低密度区域。

流型假设:高维数据分布在一个低维的流型上。

若满足如上几个假设,则半监督学习就能够获得等于或超过监督学习的预测性能。

来自为知笔记(Wiz)

时间: 2024-10-10 04:30:51

半监督学习有没有意义?的相关文章

半监督学习[转]

0  引言 机器学习(machine learning)是人工智能的核心研究领域,是智能信息处理的重要途径.监督学习(supervised learning)是机器学习中研究最多.应用最广泛的一种学习途径.在传统的监督学习中,学习系统通过对大量的有标记训练样本 (labeled examples) 进行学习,建立模型用于预测未知样本的标记(label).在此,标记对应于示例的输出,用于表征待学习的目标概念. 随着数据收集和存储技术的发展,收集大量缺少标记的数据已相当容易,而为这些数据提供标记则相

监督学习、 非监督学习、 半监督学习

在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning). 非监督学习(Unsupervised learning). 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类.非监督学习:直接对输入数据集进行建模,例如聚类. 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数. 一.监督

机器学习中的有监督学习,无监督学习,半监督学习

在机器学习(Machine learning)领域.主要有三类不同的学习方法: 监督学习(Supervised learning). 非监督学习(Unsupervised learning). 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出数据之间的相应关系.生成一个函数,将输入映射到合适的输出,比如分类. 非监督学习:直接对输入数据集进行建模,比如聚类. 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数. 一.监

半监督学习

概述 监督学习指的是训练样本包含标记信息的学习任务,例如:常见的分类与回归算法: 无监督学习则是训练样本不包含标记信息的学习任务,例如:聚类算法. 在实际生活中,常常会出现一部分样本有标记和较多样本无标记的情形,例如:做网页推荐时需要让用户标记出感兴趣的网页,但是少有用户愿意花时间来提供标记.若直接丢弃掉无标记样本集,使用传统的监督学习方法,常常会由于训练样本的不充足,使得其刻画总体分布的能力减弱,从而影响了学习器泛化性能.那如何利用未标记的样本数据呢?以下参考博客:https://blog.c

半监督学习(三)——混合模型

Semi-Supervised Learning 半监督学习(三) 方法介绍 Mixture Models & EM 无标签数据告诉我们所有类的实例混和在一起是如何分布的,如果我们知道每个类中的样本是如何分布的,我们就能把混合模型分解成独立的类,这就是mixture models背后的机制.今天,小编就带你学习半监督学习的混合模型方法. 混合模型 监督学习 首先,我们来学习概率模型的概念,先来看一个例子: Example 1. Gaussian Mixture Model with Two Co

半监督学习(五)——半监督支持向量机

半监督支持向量机(S3VMs) 今天我们主要介绍SVM分类器以及它的半监督形式S3VM,到这里我们关于半监督学习基础算法的介绍暂时告一段落了.之后小编还会以论文分享的形式介绍一些比较新的半监督学习算法.让我们开始今天的学习吧~ 引入 支持向量机(SVM)相信大家并不陌生吧?但是如果数据集中有大量无标签数据(如下图b),那么决策边界应该如何去确定呢?仅使用有标签数据学得的决策边界(如下图a)将穿过密集的无标签数据,如果我们假定两个类是完全分开的,那么该决策边界并不是我们想要的,我们希望的决策边界是

半监督学习和直推学习的区别

直推学习实际上是半监督学习的一部分. 如果用来学习的数据中未标记数据就是最终要预测的数据,那么就是直推学习: 如果不知道最后用来预测的数据是什么,就是单纯的半监督学习. 原文地址:https://www.cnblogs.com/shona/p/12040342.html

聊聊机器学习中的无监督学习

机器学习分为监督式机器学习.无监督式机器学习和半监督式机器学习.其划分的标准是训练样本是否包含人为标注的结果. (1)监督式机器学习:从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果.监督学习的训练集要求是包括输入和输出,也可以说是特征和目标.训练集中的目标是由人标注的.常见的监督学习算法包括回归分析和统计分类. (2)无监督式机器学习:与监督学习相比,训练集没有人为标注的结果.常见的无监督学习算法有聚类. (3)半监督式机器学习:是监督学习和无监督学习相结合的一种

有监督学习和无监督学习

有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测.这里,所有的标记(分类)是已知的.因此,训练样本的岐义性低. 无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识.这里,所有的标记(分类)是未知的.因此,训练样本的岐义性高.聚类就是典型的无监督学习 附: 机器学习中的方法或范式(paradigm)有很多种分类体系,例如从学习的方式分,有例子中学习.类比学习.分析学习等,但一般来说,现在研究得最多.被认为最有用