半监督学习的意义在于对比监督学习而言,半监督学习所利用的非标签样本是否能够提高我们的预测准确率。
平滑性假设:若两点x1和x2都位于高密度样本分布区域,且他们的‘距离’很久,那么理想的标签函数(label function)输出y1和y2也是相近的。反而言之, x1和x2位于低密度区域时,y1和y2应当不是很近。
聚类假设:若样本点是属于同一聚类,则他们很可能是属于同一种分类。聚类假设的另一种表述方式:决策面一般分布在低密度区域。
流型假设:高维数据分布在一个低维的流型上。
若满足如上几个假设,则半监督学习就能够获得等于或超过监督学习的预测性能。
时间: 2024-10-10 04:30:51