STL-10 dataset
STL-10为了发展无监督特征学习、深度学习、自我学习算法而建立的图片识别数据集。受CIFAR10数据集的启发,但做了一些修正。每一类有比CIFAR10更少的标定的训练样本,但有非常大的未标记样本在进行监督训练前提供给模型。主要的挑战在于好好利用未标记的数据(来源类似但分布不同于标记的数据)来建立一个有用的先验。也期望数据集的更大的分辨率(96x96)能使其成为一个更具有可扩展性的无监督学习方法的更具挑战性的基准。
综述:
时间: 2024-10-09 23:24:54