1.图像分类的挑战:
- 视角变化(Viewpoint variation):同一个物体,摄像机可以从多个角度来展现。
- 大小变化(Scale variation):物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
- 形变(Deformation):很多东西的形状并非一成不变,会有很大变化。
- 遮挡(Occlusion):目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
- 光照条件(Illumination conditions):在像素层面上,光照的影响非常大。
- 背景干扰(Background clutter):物体可能混入背景之中,使之难以被辨认。
- 类内差异(Intra-class variation):一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。
2.Nearest Neighbor 分类器和 K-Nearest Neighbor分类器的 原理公式 以及区别,联系
KNN是寻找K个相似的图片的标签。分别投票,选出最相似的标签。
L1 L2
3.交叉验证的到 htperparameter的原理:
数据只有1000个,我们分成5分,用其中4分训练,剩下的一份来验证,如此循环。
4.NN分类器的优缺点
优点:易于理解,实现简单,测试耗费时间长。因为要与测试的每一张图片进行比较。 将所有的数据都存储起来,过于浪费资源。
5.基于 4的优缺点,我们提出了使用Score function 和 Loss function 来进行图像分类,将图像分类变成一个最优化问题,这是如何实现的?
关键点 :将图像到标签值的参数化映射,也就是 Score function ,一个线性得分函数:
6.小知识点:将权重和偏置参数合并的技术:
时间: 2024-11-23 12:20:11