自问自答 学习系列(1):从图像分类,到损失函数,到神经网络

1.图像分类的挑战:

  • 视角变化(Viewpoint variation:同一个物体,摄像机可以从多个角度来展现。
  • 大小变化(Scale variation:物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
  • 形变(Deformation:很多东西的形状并非一成不变,会有很大变化。
  • 遮挡(Occlusion:目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
  • 光照条件(Illumination conditions:在像素层面上,光照的影响非常大。
  • 背景干扰(Background clutter:物体可能混入背景之中,使之难以被辨认。
  • 类内差异(Intra-class variation:一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。

2.Nearest Neighbor 分类器和 K-Nearest Neighbor分类器的 原理公式 以及区别,联系

KNN是寻找K个相似的图片的标签。分别投票,选出最相似的标签。

L1  L2

3.交叉验证的到 htperparameter的原理:

数据只有1000个,我们分成5分,用其中4分训练,剩下的一份来验证,如此循环。

4.NN分类器的优缺点

优点:易于理解,实现简单,测试耗费时间长。因为要与测试的每一张图片进行比较。 将所有的数据都存储起来,过于浪费资源。

5.基于 4的优缺点,我们提出了使用Score function 和 Loss function 来进行图像分类,将图像分类变成一个最优化问题,这是如何实现的?

关键点 :将图像到标签值的参数化映射,也就是 Score function ,一个线性得分函数:

6.小知识点:将权重和偏置参数合并的技术:

时间: 2024-11-23 12:20:11

自问自答 学习系列(1):从图像分类,到损失函数,到神经网络的相关文章

【深度学习系列1】 深度学习在腾讯的平台化和应用实践(转载)

转载:原文链接 [深度学习系列1] 深度学习在腾讯的平台化和应用实践 引言:深度学习是近年机器学习领域的重大突破,有着广泛的应用前景.随着Google公开 Google Brain计划,业界对深度学习的热情高涨.腾讯在深度学习领域持续投入,获得了实际落地的产出.我们准备了四篇文章,阐述深度学习的原理和在腾讯的实 践,介绍腾讯深度学习平台Mariana,本文为第一篇. 深度学习(Deep Learning)是近年来机器学习领域的热点,在语音识别.图像识别等领域均取得了突破性进展.腾讯提供广泛的互联

自问自答之VR遐想

先让我组织一下语言,作为表达能力超弱的战五渣来讲,归纳总结什么的最要命了. 我可以给你分析个1到N条出来,但是一般来讲没什么顺序,想到什么就说什么.而且我属于线性思维,有一个引子就可以按着话头一步步发散,但是特别容易舍本逐末.就是说,我能想到一个东西的用法,如果沿着该物品的思维线联想,可以想到其生产地.原料等等.但是,我为何会想到它呢?我可能就忘了我的初衷.比如现在就跑题了~ 为何要取名叫自问自答呢?这是因为我要先有个任务,然后才有完成任务的动力及目标.如果只是自由表述,那我能扯到外太空去.当然

《一个销售的VMWARE学习系列之一 ----虚拟化的理解》

作为一个销售,面对客户的不同问题需求,为了能更好的解决客户的不同问题,以及将产品的优势展现出来,所以下定决心我也要学习VMWARE虚拟化与云服务. 首先,经常会被客户问起一些关于虚拟化的问题?如下: 1.虚拟机稳定吗? 2.为什么要使用虚拟化啊? 3.虚拟化能带来什么好处啊? 4.主机坏了,是不是所有虚拟机都不能用啊? 5.虚拟机容易管理吗? 6.可以把现在的物理机迁移到虚拟机上吗? 7.虚拟机怎样备份啊? 为了能更好的解决客户的问题,我也问了度娘很多问题,下面就简单的一一解答: 问题一:虚拟机

【深度学习系列3】 Mariana CNN并行框架与图像识别

[深度学习系列3] Mariana CNN并行框架与图像识别 本文是腾讯深度学习系列文章的第三篇,聚焦于腾讯深度学习平台Mariana中深度卷积神经网络Deep CNNs的多GPU模型并行和数据并行框架. 将深度卷积神经网络(Convolutional Neural Networks, 简称CNNs)用于图像识别在研究领域吸引着越来越多目光.由于卷积神经网络结构非常适合模型并行的训练,因此以模型并行+数据并行的方式来加速Deep CNNs训练,可预期取得较大收获.Deep CNNs的单机多GPU

【深度学习系列4】深度学习及并行化实现概述

[深度学习系列4]深度学习及并行化实现概述 摘要: 深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别.图像识别和检索.自然语言理解等.深层模型是包含多个隐藏层的人工神经网络,多层非线性结构使其具备强大的特征表达能力和对复杂任务建模能力.训练深层模型是长期以来的难题,近年来以层次化.逐层初始化为代表的一系列方法的提出给训练深层模型带来了希望,并在多个应用领域获得了成功.深层模型的并行化框架和训练加速方法是深度学习走向实用的重要基石,已有多个针对不同深度模型的开源实现,Google.Fac

Deep Learning(深度学习)学习系列之(一)

Deep Learning(深度学习)学习笔记整理系列 http://blog.csdn.net/gggg_ggg?viewmode=contents   声明: 1)该Deep Learning的学习系列是整理自网上很大牛和机器学习专家所无私奉献的资料的.具体引用的资料请看参考文献.具体的版本声明也参考原文献. 2)本文仅供学术交流,非商用.所以每一部分具体的参考资料并没有详细对应.如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除. 3)本人才疏学浅,整理总结的时候难免出错,还望各位

FineBI学习系列之FineBI官网提供的程序数据集(图文详解)

不多说,直接上干货! 这是来自FineBI官网提供的帮助文档 http://help.finebi.com/http://help.finebi.com/doc-view-31.html 目录: 1.描述 2.实现原理 3.案例 1.描述 由上一节BI可能通过设计器远程服务器的方式,以服务器数据集的形式来连接数据. 这样其数据来源可以是数据库数据,还可以是其它任何类型的数据,因为BI是通过AbstractTableData抽象类来读取数据源的,而上述所有的数据来源都继承实现其抽象方法,因此BI可

系统改版自问自答

系统改版,尤其是erp系统.资产管理等后台系统的改版,尤其要慎重,改版优化之前,先要做几个自问自答,帮助自己梳理好设计思路. 首先,为什么要改版 现存系统最大的问题是什么,为什么要改版? 具体可以通过访谈使用者.模拟使用场景.新人系统自学后访谈等方式,提炼各路人马在体验系统使用之后遇到的问题. 举个例子,假设你得到的原因有如下几个: 使用者人员流动大 严谨的专业词汇(toB产品的特性) 功能叠加无整体性 功能入口不明确 流程逻辑不易理解 缺乏一致性. 怎么改 根据系统改版原因,制定设计目标 由业

Android学习系列(17)--App列表之圆角ListView(续)

http://www.cnblogs.com/qianxudetianxia/archive/2011/09/19/2068760.html 本来这篇文章想并到上篇Android学习系列(16)--App列表之圆角ListView中的,但是若是如此就让大家错过一篇新的好的文章,着实可惜.上篇中我们使用shape,corners,gradient实现了一个渐变的圆角效果,但是在完文之后的实践中,我发现有时效果不甚满意,选中和放手的事件监听没有去正确的判断,然后渐变效果也比较单一,性能也觉得不是很快