李飞飞计算机视觉学习总结三

学习线性分类器

学习内容提要：

第二讲：图像分类

数据驱动方法

1.1. 收集大量的图像数据及标签

1.2. 使用机器学习算法训练一个分类器

1.3. 使用新图像衡量训练的分类器
近邻算法
2.1. 算法描述：

训练数据集合为 T={（x1,y1）,（x2,y2）,...,（xn，yn）}

其中Xi是一个n维的特征向量，Yi为实例对应类别

2.2. 距离向量

根据给定的度量，在训练集合中找出与x轴距离最近的k个点（k=1时为近邻算法）

2.3. 分类决策规则（k>1的时候->KNN）

根据分类决策规则（如对数表决，加权方法等）决定x的类别y
KNN算法（K-Nearest Neighbor）
3.1. 三要素：K的值的选择，距离度量，分类决策规则

3.2. 过程：训练数据集合T，选择K值，度量距离（L1或者L2）

3.3. 复杂度分析

a. 训练复杂度：KNN算法只是将训练数据及标签先保存，并不涉及某些运算，复杂度为o(1)

b. 测试复杂度：对于某个样本，需要与数据标签逐一进行对比，计算量与数据大小有关，复杂度为o(N)
线性分类器
4.1. 概念：通过特征的线性组合来作出分类决定（如感知机，svm，Fisher，Logistic）

对于32*32*3一张图彩色图，f(x,w)线性分类器与knn区别

线性分类器模型函数f(x,w)=wx+b （可以看成一种模板匹配方法）

线性分类器的缺点也就是存在的问题

Ps: f(x,w)线性分类器与knn区别线性分类器的缺点也就是存在的问题

打卡内容：

f(x,w)线性分类器与knn区别

1.1. KNN: 计算一个点A与其他所有点之间的距离，取出与该点最近的k个点，然后统计这k个点里面所属分类比例最大的，则点A属于该分类
1.2. f(xi,W,b)=Wxi+b :参数W被称为权重（weights）。b被称为偏差向量（bias vector）

1.3. knn需要保留训练数据，而线性分类器只需要保留训练好的权重w即可，线性分类器可运行在小型设备上
线性分类器为什么可以看成一种模板匹配方法

2.1. 权重W的另一个解释是它的每一行对应着一个分类的模板（有时候也叫作原型）,一张图像对应不同分类的得分，是通过使用内积（也叫点积）来比较图像和模板，然后找到和哪个模板最相似。从这个角度来看，线性分类器就是在利用学习到的模板，针对图像做模板匹配。

2.2. 高效地使用k-NN，没有使用所有的训练集的图像来比较，而是每个类别只用了一张图片（这张图片是我们学习到的，而不是训练集中的某一张），使用（负）内积来计算向量间的距离，而不是使用L1或者L2距离。
线性分类器的缺点也就是存在的问题

线性分类器优缺点：算法简单和具有“学习”能力，线性分类器速度快、编程方便；但是可能拟合效果不会很好。
分析代码实现的任务是什么，每个函数模块实现的功能是什么，代码运行的逻辑

研究中

原文地址：https://www.cnblogs.com/feng2019/p/11990947.html

时间： 2024-11-05 03:16:18

李飞飞计算机视觉学习总结三的相关文章

李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程

目前,深度学习和深度强化学习已经在实践中得到了广泛的运用.资源型博客sky2learn整理了15个深度学习和深入强化学习相关的在线课程,其中包括它们在自然语言处理(NLP),计算机视觉和控制系统中的应用教程. 这些课程涵盖了神经网络,卷积神经网络,循环网络和其变体,训练深度网络的困难,无监督表示学习,深度信念网络,深玻尔兹曼机器,深度Q学习,价值函数估计和优化以及蒙特卡洛树搜索等多种算法的基础知识. 吴恩达:深度学习专项这系列课程侧重于讲解深度学习的基础和在不同领域的运用方式,如医疗健康,自动

李飞飞、王海峰……悉数那些人工智能领域的传火者

12月14日的谷歌开发者大会上,身着红衣的李飞飞不仅激荡起了台下的掌声,还成为了各路媒体报道中讨论的焦点.这不得不让人感叹,我们又回到了崇拜科学家的时代. 或许是因为人工智能本身就是一个学术话语权极强的领域,现在的AI企业不管体量大小,往往都有教授.专家坐镇,发布论文的数量和学术竞赛排名,似乎也成了考量企业技术含金量的标准. 可问题的关键是,我们不仅优秀的科研成果,更需要能把技术从论文中带到我们身边的传火者.今天就来谈谈,怎样才能称得上人工智能领域的传火者. 论文产品化:象牙塔内外的海水与火焰

2017年度好视频，吴恩达、李飞飞、Hinton、OpenAI、NIPS、CVPR、CS231n全都在

我们经常被问:机器翻译迭代了好几轮,专业翻译的饭碗都端不稳了,字幕组到底还能做什么? 对于这个问题,我们自己感受最深,却又来不及解释,就已经边感受边做地冲出去了很远,摸爬滚打了一整年. 其实,现在看来,机器翻译在通用领域的短句上,已经做得不错了,但是复杂长句.需要结合上下文语境.特定知识的翻译上,效果还远远不能让人满意. 人工智能领域的翻译,就属于后者.它不仅需要数学.编程知识打底,对特定专业表达进行界定,还需要适时结合上下文语境理解和延伸. 这样一来,你也许能够理解,忠于原意又有人情味的翻译很

Windows API 编程学习记录<三>

恩,开始写API编程的第三节,其实马上要考试了,但是不把这节写完,心里总感觉不舒服啊.写完赶紧去复习啊在前两节中,我们介绍了Windows API 编程的一些基本概念和一个最基本API函数 MessageBox的使用,在这节中,我们就来正式编写一个Windows的窗口程序. 在具体编写代码之前,我们必须先要了解一下API 编写窗口程序具体的三个基本步骤: 1. 注册窗口类: 2.创建窗口: 3.显示窗口: 恩,

Caliburn.Micro学习笔记(三)----事件聚合IEventAggregator和 Ihandle<T>

Caliburn.Micro学习笔记(三)----事件聚合IEventAggregator和 Ihandle<T> 今天说一下Caliburn.Micro的IEventAggregator和IHandle<T>分成两篇去讲这一篇写一个简单的例子看一它的的实现和源码下一篇用它们做一个多语言的demo 这两个是事件的订阅和广播,很强大,但用的时候要小心发生不必要的冲突. 先看一下它的实现思想在Caliburn.Micro里EventAggregator要以单例的形式出现这样可以

WebService学习总结(三)——使用JDK开发WebService

WebService学习总结(三)——使用JDK开发WebService一.WebService的开发手段使用Java开发WebService时可以使用以下两种开发手段 1. 使用JDK开发(1.6及以上版本) 2.使用CXF框架开发(工作中)二.使用JDK开发WebService2.1.开发WebService服务器端 1.定义一个interface,使用@WebService注解标注接口,使用@WebMethod注解标注接口中定义的所有方法,如下所示:复制代码 1 package me.g

OpenCV for Python 学习笔记三

给源图像增加边界 cv2.copyMakeBorder(src,top, bottom, left, right ,borderType,value) src:源图像 top,bottem,left,right: 分别表示四个方向上边界的长度 borderType: 边界的类型有以下几种: BORDER_REFLICATE # 直接用边界的颜色填充, aaaaaa | abcdefg | gggg BORDER_REFLECT # 倒映,abcdefg | gfedcbamn | nmabcd

Android学习Scroller(三)——控件平移划过屏幕 (Scroller简单使用)

MainActivity如下: package cc.cn; import android.os.Bundle; import android.view.View; import android.view.View.OnClickListener; import android.widget.Button; import android.app.Activity; /** * Demo描述: * Scroller使用示例--让控件平移划过屏幕 * * 参考资料: * http://blog.cs

NFC学习笔记——三（在windows操作系统上安装libnfc）

本篇翻译文章: 这篇文章主要是说明如何在windows操作系统上安装.配置和使用libnfc. 一.基本信息 1.操作系统: Windows Vista Home Premium SP 2 2.硬件信息: System: Dell Inspiron 1720 Processor: Intel Core 2 Duo CPU T9300 @ 2.5GHz 2.5GHz System type: 32-bit Operating System 3.所需软件: 在windows操作系统上安装软件需要下列