模式识别(Pattern Recognition)学习笔记(七)——线性分类器及线性判别函数

1.为什么要设计分类器?

回顾下前面学习的统计决策,也就是贝叶斯决策,它可以简单被划分为两步,首先根据样本进行PDF估计,然后根据估计出的PDF来求分类面,因此又经常被叫做两步贝叶斯决策。如果我们能够很好地估计出PDF模型,也总可以利用贝叶斯来实现两类甚至多类的最优分类,但是很多实际情形中,想要精准的估计出PDF模型,并非易事,尤其当样本存在高维特征空间,以及样本数量并不足够多的情况,本质上来说,模式识别的真正目的并非估计PDF模型,而是在特征空间中想方设法找到各类的分界线或分界面。因此,如果可以直接根据样本就能求出分类面,是不是就可以省略估计PDF模型这一步而回归本质呢,答案是肯定的,这篇博客就来学习学习有关基于样本直接设计分类器的有关知识。

2.设计分类器的三大基本要素

基于样本直接设计分类器需要确定以下三个基本要素:

a.判别函数的类型,即从什么样的判别函数(集)中求分类面;

b.分类器设计的目标或准则,在确定了准则后,分类器设计就是根据样本从确定好的判别函数(集)中选择出在该准则下的最优函数,一般来说就是确定函数中的某些特定参数;

c.前两个要素都确定好了,剩下的工作就是设计可以搜索到最优函参的算法;

总的来说,就是判别函数、判别准则以及优化算法,为表达简洁,上述三要素可以用数学形式来描述:在判别函数(集)中确定待定参数,使得准则函数最大化或者最小化。

3.什么是线性分类器?

不同的判别函数,不同的判别准则,以及不同的优化算法都决定了不同分类器的设计方法,其中判别函数最为关键,因为判别函数就是我们要根据样本所寻找的各类之间的分类面,找到了最优分类面,分类基本上就很好解决了;当判别函数为线性函数时,这样设计出的分类器就叫做线性分类器或线性判别方法,线性分类器是最简单的一种分类器,在一般情况下,线性分类器只能是次优分类器,但是由于其设计简单,而且在一些情况(例如样本分布服从正态分布且各类协方差矩阵相等)下,判别函数可以是最小错误率或最小风险意义下的最优分类器
,因此应用比较广泛,尤其是在有限样本的情况下甚至可以做到比非线性分类器效果更好。

4.什么是线性判别函数?

首先给出判别函数的一般表达式,两类情况为:

    (1)

则多类情况为:       (2),c代表共有c类。

为了简单起见,仍然采用两类情况来进行推导。公式(1)中,x是d维的样本特征向量,又叫做样本向量,w是权重向量,分别表示如下:

而w0是个常值,叫做阈值权。对于两类问题,可以采用如下决策规则:令,如果g(x)>0,则判到1类,如果g(x)<0,则判到2类,如果g(x)=0,则判到任意类或者reject。因此g(x)=0方程定义了一个决策面(或分类面),可以将两类的点分开,当g(x)是线性时,该决策面就是一个超平面(hyper
plane)。下面,来进行判别函数的几何推导:

假设有两个样本x1和x2,它们同落在决策面H上,那么有:

明显,w是分类面H的法向量,它决定了决策面H的方向;因此对于一个被分成两个半平面R1和R2的H来说,当x落在R1中时,法向量w是指向R1的,即R1中的所有样本x都在分类面H的正侧,于是R2中的所有样本x都在H的负侧,如图:

此时,线性判别函数g(x)可以看成是样本特征空间中某一点x到分类面H的距离的一种代数度量;设上图中落入R1中的样本x特征点到H的距离向量为r,则根据向量性质可得到:

于是,将上式代入我们的一般式(1)中,得到:

因此,,当样本x=0(原点),可计算出原点到分类面的距离:

    或    

容易知道,w0的值其实就决定了分类面H的位置,如果w0>0,则原点在分类面的正侧;w0<0,则原点在H的负侧;w0=0,表明判别函数齐次,H过原点。

由上面的推导可以看出,判别函数g(x)其实就是某一样本点x到分类面H的代数距离,当x在H正侧,g(x)>0;当x在H负侧,g(x)<0;当x在H上,g(x)=0。

时间: 2024-07-29 13:19:59

模式识别(Pattern Recognition)学习笔记(七)——线性分类器及线性判别函数的相关文章

Linux System Programming 学习笔记(七) 线程

1. Threading is the creation and management of multiple units of execution within a single process 二进制文件是驻留在存储介质上,已被编译成操作系统可以使用,准备执行但没有正运行的休眠程序 进程是操作系统对 正在执行中的二进制文件的抽象:已加载的二进制.虚拟内存.内核资源 线程是进程内的执行单元 processes are running binaries, threads are the smal

第十七篇:博采众长--初探WDDM驱动学习笔记(七)

基于WDDM驱动的DirectX视频加速重定向框架设计与实现 现在的研究生的论文, 真正质量高的, 少之又少, 开题开得特别大, 动不动就要搞个大课题, 从绪论开始到真正自己所做的内容之间, 是东拼西凑地抄概念, 抄公式, 达到字数篇幅的要求, 而自己正真做了什么, 有哪些实际感受, 做出的内容, 相比前面的东拼西凑就几点内容, 之后就草草结束, 步入感谢的段落. 原因不光只有学生自己, 所谓的读研, 如果没有一个环境, 学生有再大的愿望, 再强的毅力, 到头来也只是空无奈. 有些导师要写书,

马哥学习笔记七——LAMP编译安装之MYSQL

1.准备数据存放的文件系统 新建一个逻辑卷,并将其挂载至特定目录即可.这里不再给出过程. 这里假设其逻辑卷的挂载目录为/mydata,而后需要创建/mydata/data目录做为mysql数据的存放目录. 2.新建用户以安全方式运行进程: # groupadd -r mysql # useradd -g mysql -r -s /sbin/nologin -M -d /mydata/data mysql # chown -R mysql:mysql /mydata/data 3.安装并初始化my

Lua学习笔记(七):迭代器与泛型for

1.迭代器与闭包 迭代器是一种支持指针类型的结构,它可以遍历集合的每一个元素.在Lua中我们常常使用函数来描述迭代器,每次调用该函数就返回集合的下一个元素. 迭代器需要保留上一次成功调用的状态和下一次成功调用的状态,也就是他知道来自于哪里和将要前往哪里.闭包提供的机制可以很容易实现这个任务.记住:闭包是一个内部函数,它可以访问一个或者多个外部函数的外部局部变量.每次闭包的成功调用后这些外部局部变量都保存他们的值(状态).当然如果要创建一个闭包必须要创建其外部局部变量.所以一个典型的闭包的结构包含

python学习笔记七:条件&循环语句

1.print/import更多信息 print打印多个表达式,使用逗号隔开 >>> print 'Age:',42 Age: 42   #注意个结果之间有一个空格符 import:从模块导入函数 import 模块 from 模块 import 函数 from 模块 import * 如果两个模块都有open函数的时候, 1)使用下面方法使用: module1.open()... module2.open()... 2)语句末尾增加as子句 >>> import ma

swift学习笔记(七)自动引用计数

与Object-c一样,swift使用自动引用计数来跟踪并管理应用使用的内存.当实例不再被使用时,及retainCount=0时,会自动释放是理所占用的内存空间. 注:引用计数仅适用于类的实例,因为struct和enumeration属于值类型,也就不牵涉引用,所以其存储和管理方式并不是引用计数. 当一个实例被初始化时,系统会自动分配一定的内存空间,用于管理属性和方法.当实例对象不再被使用时,其内存空间被收回. swift中的引用类型分为三种,即Strong强引用,weak弱引用和无主引用unw

Swift学习笔记七:闭包

闭包可以 捕获 和存储其所在上下文中任意常量和变量的引用. Swift 会为您管理在 捕获 过程中涉及到的内存操作. 在 函数 章节中介绍的全局和嵌套函数实际上也是特殊的闭包,闭包采取如下三种形式之一: 1. 全局函数是一个有名字但不会捕获任何值的闭包 2. 嵌套函数是一个有名字并可以捕获其封闭函数域内值的闭包 3. 闭包表达式是一个可以捕获其上下文中变量或常量值的没有名字的闭包 一.闭包表达式 闭包函数类似于Objective-C中的block.下面我们用事实说话: let counts =

CCNA学习笔记七——路由概述

静态路由协议: 动态路由协议:AS(自治系统):执行统一路由策略的一组设备的集合 EGP(外部网关协议): BGP:边界网关协议 IGP(内部网关协议): 距离矢量协议: RIP:V1,V2 IGRP EIGRP 链路状态路由协议: OSPF IS-IS 静态路由: 特点: 路由表是手工设置的 除非网络管理员干预,否则静态路由不会发生变化 路由表的形成不需要占用网络资源 适合环境 一般用于网络规模很小,拓扑结构固定的网络中 默认路由: 特点: 在所有路由类型中,默认路由优先级最低 适用环境: 一

[傅里叶变换及其应用学习笔记] 七. 傅里叶正(反)变换复习

这份是本人的学习笔记,课程为网易公开课上的斯坦福大学公开课:傅里叶变换及其应用. 傅里叶变换没有统一的定义 符号 傅里叶变换的符号在不同的书籍可能有不同的写法: 如正变换的符号:$\eta f(s)$,$\hat{f}(s)$,$F(s)$ 如反变换的符号:$\eta^{-1}f(t)$,$\check{f}(t)$,$f(t)$ 公式 傅里叶变换的公式也没有统一的写法: 本课程采用的是如下公式 $\eta f(s) = \displaystyle{\int_{-\infty}^{\infty}