模式识别与智能计算学习笔记1

1、概述

1.1基本概念

模式识别的目的是利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。

特征:与识别有关的因素,称为一个特征。

模式:就是样品所具有的特征的描述。

模式识别系统:数据获取——>预处理———>特征提取和选择——>分类决策——>分类器设计

统计模式识别研究的主要问题:特征的选择与优化,分类判别,聚类判别。

1.2特征空间优化设计问题

所选用的特征应具有使同类物体分布具有紧致性,对初始的特征进行改造,目的在于提高某方面的性能,因此又称为特征的优化问题

一般来说,优化就是降维,优化后的特征更有利于分类计算。

两种基本方法:一种是特征选择,一种是组合优化。

特征选择就是筛选,选出一些主要的特征,忽略一些次要的特征。

特征优化就是一种映射变换改造原特征空间,新的特征是原有特征的一个函数,主要限定在线性变换的方法上。

Kanal.L曾经总结过经验;样品数N与特征数n之比应足够大,通常样本数N是特征数n的5~10倍。

总之,特征选择与特征优化的任务是求出一组对分类最有效的特征。有效是指在特征维数减少到同等水平时,其分类性能最佳。

1.3 分类器设计

在统计模式识别中,感兴趣的主要问题并不是决策正误,而是如何使决策错误造成的分类误差在整个识别过程中的风险代价达到最小。这种最优是针对某一种设计原则讲的,这种原则称为一种准则,常用的准则有最小错误率准则,最小风险准则,近邻准则,Fisher准则,均方误差最小准则,感知准则等。设计准则,并使该准则达到最优的条件是设计模式识别最基本的方法。

Fisher准则:根据两类样品一般类内密集,类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样品在该方向上的投影满足雷内尽可能密集,类间尽可能分开的原则,把它们投影到任意一根直线上,又可能不同类别的样品就混在一起了,无法区分。

感知准则:使错误分类样品到分界面距离之和最小为原则。提出利用错误提供信息实现迭代修正的学习原理,即利用错分类提供信息修正错误。这种准则是人工神经元网络多层感知器的基础。

1.3.1 分类器设计基本方法

1、模板匹配

最近邻方法,其缺点是计算量大,存储量大,要存储的模板多,

2、判别函数

(1)基于概率统计的分类法

(2)判别函数分类法 判别分类器不依赖于条件概率密度的知识,可以理解为通过几何的方法,把特征空间分解为对应于不同类别的子空间。

3、神经网络分类

从输入空间到输出空间的一个非线性映射,它通过调整权重和阈值来“学习”或发现变量间的关系,实现对事物的分类。由于神经网络是一种对数据分布无任何要求的非线性技术,它能有效解决非正态分布、非线性的评价问题,因而受到广泛的应用。

4、基于规则推理法

通过样本训练集构造推理规则进行模式分类,主要有决策树和粗糙集理论。决策树学习室以实例为基础的归纳学习算法。决策树是以实例为基础的归纳学习算法。它着眼于从一组无次序、无规则的实例中推理出决策树表示形式的分类规则。

粗糙集理论反映了认知过程在非确定、非模型信息处理方面的机制和特点,是一种有效的非单调推理工具。粗糙集以等价关系为基础,用上、下近似两个集合来逼近任意一个集合,该集合的边界区域被定为上近似集合下近似集之差集。

1.3.2 判别函数

无论用概率统计的分类方法还是应用几何分类法,最终都转化为确定判别函数形式。确定分界面方程包括选择函数类型与确定最佳参数两个部分。一般来说,选择函数室友设计者确定的,但其参数的确定准则是通过一个学习过程来实现的,是一个迭代实现优化的过程。

线性分类器设计:

(1)确定使用的判别函数类型或决策面方程类型,如线性分类器,分段线性分类器,非线性分类器或近邻法

(2)按需要确定一准则函数J,如Fisher算法,感知器算法,增量校正算法,LMSE算法。

(3)确定准则函数J达到极值W*的具体数值,从而确定判别函数,完成分类器的设计。

这种方法没有使用样本的统计参数,称为非参数判别分类法。

时间: 2024-08-21 16:11:19

模式识别与智能计算学习笔记1的相关文章

智能指针学习笔记

1. 介绍 本文介绍智能指针的使用.智能指针是c++ 中管理资源的一种方式,用智能指针管理资源,不必担心资源泄露,将c++ 程序员 从指针和内存管理中解脱出来,再者,这也是c++发展的趋势(这话不是我说的,见<Effective c++>和<c++实践编程>),应该认真学习一下. 智能指针中,最有名的应该数auto_ptr,该智能指针已经被纳入标准库,只需要包含<memory>头文件即可以使用,另外,TR1文档定义的shared_ptr和weak_ptr也已经实现(我用

SCSF智能客户端学习笔记(一)

什么是智能客户端 要了解智能客户端,首先要认识瘦客户端技术和胖客户端技术各自的优缺点. 对于前者,典型的应用就是使用浏览器,通过输入URL远程访问服务端,并向服务端发送命令,获取服务端的资源,然后在客户端的浏览器上显示出来.由于这种技术数据库存放在服务端,客户端应用界面的也是由服务端的文件生成,因此在客户端上占用资源少,对客户端的设备要求不高,只需一个浏览器软件和可用的网络便能开始工作,另外,如果系统需要升级修改,只需要在服务端更新文件,当客户再次访问时,就可以使用新的应用系统了,因而部署和升级

《利用python进行数据分析》NumPy基础:数组和矢量计算 学习笔记

一.有关NumPy (一)官方解释 NumPy is the fundamental package for scientific computing with Python. It contains among other things: a powerful N-dimensional array object sophisticated (broadcasting) functions tools for integrating C/C++ and Fortran code useful

struts2学习笔记(二)—— 获取登录信息及计算在线人数

实现目的: 1.点击"Login"的超链接,进入登录页面 2.填写登录信息,提交表单,将用户信息保存进Session 3.显示用户名,并计算在线人数 4.点击"Logout"的超链接,在线人数减一,并使Session失效 Struts2实现: 1.配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http:/

现代C++学习笔记之一入门篇:智能指针(C++ 11)

原始指针:通过new建立的*指针 智能指针:通过智能指针关键字(unique_ptr, shared_ptr ,weak_ptr)建立的指针 在现代 C++ 编程中,标准库包含智能指针,该指针用于确保程序不存在内存和资源泄漏且是异常安全的. 在现代 C++ 中,原始指针仅用于范围有限的小代码块.循环或者性能至关重要且不会混淆所有权的 Helper 函数中. 1 void UseRawPointer() 2 { 3 // Using a raw pointer -- not recommended

angular学习笔记(五)-阶乘计算实例(1)

<!DOCTYPE html> <html ng-app> <head> <title>2.3.2计算阶乘实例1</title> <meta charset="utf-8"> <script src="../angular.js"></script> <script src="script.js"></script> </

Perl语言学习笔记 15 智能匹配与give-when结构

1.智能匹配操作符 替代绑定操作符: 在哈希中查找某一个键: 比较两个数组是否完全相同: 查找列表中是否存在某个元素: 智能匹配操作符与顺序无关,~~ 左右元素可以互换 2.智能操作符优先级 3.given语句 相当于c语言的switch语句 4.given可以测试多个条件,在default前用break,否则会导致default一直执行 5.笨拙匹配(正则表达式方式) 6.多个项目的when匹配 可以在语句中间加上其他语句: Perl语言学习笔记 15 智能匹配与give-when结构,布布扣

开源的人工神经网络计算库 FANN 学习笔记 1

开源的人工神经网络计算库 FANN 学习笔记 1 这年头机器学习非常的火,神经网络算是机器学习算法中的比较重要的一种.这段时间我也花了些功夫,学了点皮毛,顺便做点学习笔记. 介绍人工神经网络的基本理论的教科书很多.我正在看的是蒋宗礼教授写的<人工神经网络导论>,之所以选这本书,主要是这本比较薄,太厚的书实在是啃不动.这本书写的也比较浅显,用来入门正合适. 看书的同时也在网上找了找人工神经网络的库代码.感觉 FANN 这个库还不错,就顺道学了学这个库的使用方法. FANN 是个开源的 C 语言实

大数据学习笔记6&#183;社会计算中的大数据(4)

上一篇介绍了LifeSpec项目,这个项目是关于用户理解和用户画像的.这篇是社会计算部分的最后一篇,关于用户连接和图隐私. 用户连接与隐私保护 用户连接与隐私保护有很强的相关性. 上图中,左边有两个网络.对于用户连接,我们的目标是映射这两个网络和连接这些网络中的用户节点.然后,我们就能产生一个更大的网络.这样,用户就能够被连接在一起,我们就可以知道跨网络的用户信息. 但是,如果从隐私的角度来看这个问题,把第一个图看成一个匿名化处理后的图,称其为目标图:把第二张图看成辅助图或者攻击者可获得的信息.