<脱机手写汉字识别若干关键技术研究>

脱机手写汉字识别若干关键技术研究

 

对于大字符集识别问题,一般采用模板匹配的算法,主要是因为该算法比较简单,识别速度快。但直接的模板匹配算法往往无法满足实际应用中对识别精度的需求。为此任俊玲编著的《脱机手写汉字识别若干关键技术研究》在模板匹配算法的基础上,结合统计分析和统计信号处理的原理,对脱机手写汉字识别算法以及相关问题进行了研究,力求在基本不降低识别速度的基础上较大地提高识别的精度。

内容简介

书籍
计算机书籍
《脱机手写汉字识别若干关键技术研究》从脱机手写汉字识别为大类别数模式识别问题出发,以在基本不降低识别速度的基础上较大地提高识别的精度为研究目的,就手写汉字库的建立、脱机汉字识别系统的构建、基于统计分析的汉字识别算法中汉字特征的描述、样本选择等问题进行了详尽阐述。

目录

第1章 绪论
1.1 课题的提出
1.2 研究现状分析
1.3 研究内容和主要工作
1.4 本书的结构及安排
参考文献
第2章 脱机手写汉字识别系统的实现
2.1 脱机手写汉字识别系统
2.1.1 识别原理
2.1.2 基于模板匹配的两级脱机手写汉字识别系统
2.2 手写汉字识别系统的特征提取
2.2.1 方向线素的定义
2.2.2 方向线素特征的提取
2.3 基于模板匹配的识别算法
2.4 汉字识别系统的粗分类算法
2.4.1 粗分类特征提取
2.4.2 粗分类时的识别算法
2.5 汉字识别系统的细分类算法
2.5.1 细分类特征提取
2.5.2 细分类时的识别算法

2.6 本章小结
参考文献
第3章 HCL2004脱机手写汉字库及相关研究 
3.1 研究背景及现状
3.2 HCL2000手写汉字数据库
3.2.1 数据库系统模型
3.2.2 汉字样本信息的组织
3.2.3 书写者信息的管理
3.2.4 两种信息的互查方法
3.2.5 HCL2000的数据分布
3.3 对HCL2000数据库进行更新的原因
3.4 手写汉字数据库HCL2004系统模型及实现
3.4.1 汉字样本信息的组织形式
3.4.2 样本集的划分
3.4.3 HCL2004手写汉字数据库的实现
3.5 基于HCL2004数据库的分析
3.5.1 实验系统
3.5.2 训练样本数与识别率
3.5.3 样本质量的选择与识别
3.5.4 基于单字的识别性能分析
3.5.5 关于距离测度分类器性能的分析
3.6 本章小结
参考文献
第4章 基于统计分析的手写汉字识别算法研究
4.1 引言
4.2 几种常用的平均数
4.2.1 均值
4.2.2 中位数
4.3 样本数据的分散程度描述
4.3.1 标准差
4.3.2 极差
4.4 HCL2004数据库样本特征分析
4.5 基于平均数的手写汉字标准模板
4.5.1 基于均值的标准模板
4.5.2 基于分位数的标准模板
4.6 引人数据分散程度参数的距离测度
4.6.1 引入极差的距离测度
4.6.2 引入标准差的距离测度
4.7 实验
4.7.1 不同标准模板分类性能分析
4.7.2 引入不同分散程度参数的距离测度分类性能分析
4.8 本章小结
参考文献
第5章 基于高阶统计量的距离测度
5.1 引言
5.2 在距离测度中引入高阶统计量
5.3 基于二阶标准差的距离测度
5.3.1 二阶标准差的定义
5.3.2 用二阶标准差刻画特征分布的可行性分析
5.3.3 基于二阶标准差的距离测度
5.3.4 实验
5.4 基于高阶统计量的距离测度
5.4.1 3种高阶统计量
5.4.2 基于高阶统计量的距离测度
5.4.3 实验
5.5 本章小结
参考文献
第6章 基于样本聚类的多级汉字识别系统
6.1引言
6.2 基于DB准则的K均值聚类算法
6.2.1 K均值算法
6.2.2 DB有效性准则
6.2.3 基于DB准则的K均值算法
6.3多模板匹配算法
6.3.1 多模板匹配算法原理
6.3.2 多模板匹配算法的设计方案
6.4 实验
6.4.1 实验系统
6.4.2 系统实现
6.4.3 实验结果及分析
6.5 本章小结
参考文献
第7章 基于广义置信度的样本选择算法
7.1 引言
7.2 字符识别的置信度分析
7.2.1 分类器的置信度和广义置信度
7.2.2 分类器的置信度估计
7.3 基于广义置信度的边界样本定义
7.4 基于广义置信度的样本选择算法
7.5 实验结果及分析
7.6 本章小结
参考文献
第8章 结束语

时间: 2025-01-05 07:23:49

<脱机手写汉字识别若干关键技术研究>的相关文章

CI框架源码阅读笔记3 全局函数Common.php

从本篇开始,将深入CI框架的内部,一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说,全局函数具有最高的加载优先权,因此大多数的框架中BootStrap引导文件都会最先引入全局函数,以便于之后的处理工作). 打开Common.php中,第一行代码就非常诡异: if ( ! defined('BASEPATH')) exit('No direct script access allowed'); 上一篇(CI框架源码阅读笔记2 一切的入口 index

IOS测试框架之:athrun的InstrumentDriver源码阅读笔记

athrun的InstrumentDriver源码阅读笔记 作者:唯一 athrun是淘宝的开源测试项目,InstrumentDriver是ios端的实现,之前在公司项目中用过这个框架,没有深入了解,现在回来记录下. 官方介绍:http://code.taobao.org/p/athrun/wiki/instrumentDriver/ 优点:这个框架是对UIAutomation的java实现,在代码提示.用例维护方面比UIAutomation强多了,借junit4的光,我们可以通过junit4的

Yii源码阅读笔记 - 日志组件

?使用 Yii框架为开发者提供两个静态方法进行日志记录: Yii::log($message, $level, $category);Yii::trace($message, $category); 两者的区别在于后者依赖于应用开启调试模式,即定义常量YII_DEBUG: defined('YII_DEBUG') or define('YII_DEBUG', true); Yii::log方法的调用需要指定message的level和category.category是格式为“xxx.yyy.z

源码阅读笔记 - 1 MSVC2015中的std::sort

大约寒假开始的时候我就已经把std::sort的源码阅读完毕并理解其中的做法了,到了寒假结尾,姑且把它写出来 这是我的第一篇源码阅读笔记,以后会发更多的,包括算法和库实现,源码会按照我自己的代码风格格式化,去掉或者展开用于条件编译或者debug检查的宏,依重要程度重新排序函数,但是不会改变命名方式(虽然MSVC的STL命名实在是我不能接受的那种),对于代码块的解释会在代码块前(上面)用注释标明. template<class _RanIt, class _Diff, class _Pr> in

CI框架源码阅读笔记5 基准测试 BenchMark.php

上一篇博客(CI框架源码阅读笔记4 引导文件CodeIgniter.php)中,我们已经看到:CI中核心流程的核心功能都是由不同的组件来完成的.这些组件类似于一个一个单独的模块,不同的模块完成不同的功能,各模块之间可以相互调用,共同构成了CI的核心骨架. 从本篇开始,将进一步去分析各组件的实现细节,深入CI核心的黑盒内部(研究之后,其实就应该是白盒了,仅仅对于应用来说,它应该算是黑盒),从而更好的去认识.把握这个框架. 按照惯例,在开始之前,我们贴上CI中不完全的核心组件图: 由于BenchMa

CI框架源码阅读笔记2 一切的入口 index.php

上一节(CI框架源码阅读笔记1 - 环境准备.基本术语和框架流程)中,我们提到了CI框架的基本流程,这里这次贴出流程图,以备参考: 作为CI框架的入口文件,源码阅读,自然由此开始.在源码阅读的过程中,我们并不会逐行进行解释,而只解释核心的功能和实现. 1.       设置应用程序环境 define('ENVIRONMENT', 'development'); 这里的development可以是任何你喜欢的环境名称(比如dev,再如test),相对应的,你要在下面的switch case代码块中

Apache Storm源码阅读笔记

欢迎转载,转载请注明出处. 楔子 自从建了Spark交流的QQ群之后,热情加入的同学不少,大家不仅对Spark很热衷对于Storm也是充满好奇.大家都提到一个问题就是有关storm内部实现机理的资料比较少,理解起来非常费劲. 尽管自己也陆续对storm的源码走读发表了一些博文,当时写的时候比较匆忙,有时候衔接的不是太好,此番做了一些整理,主要是针对TridentTopology部分,修改过的内容采用pdf格式发布,方便打印. 文章中有些内容的理解得益于徐明明和fxjwind两位的指点,非常感谢.

CI框架源码阅读笔记4 引导文件CodeIgniter.php

到了这里,终于进入CI框架的核心了.既然是"引导"文件,那么就是对用户的请求.参数等做相应的导向,让用户请求和数据流按照正确的线路各就各位.例如,用户的请求url: http://you.host.com/usr/reg 经过引导文件,实际上会交给Application中的UsrController控制器的reg方法去处理. 这之中,CodeIgniter.php做了哪些工作?我们一步步来看. 1.    导入预定义常量.框架环境初始化 之前的一篇博客(CI框架源码阅读笔记2 一切的入

jdk源码阅读笔记之java集合框架(二)(ArrayList)

关于ArrayList的分析,会从且仅从其添加(add)与删除(remove)方法入手. ArrayList类定义: p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 18.0px Monaco } span.s1 { color: #931a68 } public class ArrayList<E> extends AbstractList<E> implements List<E> ArrayList基本属性: /** *

dubbo源码阅读笔记--服务调用时序

上接dubbo源码阅读笔记--暴露服务时序,继续梳理服务调用时序,下图右面红线流程. 整理了调用时序图 分为3步,connect,decode,invoke. 连接 AllChannelHandler.connected(Channel) line: 38 HeartbeatHandler.connected(Channel) line: 47 MultiMessageHandler(AbstractChannelHandlerDelegate).connected(Channel) line: