对语音识别来讲,同一个单词被同一个人每次说的情况都不同,给识别带来困难。本章讨论的就是对不同的情形如何定义适应不同特性的度量。
1,基于最优路径搜索的度量:①贝尔曼最优性原则和动态编程②编辑距离(The Edit Distance)③在语音识别动态时间扭曲(DTW), speaker-dependentrecognition. speaker-independentrecognition.
2,基于相关性的度量:这一部分解决的问题是“给定一组记录数据,查找数据是否包含已知模式,并找出其具体位置”。许多应用都涉及这一问题:目标检测、机器人视觉和视频编码。
3,可变形模板模型:这部分的目标就是寻求模板匹配来解释图像中参考模板和测试模板之间的差异。
4,基于内容的信息检索:相关性反馈。传统的信息检索是基于文本的,本部分讨论基于内容的,比如,图像检索中,通过图像的纹理,颜色,形状描述检索。
时间: 2024-12-29 23:13:03