【sphinx】sphinx文档学习笔记

2.4 Which CMUSphinx should I use?

  • 按平台来说,sphinx2可以作为嵌入式平台的选择
  • 按研究来说,如果研究声学模型和快速GMM计算的研究,选sphinx3;如果研究搜索算法,选sphinx4;如果做自适应和声学模型生成,可以用sphinxtrain中的estimation(估计)模块
  • 你的要求真的可行吗?  一般来说,如果没有语言学的限制,识别率会很差。影响系统的主要两个因素是:声学复杂度和语言学复杂度。
  • 建立一个有1000个人名的通讯录系统,难度要超过建立一个3000个词的对话系统,因为人名有很多相似很难区分
  • 为语音识别系统设计语法,可以用ngram和有限状态机。语法不能太少到不足以覆盖所有单词,会产生很多OOV单词。而如果只是盲目的增加新词也不可以。在加入新词之前,需要一些决策和基准。
  • sphinx是一个基于音素的识别工具,识别的过程,就是会建立一个巨大的HMM模型,而搜索就是找到最佳的路径,给出这个hmm模型。
  • 最好的词典中含有的是最适合你的用户的发音,而并非是官方发音。
  • cmu官网上开源的broadcast模型,是来自于140个小时的数据训练。http://www.speech.cs.cmu.edu/sphinx/models/。其中建立语言模型用到的词条有约13w。
  • Adding stress markers degrades perfromance by about 5within-word and cross-word triphone HMMs with
    no skips permitted between states. 开源的broadcast模型中,音素级未标记重音,如果标记饿了,会降低性能。状态之间不允许跳过。
  • HMM模型中的元素:Sphinx’s HMM definition are spread in five different files. They are mean,
    variance, mixture weight, transition matrices and model definition.
  • model definition:模型描述,在model_arch目录中。
时间: 2024-10-03 13:39:01

【sphinx】sphinx文档学习笔记的相关文章

20140602-XML之Schema文档学习笔记

20140602-XML之Schema文档学习笔记 一.Schema约束 几个重要知识: 1.namespace 相当于schema文件的id.Namespace是一个概念,并没有这个属性. 2.targetNamespace属性 注意:这个属性只在schema文档中出现.用来指定schema文档的namespace的值. 3.xmlns属性(非常重要,用于引入一个约束) 引入一个约束,它的值是一个schema文档的targetNamespace值(确切地说,是targetNamespace的属

Spring3.0官网文档学习笔记(五)--3.3

3.3 概述 Table 3.1. The bean definition Property Explained in... class Section 3.3.2, "Instantiating beans" name Section 3.3.1, "Naming beans" scope Section 3.5, "Bean scopes" constructor arguments Section 3.4.1, "Dependen

Spring3.0官网文档学习笔记(六)--3.4.1

3.4 依赖 3.4.1 依赖注入 依赖注入两种方式:基于构造器的DI.基于setter方法的DI. 3.4.1.1 基于构造器的DI 参数是引入对象,且之前不存在父-子类关系: package x.y; public class Foo { public Foo(Bar bar, Baz baz) { // ... } } <beans> <bean id="foo" class="x.y.Foo"> <constructor-arg

Spring3.0官网文档学习笔记(七)--3.4.2

3.4.2 依赖与配置的细节 3.4.2.1  Straight values (primitives, Strings, and so on) JavaBeans PropertyEditors被用来转换这些value到实际的类型.? <bean id="myDataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close"> <

Spring3.0官网文档学习笔记(四)--3.1~3.2.3

3.1 Spring IoC容器与Beans简介 BeanFactory接口提供对任意对象的配置: ApplicationContext是BeanFactory的子接口,整合了Spring Aop功能,消息资源控制,事件发布,应用层特殊的上下文(在web应用中) 由IoC容器实例化.组装.管理的对象都是Bean 3.2 容器概述 org.springframework.context.ApplicationContext代表Spring IoC容器,并且负责通过读取配置元数据来实例化.配置.组装

Spring3.0官网文档学习笔记(八)--3.4.3~3.4.6

3.4.3 使用depends-on 使用depends-on可以强制使一个或多个beans先初始化,之后再对这个bean进行初始化. 多个bean之间用",".";"." "隔开. <bean id="beanOne" class="ExampleBean" depends-on="manager"/> <bean id="manager" cla

Spring3.0官网文档学习笔记(二)

1.3 使用场景 典型的成熟的spring web应用 spring使用第三方框架作为中间层 远程使用场景 EJB包装 1.3.1 依赖管理.命名规则(包) spring-*.jar *号代表的是模块的简写,如:spring-core, spring-webmvc, spring-jms 可以在四个不同的地方找到Spring: http://www.springsource.org/downloads/community  所有的jar包被打包成zip,名称从3.0开始是: org.spring

Spring3.0官网文档学习笔记(一)

Part 1 Spring框架概述 Spring是模块化的,在应用中只需要引入你所需要用到的模块的jar包,其余的jar包不用引入. spring框架支持声明式的事务管理,通过RMI或web service访问你的逻辑,还有许多种方式保存数据. spring被设计成非侵入式的. 1.Spring框架简介 Spring框架提供了应用开发的基础部分,使得我们可以集中精神在业务开发层上. POJOS:plain old Java objects Spring允许创建非侵入式的POJO.这个特性支持Ja

通过程序校验xml文档学习笔记

校验xml文档,可以通过程序来校验,利用一段js代码即可. 各行代码的含义已经写出,运行这个html文件,检验如下xml代码: 结果如下: 如果xml文档出现错误: 结果如下: 其中,obj.async=false是关闭对象的异步加载模式,所谓异步是加载一句解释一句,同步是加载完成后再解释.