Spoken Language Processing读书笔记之Spoken Language Structure

  本章主要讲的是我们在说话和倾听的时候发生了什么,具体的过程是怎样实现的。明确这个目标后,心里应该有个底了。

  在正式开始之前,我想分享一个事情:今天去图书馆借书,清华大学出版的《统计自然语言处理》,本以为它会安静地躺在9楼或10楼这些计算机、数学专业书籍所在楼层的某个角落,结果却躺在一大堆商务英语和思密达书籍所在的语言专业楼层。这大概就是交叉学科的美妙之处吧。

  好了,干正事。Spoken language,暂且译为口语,它的作用是方便说话者和听者之间进行信息交流。举个例子,屌丝小明(怎么又是他)对女神小红还是念念不忘,有一天,他一个人走在大街上,想起大后天就是光棍节了,倍感凄凉。这时小红正从对面走来,小明再次鼓起勇气对小红说:“你知道吗?我喜欢你很久了”,小红愣了一下,说:“对不起,我已经有喜欢的人了”。哎,可怜的小明。

  我们来看看这个失败的表白过程发生了什么事情。Figure 2.1展示了语音交流的所有组成部分,我们来逐个分析吧。

  小明由于寂寞太久,导致每次遇到女神小红,脑子里都是表白的想法,这个想法是一种Message Formulation,包含着类似“我爱你小红”、“小红我喜欢你”等这些语义信息;这些想法(信息)在大脑中形成后,下一步就是利用语文老师教的拼音、电视剧里的狗血对话等这些知识(包括发音、词汇等)将之前表白的想法(信息)转换为一句表白的话(“你知道吗?我喜欢你很久了”),这句话中的每个字(如“你”)都是由若干个的音节组成(“你”->“nǐ”),这个是大脑中的语言系统(Language System)做的事情;语言系统造句完成后,小明的亿万个神经肌肉(Neuromuscular)就已经在蠢蠢欲动了,这些神经肌肉通过控制声带、嘴唇、下巴、舌、软腭等器官产生闷骚的表白语:“你知道吗?我喜欢你很久了”,这个神经肌肉控制器官把话说出口的过程叫做神经肌肉映射(Neuromuscular Mapping),通过的那些器官叫声道系统(Vocal Tract System)。到这里为止,小明真的可以松一口气了:“啊!我终于说出口了”。

  下面就来看看女神小红拒绝小明的过程吧。

  小明说的话在空气中传播,到达小红的耳朵,冲击耳膜,穿过内耳的耳蜗(可看成是一个滤波器组进行频率分析),这个过程叫做耳蜗运动(Cochlea Motion);紧接着就是神经传导(Neural Transduction)过程,这个过程频谱信号(经过耳蜗后的声音信号)转换成听觉神经上活动的信号,可近似认为是一个特征提取(Feature Extraction)过程,遗憾的是到目前为止(2001年)我们不清楚神经活动是怎样映射到语言系统(Language System)的,也不清楚大脑是怎样对信息进行理解的(Message Comprehension)。经过这些一系列的过程,小红知道小明是真心喜欢他的,但还是拒绝了他。

  故事过于悲伤,今天就写到这了。

  2014-11-08 20:41:50



  持续更新……



References: Xuedong Huang, Alex Acero, Hsiao-Wuen Hon, Spoken Language Processing: A Guide to Theory, Algorithm and System Development 2001

欢迎交流,转载请注明出处:http://www.cnblogs.com/s5plus1/p/4083988.html

时间: 2024-10-12 03:42:40

Spoken Language Processing读书笔记之Spoken Language Structure的相关文章

Spoken Language Processing读书笔记之Introduction

为了舒适地学习,我把背景颜色调成了浅绿色(色调:85,饱和度:123,亮度:205).好了,现在进入正题——令人兴奋的自然语言处理之旅. 首先,非常感谢那些在Spoken Language Processing(以下简称为SLP)领域做出伟大贡献的科学家们,本书的前言部分提到了众多在该领域杰出的人物,他们为此付出了很多心血. 本书涉及到的知识点: 现在大部分电脑都是利用图形用户界面(GUI)实现人机交互,这些电脑缺乏人类基本的能力,如说话.倾听.理解与学习.语音将成为人机交互的其中一个主要方式,

A curated list of speech and natural language processing resources

A curated list of speech and natural language processing resources At Josh.ai, we’re often asked for developer resources relating to natural language processing, machine learning, and artificial intelligence. Paul Dixon, a researcher living in Kyoto

自然语言处理一些读书笔记和自己的思考。

在知乎上搜索相关问题,有人推荐<数学之美>,之前粗略看过一次,这次想重新看一下并且做个读书笔记.下面是关于自然语言理解方面的一些读书笔记和自己的思考. 一. 自然语言处理历史: 自然语言处理最初发展的20多年里,相关科学家都极力通过电脑模拟人脑,试图用这种方式来处理人类语言,但是这种方式被证明是行不通的,成功几乎为零.NLP发展的第二阶段是70年代之后,科学家们终于找到了基于数学模型和统计的方法. 第一阶段的时候,学术界对人工智能和自然语言理解的普遍认识是:要让机器完成翻译或者语音识别等等,必

The SwiftProgramming Language读书笔记第26页

·        第26页 The SwiftProgramming Language读书笔记学习笔记第26页 本页主要讨论swift语言里的整形数据和浮点数. 1 int整形,有符号整形数据,是和计算机平台cpu字节数相关的数据类型. 即,在8位计算机的int型整形,占一字节int:在16位计算机上int代表2字 节整形数据,因此平时我们熟知的32位计算机的int型数据占四字节,可 以表示的数 min:-2147483648  max:2147483647(-2^31 ~ 2 ^31 - 1)

《The Swift Programming Language》中文翻译及读书笔记-page29

·        第29页 数字字面上可以用下划线_,目的是增强数值的阅读性. 例如在表示1000时,一般人这样写1000,  但财务人员这样写1,000大家都知道这是1000. 故在swift语言里可以在数字间插入下划线来增强阅读性. eg: let oneMillion = 1_000_000  => 常量壹佰万 <The Swift Programming Language>中文翻译及读书笔记-page29

《The Swift Programming Language》的笔记-第24页

The Swift Programming Language读书笔记学习笔记 第24页 本页主要内容有两个:打印输出和如何在swift注释代码 1 如何打印变量和常量的值? 使用println函数,细节:println函数除打印变量常量值外还输出一个换行 1) 打印常量 eg1 let hw = "hello chinagame.me" println(hw) => 可将字符串常量输出到Console里 2) 打印变量, 双引号里用 \(变量名) 输出,这个像C语言里的%s eg

《The Swift Programming Language》的笔记-第28页

·        第28页 本页里的主要内容是: 1 介绍swift语言里的各类数制,或者说某一整数的不同表示形式. 1)十进制,无前缀 2)二进制,以0b开头,后边是若干个0和1的序列 3)八进制,以0o开头,后边是若干0~7的序列 4)16进制,以0x开头,后是0~9.a~f序列 以常量31为例,二进制表示31为:0b11111 以常量31为例,八进制表示31为:0o37 以常量31为例,16进制表示31为:0x1f 2 科学计数表示数 1)以10为底的科学计数 2)以2为底的科学计数 12

Natural Language Processing with Python - Chapter 0

一年之前,我做梦也想不到会来这里写技术总结.误打误撞来到了上海西南某高校,成为了文科专业的工科男,现在每天除了膜ha,就是恶补CS.导师是做计算语言学的,所以当务之急就是先自学计算机自然语言处理,打好底子准备做科研(认真脸). 进入正题,从图书馆找了本“Natural Language Processing with Python” (影印版),书长这个样子,作者是Steven Bird, Ewan Klein和Edward Loper.粘贴个豆瓣链接供参考:https://book.douba

natural language processing

基于python 自然语言处理工具包 :NLPT(natural language processing toolkit)  ,安装时 sudo pip -U install nltk NLPT的网址 Natural language processing toolkits Name Language License Creators Website Apertium C++, Java GPL (various) [1] Deeplearning4j Java, Scala Apache 2.