语音芯片选型
随着科技的发展和产品的集成化,语音芯片已经逐渐替代了多种语音设备应用在各场合。语音芯片主要特性是功耗低,抗干扰能力强,外围器件少,控制简单,语音保存时间久(某些语音芯片可以保存内容100年),掉电不丢失语音,部分芯片还可以重复擦写语音内容。如汽车倒车雷达,公交车报站器,银行排队机、语音玩具、防盗系统等设备都装备了语音芯片。由于芯片种类众多,功能各异。
1、录音芯片及放音芯片的选择
语音芯片从使用功能上,基本可以划分为录音语音芯片和放音语音芯片。设计一个使用语音芯片的产品,首先要考虑是否使用录制现场语音,如需要录制语音则选用带有录音功能的语音芯片,否则就选用只有放音功能的语音芯片。通常带有录音功能的语音芯片都具有回放语音的功能,但是在播放语音时,音质都没有专门的放音语音芯片好,所以在选择语音芯片时要权衡功能及音质方面等因素。
安防系统、会议记录系统、录音玩具等产品都要求具备录音功能,这类型产品的开发都会用到录音语音芯片,市场上有录音功能的芯片主要有ISD1110、ISD1400、ISD1700、ISD1800、ISD2500、ISD3300、ISD4000、WTR010、WTV040、APR96000等。利用录音芯片开发的录音模块,拥有更为简洁的外围电路和更佳的效果。如WTR-S4、WTV-NAND录音模块,这些模块利用外部的FLASH ROM作为存储中心,因而能够录制更长时间的语音。
仅用到放音功能的设备很多,像治疗仪、倒车雷达、报站器、报警器等。这类型的产品不需要录制现场的语音,将已经处理过的语音利用工具下载到语音芯片播放就可以。放音芯片根据存储方式可分为OTP ROM、FLASH ROM、EEPROM及MASK四种。
2、OTP ROM、FLASH ROM和EEPROM的选择
OTP(One Time Programable)是指一次性可编程语音芯片,语音只能烧写一次,适合应用在不需要修改语音、语音长度短的场合,从放音的长度上可以分为10秒、20秒、40秒、80秒、170秒、340秒。OTP语音芯片的特点是单芯片方案、价格便宜,适合中小型批量生产,即便是小数量生产也可以及时拿货。主要应用在中低端玩具、电子琴、电动车等产品上。
FLASH ROM和EEPROM的共性是可重复擦写、存储空间大,可随意更换控制方式和语音内容,能存储更大的语音文件。EEPROM通常都会集成在芯片中,此类型语音芯片价格比较昂贵,如ISD1700、ISD2500等。一般可以外挂的FLASH ROM有1Mbit~32Mbit,因需要用“语音芯片+FLASH”才能工作,价格比OTP的稍高,但整体售价比EEPROM的低,适合制样或者中小型批量投产。使用FLASH ROM的语音芯片有WT588D、WTV020-S,WTV040(需烧写特殊程序)等。
3、MASK掩膜投产
MASK投产使得整个语音芯片方案在保持性能、功能不变的情况下成本降低将近一半,且多数语音芯片在MASK投产不需要更改外围电路。但MASK投产需要订单数量超过2~7万,否则厂家会收取高额的光罩费,MASK生产时间大概要用1个月左右。目前MASK掩膜投产的芯片有WTB及WT588D(≤4Mbit FLASH ROM),其语音时间在5秒~340秒,是大批量投产的最佳选择。
4、可以存储更多语音的SD卡方案
SD卡已经成为当前市场上一大主流存储载体,其价格便宜,存储空间大,可移植性强等优点得到大部分厂家青睐。语音芯片也同样向外置SD卡的方向发展,厂家根据主控芯片的特性设计出可以播放各种音频格式的SD卡播放器,如WAV、MP3、WMA、AD4等主流音频格式。WTM-SD模块、USBSD模块 在外挂SD卡的时候可以播放WAV、MP3音频格式,WTV020-SD模块可以播放AD4、WAV音频格式等。这类型模块的播放时间均能达到数十小时。
5、从语音音质、语音长度方面选择
语音存放的长度由音频采样率及芯片内部(或外挂)ROM空间所决定,音频采样率的大小直接影响音频输出的音质,同一型号芯片的音频采样率越高,音质越好,但是需要占用更多的ROM空间。芯片的成本也因存储空间的增大而有不同幅度的上涨。如果对音质要求较高、语音时间在5分钟内,可以考虑选用ISD语音芯片、WTV语音芯片、WTC语音芯片、WT588D语音芯片、ISD语音芯片;要求音质高、语音时间长可以选用WTV020-SD模块、WTM-SD模块、USBSD模块;对音质要求不高、语音时间在340秒以内可选用WTB语音芯片。从录音长度方面考虑,要求录音长度在340秒以内,可选用ISD1700、ISD2500语音芯片;要求录音长度在30分钟内,可选用WTR-S4录音模块;录音长度达到数小时,则要用WTV-NAND录音模块。
6、是否选用MCU控制
部分语音芯片是只支持串口通讯协议的,因此必须由MCU进行控制,而不能利用脉冲或者电平来控制,此部分芯片中包括ISD3300、ISD4000等,在选择此类芯片的时候要考虑到控制端是否具备MCU。大部分芯片都是可以用MCU或者按键来控制的,如WTV、WTB、WTC、WT588D、ISD1700、ISD2500等。
7、语音芯片/模块综合素质对比一览表
\ |
芯片/模块型号 |
特性 |
稳定性 |
控制方式 |
工作电压 |
音质 |
价格 |
11 |
WTV010/020 |
10~20秒放音,OTP,可编程 |
好 |
串口/并口/按键 |
2.5~3.6V |
一般 |
便宜 |
12 |
WTV040/080 |
40~80秒放音,OTP,可编程 |
好 |
串口/并口/按键 |
2.5~3.6V |
一般 |
便宜 |
30 |
API840N |
40秒语音播放,OTP |
稍差 |
并口/按键 |
3.0~6.0V |
差 |
便宜 |
31 |
AP8910/21 |
10~21秒语音播放,OTP |
好 |
并口/按键 |
2.6~5.0V |
差 |
便宜 |
32 |
AP89021/042 |
21~42秒语音播放,OTP |
好 |
并口/按键 |
2.2~3.6V |
差 |
便宜 |