音频中采样位数,采样率,比特率的名词解释(转)

采样位数:

采样位数可以理解为采集卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。我们首先要知道:电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256,16位则代表2的16次方--64K。比较一下,一段相同的音乐信息,16位声卡能把它分为64K个精度单位进行处理,而8位声卡只能处理256个精度单位, 造成了较大的信号损失,最终的采样效果自然是无法相提并论的。

采样率:

采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。采样定理指采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。

如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。

换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。过采样指采样频率超出信号带宽的两倍这样就可以用数字滤波器替换性能不好的模拟抗混叠滤波器。

比特率:

比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,还原后的音质就越好。 作为一种数字音乐压缩效率的参考性指标,比特率表示单位时间(1秒)内传送的比特数bps(bit per second,位/秒)的速度。通常使用kbps(通俗地讲就是每秒钟1000比特)作为单位。CD中的数字音乐比特率为1411.2kbps(也就是记录1秒钟的CD音乐,需要1411.2×1024比特的数据),音乐文件的BIT RATE高是意味着在单位时间(1秒)内需要处理的数据量(BIT)多,也就是音乐文件的音质好的意思。但是,BIT RATE高时文件大小变大,会占据很多的内存容量,音乐文件最常用的BIT RATE是128kbps,MP3文件可以使用的一般是8~320kbps,但不同MP3机在这方面支持的范围不一样,大部分的是32-256Kbps,这个指数当然是越广越好了,不过320Kbps是暂时最高等级了。

比特率值与现实音频对照:

  1. 16Kbps=电话音质
  2. 24Kbps=增加电话音质、短波广播、长波广播、欧洲制式中波广播
  3. 40Kbps=美国制式中波广播
  4. 56Kbps=话音
  5. 64Kbps=增加话音(手机铃声最佳比特率设定值、手机单声道MP3播放器最佳设定值)
  6. 112Kbps=FM调频立体声广播
  7. 128Kbps=磁带(手机立体声MP3播放器最佳设定值、低档MP3播放器最佳设定值)
  8. 160Kbps=HIFI高保真(中高档MP3播放器最佳设定值)
  9. 192Kbps=CD(高档MP3播放器最佳设定值)
  10. 256Kbps=Studio音乐工作室(音乐发烧友适用)
  11. 实际上随着技术的进步,比特率也越来越高,MP3的最高比特率为320Kbps,但一些格式可以达到更高的比特率和更高的音质。
  12. 比如正逐渐兴起的APE音频格式,能够提供真正发烧级的无损音质和相对于WAV格式更小的体积,其比特率通常为550kbps-----950kbps。

常见编码模式:

  1. VBR(Variable Bitrate)动态比特率,也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;
  2. ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
  3. CBR(Constant Bitrate),常数比特率,指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。

通俗表示:

简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。

横坐标的采样率表示了每秒钟的采样次数。

纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。

采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。

而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。

解释:

1、那为什么很多专业的标准都达到了24Bit/192KHz呢?

现在普遍在工程中都是使用48kHz或者96kHz频率录音,只有在最终母带处理时才会转成44.1kHz的CD格式,这样减少多次采样率转换造成的失真。

而在电脑领域,作为音频硬件codec标准的AC97规范只规定了48kHz。这造成几乎所有的输入、输出信号都要被重新采样(专业术语叫采样率转换,即 SRC)。SRC一般都会造成音质的损失,较简单(即较差)的SRC算法会造成音质明显劣化。但这已经是一个既成事实了。

2、既然44K够了,那为什么还要用192KHZ来录音?

首先,20kHz只是大多数人的听觉门限,也就是说,人耳对于20kHz以上的声音很不敏感。注意不敏感并不意味着完全无法感知。大多数乐器(特别是钢琴和弦乐器)的乐音含有丰富的高次谐波,用音乐术语来说即所谓的上方泛音。截止频率为22.05kHz的CD音频,的确会给听惯了真实乐器的人一种不自然的感觉,尤其在高频部分,因为奈奎斯特截止频率造成更高频率泛音的信号失真。

其次,数字录音通常都需要进行后处理。音频处理会对信号产生进一步的失真,包括信号畸变、频谱混叠,等等。如果录音时仅仅用44.1kHz对原始信号采样,那么在后处理前还得进行上采样(up-sampling),对采样频率进行扩展。由于这种扩展是“假”的,实际上并没有更多有用的原始信号,并且上采样算法的优劣也会影响原录音信号的失真,所以这个做法并不可取。因此,通常的做法是用更高的频率进行采样。

而现在的完全专业数字录音棚中,则不再按CD标准的规范录音、混音以及母带,而是优先使用HD音频规范。即:

采用24Bit 48KHz、24Bit 96KHz、24Bit 192KHz 三种规格进行录音,当然,24Bit 48KHz是一些小的录音棚使用,因为他们的处理器资源有限。而大的录音棚,都清一色的使用24Bit 96KHz和24Bit 192KHz 进行录音。

那么,这样的录音规范,有什么好处?

1.符合HD音频标准,这也是将来的主流标准,制作出的成品,可以直接应用于HDCD、DVD-Audio、蓝光唱片、数字音乐下载业务、数字对媒体播放机业务。

2.完全照顾数字影视视频业务,多声道电影视频都会采用HD音频规范。包括移动便携数字视频设备都用它。

3.完全照顾消费性音频播放业务,比如:因特尔HD-Audio音频标准,AC97音频编码解码,便携MP3/mp4/电话/游戏机最高音频质量播放。

目前,专业录音行业的最高质量标准就是:24比特定点位深、192000Hz采样频率,简称“24Bit/192KHz”。当然,将来这个标准依然会继续提高,向32Bit 384KHz进发也是可能的。

实际上,现在的CD唱片市场上卖的产品(正版),最低级别的通常都是HDCD唱片,你买唱片时都会发现基本上都是HDCD标识,也就是一张激光唱片包含两种音轨:普通CD音轨和HDCD音轨。其中CD音轨记录16比特44.1KHz信号(这是这张唱片的兼容内容,照顾早期的CD播放机),HDCD音轨则记录24Bit 96KHz信号(这才是该唱片的主要内容)。普通的CD播放机只能播放CD音轨信号,而HDCD音轨则需要HDCD播放机才能播放(实际上现在的绝大多数 DVD播放机都能播放HDCD,而现在的电脑则更没问题了。)

说明:虽然文章有一定历史,但可以了解相关知识点。

以上转自:http://blog.sina.com.cn/s/blog_7032e6960100zzhn.html

时间: 2024-11-25 20:48:48

音频中采样位数,采样率,比特率的名词解释(转)的相关文章

音频 属性详解(涉及采样率、通道数、位数、比特率、帧等)

[音频] 指人耳可以听到的声音频率在20HZ~20kHz之间的声波,称为音频. [采样频率] 即取样频率, 指每秒钟取得声音样本的次数.采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多.由于人耳的分辨率很有限,太高的频率并不能分辨出来. 22050 的采样频率是常用的, 44100已是CD音质, 超过48000或96000的采样对人耳已经没有意义.这和电影的每秒 24 帧图片的道理差不多. 如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍. [

音频中PCM的概念

本文取自由http://blog.csdn.net/droidphone一部分 1. PCM是什么 PCM是英文Pulse-code modulation的缩写,中文译名是脉冲编码调制.我们知道在现实生活中,人耳听到的声音是模拟信号,PCM就是要把声音从模拟转换成数字信号的一种技术,他的原理简单地说就是利用一个固定的频率对模拟信号进行采样,采样后的信号在波形上看就像一串连续的幅值不一的脉冲,把这些脉冲的幅值按一定的精度进行量化,这些量化后的数值被连续地输出.传输.处理或记录到存储介质中,所有这些

aop中的名词解释

aop中的名词解释 aop spring Joinpoint(连接点) 目标对象中所有可以增强的方法叫做连接点 Pointcut(切入点) 目标对象中要增强的的方法 Advice(通知/增强) 增强的代码 Target(目标对象) 被代理对象 Weaving(织入) 将通知应用到连接点的过程 Proxy(代理) 生成的代理对象 Aspect(切面) 切入点+通知就形成了切面

AD域中常见属性名词解释

AD域中常见属性名词解释 Active Directory(AD)活动目录 schema对象模型 Organizational Unit(OU)组织单位 Distinguished name(DN)识别名 Canonical Name(CN)正式名称 Domain Controllers(DC)域控制器 displayname显示名称 homephone住宅电话 家庭电话(M) givenname名(F) samaccounttype账号类型 mobile手机 primarygroupid分组I

隐藏文件到图片或音频中——Kali linux Steghide工具

1. 介绍 Kali Linux操作系统通常被一些安全专家和网络罪犯用来做渗透和审计工作,但是除此之外,这里介绍一个另外的特别的功能:将目标文件隐藏到图片或者音频中.(看起来好诱人的样子,有没有跃跃欲试的感觉,^_^) 2. 安装steghide工具到Kali linux中 如果你的Kali Linux还没有更新过的话,那么执行以下命令进行更新. # apt-get upgrade 当系统更新完毕后,就可以采取在线安装的方式把steghide工具装入到你的系统中. # apt-get insta

Asp.net中固定位数用零补齐的函数(已解决,示例)!

在开发当中,出现编号实现8位数,但需要用0补齐.如:123,表示:0000123. 实例如下: decimal aaa = 123; // 数值型 string bbb = aaa.ToString(); // 转换为字符 bbb = bbb.PadLeft(7, '0'); // 共7位,之前用0补齐 response.write(bbb ); decimal aaa = 123;    // 数值型 string bbb =  aaa.ToString();   // 转换为字符 bbb =

转OSGchina中,array老大的名词解释

转OSGchina中,array老大的名词解释 转自:http://ydwcowboy.blog.163.com/blog/static/25849015200983518395/ osg:: ClearNode:颜色清除节点:用于设置清除颜色缓存的相关选项,它的子节点将在场景中首先渲染,以确保正确执行颜色缓存的设置:osghangglide osg:: ClipNode:剪切平面节点:定义场景中的剪切平面并剪切所有可剪切的子节点.注意,ClipNode能够剪切的节点不一定是它的子节点,详见第七

随笔11 J2EE中常用的名词解释

J2EE中常用的名词解释 ① web容器:给处于其中的应用程序组件(JSP,SERVLET)提供一个环境,使JSP,SERVLET直接和容器中的环境变量接口交互,不必关注其它系统问题.主要由WEB服务器来实现.例如:TOMCAT,WEBLOGIC,WEBSPHERE等.该容器提供的接口严格遵守J2EE规范中的WEB APPLICATION 标准.我们把遵守以上标准的WEB服务器就叫做J2EE中的WEB容器. ② Web container:实现J2EE体系结构中Web组件协议的容器.这个协议规定

3.数据表中的名词解释

名词解释 列.字段 数据库中某张表的一列,是行的组成单位 字段就如我们excel中的表头. 一个行可以包含一个或多个列,每个列都有其类型.长度与所存储的值,该值为字段值,字段值就像excel单元格中除了表头以外的值. 行.记录 行就是记录,一行就是一条完整的记录信息,和excel中的“行”类似. 结果集 符合SQL语句中的条件的所有行集合,结果集一般是一个表,其中有查询所返回的列标题及相应的值. 原文地址:https://www.cnblogs.com/Abby123wen/p/11122277