speex的基本编码和解码流程

最近在研究speex的编码和解码流程

之前在IM上用到的都是发语音片段,这个很简单,只需要找到googlecode上gauss的代码,然后套一下就可以用了。

不过googlecode要关闭,有人将他导入到了github,地址在这里 https://github.com/cczufish/OggSpeex-android

我也导入了,但是没成功,不知道什么问题,可能级别不够吧,哈哈 https://github.com/dongweiq/android-recorder

现在我们的需求是要求将语音片段拼接合成,而且要在UI中显示出正在播放的时间,看了gauss的代码后发现,他的代码是边解码边播放的,按照的是short[160]的片段一个个播放的

 1 /* decode each segment, writing output to wav */
 2                 for (curseg = 0; curseg < segments; curseg++) {
 3
 4                     if (Thread.interrupted()) {
 5                         dis.close();
 6                         track.stop();
 7                         track.release();
 8                         return;
 9                     }
10
11                     while (this.isPaused()) {
12                         track.stop();
13                         track.release();
14                         // Thread.sleep(100);
15                     }
16
17                     /* get the number of bytes in the segment */
18                     bodybytes = header[OGG_HEADERSIZE + curseg] & 0xFF;
19                     if (bodybytes == 255) {
20                         System.err.println("sorry, don‘t handle 255 sizes!");
21                         return;
22                     }
23                     dis.readFully(payload, 0, bodybytes);
24                     chksum = OggCrc.checksum(chksum, payload, 0, bodybytes);
25
26                     /* decode the segment */
27                     /* if first packet, read the Speex header */
28                     if (packetNo == 0) {
29                         if (readSpeexHeader(payload, 0, bodybytes, true)) {
30                             packetNo++;
31                         } else {
32                             packetNo = 0;
33                         }
34                     } else if (packetNo == 1) { // Ogg Comment packet
35                         packetNo++;
36                     } else {
37
38                         /* get the amount of decoded data */
39                         short[] decoded = new short[160];
40                         if ((decsize = speexDecoder.decode(payload, decoded, 160)) > 0) {
41                             track.write(decoded, 0, decsize);
42                             float maxVol = AudioTrack.getMaxVolume();
43                             track.setStereoVolume(maxVol, maxVol);// 设置当前音量大小
44                             track.play();
45                         }
46                         packetNo++;
47                     }
48                 }

而且他还有一个包序号,pacetNo为0则是speex的文件头,占80字节,packetNo为1则查找包序号2,2中就按照160short解码音频,然后播放解码后的wav。

后来从网上找到以下内容http://blog.163.com/yuan_zhch/blog/static/193790046201172611527217/

相当于是对整个speex编码和解码的过程的总结吧

一:编码流程

使用Speex的API函数对音频数据进行压缩编码要经过如下步骤:

1、定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。

2、调用speex_bits_init(&bits)初始化bits。

3、调用speex_encoder_init(&speex_nb_mode)来初始 化enc_state。其中speex_nb_mode是SpeexMode类型的变量,表示的是窄带模式。还有speex_wb_mode表示宽带模 式、speex_uwb_mode表示超宽带模式。

4、调用函数int speex_encoder_ ctl(void *state, int request, void *ptr)来设定编码器的参数,其中参数state表示编码器的状态;参数request表示要定义的参数类型,如SPEEX_ GET_ FRAME_SIZE表示设置帧大小,SPEEX_ SET_QUALITY表示量化大小,这决定了编码的质量;参数ptr表示要设定的值。

可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。

5、初始化完毕后,对每一帧声音作如下处理:调用函数 speex_bits_reset(&bits)再次设定SpeexBits,然后调用函数speex_encode(enc_state, input_frame, &bits),参数bits中保存编码后的数据流。

6、编码结束后,调用函数speex_bits_destroy (&bits),    speex_encoder_destroy (enc_state)来

二:解码流程

同样,对已经编码过的音频数据进行解码要经过以下步骤:

1、     定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。

2、   调用speex_bits_init(&bits)初始化bits。

3、   调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。

4、    调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。

5、   调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码,参数out中保存解码后的数据流。

6、   调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。

下面是一段实例代码:

  1. #include <speex.h>
  2. #include <stdio.h>
  3. /*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/
  4. #define FRAME_SIZE 160
  5. int main(int argc, char **argv)
  6. {
    1. char *inFile;
    2. FILE *fin;
    3. short in[FRAME_SIZE];
    4. float input[FRAME_SIZE];
    5. char cbits[200];
    6. int nbBytes;
    7. /*保存编码的状态*/
    8. void *state;
    9. /*保存字节因此他们可以被speex常规读写*/
    10. SpeexBits bits;
    11. int i, tmp;
    12. //新建一个新的编码状态在窄宽(narrowband)模式下
    13. state = speex_encoder_init(&speex_nb_mode);
    14. //设置质量为8(15kbps)
    15. tmp=8;
    16. speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp);
    17. inFile = argv[1];
    18. fin = fopen(inFile, "r");
    19. //初始化结构使他们保存数据
    20. speex_bits_init(&bits);
    21. while (1)
    22. {
      1. //读入一帧16bits的声音
      2. fread(in, sizeof(short), FRAME_SIZE, fin);
      3. if (feof(fin))
        1. break;
      4. //把16bits的值转化为float,以便speex库可以在上面工作
      5. for (i=0;i<FRAME_SIZE;i++)
        1. input[i]=in[i];
      6. //清空这个结构体里所有的字节,以便我们可以编码一个新的帧
      7. speex_bits_reset(&bits);
      8. //对帧进行编码
      9. speex_encode(state, input, &bits);
      10. //把bits拷贝到一个利用写出的char型数组
      11. nbBytes = speex_bits_write(&bits, cbits, 200);
      12. //首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样
      13. fwrite(&nbBytes, sizeof(int), 1, stdout);
      14. //写出压缩后的数组
      15. fwrite(cbits, 1, nbBytes, stdout);
    23. }
    24. //释放编码器状态量
    25. speex_encoder_destroy(state);
    26. //释放bit_packing结构
    27. speex_bits_destroy(&bits);
    28. fclose(fin);
    29. return 0;
  7. }
时间: 2025-01-05 20:36:52

speex的基本编码和解码流程的相关文章

ffmpeg解码流程

来源:http://www.xuebuyuan.com/807209.html ffmpeg解码流程 . 2013年08月20日 ⁄ 综合 ⁄ 共 14054字 ⁄ 字号 小 中 大 ⁄ 评论关闭 文章目录 1. 注册所有容器格式和CODEC:av_register_all() 2. 打开文件:av_open_input_file() 3. 从文件中提取流信息:av_find_stream_info() 4. 穷举所有的流,查找其中种类为CODEC_TYPE_VIDEO 5. 查找对应的解码器:

http协议中的编码和解码

http://www.csdn1 2 3.com/html/itweb/20130730/29422_29378_29408.htm ****************************** 一.字符集与文字编码简介 1. 计算机如何显示文字 我们知道,计算机是以二进制的“形式”来保存和处理数据的,也 就是说,不管我们使用键盘进行输入,还是让计算机去读取一个文本文件,计算机得到的原始内容是一些二进制序列,当需要对这些二进制序列进行显示时,计算机 会依照某种“翻译机制”(也就是编码方式),取到

AAC 文件解析及解码流程(音频术语aac he lc等及其功能性的描述)

OUTLINE: * AAC概述 * AAC规格简述 * AAC特点 * AAC音频文件解析 --ADIF&ADTS格式 --ADIF&ADTS头信息 --ADIF&ADTS数据信息 --AAC文件处理流程 * AAC解码流程 --技术解析 * 术语说明 一.AAC概述 AAC是高级音频编码(Advanced Audio Coding)的缩写,出现于1997年,最初是基于MPEG-2的音频编码技术.由Fraunhofer IIS.Dolby Laboratories.AT&

[编码] 曼彻斯特编码与解码

常见的编码方式有以下几种, 1.NRZ(Not Return to Zero)不归零编码, 这是一种比较简单的编码方式,二进制数据“0”和“1”分别用高电平和低电平来表示,当1位数据传输完以后,信号电平  不返回零所以称为不归零编码. 2.BiPhase编码, 相比NRZ编码方式,这种编码稍微复杂了一点,他是这样规定,在每一位数据传输时,电平都会跳变(高电平变低电平,或者低电平变高电平), 同时当数据为“1”时(按照规定也可以是“0”),在数据位中间也会跳变. 3.曼彻斯特编码方式, 这种编码方

Python学习笔记八:文件操作(续),文件编码与解码,函数,递归,函数式编程介绍,高阶函数

文件操作(续) 获得文件句柄位置,f.tell(),从0开始,按字符数计数 f.read(5),读取5个字符 返回文件句柄到某位置,f.seek(0) 文件在编辑过程中改变编码,f.detech() 获取文件编码,f.encoding() 获取文件在内存中的编号,f.fileno() 获取文件终端类型(tty.打印机等),f.isatty() 获取文件名,f.name() 判断文件句柄是否可移动(tty等不可移动),f.seekable() 判断文件是否可读,f.readable() 判断文件是

win api 实现 base64编码、解码

最近在写小玩意,用到了base64编码,但是考虑到体积大小,网上的多种实现都是利用开源的代码,这就增加了其大小.我想win api能不能实现base64编码.解码.通过一通乱搜,还有收获.就有了以下代码 #pragma comment(lib,"crypt32.lib") LPSTR Base64Encode(LPBYTE lpBuffer,DWORD dwLen) { DWORD dwNeed; LPSTR lpBase64Str ; DWORD dwIndex ; DWORD dw

了解URL编码的基本概念,在javascript和java程序中使用内置的API进行编码和解码

1.URL编码的基本概念 URL只能使用US-ASCII 字符集来通过因特网进行发送.由于URL常常会包含 ASCII 集合之外的字符,URL必须转换为有效的 ASCII 格式.URL 编码使用 "%" 其后跟随两位的十六进制数来替换非 ASCII 字符.URL 不能包含空格,URL 编码通常使用 + 来替换空格.所谓URL编码,就是将非US-ASCII字符和US-ASCII中的特殊字符,用相应的字符集编码来表示.比如,汉字"你",如果用UTF-8编码,出现在URL

【转】C/C++ URL编码,解码(提取自PHP)

//解码 //头文件自己加上的 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <string> #include <iostream> using namespace std; /* {{{ php_htoi  */ static int php_htoi(char *s) { int value; int c; c = ((unsigned char *)

H.264硬编码&硬解码

Firefly-RK3288拥有强大的VPU(视像处理器),能够流畅实现720P和1080P视频的H.264编解码: 而H.264的压缩率更高,可以更大程度更小视频的空间占用. 详细看视频演示 1. 演示介绍 基于Firefly开发板:视频监控演示: 需要两块开发板:一块开发板摄像头采集+硬编码,网络传输. 另一块开发板 网络接收.硬解码+显示. Demo中采样5GHz Wi-Fi传输,摄像头使用OV13850,或UVC camera 2. H.264技术介绍 H.264是一种高性能视频编解码技