解码aac，并生成wav文件

小程在讲多媒体的编码格式时，详细介绍过pcm跟aac等概念。简单来说，pcm是没有压缩的数字信号，可以直接用于音频输出，而aac则是一种音频编码格式，需要解码后才能用于音频输出。

aac编码格式，已经是一种很常见的音频编码格式，硬件设备（比如电脑芯片、手机、其它终端设备）都集成了aac的解码功能，而且有些系统还提供了调用硬件解码的接口，比如iOS上的AudioConverterRef接口、Android上的MediaCodec接口等。

从性能的角度，使用硬件解码是最佳选择，但如果从通用的角度，使用软件解码（相当于写个程序）是最佳的选择。这一次，小程介绍的是音频的软解码。

本文讲解使用fadd，把aac音频解码成pcm数据，并以wav来封装。

对于aac的软解码，使用FFmpeg也是一个选择，但如果只为了解码aac而用FFmpeg，就有点大材小用了，而且要应对比较复杂的接口调用，另外FFmpeg体积也比较大（即便裁剪后可以使FFmpeg编译出来的库小很多），那么，是否有更加简单一点的解码库可以使用呢？

这个开源库就是faad。

接下来，小程介绍使用faad来解码aac，并生成wav文件的流程。

（1）下载faad

git clone git://git.code.sf.net/p/faac/faad2 faac-faad2

文件结构大概是这样的：

这个开源项目，似乎一直有维护与更新：

（2）编译faad

执行以下指令，生成configure配置文件，以及makefile编译脚本，然后，再make出faad的库文件。

aclocal
autoconf
autoheader
libtoolize --force
automake --add-missing
./configure
make

由于只考虑在macos上运行，而且是在mac系统上编译，所以confiure时并不需要指定特定的参数。

以上命令，使用automake来生成编译脚本（makefile），如果读者发现这类指令执行不了，那有可能还没有正确安装，可以查阅相关的知识，也可以参考以下的内容，这是小程在网上摘录到的内容（小程使用的是macos）：

====install autoconf and automake（摘录）

curl -O http://mirrors.kernel.org/gnu/m4/m4-1.4.13.tar.gz
tar -xzvf m4-1.4.13.tar.gz
cd m4-1.4.13
./configure --prefix=/usr/local
make
sudo make install
cd ..
curl -O http://mirrors.kernel.org/gnu/autoconf/autoconf-2.65.tar.gz
tar -xzvf autoconf-2.65.tar.gz
cd autoconf-2.65
./configure --prefix=/usr/local # ironic, isn‘t it?
make
sudo make install
cd ..
# here you might want to restart your terminal session, to ensure the new autoconf is picked up and used in the rest of the script
curl -O http://mirrors.kernel.org/gnu/automake/automake-1.11.tar.gz
tar xzvf automake-1.11.tar.gz
cd automake-1.11
./configure --prefix=/usr/local
make
sudo make install
cd ..
curl -O http://mirrors.kernel.org/gnu/libtool/libtool-2.2.6b.tar.gz
tar xzvf libtool-2.2.6b.tar.gz
cd libtool-2.2.6b
./configure --prefix=/usr/local
make
sudo make install

最终，生成faad库文件：

通过lipo来查看库文件支持的指令集：

（3）调用faad

这里演示一下，把一个aac文件解码成pcm数据，并用wav容器来封装。

demo的文件结构：

demo的代码：

#include "libfaad/include/faad.h"
#include <stdio.h>
#include <string.h>
#include <stdlib.h>

struct WavFileHeader
{
    char        id[4];          // should always contain "RIFF"
    int     totallength;    // total file length minus 8
    char        wavefmt[8];     // should be "WAVEfmt "
    int     format;         // 16 for PCM format
    short     pcm;            // 1 for PCM format
    short     channels;       // channels
    int     frequency;      // sampling frequency
    int     bytes_per_second;
    short     bytes_by_capture;
    short     bits_per_sample;
    char        data[4];        // should always contain "data"
    int     bytes_in_data;
};
void write_wav_header(FILE* file, int totalsamcnt_per_channel, int samplerate, int channels){
    struct WavFileHeader filler;
    strcpy(filler.id, "RIFF");
    filler.bits_per_sample = 16;
    filler.totallength = (totalsamcnt_per_channel * channels * filler.bits_per_sample/8) + sizeof(filler) - 8; //81956
    strcpy(filler.wavefmt, "WAVEfmt ");
    filler.format = 16;
    filler.pcm = 1;
    filler.channels = channels;
    filler.frequency = samplerate;
    filler.bytes_per_second = filler.channels * filler.frequency * filler.bits_per_sample/8;
    filler.bytes_by_capture = filler.channels*filler.bits_per_sample/8;
    filler.bytes_in_data = totalsamcnt_per_channel * filler.channels * filler.bits_per_sample/8;
    strcpy(filler.data, "data");
    fwrite(&filler, 1, sizeof(filler), file);
}

int main(int argc, char *argv[])
{
    printf("hello faad\n");
    NeAACDecHandle faadhandle = NeAACDecOpen();
    if (faadhandle) {
        printf("aacopen ok\n");
        const char* aacfile = "aac20s.aac";
        FILE* file = fopen(aacfile, "rb");
        if (file) {
            printf("fopen aac ok\n");
            fseek(file, 0, SEEK_END);
            long filelen = ftell(file);
            fseek(file, 0, SEEK_SET);
            unsigned char* filebuf = (unsigned char*)malloc(filelen);
            int len = fread(filebuf, 1, filelen, file);
            fclose(file);
            unsigned long samplerate = 0;
            unsigned char channel = 0;
            int ret = NeAACDecInit(faadhandle, filebuf, len, &samplerate, &channel);
            if (ret >= 0) {
                printf("aacinit ok: sam=%lu, chn=%d\n", samplerate, channel);
                NeAACDecFrameInfo frameinfo;
                unsigned char* curbyte = filebuf;
                unsigned long leftsize = len;
                const char* wavename = "out.wav";
                FILE* wavfile = fopen(wavename, "wb");
                if (wavfile) {
                    int wavheadsize = sizeof(struct WavFileHeader);
                    fseek(wavfile, wavheadsize, SEEK_SET);
                    int totalsmp_per_chl = 0;
                    void* out = NULL;
                    while (out = NeAACDecDecode(faadhandle, &frameinfo, curbyte, leftsize)) {
                        printf("decode one frame ok: sam:%ld, chn=%d, samplecount=%ld, obj_type=%d, header_type=%d, consumed=%ld\n",
                                frameinfo.samplerate, frameinfo.channels, frameinfo.samples, frameinfo.object_type,
                                frameinfo.header_type, frameinfo.bytesconsumed);
                        curbyte += frameinfo.bytesconsumed;
                        leftsize -= frameinfo.bytesconsumed;
                        fwrite(out, 1, frameinfo.samples*2, wavfile); // frameinfo.samples是所有声道数的样本总和；16bit位深
                        totalsmp_per_chl += frameinfo.samples / frameinfo.channels;
                    }
                    printf("aac decode done, totalsmp_per_chl=%d\n", totalsmp_per_chl);
                    fseek(wavfile, 0, SEEK_SET);
                    write_wav_header(wavfile, totalsmp_per_chl, (int)samplerate, (int)channel);
                    fclose(wavfile);
                }
            }
            free(filebuf);
        }
        NeAACDecClose(faadhandle);
    }
    return 0;
}

以上代码保存到aac2pcm.c文件，然后，makefile编译文件可以这样写（或者直接用gcc来编译）：

out=aac2pcm
obj=aac2pcm.c

$(out):$(obj)
    gcc -o $(out) $(obj) -lfaad -L./libfaad
clean:
    rm -rf $(out) *.o

执行这个程序，部分输出：

最后的输出：

（4）pcm数据观察

与FFmpeg的解码作一个对比。

可以使用ffmpeg命令来解码一个aac文件：

ffmpeg -i aac20s.aac out_ff.wav

可以看到，faad与FFmpeg解码出来的wav文件的大小，有一点差别：

使用Audition，来对比FFmpeg与faad解码后的pcm数据：

基本看不出差别。

至此，使用fadd来解码的流程就介绍完毕了。另外，对于aac的编码，可以使用faac或fdk-aac、neroaac，或硬编等，这些小程以后再作介绍。

总结一下，本文介绍了如何通过fadd来解码aac格式的音频文件，并生成wav文件。其中，介绍了faad的编译，操作的难度系数为2（考虑到有automake的使用），然后介绍了写代码调用fadd的接口，并把解码后的数据，保存到wav的文件容器中，操作的难度系数为3。

解码aac，并生成wav文件

原文地址：http://blog.51cto.com/13136504/2084647

时间： 2024-11-12 23:08:13

解码aac，并生成wav文件

（1）下载faad

（2）编译faad

（3）调用faad

（4）pcm数据观察

解码aac，并生成wav文件的相关文章

Qt由pcm数据生成wav文件

C++生成简单WAV文件（二）

C++生成简单WAV文件（三）——根据简谱生成菊花台

C++生成简单WAV文件（一）

Android 音视频深入九 FFmpeg解码视频生成yuv文件（附源码下载)

使用FAAD库解码AAC实例及及 faad解码后的通道数不正确的问题

Android中如何提取和生成mp4文件

Python解析Wav文件并绘制波形的方法

asp.net使用SpeechSynthesizer类生成语音文件部署到iis遇到的几个坑