网络媒体流的音视频同步

一、音视频同步原理介绍

在多媒体采样/编码时，音频和视频都有一个固定的频率，比如视频以h264为例，其帧率是15F/S，音频以AAC为例，其采样率为44100,每帧含1024个sample,这样其帧率约为43F/S。这样，在理论上，每秒钟需要播放15帧视频数据和43帧音频数据。如果有一方播放速度过快或过慢，都会影响用户体验，这是音视频需要同步的原因。

二、实现方案简介

2.1两个时间参考点

要实现音视频同步，需要有两个时间参考点
（1）、编码时间参考点

　　　以第一个到达的视频帧时间戳作为编码参考时间戳enPreTime

（2）、解码时间参考点

以第一个视频帧到达时间作为播放参考时间playPreTime

2.2四个缓存队列

(1)视频接收缓存队列

(2)音频接收缓存队列

(3)视频播放缓存队列

(4)音频播放缓存队列

2.3同步实现步骤

具体实现方案如下：

(1).以第一个到达的视频帧时间戳作为编码参考时间戳enPreTime，并以到达时间作为播放参考时间playPreTime。在该时间(playPreTime)之前到达的音频帧,时间戳大于enPreTime的，放入缓存，小于enPreTime的，直接丢弃。

(2).周期性的从播放缓存内读取音视频数据，并用当前帧的时间戳与enPreTime做差，得到编码时间差，获取读取时间与上一播放帧的时间差，得到等待时间。

当等待时间>=编码时间差时，则，解码并播放。否则，将数据放到播放缓存。当播放缓存已空时，则该从接收缓存队列读取数据。并作与上相同的操作。

三、类似实现方案

本方案是以视频为驱动的实现方案，还有以音频为驱动的实现方案和无驱动同步方案，这里不一一做介绍，感兴趣的同仁可以自己研究一下其优缺点和适用场景。

时间： 2024-11-10 08:16:40

网络媒体流的音视频同步

一、音视频同步原理介绍

二、实现方案简介

三、类似实现方案

网络媒体流的音视频同步的相关文章

即时通讯——详解音视频同步技术

音视频同步通讯SDK

ffmpeg转码MPEG2-TS的音视频同步机制分析

vlc源码分析（五）流媒体的音视频同步

(转)音视频同步-时间戳

音视频同步问题

ffplay(2.0.1)中的音视频同步

通俗的解释下音视频同步里pcr作用

libstagefright 音视频同步方案