在互联网的飞速发展的时代,远程教育已逐渐从传统教育领域的剥离出来并且成为一个非常重要的市场行业。目前,参加网校学习的人员正在逐步增多,按学习的目标不同分为学历学位、职业培训、网上充电等三种类型。学习方式目前主要分为集体开班和个体学习两种。另一方面,在互联网上各种各样的网校也到处可见,有正规大学开办的经过国家教委认可其学历的攻读本科、研究生课程的网校;有全国知名重点中学在网上搞的针对高考辅导的以应试教育为主的网校;还有一些商业网站针对网上充电者举办的一些职业技术培训的网校等。事实上,许多讲演、培训、会议等大量的信息是通过音频和视频媒体来进行传播的。音频和视频信息被广泛用于教学与学习上。
而音视频采集,编解码和网络传播技术是实现远程教育必不可少的技术条件。小编通过本文介绍了如何来获得技术平台和通过Internet来传播音视媒体的技术方案,并重点阐述了其中的编解码技术。还将通过网上一个实际的音视频技术的产品实例进行演说,AnyChat音视频SDK是在该领域上,音视频和网络传播技术就是非常领先的!(www.anychat.cn网址可以浏览其他信息)
建立Internet的传播系统。此系统包括提供与此方案相关网页的Web服务器;为本媒体服务的音频和视频流服务器;高质量的音、视频录制设备(如无线话筒、有线话筒、调音台和专业摄像机等)。并配备合适的音、视频捕捉、编辑软件和音、视频压缩编码软件。
1 . 硬件设备
典型的录制设备配置如图1所示,制作和广播设备如图2所示。并需要几个工作室来对这些设备进行管理,其中之一主要用来维护录制设备和录制音视媒体,另外用来维护服务器的硬件和软件。基于Internet远程教育的音视频媒体技术研究
基于Internet远程教育的音视频媒体技术研究在现场录制中,音频的采集可用无线或有线话筒,通过混音器接入到摄像机的音频输入口;视频图象用摄像机进行拍摄。把从摄像机的音频输出口输出的音频信号经A/D转换后,输入到计算机,并用相应的软件进行音频压缩编码,生成音频流文件。把摄像机输出的视频信号送入计算机中的视频捕捉卡,以转换为数字信号,并由相应的软件进行视频压缩编码,形成视频流文件。然后把这些流文件传到指定的网络服务器上,这样远端的学生就可通过Internet来访问这些流文件。
由于远端学生的Internet接入速率各不相同,而且往往是比较有限的。因此对录入的音频和视频信号进行压缩编码的质量与压缩比是此技术方案的关键。采用先进的音频和视频压缩编码技术,能很好地保证此方案的实现。
2. 音频编解码技术
本方案的音频压缩采用MP3压缩编码技术。MP3是MPEG-1音频压缩标准的第三层,结合了MUSICAM和ASPEC两种算法,是运算复杂度最高而压缩效果最好的一层。MP3编码属于频域编码,它主要利用了人体听觉系统掩蔽效应。
MP3采用与杜比AC-3相似的变压缩比率(VBR)压缩技术,采样的压缩比率依音乐中信息多寡、并利用人耳的掩蔽效应来减少冗余数据。经过MP3编解码后,尽管还原的信号与原信号不完全一致,仪器实测的指标也不高,但主观听音效果却基本未受影响,而数据量却大大减少,只有原来的1/10~1/12,约1MB/分钟,也就是说,一张650M的CD盘可容纳超过10小时的CD音质的音乐(44.1kHz,16bit)。换句话说,采用44.1kHz的取样率,MP3的压缩比例能够达到1:10~1:12,而基本上拥有近似CD的音质。1分钟无压缩的CD音乐转换成文件需要10MB的存储空间,如果压缩成MP3文件只需要1MB就够了。将音频文件压缩成MP3文件,其实就是利用MP3编码器找到并删除音频文件中人耳听不到的声音。正常的人耳只能听到频率在20赫兹至2万赫兹的声音,音频文件中包含的一些声音可能超出了人耳所能听到的范围,另外还有一些细微的声音可能被更大的声音掩盖,还有一些音乐中的声音可能根本就是多余的。编码软件能将代表这类声音的文件找出来并加以删除。这样,原先臃肿的音频文件就变小了。
而AnyChat采用先进的AAC(Advanced Audio Coding)语音编码体系,AAC是新一代 MPEG1/2 Audio 的有损音频编码, 是 MPEG-4 使用的音频编码,AAC采用了感知子带技术(perceptual sub-band technology),与MP3等其它编码器相比,AAC编码器很大程度地改善了数据压缩率和声音品质。AnyChat还全面支持静音检测(VAD)、噪音抑制(NS)、自动增益(AGC)以及回音消除(AEC)等音效处理,极大提高用户体验。
3.视频编解码技术
本方案的视频压缩采用MPEG-4压缩编码技术。MPEG-4是在MPEG-1和 MPEG-2标准发展起来的一个国际标准,MPEG-4标准提供了一套满足程序设计者、服务提供者、终端用户需要的技术。MPEG-4的视频编码部分为了实现众多的媒体应用,以算法和工具的形式为下列功能的实现提供了解决方案:
(1) 图像和视频的有效压缩;(2) 2D和 3D网格纹理映射图 (用于合成图像编码 )的有效压缩;
(3) 隐含 ( implicit )的 2D网格的有效压缩;(4) 控制网格运动的节点时变几何数据流的有效压缩;
(5) 各种视频对象的有效存取;(6) 对图像和视频序列的扩展操纵;(7) 基于内容的图像和视频编码;
(8) 纹理、图像和视频基于内容的伸缩性;(9) 视频序列中时域、空间及质量的伸缩性。
此外,MPEG-4还致力于一些新功能的研究与定义。这些新功能可划分为三大类:(1)基于内容的交互功能。包括基于对象的多媒体存取工具;基于对象的码率控制和编辑功能;基于对象的时域随机存取。(2)数据压缩编码。包括视频数据的高效编码,多个并发数据的有效编码。(3)通用存取功能:包括易错环境下的鲁棒性;基于内容的伸缩性 (表现在时域、空间及重建图像质量上)。
AnyChat采用国际领先的视频编码标准H.264(MPEG-4 part 10 AVC /H.264)编码,H.264/AVC 在压缩效率方面有着特殊的表现,一般情况下达到 MPEG-2 及 MPEG-4 简化类压缩效率的大约 2 倍。H.264具有许多与旧标准不同的新功能,它们一起实现了编码效率的提高。特别是在帧内预测与编码、帧间预测与编码、可变矢量块大小、四分之一像素运动估计、多参考帧预测、自适应环路去块滤波器、整数变换、量化与变换系数扫描、熵编码、加权预测等实现上都有其独特的考虑。采用先进去马赛克技术,保障在视频通讯过程中不出现花屏、马赛克等现象。对于远程教育来说,该技术是实现高质量教学的重要技术方式!
3.P2P技术
针对可不经过服务器中转的音视频应用,采用了P2P通信技术,该技术的核心在于防火墙的穿越。使用P2P通信技术,可以大大的减轻系统服务器的负荷,并成几何倍数的扩大系统的容量,且并不会因为在线用户数太多而导致服务器的网络阻塞。
AnyChat产品支持UPNP协议,自动搜索网络中的UPNP设备,主动打开端口映射,提高P2P通信效率。
通过本技术方案,可以对专家的讲演、教师的优质课进行实况录音、录像,并把采集到的音频和视频媒体用MP3和MPEG-4压缩编码技术进行处理,使其成为适合在Internet上可以传播的音频流和视频流,以便远端的学生进行访问,这样,可最大限度地实现师资和各种教育资源的共享,充分发挥学生的自主学习,实现远程教育的目的。