视频通讯应用的音频和视频技术

随着视频通讯应用技术的不断发展和完善,越来越多的行业用户接受和使用视频通信产品。但在传统视频通讯技术标准下,由于受到视频通讯应用技术和音视频编解码技术发展的制约,视频通讯技术到现在还没有从根本上解决通讯过程中的图像和声音问题。低等级的视频质量无法满足用户对高清晰图像质量的特殊需求。

在现实运用中,人们对于视频的图像和声音的要求越来越高,例如:远程医疗、远程手术;远程维修等需要通过视频通讯这一过程实现对现场情况的精确视频传输(高清晰视频应用)。所以就需要我们提供更高视频通讯质量的高清晰视频通讯产品。因此佰锐科技推出了基于标准的H.264;H.264的高清晰视频通讯产品AnyChat开发平台。

高清晰视频通讯技术的视频要求:

视频通讯应用作为一种媒体应用方式同样需要遵循各标准组织所倡导的高清晰多媒体标准。当前高清晰数字电视(HDTV)所倡导的视频解析度主要有三种格式,分别为720P、1080I、1080P(其中“P”为逐行扫描方式;“I”为隔行扫描方式)。而高清晰视频通讯主要应用格式为:720P——即逐行720线。

视频通讯采用逐行扫描的原因在于,视频会议场景通常对动态图像要求不大(特殊领域除外),图像动态变化也较小,但对图像的细节要求却很高,同时还要保证图像的稳定性。而这些都是采用隔行扫描1080i(PAL制每秒钟扫描50场,分别对水平方向的奇数行和偶数行进行扫描,每场的实际解析度仅有540线)所无法满足的,因此在扫描方式上采用逐行扫描,能够更稳定的显示画面的细节,使得画面更加清晰。

在媒体流处理方面,需要将大量的原始视频音频数据流进行编码压缩后在传输链路上进行压缩传输。高清晰音视频流(720P)所处理的视频流是传统CIF格式流的10倍。如果采用更大解析度格式的视频图像,如1080P,会造成原始媒体数据流更为巨大,从而影响视频编码效率,降低通讯过程的实时性,增加延迟,同时也是对图像实时压缩技术的考验。因此,视频会议系统的建设,无论是建设标清还是高清晰视频通讯系统都要综合考虑用户对系统建设的投资,让用户付出相对较低的成本,得到最大的收益。采用过高的视频图像格式(1080P)进行媒体流的处理,这样对DSP的成本会增加,同时也会相应造成用户整体成本的增加,例如视频会议系统的周边配套设备——高清晰显示设备、回放设备、存储设备和主要的摄像采集设备,都要符合高清晰通讯的规程(高清晰视频通讯是一个完整的端到端的系统),而这些设备的价格都远超其他设备,会使得整体成本大幅提升,从而给用户所能带来的实际效果提升却并不明显。因此,采用720P视频格式作为图像解析度的格式能够使整体系统达到最佳的性价比,能够有效的降低用户的采购成本,避免投资浪费。

在图像的幅面显示方面,目前高清晰显示设备均可以同时支持4:3和16:9两种显示方式。传统视频通讯系统多数采用4:3显示方式,而高清晰视频通讯在视频格式幅型比上应采用更为符合人眼观赏习惯的16:9的显示方式来替代传统视频会议系统采用的4:3的显示方式,这是因为屏幕显示区域在垂直解像度(线数)相同的情况下,采用16:9显示方式可视面积比4:3显示方式的可视面积要增加20%左右,单帧画面可容纳更多的视频信息,这样视频通讯中用户就可以获得更大角度的视频图像。

所以综述得出结论是:在对高清晰视频通讯视频图像的最佳选择应该是:选择720P视频格式、16:9幅面的高清晰视频标准。

音频要求:

视频通讯过程是视频和音频的实时双向完整通讯过程。在这个过程中我们为了获得高清晰视频图像,有时却忽略了另外一个重要的过程——音频通讯过程。如果我们在观看高清晰视频图像的时候,不能得到一个更清晰、连续的音频效果。那么这个过程实际上就没有任何意义,所以其重要性甚至超过视频。在传统的视频会议系统中音频技术发展极其缓慢,原因在于目前应用于视频通讯的音频编解码压缩标准都是为了保持传输时的低带宽占用和较高的编解码效率,从而将音频信号的采样频率、采样精度和采样范围指标做了极大的降低,使得所能提供的音频清晰度和还原性都有很大程度上的衰减。与用于存储和回放非实时压缩协议的标准(如OGG、MP3等)相比,音频的保真度非常低。这样就在某种程度上对现场声音的还原达不到要求。目前传统视频通讯过程中主要采用的是G.711、G.722、G.722.1、G.728等音频标准,音频宽度仅有50Hz-7KHz单声道,而人耳所能感知的自然界的频响能力可以达到20Hz-20KHz,因此,在对现场环境音的还原过程中过多的音频信息的丢失造成了无法真实表现现场情况。所以在高清晰视频通讯过程中我们势必要有一种相辅助的音频处理方式解决此问题。使真个高清晰通讯过程更去近于完美。

目前国际上对音频处理技术上标准较多,在对下一代实时交互音频处理上可以采用MPEG-1 Layer 2或AAC系列音频,对选用标准的原则是,音频频响范围要达到22KHz,这样就几乎可以覆盖了人耳听觉的全部范围,甚至在高频方面还有所超越,能够使现场音频得到真实自然的还原,并且在还原时可以采用双声道立体声回放,使整个视频通讯的声音有更强的临近感,达到CD级音质。同时在对链路带宽的适应和编解码效率上达到最佳。下表列出AAC的9种规格。


标准


规   格


MPEG-2 AAC MAIN


主标准,对音频处理上,缺少增益控制


MPEG-2 AAC LC


使用了TNS,缺少增益和预测,提高编码效率


MPEG-2AAC SSR


可变取样方式


MPEG-4 AAC LC


低复杂度编码方式


MPEG-4 AAC MAIN


主标准


MPEG-4 AAC SSR


可变取样方式


MPEG-4 AAC LD


低延迟编码方式


MPEG-4 AAC HE


高效率编码方式


MPEG-4 AAC LTP


长时预测规格

综上所述,我们在对宽频音频的支持上可以选择MPEG-1 Layer 2或AAC系列标准,在上述列表中可以看出有9种AAC格式可供选择,每种格式均有各自特点。在下一代高清晰视频通讯应用领域中为用户提供CD级的宽频音频是我们追求的方向。

时间: 2024-12-11 02:14:03

视频通讯应用的音频和视频技术的相关文章

专有网络视频通讯的行业应用

信息科技化的发展,人们已不再满足由电话.电视.传真和电子邮件等单一媒体提供的传统语音和文字通信,而是需要数据.图形.图像.音频和视频等多种媒体信息以超越时空限制的集中方式作为一个整体呈现在人们眼前.如现在微信,不仅仅能够语音.文字.图片的通讯,视频聊天.群聊等其他媒体功能的使用.视频会议系统将计算机的交互性.通信的分布性和多媒体的实时性完美的结合起来,正在以其信息多元化.响应及时化等特点逐步为大众接受. 我国的视讯业发展已有10年的历程.发展之初的视频会议系统只是针对政府.金融.集团公司等高端市

ooVoo(视频通讯)

插件介绍: 在与别人交流时,我们常会用到视频通话这个功能,它不仅能消除空间限制,也让用户有了前所未有的体验,今天就给大家推荐一个优秀的视频通讯插件.ooVoo(视频通讯)是一款致力于高清网络视频通讯服务的插件,轻松地连接你的家人和朋友. 使用说明: 将ooVoo(视频通讯)添加至chrome,并在应用中启动它. 功能介绍: -高质量视频和音频-自由文本,发送消息照片和视频-回音消除-自由聊天,12个人同时在线视频通话-跨平台,支持任何设备 原文出自:ooVoo(视频通讯)

第 9 章 音频和视频

学习要点: 1.音频和视频概述 2.video 视频元素 3.audio 音频元素 主讲教师:李炎恢 本章主要探讨 HTML5 中音频和视频元素,通过这两个原生的媒体元素向 HTML 页面中嵌入音频和视频. 一.音频和视频概述 首先,我们要理解两个概念:容器(container)和编解码器(codec). 1.视频容器 音频文件或视频文件,都只是一个容器文件.视频文件包含了音频轨道.视频轨道和其他一些元数据.视频播放时,音频轨道和视频轨道是绑定在一起的.元数据包含了视频的封面.标题.子标题.字幕

html5 音频和视频(audio And video)

1.音频和视频  Web 上的视频 直到现在,仍然不存在一项旨在网页上显示视频的标准. 今天,大多数视频是通过插件(比如 Flash)来显示的.然而,并非所有浏览器都拥有同样的插件. HTML5 规定了一种通过 video 元素来包含视频的标准方法. 视频格式 当前,video 元素支持三种视频格式: 格式    IE Firefox Opera Chrome Safari Ogg     No 3.5+ 10.5+  5.0+ No MPEG4 9.0+  No           No 5.

【Android】20.0 第20章 音频、视频、拍照、截图

分类:C#.Android.VS2015: 创建日期:2016-03-11 一.简介 Android提供了常见的多媒体文件编码.解码机制,你可以直接调用Android提供的API,实现相册.播放器.录音.摄像等功能.换言之,你可以通过Activity和Intent,直接访问各种多媒体文件或流数据(本地媒体文件.外部存储文件.资源文件.URL指定的音频视频网络流). 本章要点: l 音频和视频播放:MediaPlayer类. l 播放视频播放:MediaPlayer类.MediaControlle

第9章 音频和视频

第 9 章音频和视频 学习要点: 1.音频和视频概述 2.video视频元素 3.audio音频元素 本章主要探讨 HTML5中音频和视频元素,通过这两个原生的媒体元素向  HTML页面中 嵌入音频和视频. 一.音频和视频概述 首先,我们要理解两个概念:容器(container)和编解码器(codec). 1.视频容器 音频文件或视频文件,都只是一个容器文件.视频文件包含了音频轨道.视频轨道和其 他一些元数据.视频播放时,音频轨道和视频轨道是绑定在一起的.元数据包含了视频的封 面.标题.子标题.

远程教育 音视频通讯技术

多媒体指挥调度系统集指挥调度.即时通讯.视频会议.音视频录播等功能于一体.该系统结构严谨.技术先进.性能稳定,适合于解放军.武警.边防.生产企业等单位.通过该系统完成远程和现场之间的语音.数据.图像等信息的实时交互,有效解决了在不同网络带宽条件下的音视频交互,达到了充分有效利用现有网络和设备资源,实现远程可视化指挥.调度目的. 网络音视频技术是基于嵌入式结构的音视频处理.控制及传输设备,将模拟音视频信号经过编码压缩后通过以太网接口,将低码率的视音频编码数据以IP 包的形式传送给多个远端PC或网络

视频通讯技术的发展与应用

随着现代通讯技术和业务的发展,人们对通讯的需求已经过最初的单一语音需求转变为对视频和音频的通讯需求,以传送语音.数据.视频为一体的视频通讯业务成为通讯领域发展的热门,以点到点或多点视音频通讯为主要形式的视频会议.远程医疗.远程教育等服务得到越来越多的使用.佰锐科技的AnyChat SDK内部封装了音视频的采集.编码.传输.解码以及播放(显示)功能,只需要几个简单的API调用,即可实现多个用户之间的语音.视频.文字交互,在视频游戏平台.视频会议系统.远程教育系统.部队远程指挥系统等多个行业应用实现

视频通讯技术对远程教育的发展

传统教学以班级为单位,按照地域范围教学和学习,在中国地域范围特别广,地域差别决定了教育教学的不对等,随着通信技术的发展,即时通讯技术作为现代教育基本技术之一,将其应用于教育教学,是时代的需要.国内拥有领先音视频通讯技术的佰锐科技十年专注于"AnyChat"音视频开发平台,通过采用先进的H.264视频编解码技术和AAC音频编解码技术,改善P2P数据传输技术.成为大多数行业应用的音视频通讯技术第一选择.音视频通讯是一个终端服务,它允许两人或多人利用网络对文本.语音.视频等多种形式的信息进行