数字视频基础(一)

上海凯视力成信息技术有限公司 编写

版权所有,转载和引用请注明出处

1.    基本概念

1.1视频的表示

1.1.1图像的表示

把一个图像用一个个像素来表示,每个像素有确定的位置和确定的亮度值(这里假设是黑白图像)。于是构成了图象。

比如下面的图片:

我们用0表示白,1表示黑,则图像可表示成:

图像有2个分辨率:一个是空间分辨率,也就是图中的水平分辨率N和垂直分辨率M;另一个是灰度级分辨率,也就是用几个bit来表示灰度等级。极端的有二值图,如刚才那个“1”的图。

1.1.2视频的表示

视频也就是在时间轴上的图像序列,如果把图像看成是二维(空间x,y),那么视频就是三维了(空间x,y,加时间t,这个t有时候可能是帧号)。视频的数学表达是f(x, y, t)或f( ,t) 或f(x, y, n)或f( ,n)

每秒图像的帧数,称为视频的帧频。

1.1.3逐行视频和隔行视频

逐行扫描就是成像时一行行扫描形成一帧视频,显示的时候将一帧视频显示在屏幕上。

隔行视频是成像时先扫描偶数行,形成一场叫偶场,然后再扫描奇数行形成奇场图像。这样将一帧图像分成了2场:偶场和奇场,这两场在空间上和时间上都是不一样的。显示的时候,也应该先在显示器的偶行位置显示偶场图像,再在奇行位置显示奇场图像。

逐行视频和隔行视频的比较:

下面讨论一些问题:

(1)      为什么有隔行扫描这种视频格式?

假设一个720x576分辨率帧频是25Hz的视频,如果是逐行扫描,则数据量为720x576x25像素/秒。如果我们采用隔行扫描,则数据量为720x288x50像素/秒,隔行扫描是场频为50Hz。显然数据量是相同的,但是,隔行扫描带来的好处是图像的刷新频率是50Hz了,这样大大降低了早期显像管显示器的显示视觉效果,视频闪烁感会大大降低。

(2)      隔行视频的显示问题:

我们现在大量使用的LCD显示器均是逐行扫描的显示器,对于隔行视频,要把奇偶两场合并到一起形成一帧一次性显示出来,我们前面讨论过偶场和奇场在空间上和时间上都是不一样的,因此,这种简单的合并,如果图像是静止的,不会有问题;但是如果摄像机是运动的,或者说图像内容是运动的,就会出现毛刺样的锯齿问题,图像质量严重恶化,如下图,这个图是不难理解的且一定要理解。如何解决这个问题,需要一个去隔行算法,我们后面再做介绍。

(3)      隔行视频的分辨率的问题

如果视频内容是静止的,那么隔行视频能达到逐行视频的分辨率。如果视频内容是变化的,在隔行显示器中显示,垂直方向分辨率会降低一半连载逐行显示器中显示,即便采用去隔行算法,垂直分布率也会略有降低。

1.2 色彩空间

1.2.1 不同的色彩空间用处不一样

对于黑白图像,一个像素,我们用亮度(或灰度)来表示其亮暗程度,一般我们用8bit或10bit、甚至16bit的无符合整数来表示一个像素的灰度。

对于彩色图像,我们都知道可以用R(红分量)、G(绿色分量)、B(蓝色分量)来这三个分量表示一个像素。

用RGB来表示图像非常适合CCD、显示器等设备,但是有时做图像处理时用RGB并不是很方便,比如:我们想调整图像亮度、饱和度等的时候,或者仅仅想调整亮度的时候,或者分析视频对象的亮度特征的时候,我们在RGB这个色彩空间是做。于是,我们又用了YUV(YCbCr)、HSI等色彩空间,无论是RGB、YUV、HSI它们都能够对彩色图像进行表述,因此,互相之间可以转换。

         HSI:H分量反映色度,S分量反映饱和度,I分量反映亮度。

         YUV(YCbCr):Y亮度分量,U、V(或Cb、Cr)颜色分量。

1.2.2 色彩空间的互相转换

(1)RGB转HSI

(2)HSI转RGB:

(1)RGB转YUV:

(2)YUV转RGB:

1.2.3 彩色图像的格式

RGB表示的图像,一般均是4:4:4格式,也就是每个像素都有自己的RGB,数据格式R0,G0,B0,R1,G1,B1….

一般我们用8Bit无符合数来表示RGB三个分量,因此一个像素需要24bit,为了节省空间,我们有RGB444(三个分量都是4bit),RGB555(三个分量都是5bit),RGB565(R、B分量都是5bit,G分量是6bit)

YUV表示的图像有4:4:4、4:2:2、4:2:0

关于4:4:4,4:2:2,4:2:0用下图解释:

RGB和YUV每个分量数据所占的存储内存大小如下图:

         彩色图像的Bayer编码:

Bayer编码是一种使用8bit的数据位宽输出24bit(RGB)彩色信号的一种方法,给每个像素分配三个分量(R、G、B)之一,这一你可以利用每个像素自身及其临近位置像素的颜色信息来获得该像素RGB信息。

Line0:BGBGBGBG。。。

Line1:GRGRGRGR。。。

Line2:BGBGBGBG。。。

Line3:GRGRGRGR。。。

假设你想确定Line2,Col 3这个位置的像素的RGB值,其周边像素颜色分量值如下:

RGR   -----   200  50  220

GBG   ----    60  100  62

RGR   ----    196  58  198

则该像素的RGB值可以计算如下:

R = (200+220+196+198)/4

G = (50 + 80+62+58)/4 = 58

B = 100

当然这种计算法比较简单,还有更简单,也有更复杂,这些不过是运算量、速度、硬件、和图像质量之间的一种交易。

数字视频基础(一),布布扣,bubuko.com

时间: 2024-10-19 13:52:56

数字视频基础(一)的相关文章

数字视频基础(二)

2.    常用数字视频标准 2.1 BT656 首先要理解模拟PAL/NTSC的视频信号的波形: 要进行视频的数字传输,首先我们要将模拟视频信号数字化,获得每个像素的YUV值,一般采用YUV422格式,仅仅传输图像数据还不行,还要传输行同步.场同步.奇偶场信号.以及每行图像什么时候开始的,什么时候结束的.这样在接收端才能正确接收和理解数据,并获得视频的重现. SAV(有效视频开始)和EAV(有效视频结束)码,反映了模拟视频的同步信号.由前导符FF.00.00开始,这三个字节的前导符在视频数据中

数字视频基础(三)

2.3 HDMI和DVI 2.3.1 HDMI 2.3.1.1 概述 如下图所示,HDMI电缆和连接器有4对差分线,3对TMDS数据线和1对时钟通道.这些通道用来传输视频.音频和辅助数据.另外,HDMI还有DDC通道,DDC是用来配置显示器和获得显示器状态,这里我们不讨论DDC. 音频.视频和辅助数据通过3个TMDS数据通道来传输,TMDS时钟,其频率通常是视频像素时钟频率,作为接收器的参考频率.TMDS将每个TMDS数据通道的并行8bit数据转换为直流平衡跳变最少的串行10bit数,因此发送是

数字视频基础(四)

3. 常用视频处理算法 3.1 图像的缩放 所谓图像缩放就是创立新的像素位置并对这些新位置赋灰度值.比如,有一副大小为500x500像素的图像,想把它放大1.5倍,也即750x750像素,概念上看,一种最容易的形象化放大方法就是在原始图像上,放一个虚构的750x750的栅格.很显然栅格的间隔小于1个像素,因为,我们在一个较小的图像上去拟合它.为了对覆盖层上的任何电进行灰度赋值,我们在原图像上寻找最靠近的像素并把它的灰度付给栅格上的新像素.当对覆盖栅格的全部点都赋完值之后,就得到放大的图像.这种灰

音视频基础,各种连接线的接入方法。

音视频基础 1. 基本流程 2. 流程简介 2.1 解协议 名称 推出机构 传输层协议 客户端 使用领域 RTSP&RTP[&RTCP] IETF TCP&UDP VLC.WMP IPTV RTMP Adobe Inc. TCP Flash 互联网直播 RTMFP Adobe Inc. UDP Flash 互联网直播 MMS Microsoft Inc. TCP/UDP WMP 互联网直播&点播 HTTP WWW+IETF TCP Flash 互联网点播 2.2解封装 名称

数字信号处理 基础知识 对比回顾

1.非周期序列 非周期序列傅里叶变换FT: 非周期序列傅里叶逆变换IFT: 连续时间信号的傅里叶变换FT: = 连续时间信号的傅里叶逆变换IFT: (t) = 2.非周期序列傅里叶变换FT性质: (1).周期性 (2).线性 FT[a*x(n)+b*y(n)] = a*+b* (3).时移与频移 FT[x(n - a)] = FT[x(n)]* = * FT[] = (4).对称性       x(n) = 共轭对称序列 共轭对称序列的实部是偶函数,虚部是奇函数 eg:      x(n) =

视频编解码:第二章 数字视频

1. 图像与视频 图像:是人对视觉感知的物质再现: 三维自然场景的对象包括:深度.纹理和亮度信息: 二维图像:纹理和亮度信息 视频:连续的图像 视频由多幅图像构成,包含对象的运动信息,又称为运动图像. 2. 数字视频 数字视频:自然场景空间和时间的数字采样表示. 空间采样:解析度(Resolution) 空间采样:帧率/秒 3. 空间采样 二维数字视频图像采样 4. 数字视频系统 采集:照相机,摄像机 处理:编解码器,传输设备 显示:显示器 5. 人类视觉系统HVS HVS:眼睛,神经,大脑 H

[svc]数字证书基础知识

数字证书基础原理 数字证书采用PKI(Public Key Infrastructure)公开密钥基础架构技术,利用一对互相匹配的密钥进行加密和解密. 每个用户自己设定一把特定的仅为本人所知的私有密钥(私钥),用它进行解密和签名:同时设定一把公共密钥(公钥),由本人公开,为一组用户所共享,用于加密和验证签名.当发送一份保密文件时,发送方使用接收方的公钥对数据加密,而接收方则使用自己的私钥解密,通过数字的手段保证加解密过程是一个不可逆过程,即只有用私有密钥才能解密,这样保证信息安全无误地到达目的地

【深度分解】听趣拍云产品经理剖析视频基础知识(2)

"随着技术的不断进步,视频技术的制作加工门槛逐渐降低,信息资源的不断增长,同时由于视频信息内容更加丰富完整的先天优势,在近年来已经逐渐成为主流.在基础知识(1)里面已经讲了模拟时代和数字化时代的视频技术.接下来将对视频编码与压缩.画面压缩.运动压缩.互联网视频应用的到来做一个详细的介绍." 视频编码与压缩 视频编码与压缩,是数字化视频非常重要的技术,以至于它直接影响到视频在各个领域的应用.如果没有视频编码技术的不断提高,我们今天也不可能在方方面面享受到视频的便利性. 首先,视频编码是一

音视频基础知识汇总

转载自 http://www.cnblogs.com/kenshincui/p/4186022.html 随着移动互联网的发展,如今的手机早已不是打电话.发短信那么简单了,播放音乐.视频.录音.拍照等都是很常用的功能.在iOS中对于多媒体的支持是非常强大的,无论是音视频播放.录制,还是对麦克风.摄像头的操作都提供了多套API.在今天的文章中将会对这些内容进行一一介绍: 音频 音效 音乐 音频会话 录音 音频队列服务 视频 MPMoviePlayerController MPMoviePlayer