视频压缩编解码技术就是对数字的视频信号进行压缩和解压缩的过程。
将输入的模拟电视信号变成输出的数字电视信号需经过取样、量化、编码三个步骤,由 A/D 变换器完成这三个步骤。
模拟电视信号经取样、量化、编码(PCM 编码)后得到的二进制序列,即数字电视信号。
电视信号的取样有两种:空间取样和时间取样。
1.时间取样:运动图像可由每秒若干帧静止图像构成,我国采用的 PAL 制彩色电视规定每秒 25 帧,美日等采用的 NTSC 制彩色电视则为每秒 30 帧。这种取样方式即时间取样。
隔行扫描帧图像由两场组成,每场由若干行组成,奇数行和偶数行各构成一场,它们分别为顶场和底场。帧场的邻近行相关性并不相同。帧的邻近行空间相关性强,时间相关性弱,因为某行的邻近行(下一行)要一场扫描完才能被扫描,在压缩静止图像或运动量不大的图像时采用帧编码方式。场的邻近行时间相关性强,空间相关性差,因为场的一行扫描完毕,接着对场中下一行扫描。因此对运动量大的图像常采用场编码方式。实际的视频图像有快有慢,有粗有细,应根据这个标准自适应选择帧/场编码方式。
黑白图像的每个像素只需一个幅值表示其亮度即可;而彩色图像的每个像素至少需要 3 个值表示表示其亮度和色度。所谓色度空间即表示彩色图像的亮度与色度的方法。
1.RGB:众所周知,任何彩色图像可由不同比例的红色、绿色和蓝色组合而成,即三基色原理。这种表示彩色图像的方法即 RGB 彩色空间。
彩色显象管(CRT)和液晶显示器件(LCD)可显示彩色图像,彩色摄像机中的电荷耦合器件(CCD)等传感器可产生彩色电视图像,都是根据 RGB 原理获得的。
2.YC b C r (YUV):人类视觉系统(HDV)对亮度比彩色更敏感,因此可以把亮度信息从彩色信息分离处来,并使之具有更高的清晰度,彩色信息的清晰度较低些,可显著压缩带宽,实现视频压缩的一部分,人的感觉却没有不同。
3.YUV和RGB转换:由大量实验得出(说明转换是不精确的):
Y=0.299R+0587G+0.114B
Cb=0564(B-Y)
Cr=0.713(R-Y)
R=Y+1.402Cr
G=Y-0.344Cb-0.714Cr
B=Y+1.772Cb
有三种不同的彩色电视取样格式
①4:4:4:Y、Cb和Cr具有相同的水平和垂直清晰度,在每一个像素位置,都有Y、Cb和Cr分量,即不论水平方向还是垂直方向,每4个亮度像素相应的4个Cb和4个Cr色度像素。
②4:2:2 :彩色分量和亮度分量具有相同的垂直清晰度,但水平清晰度彩色分量是亮度分量的一半。水平方向上,每5个亮度像素具有两个Cb和两个Cr。
③4:2:0:在水平和垂直清晰度方面,Cb和Cr都是Y的一半。
1.量化值Qp:量化值(量化节距)取的太大,视频图像显得粗糙;取的太小,视频图像质量好,但带宽浪费过大。一般认为,每个取样值采用8个比特表示,即256个灰度级,是比较合理的。
2.取样频率:CCIR601 建议的电视国际标准为:对每幅画面 625/50(625 行,每秒 50 场)的电视系统和 525/60(525 行,每秒 60 场)的电视系统取样频率都为:
fs=13.5MHz (亮度信号,即 Y 信号)
fs=6.75MHz (色差信号,即 Cb、 Cr 信号)
一个基本的视频处理和通信系统主要包括采集、预处理、视频编码、通信、图像处理及显示等几个方面
图像采集的功能由图像传感器实现,目前图像传感器主要有电荷耦合器件(CCD, charge coupled devices)和 CMOS 传感器
对压缩后的视频质量估计可分为主观视频质量评定和客观视频质量评定两种估计方法。
1.主观视频质量评定:
由于个人的视觉系统(HVS)不尽相同,对视频内容的熟悉程度也不一样。为了减少主观随意性,在对视频图像主观评定前,选若干名专家和“非专家”作为评分委员,共同利用五项或七项评分法对同一种视频图像进行压缩编码构图像评定。最后按加权平均法则对该压缩后的图像质量进行主观评定。
测试方法可用随机次序请评委观察比较原始图像和压缩编码的图像。国际上称为 DSCOS 的测试系统如图所示。其中 A 为原始图像,B 为编码解码后的图像,以任意的 A、B 次序让评委打分评定。
2.客观视频质量评定:
主观的视频质量评分更接近人的真实视觉感受,但需耗费人力和时间,成本较高。客观质量的测定方法速度快、易实行,但往往不会太符合人眼的视觉感受,只能说大体上的质量。客观质量测定方法应致力于改进其测试标准和测试方法,使其符合人的视觉感受。
最常用的测试标准是峰值信号与噪声之比(PSNR):
其中 MSE 为原始和编解码后图像之间的均方误差,(2n -1)2为图像种最大可能的信号值平方,n 为表示每个像素的比特数。
一般而言,PSNR越高视频质量越高,反之亦然。