1 / 31

第 9 讲

第 9 讲. 数据压缩基本概念. 1. 数据压缩方法. 2. 数据压缩方法应用. 3. 视频图像国际标准. 4. 多媒体压缩编码技术. 传输. 源文件. 解压. 压缩. 还原. 9.1 数据压缩基本概念. 压缩. 从信息论(奠基人:香农 C.E.Shannon )的角度看, [ 压缩 ] 就是去掉信息中的 [ 冗余 ] ,即保留不确定的信息,去除确定的信息。用一种更接近信息本质的描述来代替原有冗余的描述。. 数据压缩. 是一种数据处理的方法,它的作用是将一个文件的数据容量减少,而又基本保持原文件的信息内容。

danyl
Télécharger la présentation

第 9 讲

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第9讲 数据压缩基本概念 1. 数据压缩方法 2. 数据压缩方法应用 3. 视频图像国际标准 4. 多媒体压缩编码技术

  2. 传输 源文件 解压 压缩 还原 9.1 数据压缩基本概念 • 压缩 从信息论(奠基人:香农C.E.Shannon)的角度看,[压缩]就是去掉信息中的[冗余],即保留不确定的信息,去除确定的信息。用一种更接近信息本质的描述来代替原有冗余的描述。 • 数据压缩 是一种数据处理的方法,它的作用是将一个文件的数据容量减少,而又基本保持原文件的信息内容。 [目的]减少信息存储空间,缩短信息传递时间,当需要使用这些信息时则需通过解压缩将信息还原。 教学进程

  3. 数据压缩的必要性 一幅640×480中等分辨率的真彩色图像数据量约为( )MB?一个容量为20GB的硬盘只能存放( )帧静止的画面,如存放25帧/秒的全活动视频画面只够播放( )秒钟? 0.879MB 17580帧 293秒(约4.88分钟) 图像数据量 = 图像总像素×像素深度/8(B) • 数据压缩的可能性 (1)原始信源数据存在着大量的冗余。 (2)由于多媒体信息的主要接受端的人类视觉、听觉器官具有某种不敏感性。

  4. 图像与视频的冗余类型 [图像数据压缩技术] 就是利用图像数据的冗余性来减少图像数据量的方法。常见图像数据冗余类型如下: 1. 空间冗余 2. 时间冗余 3. 视觉冗余 4. 符号冗余 5. 结构冗余 6. 知识冗余

  5. 图像冗余——空间冗余 特征: (1)一幅静止图像 (2)表面上各采样点的颜色之间往往存在着[空间连贯性],即区域中各点光强、色彩、饱和度相同. 例如:一幅图画,大部分区域是蓝色背景,当连续出现3000个蓝色像素时,原始信息要连续记录3000个“蓝色像素”;若改用一个简单的词组——“3000个蓝色像素”来描述这3000个“蓝色像素”,信息量也会大大减少。

  6. 图像冗余-时间冗余 序列图像(电视、运动图像)短暂时间内的变化很小,中间存在着大量重复的数据画面,即运动图像中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面 同理,语音数据中也存在着时间冗余。 图像冗余-视觉冗余 人类的视觉系统对图像场的敏感度是非均匀的。但是,在记录原始的图像数据时,通常假定视觉系统近似线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生比理想编码(即把视觉[敏感]和[不敏感]的部分区分开来的编码)更多的数据,这就是视觉冗余。

  7. 评价压缩的主要指标 压缩比:输入数据和输出数据比 信息质量(失真率):无损压缩图象质量不变;有损压缩失真情况很难量化,只能对测试的图象按信噪比、分辨率、颜色等指标进行估计 压缩和解压缩时间:静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求。 压缩比大  算法简单  恢复效果好

  8. 9.2 数据压缩方法 无损压缩(无失真压缩、可逆压缩) 压缩比:2:1---5:1 应用:文本、程序 如:算术编码、行程编码、Huffman编码等 有损压缩 允许压缩过程损失一定的信息,不能完全恢复原始数据,但对信息的呈现效果影响较小(有失真压缩) 压缩比大 如JPEG的压缩比达50:1 应用:图像、音频、视频 如:预测编码、变换编码、小波变换、分形图像编码等

  9. 无损压缩——行程编码 行程长度编码(run length encode 缩写RLE或RLC ) 检测重复 的比特或字符序列,并用它们的出现次数取而代之。 .BMP .TIFF .AVI使用这种压缩方法。 两大模式: 一是消零(消空白),将数字中连续的“0”或文本中连续的空白用一个标识符(或特殊字符)后跟数字N(连续“0”的个数)来代替。 如:数字序列:742300000000000000000055 编码为:7423Z1855   字符串abacccbbaaaa,可压缩为abac3b2a4 二是行(游)程(run length)编码。任何重复的字符序列可被一个短格式取代。 如:碰到500个连续相同的像素,像素颜色值为“01”,就可以表示为“500个01”

  10. 5 5 5 5 5 5 5 5 5 5 5 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 4 4 4 4 7 7 7 4 4 4 4 4 7 7 7 7 7 4 4 4 7 7 7 7 7 7 7 7 (5,8) (5,3) (8,5) (8,8) (8,8) (8,4) (4,4) (7,3) (4,5) (7,5) (4,3) (7,8) 无损压缩——行程编码 右边单元格中列出的是采用行程编码对这组数据水平扫描得到的编码。 说明:这里用了12对数据就描述了左边64个像素的颜色值。

  11. 无损压缩——哈夫曼编码 基本思想:将出现概率高的信号给予较短的编码,而出现概率较低的信号给予较长的编码。 特点:最佳变长码,编码效率高。 具有即时性和唯一可译性。 Huffman编码的一般过程: (1)将信源符号按概率递减排列; (2)把两个最小概率相加作为新符号的概率,并按(1)重新排列; (3)重复(1)、(2)直到概率和为1; (4)在每次合并信源时,将被合并的信源分别赋0和1; (5)寻找从每一个信源符号到概率为1处的路径,记下路径上的1和0,并写出1、0序列(从树根到信源符号节点)

  12. 信源信号 出现次数 概率 A 15 0.47 B 7 0.22 C 1 0.03 D 6 0.19 E 3 0.09 无损压缩——哈夫曼编码 例:设有一组信源信号A、B、C、D、E,它们各自出现的次数分别为:15、7、1、6和3次,用Huffman编码方式,写出五个信源的编码,并求出平均码长。 A信号出现的概率为: 15/(15+7+1+6+3)=0.47

  13. A 0.47 0.47 0.47 0.47 1 1 B 0.22 0.22 0.22 1 0.53 D 0.19 0.19 0 0 0 0.31 E 0.09 1 1 0.12 码字 码长 C 0.03 A 1 1 0 B 01 2 C 0010 4 D 000 3 E 0011 4

  14. 信源信号 出现次数 概率 编码 A 15 0.47 0 B 7 0.22 10 C 1 0.03 1111 D 6 0.19 110 E 3 0.09 1110 无损压缩——哈夫曼编码 Huffman编码的平均码字长度计算: AVG=P1L1+P2L2+......PnLn 其中:Pi为信源符号Xi的出现概率;Li为编码后Xi的码长。 AVG=0.47*1+0.22*2+0.03*4+ 0.19*3+0.09*4 =1.96

  15. 无损压缩——哈夫曼编码 例:信源信号X1、X2、X3、X4、X5、X6、X7出现的概率分别为0.35、0.2、0.15、0.1、0.1、0.06、0.04,求7个信号的H编码及平均码长 答案:00、10、010、011、110、1110、1111 共需要2.55Bit

  16. 无损压缩——算术编码 基本思想:不为每一个符号产生一个单独的代码,而是把一个信源集合表示为实数线0到1之间的一个区间。信息越长,间隔越小,表示这一间隔所需的地进制位数变越多。 无损压缩——LZW编码 LZW(Lempel-Ziv-Welch)压缩使用字典库查找方案。它读入待压缩的数据并与一个字典库(库开始是空的)中的字符串对比,如有匹配的字符串,则输出该字符串数据在字典库中的位置索引,否则将该字符串插入字典中。 .GIF 和.TIF 格式的图形文件也是按这一文件存储的。

  17. 有损压缩 图像或声音的频带宽、信息丰富,人类视觉和听觉器官对频带中某些频率成分不大敏感,有损压缩以牺牲这部分信息为代价,换取了较高的压缩比。 常用的有损压缩方法有:PCM(脉冲编码调制)、预测编码、变换编码、插值与外推等。 新一代的数据压缩方法有:矢量量化和子带编码、基于模型的压缩、分形压缩及小波变换等。

  18. 有损压缩——预测编码 利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编码。如:DPCM和ADPCM 原理:数据由采样得到,相邻值间有较大的相关性,预测误差不会很大,可用较小的位数编码。去除相关性。是一种在时间领域中的压缩编码

  19. 有损压缩---预测编码 差分脉冲编码调制DPCM:利用音频抽样的幅度分布规律,实现数据压缩。对实际值与预测值之间的差值进行量化编码 实例:x(n) 0 1 2 1 1 2 3 3 4 4 (n) 0 0 1 2 1 1 2 3 3 4 d(n) 0 1 1 -1 0 1 1 0 1 0 X(n)是下一样值的实际值; (n)是下一样值的预测值

  20. 有损压缩---预测编码 自适应差分脉冲编码调制(ADPCM):对DPCM方法的改进,通过调整量化步长,对不同频段所设置的量化字长不同,使数据进一步压缩。在DPCM中加入自适应的方法。有两种: (1)自适应量化:在一定的量化精度下减少量化误差或在同样的误差条件下压缩数据率 (2)自适应预测:选择最佳参数 有损压缩---分形编码 分形的方法是把一幅数字图像,通过一些图像处理技术,如颜色分割,边缘检测、频谱分析、统理变化分析等原始图像分成一些子图像。然后在分形集中查找这样的子图像。分形集实际上并不是存储所有可能的子图像,而是存储许多迭代函数,通过迭代函数的反复迭代,可以恢复出原来的图像

  21. 有损压缩——变换编码 先对信号函数变换,然后对变换后的信号进行编码。 目的是通过变换,尽量减少各坐标值间的相关性,使坐标值具有较大的独立性。由于图像、声音等大部分信号都是低频信号,通过变换可以使信号的能量相对集中,从而达到压缩的目的。 变换编码一般采用变换矩阵,力图使变换具有最小均方差。 关键:在信号源矩阵已知的条件下,寻找一个协方差矩阵实现交正变换,使变换后的协方差矩阵满足或接近于一个对角矩阵。 主要变换有: KLT变换是一个最佳变换,但是其变换矩阵总需要根据其信号源来计算,而且计算量非常大,因此实用性不高。 DFT与FFT虽然可以用固定的正交变换矩阵来实现压缩,但需要有复数运算,仍然达不到人们的期望程度。 离散余弦变换DCT 小波变换

  22. 有损压缩---混合编码 混合编码是利用了各种单一编码压缩的长处,以求在压缩比、压缩效率及保真度之间取得最佳折衷。 该方法在许多情况下被应用,如JPEG 和MPEG 标准就采用了混合编码的压缩方法。

  23. 音频压缩方法 无失真压缩 有失真压缩 Huffman编码 波形编码 参数编码 混合编码 全频带编码 PCM DPCM ADPCM 行程编码 矢量和激励线性预测VSELP 线性预测LPC 多脉冲线性预测MP-LPC 子带编码 自适应变换编码ATC 心理学模型 码本激励线性预测CELP 矢量量化 9.3 数据压缩方法应用

  24. 图像和视频压缩方法 无失真压缩 有失真压缩 预测编码 变换编码 模型编码 混合编码 基于重要性 Huffman编码 DCT变换 JPEG 滤波 分形编码 行程编码 运动补偿 子采样 MPEG 算术编码 小波变换 矢量量化 H.261 子带编码 LZW编码 9.3 数据压缩方法应用

  25. JPEG –静态图像编码标准 MPEG-运动图像编码标准 H2.61-视频通信编码标准 9.4 图像视频编码国际标准

  26. JPEG(Joint Photographic Experts Group)标准 联合图片专家组。适合于彩色和单色多灰度连续色调的静止图像的压缩标准。包括无损压缩的Huffman编码和有损压缩的离散余弦变换DCT 。 前者不失真但压缩比小,后者失真但压缩比大,且人眼基本不能发现。

  27. MPEG标准 ( Moving Picture Experts Group ) MPEG标准分成MPEG视频、MPEG音频和MPEG系统三大部分。 MPEG算法除了对单幅图像进行编码外(帧内编码),还利用图像序列的相关特性去除帧间图像冗余,大大提高了视 频图像的压缩比。 压缩比可达到60-100倍。

  28. MPEG标准 标准:MPEG-1,MPEG-2、3,MPEG-4,MPEG-7MPEG-21。 MPEG-1:1993年8月公布,适用于数据传输率为1.5Mb/S的应用环境。是为CDROM、光盘的视频存储和播放而制定的。 MPEG-2、3:1994、11被批准。此后对其进行了扩展。是运动图像及有关声音信息的通用编码标准。DVD, 广播级的数字电视, HDTV MPEG-4:1998、11公布。低速( <=64kb/s)的视频压缩标准。注重视频和音频对象的交互性。固定和无线网络,交互AV服务以及远程传输 MPEG-7:1998、10公布。是多媒体内容描述接口。 MPEG-21:2000.6批准制定。称为数字视听框架,将标准集成起来相互支持和相互协调以管理多媒体商务。

  29. MPEG与其它算法或压缩方案相比有什么优点? • 国际化的开放标准,兼容性好,代表技术发展趋势。 • 能够比其他算法提供更好的压缩比。 • MPEG在提供高压缩比的同时,对数据的损失很小。

  30. JPEG和MPEG的差别 (1)MPEG视频压缩技术是针对运动图像的数据压缩技术。为了提高压缩比,帧内图像数据和帧间图像数据压缩技术必须同时使用。 (2)MPEG通过帧运动补偿有效地压缩了数据的比特数,它采用了三种图像,帧内图、预测图和双向预测图。有效地减少了冗余信息。对于MPEG来说,帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT帧内图像数据压缩编码。 (3)MPEG中视频信号包含有静止画面(帧内图)和运动信息(帧间预测图)等不同的内容,量化器的设计比JPEG压缩算法中量化器的设计考虑的因素要多。

  31. 多媒体通信中的电视图像编码标准都采用H.261和H.263。H.261主要用来支持电视会议和可视电话。多媒体通信中的电视图像编码标准都采用H.261和H.263。H.261主要用来支持电视会议和可视电话。 视频通信编码标准 电视图像数据压缩后的数据速率为P×64kb/s,其中P是一个可变参数,取值范围是1-30。 H.263是在H.261的基础上开发的电视图像编码标准,用于低位速率通信的电视图像编码。

More Related