280 likes | 408 Vues
第九章 数据压缩编码技术与 JPEG 标准. 9.1 数据压缩编码技术概述 9.2 预测编码 9.3 变换编码 9.4 统计编码 9.5 其他编码 9.6 静态图像压缩标准 JPEG. 9.1 数据压缩编码技术概述. 9.1.1 信息为什么能压缩 从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息 ( 可推知的 ) ,也就是用一种更接近信息本质的描述来代替原有冗余的描述。. 图 9-1 连续的几帧画面存在着相似性. 9.1.2 有损压缩与无损压缩 多媒体数据压缩可分为有损压缩和无损压缩两类。
E N D
第九章 数据压缩编码技术与JPEG标准 • 9.1 数据压缩编码技术概述 • 9.2 预测编码 • 9.3 变换编码 • 9.4 统计编码 • 9.5 其他编码 • 9.6 静态图像压缩标准JPEG
9.1 数据压缩编码技术概述 • 9.1.1 信息为什么能压缩 • 从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。 图9-1连续的几帧画面存在着相似性
9.1.2 有损压缩与无损压缩 • 多媒体数据压缩可分为有损压缩和无损压缩两类。 • 无损压缩算法是为保留原始多媒体对象(包括图像、语音和视频)而设计的。在无损压缩中,数据在压缩或解压缩过程中不会改变或损失,解压缩产生的数据是对原始对象的完整复制。 • 当图像的冗余度很少(即同类像素重复性很小)时,用无损压缩技术不能得到可接受的结果,这时就要采用有损压缩。有损压缩会造成一些信息的损失,关键问题是看这种损失对图像质量带来的影响。只要这种损失被限制在允许的范围内,有损压缩就是可接受的。 • 有损压缩技术主要的应用领域是在影像节目、可视电话会议和多媒体网络这样的由音频、彩色图像和视频组成的多媒体应用中,并且得到了广泛的应用
9.1.3 对称压缩和不对称压缩 • 压缩技术的基本方式有两种:即对称压缩和不对称压缩。 • 在对称压缩中,压缩的算法和解压缩的算法是一样的。它是一种可逆操作。对称压缩的优点在于双方都以同一种速度进行操作。 • 另一种压缩技术是不对称压缩,是指压缩和解压缩的运算速率是互不相同的。
9.1.4 信息编码技术的发展 • 1.经典编码技术 • 2.“第二代”编码方法 • 9.1.5 图像编码技术的标准化 • 如果没有一个共同的标准做基础,不同系统间不能兼容,除非每一编码方法的各个细节完全相同,否则各系统间的联接十分困难。
9.2 预测编码 • 9.2.1 预测编码的基本概念 • 预测编码是数据压缩理论的一个重要分支,它是根据离散信号之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差值进行编码。就图像压缩而言,预测编码可分为帧内预测和帧间预测两种类型。 • 9.2.2 差分脉冲编码-DPCM • DPCM(Differential Pulse Code Modulation,差分脉冲编码调制)与PCM不同,它编码的不是采样样本值,而是样本值及其预测值的差分,即量化的是已知的样本值与预测值之间的差值。
9.2.3 自适应差分脉冲编码-ADPCM • ADPCM是自适应量化和自适应预测方法的总称。 图9-4ADPCM编码框图
9.3 变换编码 • 9.3.1 变换编码的基本方法 • 变换编码先对信号进行某种函数变换,从信号的一种表示空间变换到信号的另一种表示空间,然后在变换后的域上,对变换后的信号进行编码 。 图9-5变换编码的工作过程
9.3.2 离散余弦变换 • 离散余弦变换DCT(Discrete Cosine Transformation)具有快速算法,且易于实现等优点,它的快速算法已可由专用芯片来实现,因而被广泛采用。 图9-6JPEG将源图像划分为若干个子块,每个子块包含8×8个像素
公式9-1的物理意义是:这个变换的基本运算是将信号从一种表达形式公式9-1的物理意义是:这个变换的基本运算是将信号从一种表达形式 (空间域,即图像的像素值)变成另一种等同的表达形式(频率域,即 频率系数),并且这种变换过程是可逆的。 如果离散余弦变换是不可逆运算(即从DCT系数中恢复原始像素信息), 那么这种变换是毫无意义的。事实上,有一个逆离散余弦变换(IDCT)公式 能够将频率域的数据重新转换为像素值,如公式(9-2) 。
9.3.3 小波变换 • 小波变换是时间(空间)频率的局部化分析,它通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了傅立叶变换的困难问题,成为继傅立叶变换以来在科学方法上的重大突破。 图9-8小波压缩效果示例(压缩比:50:1)
9.4 统计编码 • 9.4.1 统计编码的基本概念 • 统计编码又称熵编码,就是利用信源的统计,减少信源所具有的冗余度而缩短了码长的编码称为熵编码。 • 统计编码又可分为定长码和变长码。 • 常用的统计编码有霍夫曼(Huffman)编码、算术编码和行程编码三种。
9.4.2 霍夫曼(Huffman)编码 • 霍夫曼压缩算法的编码思想如下: • 1.信源符号按概率递减顺序排列; • 2.把两个最小的概率加起来,作为新符号的概率; • 3.重复步骤⑴与⑵,直到概率和等于1为止; • 4.完成上述步骤后,再沿路径返回进行编码。 图9-9霍夫曼编码过程
9.4.4 行程编码 • 不需要存储每一个像素的颜色值,而仅仅存储一个像素的颜色值,以及具有相同颜色的像素数目即可,或者存储一个像素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程长度编码,用RLE(Run Length Encoding)表示,具有相同颜色并且是连续的像素数目称为行程长度。 图9-10由1610个像素组成的小图像
9.5 其他编码 • 9.5.1 LZW编码 • 9.5.2 分形编码 图9-12Koch雪花曲线生成过程 图9-13 用迭代函数产生的分形图形
9.6 静态图像压缩标准JPEG • 9.6.1 JPEG概述 • JPEG算法是一种适用于连续色调、多级灰度、静止图像的数字图像压缩编码方法。JPEG是国际上彩色、灰度、静止图像的第一个国际标准,也是一个适用范围广泛的通用标准。它不仅适用于静止图像的压缩,电视图像序列的帧内图像的压缩编码,也常采用JPEG压缩方法。 • JPEG压缩分四个步骤实现: • 颜色模式转换及采样; • DCT变换; • 量化; • 编码
9.6.2 颜色模式转换及采样 • RGB色彩模型是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。这里Y代表亮度,Cb和Cr则代表色度、饱和度。 • 9.6.3 DCT变换 • DCT变换前后的空间域矩阵(P矩阵)和频率域矩阵(T矩阵)中数值的物理意义及其联系 图9-16DCT变换是将源图像(图a)的空间域(图b)变换为频率域(图c)
9.6.3 量化 • 1.量化过程 图9-17经量化后,源图像(左)与IDCT运算后得到的图像 (右)会产生一定的失真,失真程度视量化等级而定
量化的计算公式: 量化值(i,j)=[T(i,j)/量化矩阵(i,j)] • 在解码过程中,逆量化公式为: T(i,j)=量化值(i,j)量化矩阵(i,j)
9.6.5 编码 • 1.直流系数(DC)的编码 相邻的子块DC系数的差值可用公式 表示为: • 2.交流系数(AC)编码与Z形扫描 图9-18Z字型扫描过程
3.熵编码 源图像质量 文件容量38384 bytes 高质量压缩(High quality), 文件容量11331 bytes
中等质量(Medium quality),文件容量6968 bytes 低质量(Low quality),文件容量为3687 bytes的图像质量 图9-19JPEG不同压缩率的图像质量对比(图片来源 NASA)
9.6.6 新一代静态图像压缩标准---JPEG2000 图9-20对图像感兴趣区域进行压缩