第五讲

第五讲 MTI 多媒体技术 XIDIAN 彩色数字图像基础

主要内容 • 视觉系统对颜色的感知 • 图像的颜色模型 • 图像的基本属性 • 图像的分类 • 伽马()校正 • 常用图像文件格式

视觉 a）电磁波谱 b）可见光谱

人眼横断面示意图

马赫带

彩色视觉 光谱锥体细胞的频率选择效应

视觉系统对颜色的感知 • 据统计，有70%以上的信息来自于视觉系统。图像数字化之后的数据量是非常大的，存储很占空间、网络传送很费时间。图象数据压缩主要依据两个基本事实： • 图像数据中有许多重复的数据——无损压缩（lossless compression）； • 人的眼睛对图像细节和颜色的辨认有一个极限，把超过极限的部分去掉一般不会影响观看质量——有损压缩（loss compression）。 • 可见光是波长在380 nm～780 nm之间的电磁波，我们看到的大多数光不是同一种波长的光，而是由许多不同波长的光组合成的。

视觉系统对颜色的感知 • 研究表明，人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞，另外还有一种在光功率极低的条件下才起作用的杆状体细胞，在计算机图像处理中，杆状细胞没有扮演什么角色。人的视觉系统对颜色的感知可归纳出如下几个特性： • 眼睛本质上是一个照相机。人的视网膜(human retina)通过神经元来感知外部世界的颜色，每个神经元或者是一个对颜色敏感的锥体(cone)，或者是一个对颜色不敏感的杆状体(rod)。

视觉系统对颜色的感知 • 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同，对不同亮度的感知程度也不同，这就意味着，人们可以使用数字图像处理技术来降低数据率而不使人感到图像质量明显下降。 • 自然界中的任何一种颜色都可以由R，G，B这3种颜色值之和来确定，它们构成一个3维的RGB矢量空间。这就是说，R，G，B的数值不同混合得到的颜色就不同，也就是光波的波长不同。

视觉系统对颜色的感知 • 可见光的波长范围为380nm～780nm，大多数自然光都是由不同波长的光组合而成。 • 人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞，另外还有一种在光功率极端低的条件下才起作用的杆状体细胞，因此颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。 • 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同，对不同亮度的感知程度也不同，因此不同组成成分的可见光就呈现出不同的颜色

视觉系统对颜色的感知 视觉系统对颜色和亮度的响应特性曲线（各个波长的光的强度相等）

视觉系统对颜色的感知 • 上面的颜色响应曲线表明，人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。 • 亮度响应曲线表明人眼对波长为550nm左右的黄绿色最为敏感。

视觉系统对颜色的感知 • 许多具有不同光谱分布的光产生的视觉效果（颜色）是一样的。即光谱与颜色的对应是多对一的。 • 光谱分布不同而看上去相同的两种颜色称为条件等色（匹配等色）。 • 绝大部分可见光谱对眼睛的刺激效果都可以用红（700nm）、绿（546.1）、蓝（435.8nm）三色光按不同比例和强度的混合来等效表示。（三刺激理论）

视觉系统对颜色的感知 匹配任意可见光所需的三原色光比例曲线

视觉系统对颜色的感知 颜色匹配试验

三基色

视觉系统对颜色的感知

视觉系统对颜色的感知 从人的主观感觉角度，颜色包含三个要素： 1、色调（hue）：色调反映颜色的类别，如红色、绿色、蓝色等。色调大致对应光谱分布中的主波长。

视觉系统对颜色的感知 2、饱和度（Saturation）饱和度是指彩色光所呈现颜色的深浅或纯洁程度。对于同一色调的彩色光，其饱和度越高，颜色就越深，或越纯；而饱和度越小，颜色就越浅，或纯度越低。高饱和度的彩色光可因掺入白光而降低纯度或变浅，变成低饱和度的色光。100%饱和度的色光就代表完全没有混入白光的纯色光。

视觉系统对颜色的感知 3、明亮度（luminance）明亮度是光作用于人眼时引起的明亮程度的感觉。一般来说，彩色光能量大则显得亮，反之则暗。大量试验表明，人的眼睛能分辨128种不同的色调，10－30种不同的饱和度，而对亮度非常敏感。人眼大约可以分辨35万种颜色。

形状和景深的知觉

长度的感知 平行度的感知圆的大小的感知

颜色模型 • 颜色模型（color model）是用来精确标定和生成各种颜色的一套规则和定义。某种颜色模型所标定的所有颜色就构成了一个颜色空间。 • 颜色空间通常用三维模型表示，空间中的颜色通常使用代表三个参数的三维坐标来指定 • 对于人来说，可以通过色调、饱和度和亮度来定义颜色（HSL颜色模型）；对于显示设备来说，可以用红、绿、蓝磷光体的发光量来描述颜色（RGB颜色模型）；对于打印设备来说，可以使用青色、品红、黄色和黑色颜料的用量来指定颜色（CMYK颜色模型）。

RGB颜色模型 • 理论上绝大部分可见光谱都可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。 • 颜色C＝R(红色的百分比)＋G(绿色的百分比)＋ • B(蓝色的百分比) • RGB模型称为相加混色模型，用于光照、视频和显示器。例如，显示器通过红、绿和蓝荧光粉发射光线产生彩色。

CMYK颜色模型 • 在理论上，绝大多数颜色都可以用三种基本颜料（青色cyan、品红magenta、和黄色yellow）按一定比例混合得到。 • 理论上，青色、品红和黄色三种基本色素等量混合能得到黑色。但实际上，因为所有打印油墨都会包含一些杂质，这三种油墨混合实际上产生一种土灰色，必须与黑色 (K) 油墨混合才能产生真正的黑色，所以再加入黑色作为基本色形成CMYK颜色模型。 • CMYK模型称为相减混色模型。

相加色与相减色的关系

RGB模型到CMYK模型的转换 分色算法（F代表白色）

颜色模型的空间表示 RGB彩色空间和CMY彩色空间的表示法

HSL颜色模型 • 在HSL模型中，H定义色调；S定义颜色的深浅程度或饱和度；L定义亮度。 • RGB模型和CMYK模型主要是面向设备的，而HSL模型更容易被人理解和控制。的白光量

颜色的输入

图像的分类 • 矢量图与点位图矢量图是用一系列计算机指令来表示一幅图，如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。矢量图的优点是：（1）缩放、旋转、移动时图像不会失真。（2）存储和传输时数据量较小。矢量图的缺点是：（1）图像显示时花费时间比较长。（2）真实世界的彩色图像难以转化为矢量图。

图像的分类 • 矢量图与点位图点位图是将一副图像在空间上离散化，即将图像分成许许多多的像素，每个象素用若干个二进制位来指定该像素的颜色或灰度值。点位图的优点是：（1）显示速度快。（2）真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。点位图的缺点是：（1）存储和传输时数据量比较大。（2）缩放、旋转时算法复杂且容易失真。

图像的分类 矢量图点位图

图像的分类 • 灰度图标准单色图标准灰度图

图像的分类 • 彩色图 256色标准图像 24位标准图像

图像的基本属性 1、分辨率显示分辨率：指显示屏上能够显示出的象素数目。同样大小显示屏能够显示的象素越多，说明显示设备的分辨率越高，显示的图像质量也就越高。（640×480，1024 × 768）图像分辨率：指组成一副图像的像素的密度，一般用单位长度上包含像素的个数来衡量。常用单位为DPI（dots per inch），即每英寸多少点。

图像的基本属性 2、像素深度像素深度是指存储每个像素所用的位数。像素深度决定彩色图像每个像素可能有的颜色数，或者确定灰度图像每个像素可能有的灰度级数。 3、调色板一个彩色图像假如只包含24位真彩色空间中的16个离散的点（16色图），则可以建立一个颜色查找表，表中的每一行记录一组RGB值，实际像素的值用来指定该点颜色在查找表中的索引值，这样就可以大大缩小存储量。这个颜色查找表就叫做调色板。

图像的基本属性 4、真彩色、伪彩色与直接色真彩色：真彩色是指在组成一幅彩色图像的每个像素值中，有R，G，B三个基色分量，每个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。伪彩色：每个像素的颜色不是由每个基色分量的数值直接决定，而是把像素值当作彩色查找表(调色板)的表项入口地址，去查找一个显示图像时使用的R，G，B强度值，用查找出的R，G，B强度值产生的彩色称为伪彩色。直接色：每个像素值分成R，G，B分量，每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度，用变换后得到的R，G，B强度值产生的彩色称为直接色。

伽马()校正 • 一个图像系统中一般包含输入设备（扫描仪、摄像机、数码相机）、存储设备（胶片、磁盘）和输出设备三大模块。 • 各种涉及到光电转换的设备的输入输出特性曲线一般是非线性的，且表现为幂函数的形式： y＝xn输出＝(输入)γ（按照惯例，“输入”和“输出”都缩放到0～1之间）。所以整个图像系统的传递函数是一个幂函数。＝ 1×2×…×n • 一个图像系统追求的目标：真实的再现原始场景。

伽马()校正 • 为了真实地再现原始场景，如果图像再现环境为明亮环境则必须时整个图像系统的γ＝1；如果为暗淡环境，则必须使整个系统的γ1.25；如果为黑暗环境，则必须使系统的γ1.5。 • 实际图像系统的值并非符合我们要求的值，且是不能随意改变的。所有要求我们加入一个中间环节来校正整个系统的值，即补偿系统的非特性曲线，使之接近于应用环境所要求的值。这个过程就叫做伽马（）校正。

伽马()校正 Photoshop 中提供的Gamma校正功能

BMP图像文件格式 位图文件(Bitmap-File，BMP)格式是Windows采用的图像文件存储格式，在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp或者dib。 BMP文件大体上分为四个部分：

BMP图像文件格式 typedef struct tagBITMAPFILEHEADER { WORD bfType; /* 说明文件的类型 */ DWORD bfSize; /* 说明文件的大小，用字节为单位 */ WORD bfReserved1; /* 保留，设置为0 */ WORD bfReserved2; /* 保留，设置为0 */ DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构开始到实际的图像数据之间的字节偏移量 */ } BITMAPFILEHEADER;

BMP图像文件格式 typedef struct tagBITMAPINFOHEADER { DWORD biSize; /* 说明结构体所需字节数 */ LONG biWidth; /* 以像素为单位说明图像的宽度 */ LONG biHeight; /* 以像素为单位说明图像的高速 */ WORD biPlanes; /* 说明位面数，必须为1 */ WORD biBitCount; /* 说明位数/像素，1、2、4、8、24 */ DWORD biCompression; /* 说明图像是否压缩及压缩类型 */ DWORD biSizeImage; /* 以字节为单位说明图像大小 */ LONG biXPelsPerMeter; /* 说明水平分辨率，像素/米 */ LONG biYPelsPerMeter; /* 说明垂直分辨率，像素/米 */ DWORD biClrUsed; /* 说明图像实际用到的颜色数，如果为0 则颜色数为2的biBitCount次方 */ DWORD biClrImportant; /*说明对图像显示有重要影响的颜色索引的数目，如果是0，表示都重要。*/ } BITMAPINFOHEADER;

BMP图像文件格式 调色板实际上是一个数组，它所包含的元素与位图所具有的颜色数相同，决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。 typedef struct tagRGBQUAD { BYTE rgbBlue; /*指定蓝色分量*/ BYTE rgbGreen; /*指定绿色分量*/ BYTE rgbRed; /*指定红色分量*/ BYTE rgbReserved; /*保留，指定为0*/ } RGBQUAD;

BMP图像文件格式 紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成，每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的，这就是说，阵列中的第一个字节表示位图左下角的像素，而最后一个字节表示位图右上角的像素。

GIF图像文件格式 GIF（Graphics Interchange Format）格式由CompuServe公司于87年开发，版本号GIF87a，89年扩充后版本号为GIF89a。 GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成，称为GIF数据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。

GIF图像文件格式

GIF图像文件格式 GIF文件格式的特点： • GIF文件采用了LZW无损压缩算法来存储图像数据。 • GIF文件允许设置背景的透明属性。 • GIF文件格式可在一个文件中存放多幅彩色图像并且制作出幻灯片或者动画效果。 • GIF文件支持图像数据的交叉存储方式，这样一个大的图像可以逐步显示，让用户首先看到图像概貌，然后逐步清晰。 • GIF文件定义的图像中可以加入文本。

JPEG编码标准 算法概要 JPEG(Joint Photographic Experts Group) 是一个由 ISO和CCITT两个组织机构联合组成的一个图像专家小组，负责制定静态的数字图像数据压缩编码标准，这个专家组开发的算法称为JPEG算法，并且成为国际上通用的标准。JPEG是一个适用范围很广的静态图像数据压缩标准，既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩，电视图像的帧内图像的压缩编码，也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。标准主要采用了两种基本的压缩算法，一种是采用以离散余弦变换(DCT)为基础的有损压缩算法，另一种是采用以预测技术为基础的DPCM无损压缩算法。

第五讲

第五讲

Presentation Transcript