文档章节

颜色空间系列1: RGB和CIEXYZ颜色空间的转换及相关优化

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:39
字数 1885
阅读 2
收藏 0

      颜色空间系列代码下载链接:http://files.cnblogs.com/Imageshop/ImageInfo.rar (同文章同步更新)

      在颜色感知的研究中,CIE 1931 XYZ 色彩空间(也叫做 CIE 1931 色彩空间)是其中一个最先采用数学方式来定义的色彩空间,它由国际照明委员会(CIE)于1931年创立。CIE XYZ 色彩空间是从 1920 年代后期 W. David Wright (Wright 1928) 和 John Guild (Guild 1931) 做的一系列实验中得出的。他们的实验结果合并到了 CIE RGB 色彩空间的规定中,CIE XYZ 色彩空间再从它得出。

       更过具体的关于XYZ空间的理论解释可见:点击打开链接

      本文的重点是如何优化这个RGB<->XYZ相互转换的过程。

      从相关的文献包括OpenCv的文档中可找到两者的理论转换算式如下:

      [X]        [0.412453    0.357580    0.180423]    [R]

      [Y]    =  [0.212671    0.715160    0.072169]    [G]       (1)

      [Z]        [0.019334    0.119193    0.950227]    [B]

      [R]        [3.240479   -1.537150   -0.498535]  [X]

      [G]    =  [-0.969256  1.875992   0.041556]    [Y]        (2)

      [B]         [0.055648   -0.204043  1.057311]    [Z]

        仔细观察式(1),其中 X = 0.412453 * R +  0.412453 *G+  0.412453B ;  各系数相加之和为0.950456,非常接近于1,我们知道R/G/B的取值范围为[ 0,255 ],如果系数和等于1,则X的取值范围也必然在[ 0,255 ]之间,因此我们可以考虑等比修改各系数,使其之和等于1,这样就做到了XYZ和RGB在同等范围的映射,因此第一行的系数应分别修改为 [0.412453    0.357580    0.180423]  / [0.950456] = [0.433953    0.376219    0.189828]。

       式(1)的第二行,三个系数之和恰为1,因此无需修正。

       式(1)的第三行,三个系数之和为1.088754,修正算式为  [0.019334    0.119193    0.950227]  /  [1.088754] = [0.017758    0.109477    0.872765]

       由于式(1)的变化,式(2)必须做相应的调整,考虑式(1)关于X的各分量都除以了 0.950456,因此,只需在式2的对应分量上乘以  0.950456即可,同理,关于Z的各分量由于都除以了1.088754,式(2)各分量必须对应乘以1.088754。得到最终的变换式(3)(4)。

      [X]        [0.433953    0.376219    0.189828]    [R]

      [Y]    =  [0.212671    0.715160    0.072169]    [G]       (3)

      [Z]        [0.017758    0.109477    0.872765]    [B]

      [R]        [3.0799327   -1.537150   -0.542782]  [X]

      [G]    =  [-0.921235   1.875992    0.0452442]  [Y]      (4)

      [B]         [0.0528909  -0.204043  1.1511515]   [Z]

        如果有朋友查阅过OpenCv的RGB到LAB空间的转换,就可以发现Cv就是用的上述矩阵先将RGB转到XYZ,再由XYZ转为LAB的。

        由以上数式可以看出RGB和XYZ颜色空间的转换时线性的,因此,两个系数矩阵之间的成绩必为一个E矩阵(对角线为1,其他元素都为0),读者可以用matlab测试下。

        由于各小数的存在,理论上说,RGB颜色空间的颜色对应的XYZ分量的数值一般都为浮点数,之前说过经过调整系数矩阵后其有效范围在[0,255]之间,这和RGB的范围是一致的,因此我们更感兴趣的可能是用整数表示XYZ的值,此时,如果先用上述计算式计算,最后在用(int) 强制取整,则效率很低下,因此,很有必要做点的优化。

        优化的原理基本就是用整数的乘除法来替代浮点运算,比如,对各系数乘以一个很大的数,计算出结果在整除这个数,则得到的数字和之前的浮点算式取整结果是一致的。

        如何取放大系数,也有着一定的讲究,比如0.433953 ,很多朋友的第一反应应该是乘以1000000得到433953 ,不错,这是个很好的优化,却不是最好的,因为最后的整除1000000相对来说也是个慢的过程,如果我们能够整除一个2的N次幂数,则可以用整数的移位来代替整除。众所周知,移位的速度非常快。

        那这个N如何取呢,比方说取1可行吗,分析下马上得到的结果是绝对不行,因为很多系数乘以2再取整就变为0了。我对这个N的取值建议是在保证整个算式的每个部分的计算结果不超过int(对于64位CPU,则是long类型)类型的最大范围时,N越大越好。像我们这种情况,由于RGB的取值范围是[255],因此N的取值最大只能是23。

        假定我们取N的值为20,则RGB转XYZ的算式可以写为如下:

X = (Blue * 199049 + Green * 394494 + Red * 455033 + 524288) >> 20;          // 这些系数是按照RGBLAB类里的labXr_32f放大2^20后得到的  
Y = (Blue * 75675 + Green * 749900 + Red * 223002 + 524288) >> 20;  
Z = (Blue * 915161 + Green * 114795 + Red * 18621 + 524288) >> 20;            //  这里无需验证结果是否在[0,255]之间,必然在。

       注意算式中的524288,这个值等于(2^20)/2,加上他的作用是使整个算式能够做到四舍五入。

       另外,还要注意各系数小数点后数字的累积,那X一行来说事,0.433953  * 2^20  =  455032.700928,我们取值455033 ,0.376219    * 2^20= 394494.214144 ,则取值394494 ,那么最后一个系数其实可以不用计算,直接拿 2^20-455033 -394494 =199049 。

       对应的XYZ转RGB空间算式为:

Blue = (X * 55460 - Y * 213955 + Z * 1207070) >> 20;  
Green = (X * -965985 + Y * 1967119 + Z * 47442) >> 20;    // x * -965985 和 -x * 965985 在反汇编后是不一样的,后者多了个neg指令  
Red = (X * 3229543 - Y * 1611819 - Z * 569148) >> 20;  
if (Red > 255) Red = 255; else if (Red < 0) Red = 0;      // 这里需要判断,因为RGB空间所有的颜色转换到XYZ后,并不是填充满了0-255的范围的,反转过去就会存在一些溢出的点。
if (Green > 255) Green = 255; else if (Green < 0) Green = 0;  // 编译后比三目运算符的效率高  
if (Blue > 255) Blue = 255; else if (Blue < 0) Blue = 0;

        正如代码中的注释一样,XYZ-RGB的转换必须判断转换的颜色是否在有效范围内。

        另外对上述算式提一点点优化方面的是事情:

Green = (X * -965985 + Y * 1967119 + Z * 47442) >> 20;       // x * -965985 和 -x * 965985 在反汇编后是不一样的,后者多了个neg指令  
00000048  imul        ebx,edi,0FFF1429Fh   
0000004e  imul        eax,dword ptr [ebp-10h],1E040Fh   
00000055  add         ebx,eax   
00000057  imul        eax,dword ptr [ebp-14h],0B952h   
0000005e  add         ebx,eax   
00000060  sar         ebx,14h
       另外一种写法:
Green = (-X * 965985 + Y * 1967119 + Z * 47442) >> 20;       // x * -965985 和 -x * 965985 在反汇编后是不一样的,后者多了个neg指令  
00000048  mov         ebx,edi   
0000004a  neg         ebx   
0000004c  imul        ebx,ebx,0EBD61h   
00000052  imul        eax,dword ptr [ebp-10h],1E040Fh   
00000059  add         ebx,eax   
0000005b  imul        eax,dword ptr [ebp-14h],0B952h   
00000062  add         ebx,eax   
00000064  sar         ebx,14h
      可以看到多了一句neg语句,虽然这个语句基本对效率没啥影响,但是作为一个速度控,我对这些还是很感兴趣的。
      下面给出一些转换后的视觉图:
      原始图像:
 
       
 
          XYZ综合图像:
 
      
       
      X通道图像:
 
     
 
      Y通道图像:
 
     
 
       Z通道图像:
 
       
     
     最后说一句,由于上述取整操作的执行,实际上是执行了一个有损的过程,因此,即使不做任何对XYZ的改变,对一副图片进行多次转换,就可以看出图像慢慢的变得不同了,   如下图所示为转换10次左后的结果:
 
       
 
  可以看到脸部有明显的斑纹,因此,如果要进行高精度的计算,那还是请按照公式(3)(4)一步一步来吧。
 
 
'*********************************************************************

  转载请保留以下信息:

  作者: laviewpbt

  时间:2013.1.31 7点于办公室

  QQ:33184777

  E-Mail : laviewpbt@sina.com

本文转载自:http://www.cnblogs.com/Imageshop/archive/2013/01/31/2888097.html

共有 人打赏支持
abcijkxyz
粉丝 63
博文 6196
码字总数 1876
作品 0
深圳
项目经理
将RGB值转换为灰度值的简单算法

原文地址:点击打开链接 RGB是如何转换为灰度的?这是让人困惑已久的一道难题 1、RGB复合通道转灰度:转换后的色阶值只与RGB空间有关,而与作为目的地的灰度空间无关。也就是说,只要当前的R...

floatdreamed
01/09
0
0
Metal视频处理——绿幕视频合成

前言 Metal入门教程总结 Metal图像处理——直方图均衡化 本文介绍如何用Metal把一个带绿幕的视频和一个普通视频进行合并。 正文 绿幕视频合成可以分为两步,首先是把视频读取成视频帧并做好对...

落影loyinglin
09/16
0
0
YUV / RGB 格式分析及快速查表算法设计

1 前言 自然界的颜色千变万化,为了给颜色一个量化的衡量标准,就需要建立色彩空间模型来描述各种各样的颜色,由于人对色彩的感知是一个复杂的生理和心理联合作用的过程,所以在不同的应用领...

鉴客
2011/10/01
389
0
【AI超级美发师】深度学习算法打造染发特效(附代码)

【新智元导读】如今,在类似天天P图、美图秀秀等手机APP中,给指定照片或视频中的人物更换头发颜色已经是再正常不过的事情了。那么本文便介绍了该功能背后如AI头发分割模块、头发换色、颜色增...

技术小能手
08/03
0
0
Image Representation & Classification(图像表示与分类)

1.Computer Vision Pipeline(计算机视觉管道) 预处理主要是关于标准化数据,比如处理输入图像大小。 Separating Data(分离数据) Images as Grids of Pixels Import resources Read in a...

徐凯_xp
08/12
0
0

没有更多内容

加载失败,请刷新页面

加载更多

5、前后端分离跨域问题

在以往的开发中,前后端分离也不是像现在这么热门,所谓的前端工程师也只不过是写好静态页面由Java工程师或者php工程师嵌入到页面中进行开发,这或许加重了这些工程师的工作量,而且在样式调...

永远的Chester
12分钟前
0
0
全志T3 Linux显示驱动分析

1、总体架构 全志T3处理器的显示框架是基于标准Linux的帧缓冲架构,其结构如图 1.1所示。显示控制器DE的驱动架构如图 1.2所示,包括屏蔽差异的显示管理抽象层,以及显示图层驱动、显示设备驱...

pnsam301
20分钟前
0
0
【HAVENT原创】VUE2 经验问题汇总

新建一个 Vue 实例可以有下列两种方式: 1. new 一个实例 var app= new Vue({ el:'#todo-app', // 挂载元素 data:{ // 在.vue组件中data是一个函数,要写成data () {}这种方式 i...

HAVENT
23分钟前
0
0
IO基础知识

读文件,可以使用内置的open(file,mode); with 语句自动close; 查看当前目录的绝对路径:os.path.abspath('.'); 创建目录:os.mkdir(path); 删除目录:os.rmdir(path); 拼接路径推荐使用:o...

年轻的中年大叔
26分钟前
0
0
BATJ等大厂最全经典面试题分享

金九银十,又到了面试求职高峰期,最近有很多网友都在求大厂面试题。正好我之前电脑里面有这方面的整理,于是就发上来分享给大家。 这些题目是网友去百度、蚂蚁金服、小米、乐视、美团、58、...

老道士
28分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部