本文是一篇计算机论文,本文采用韦伯-费希纳定律,建立了一个色差调制尺度和光泽感评价分数的客观预测模型,该模型可以根据色差调制尺度参数大小预测出观察者的双目光泽评分。
第1章绪论
1.1研究背景
视觉是人类认识和感知世界的重要手段,研究表明,在人类对外界的感知活动中,有高达百分之八十的外界信息都是通过双眼感知所获得[1]。显示技术作为信息传递的重要手段之一,其地位不言而喻。人类生活的客观世界是一个三维立体的空间,大脑早已习惯处理三维视觉信息,为此我们不懈奋斗于重现真实世界的景象。从二维(two-dimensional,2D)显示技术到三维(three-dimensional,3D)显示技术,人们一直追求的是更加真实、自然、舒适的视觉体验。随着现代显示技术飞速发展,3D立体显示技术已被广泛应用于各个领域[2]。
Hutchings和Pointer提出将颜色、光泽、半透明性和纹理确定为物体感知的四个主要外观属性[3],是它们为人眼视觉系统提供了关键的物体特征信息。其中,光泽作为一种十分“突出”的视觉信号,对人类生存意义重大。比如有冰块或潮湿的道路比正常道路更容易打滑,行驶时人们根据有冰块路面提供的光泽信号就能够轻易避开危险;闪亮的金属物体比生锈金属的导电性更好;果皮光滑的水果比有褶皱的水果看起来更新鲜……因此,要想实现对真实世界的感知渲染,扩展立体显示器的显示内容,提升立体显示中物体表面材料光泽属性的感知效果,再现双目光泽必不可少。
1.2研究现状
1.2.1国外研究现状
在国外,作为一种感知现象,立体光泽的研究始于十九世纪中叶。1851年,在两个倒金字塔的透视线条画中,海因里希·威廉·多夫(Heinrich Wilhelm Dove)[15]发现当这两个图像通过立体镜融合时,这个融合的几何体表面产生了一种生动的光彩外观。Dove将这种光彩现象解释为是外部反射光与内部反射光或散射光结合的结果,他认为来自物体表面的两种不同方式反射的光会到达观察者眼睛的不同深度层,使得人眼无法适应从而产生光泽感。但是,1861年,大卫·布鲁斯特(David Brewster)[16]使用立体镜将无背景的黑白表面(它们的反光率不同)融合后却没有观察到光泽现象,这一结果无法根据Dove的说法来解释。对此,Brewster提出了自己的见解:光泽是由两只眼睛努力将立体图像结合而来的。1867年,赫尔曼·赫尔姆霍茨(Hermann von Helmholtz)[17]对光泽知觉提出了一个无意识推理解释:由于视觉系统的内化作用,每当视网膜区域接收到从远端物体表面同一位置反射回来的具有不同亮度的光,就会不自觉地认为该物体有光泽,这一解释也获得了当时其他研究人员的普遍认可。1895年,奥古斯特·基尔希曼(August Kirschmann)试图解开影响光泽感知的决定性因素,他测量了镜面反射面上的高光差异对感知强度和感知真实性的影响,解释了为什么镜面反射(如高光)看起来在空间上与表面分离的原因,并得出高光差可以作为光泽的启发线索这一结论,此外他还提出可以将双目线索用于光泽的感知[18,19]。尽管在那个短暂而富有成果的时期里,研究人员曾经对立体光泽进行了许多研究,但他们并没有对它进行持续的科学探索。或许是因为他们认为包裹立体光泽的谜团已经被解开,对光泽的科学研究似乎没有继续进行下去的必要。这导致在接下来的100年里,国外对于立体光泽的研究几乎处于停滞状态。
第2章基础理论
2.1人眼的生理结构
人眼是一个复杂的意识感觉器官,并不是一个完全的球体,而是一个近似球状的融合的两件式单位。较小的单位与较大的单位通过角膜部分和巩膜部分相联结。一个成年人的眼球直径,在水平方向一般为24~25毫米,垂直方向上的大小通常小于水平方向,横向直径约为20毫米[48]。
在结构上,人眼视觉系统(Human Visual System,HVS)包括光学成像系统和神经认知系统。人眼主要负责接收光信息成像,见图2.1,它由角膜、虹膜、瞳孔、晶状体、玻璃体和视网膜等组织构成[49]。角膜是一层约1毫米厚的透明膜,是最先接触到外界光线信息的结构,相当于一个透镜,有很强的屈光能力。虹膜是一个含有色素的环状薄膜,它决定了人类眼球的颜色。在虹膜中央的是瞳孔,是一个外界光线进入眼睛的通道,它主要通过括约肌的收缩控制进入眼睛的光线的强弱。晶状体是一个多层膜结构,呈双凸透镜状,富有弹性,因此,除了起到屈光作用外它还提供对焦作用,这种调节机制使得我们即使在不同距离观看的物体都能够成像到视网膜。玻璃体是一种透明的胶状物质,也是眼睛屈光间质之一,主要作用是对视网膜和眼球壁提供支撑,维持眼球形态。视网膜是一层透明的薄膜,由色素上皮层和视网膜感觉层组成,感觉层含有许多感光细胞,有感光作用。
2.2双目视觉的信息编码过程
双目视觉的信息编码过程包含视觉信息的获取、处理和主观感知的形成,该过程主要由人眼视觉系统负责,视觉处理过程见下图2.2。当外界光信号经过角膜折射,穿过瞳孔,通过晶状体调节,投射到视网膜上,视觉信息处理的第一站就在此发生,即光信号被视网膜细胞吸收并转换为电信号[51]。随后被视网膜接收到的信号经过视网膜神经节细胞整合后向下传递至外侧膝状体(LateralGeniculate Nucleus,LGN)。LGN位于后丘脑的一个神经核团[52],是视觉信息处理的第二站,主要负责视觉信号的中转,它通过中级轴突与每只眼睛相连,从而将不同种类的电信号(朝向信息,运动信息,速度信息)传导至同侧视皮层。外侧膝状体作为视觉信号传入大脑皮层的重要中继站,对于信息平行处理发挥了关键作用,它具备一部分视觉特征检测功能,并在初级视觉皮层形成高度特化的特征检测功能的过程中扮演关键角色。
视皮层是位于大脑枕叶的距状裂周围的一种典型的感觉型粒状皮层。当前公认的视皮层包含初级视皮层(纹状皮层或视觉第一区域,即V1)和纹外皮层(视觉第二、第三、第四、第五区域,即V2、V3、V4、V5)。根据组织染色的结果以及神经元的种类与连接方式等,视觉皮层通常分为6层,其不同区域之间的关系既独立又紧密。对于大多数灵长类动物来说,它们的初级视觉皮层主要接收来自外侧膝状体的信息。这些信息经过V1通道传递到V2、V3、V4、V5等更高级别的脑部区域[53,54]。生物物理建模表明,整个的皮层信息处理过程是由两条并行通路完成的:腹侧通路和背侧通路,如图2.3所示。负责处理物体形状、颜色等信息的腹侧通路由V1、V2、V4等组成;负责感知运动、方向等信息的背侧通路由V1、V2、V5等组成。
第3章 双目颜色差异调制方案 ................... 20
3.1 立体图片库 .................................... 20
3.2 双目色差调和映射流程............................. 21
3.3 颜色空间的转换 ................................ 23
第4章 立体显示下双目颜色不对称的双目光泽感评估实验 ............ 30
4.1 实验设计 ............................. 30
4.1.1 实验方案 ............................. 30
4.1.2 实验刺激演示方法 ................................... 31
第5章 实验结果与分析 ........................................ 37
5.1 信度检验和一致性分析................................ 37
5.2 显著性分析 .............................................. 38
5.3 光泽度估计 ...................................... 49
第6章基于韦伯-费希纳定律的光泽感评价模型
6.1韦伯-费希纳定律
韦伯-费希纳定律(Weber-Fechner's Law,W-F定律)[93]是两个关于心理物理学实验的假说,它由德国生理学家韦伯(Weber)提出的韦伯定律,后德国物理学家费希纳(Fechner)在其基础上发展而来,这两条定律都与人类的感知有关(感知即意识对外界的信息察觉感觉注意知觉等一系列过程)。它描述的是物理刺激的实际变化与心理感知变化之间的联系。具体而言,它指出物理学中光学空间中的一个点对应于心理学中知觉空间中的一个特定区域,相反,心理学领域知觉空间中的一点,也对应于物理学领域光学空间的一定范围的区域。
韦伯定律:同一个刺激差别量必须达到一定比例才能引起人的差别感觉,用一个差别量化公式表示为:ΔI/I=K(6.1)其中,I为刺激强度,ΔI为此时的差别阈限,K为韦伯率。韦伯费希纳定律:人类的感觉与对应物理量的刺激强度的常用对数成正比,用公式表示为:S=K lg I(6.2)
其中S是感觉强度,I是刺激强度,K为韦伯率,是一个常数。
由上可以看出,费希纳定律和韦伯定律之间存在较大差异。韦伯定律主要研究“最小可觉差”,而费希纳定律更关注如何用数学语言描述物质世界和精神世界之间的关系。通常来说,人类的视觉系统在接收外界传递的图像信息后开始工作,其中光泽感的形成就经历了三个阶段。首先是光学信息对视觉感受器官的物理刺激,然后是感光神经末梢的生理刺激,最后是大脑进行心理判断和产生知觉。在现代的视觉感知模型中,对数函数被广泛应用于描述感知量的大小和强度关系,因为对数函数在描述感知量的大小和强度关系时,更符合人类视觉感知的特点。
第7章总结和展望
7.1总结
本文以双目颜色差异调制为主要手段,着重关注于借助立体显示器再现复杂图像的光泽感这种特殊的知觉现象。具体来说,我们借助了现有颜色空间理论,利用颜色感知属性中的彩度和色调属性,设计了一个针对复杂图像的双目颜色差异调和映射算法,并通过一个心理物理学实验验证了该算法的有效性。最后,我们借助了费希纳韦伯定律完成了对光泽感客观评价模型的拟合,得出了一个可再现复杂图像光泽感的最小双目色差调制阈值,期望能够达到扩展立体显示设备显示效果的目的。主要工作如下:
(1)设计了一种双目颜色差异调制方案。整个代码在MATLAB开发环境下编写,主要功能包括读取图像的元数据,图像去噪,颜色模式的转换,颜色差异的调制,演示图像的背景合成和拼接等。这些功能的实现为本研究生成了丰富的刺激图像样本。
(2)定量测量了不同类型图像、不同色差调制方式、不同色差调制尺度再现复杂图像的光泽感的主观评价结果。该实验的打分结果由C#语言在VisualStudio开发环境下编写的专用打分软件收集。评分实验数据来自观察者对双目色差调制方案生成的一系列刺激对的评分。这些刺激来自每种图像不同调制方式的不同色差尺度的两两组合,即3幅不同类型的图像,分别为计算机生成的木球、相机拍摄的苹果和网络下载的帽子;3种不同的调制方式,分别为彩度调制、色调调制以及彩度-色调调制;11个范围从0到2,步长为0.2的色差调制尺度。整个实验收集到计划收集数据15*3*3*110=14850个,由于一位受试者在其中一组测试(110次评分)中数据有缺漏,被我们整组删除后共收集到数据14740个。测量结果显示:复杂图像也和纯色块图像一样,在“颜色混合”界限内,存在一个双眼互动阶段。
参考文献(略)