第 1 章 绪论
1. 1 研究背景
在日常生活中,我们常常利用视觉观察事物和环境,获取论文范文相关信息。视觉对正常人来说是基本的、普通的能力,然而,视觉系统所完成功能的过程和原理却是十分复杂的。有些研究者[1-5]认为视觉本身就包含了思维或智能的一切基本因素。
计算机视觉(Computer Vision, CV)模拟人类视觉,利用计算机软、硬件实现对视觉信息和数据的分析和处理,包括对视觉信息的获取、传输、处理、筛选、存储与理解等过程,从图像或图像序列中获取对外部世界的认知和理解,获得感兴趣物体的相关信息,比如形状、位置、姿态、运动、特征、纹理等,并能描述、识别与理解。“计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力,需要对图象信号、纹理和颜色建模、几何处理和推理、并对引起注意的目标建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起”[6]。
毫无疑问,计算机视觉是基于计算设备和计算的。然而,自从上个世纪 30 年代以来,对于计算设备的能力上限,主流的科学家一直持悲观的态度。他们认为,计算是基于计算设备和算法的,其表达能力等价于图灵机[7,79](Turing Machine, TM);在数学上存在大量的问题是图灵机无法判定的,而图灵机可判定的问题只是占问题集合中极其有限的部分;已经发现,有很多极其简明的问题,比如停机问题,图灵机无法判定的。这与我们人的智能有很大的差距。进一步,理论学家[8]得到如下的推论:所有的计算设备的计算能力仅仅限制于递归可枚举语言,存在大量的人能求解而计算设备不能求解的问题。
经典的计算理论是否会成为计算机视觉的瓶颈呢?能否从经典的计算理论中解放出来,为计算以及计算机视觉开辟新的途径?如果从理论上可以证明用计算的方法不能达到某个目的,比如视觉和智能,那么再多的实践和尝试都将会是徒劳而无益的。然而,另一种情况是,算法并非是物理设备上计算的根本途径,计算能完成算法无法完成的功能,算法上不可解并非计算上不可解。将计算和计算设备的表达能力归结于算法的表达能力,是一个误导。已经有学者[9]对于经典计算理论的结论提出了质疑,认为使用算法并非是使用计算设备唯一的途径,经典的计算理论低估了计算设备的计算和表达能力。
理论的缺陷会导致实践中错误的方向。各种视觉算法大行其道(实际上目前的计算机视觉的研究和应用绝大部分都是基于算法的,比如目前依然占主导地位的 Marr 计算理论[10],将计算机视觉分为 3 个层次:计算理论、表达和算法、算法实现,直接描述了算法在计算机视觉中的中心地位)。这本身并没有问题,但是,指望用算法去求解一切,认为设计算法是使用计算设备的唯一的、基本的方法,这种思路值得探索和讨论。
演化(Evolution)也许是世界上最神秘的机制。在量子物理学、热力学、化学、地质学、生物学、经济学、社会学、甚至宇宙学等领域建立了各种演化模型以解释各种现象、变化和过程。人们对于这个与时间、信息、非平衡系统、动力学等密切关联的概念还知之甚少[11],但是,绝大多数人相信生物进化论,相信人类及其视觉和智能是自然界长期演化的结果,也就是说,生命、智能、视觉等等现象和功能是简单物理、化学系统在适当的环境下通过演化而产生。
一方面,计算理论学家已经证明了,算法和图灵机无法实现真正意义的智能和自适应的视觉[12],另一方面,自然界已经通过演化产生了智能和视觉,这说明,演化的过程肯定不是基于算法和图灵机的,其中必定包含有非常重要的机理。
目前的计算机视觉、人工智能的研究依然没有突破自适应性的瓶颈。在计算机视觉方面的理论和实践双双遇到强大阻力的情形下,将计算机视觉的困难与图灵机的缺陷关联起来的想法是非常自然的。
理论的研究往往要结合具体实践。计算理论的研究可以指导计算机视觉的研究,而各种应用,比如钢坯板表面缺陷检测问题、足球机器人视觉问题等,为计算机视觉的研究提供了极好的背景和平台。同时,生物计算、生物视觉是研究计算机视觉的巨大宝藏,无视生物视觉带来的启示和信息将在对于计算机视觉的研究的过程中处于被动地位。本学位论文以生物视觉为证据,以演化计算为基础,研究提高计算机视觉自适应的方法,并用于对钢坯板表面缺陷检测等问题的求解。
第2章 视觉的生物................... 30-40
2.1 引言................... 30
2.2 生物视觉的................ 30-38
2.2.1 视觉与智能的................. 30-31
2.2.2 演化机.............. 31-32
2.2.3 并行处理................ 32-34
2.2.4 自适应机制................... 34-36
2.2.5 层次处理................ 36-37
2.2.6 竞争.............. 37-38
2.3 本章.............. 38-40
第3章 演化计算基............ 40-56
3.1 引言.................... 40-41
3.2 经典可计算.................. 41-45
3.2.1 图灵机与................ 42-43
3.2.2 停机............. 43-45
3.3 计算及演............... 45-47
3.4 演化计算运动................. 47-50
3.4.1 演化状态.................. 47-49
3.4.2 演化状态自动.................. 49-50
3.5 演化计算动................ 50-54
3.5.1 图灵机模.............. 50-51
3.5.2 演化计................ 51-53
3.5.3 演化图灵................ 53-54
3.6 本章................. 54-56
第4章 基于演化计算的.................. 56-80
总结
为开发自适应性强、准确性高、反应迅速的计算机视觉系统,本文对于演化计算、模式识别、生物视觉、钢坯板表面缺陷检测等内容进行了研究。
1)本文归纳、提取了生物视觉中可借鉴的生物学启发,包括视觉与智能的同源性、演化机制、并行机制、自适应机制、层次处理机制、竞争机制等等。提出了视野多区域分离并行假设、生物视觉在微观上的输入数据选择性假设。
2)物理计算设备是实现计算和计算机视觉的基础。关于计算机的根本能力和局限等问题,本文在经典计算理论的基础之上,对于其中最重要的理论:关于所有物理计算设备的计算能力的上限问题的结论,提出了质疑。提出了演化计算的定义、演化计算运动学模型、演化计算动力学模型,包括演化状态自动机模型和演化图灵机模型。并对于其计算能力进行了表达和论证,证明了“对于字母表 Σ 上的任意的语言 A,必定存在一个演化状态自动机 E 识别并判定它”的结论,结合定理“字母表 Σ 上存在语言 A,任意的图灵机无法识别它”,以及定理 “字母表 Σ 上存在语言 A,任意的图灵机无法判定它”,从而证明了演化状态自动机的计算表达能力已经超出了图灵机和算法。进而证明了算法不是使用物理计算设备的最基本方法。同时,本文将物理计算设备的计算能力与计算机视觉、人工智能联系起来,认为计算机视觉、人工智能必定要通过演化计算途径才能真正来实现。本文对演化计算的动力进行了探讨。一个演化计算系统的动力来自信息的增加,源于编码和计算的不确定性。提出了在编码和计算之间转换并提升的演化计算“单摆”模型。认识计算设备的性质有利于计算机视觉的开发。
参考文献
[1]. Crick, Francis. The Computer, the Eye, the Soul[J]. Saturday Review, 1966:53-55.
[2]. Crick, Thinking about the Brain[J]. Scientific American 1979, 241,3:181-188.
[3]. Jeff Hawkins, Sandra Blakeslee. On Intelligence[M], Times Books, 2005:25-36.
[4]. 钱学森. 关于思维科学[M]. 上海:上海人民出版社.1986:64-74.
[5]. 徐光佑. 计算机视觉[M]. 北京:清华大学出版社.1999:1-14.
[6]. Negahdaripour, S. Jain, A.K., http://www.1daixie.com/dxjsjlw/ Final Report of the NSF Workshop on the Challenges in Computer VisionResearch[J]. Future Directions of Research, Lahina, Maui, Hawaii, 1991.
[7]. A.M. Turing, Computing machinery and intelligence[J]. Mind Vol. 59,1950: 433–460.
[8]. John E. Hopcroft, Rajeev Motwani,Jeffrey D. Ullman. Introduction to Automata Theory, Languages andComputation[M], 3ed. Pearson Addison-Wesley. 2007:205-350.
[9]. Peter Wegner. Why Interaction is More Powerful than Algorithms[J], Communications of the ACM 40(5), 1997.
[10]. Marr, D., Vision[M], W.H. Freeman and Company, 1982.