计算机视觉的理论框架探索

罗阳倩子 LUO Yang-qian-zi

（广东农工商职业技术学院，广州 510663）

（Guangdong AIB Polytechnic College，Guangzhou 510663，China）

摘要：本文就计算机视觉的理论框架进行阐述，对计算机视觉理论框架存在的问题进行分析，提出计算机视觉理论框架的新发展，以确保通过计算机视觉获得的景物信息更加完整。

Abstract： This paper expounds the theory framework of computer vision, analyzes the problems of theory framework of computer vision, and puts forward new development of the theory framework of computer vision to ensure that the scene information obtained through computer vision is more complete.

教育期刊网 http://www.jyqkw.com
关键词：计算机视觉；理论框架；问题；新发展

Key words： computer vision；theory framework；problems；new development

中图分类号：TP391.4 文献标识码：A

文章编号：1006-4311（2015）02-0209-02

0 引言

在计算机系统中，计算机视觉是通过模拟人类视觉，从而对不同事物进行相关描述，以获得更全面的信息。随着计算机视觉在文字识别、漫步机器人和导航中的成功应用，计算机视觉的理论框架研究显得越来越重要，对于促进我国计算机应用技术水平不断提升具有重要意义。

1 计算机视觉的理论框架

随着计算机视觉的不断研究和总结，从二维景物图像发展到三维景物图像，计算机视觉的理论框架主要有如下三个：

1.1 计算视觉理论框架在七十年代中期，有关研究人员提出了第一个计算机视觉理论框架，即计算视觉理论，将视觉过程看作是信息处理过程，并将信息处理过程分为三个不同的层次，它们分别是计算理论层次、数据结构层次和硬件实现层次，从而对计算机视觉进行全面分析。根据相关数据和资料显示，视觉是对图像的位置、形状和特征等进行描述，因此，计算理论层成为了研究的重点，进而将视觉过程看作是从二维图像信息中对图像进行重塑，从而将三维物体的形状、位置和空间等反映出来，最终形成三维图像。由此可见，早期的视觉处理是从输入的二维图像中获得二维要素图，即图像中强度变化较强时的位置和几何分布情况、结构等；中期的视觉处理是从二维要素图中获得二点五维图，即以观察者为中心，对表面的法向、深度和不连续的轮廓等进行观测。虽然二点五维包含的深度信息比二维要多，但还不是真正意义上的三维表示，而仅仅是有多个相对独立的视觉模块组成的，在相关研究中被称作是“shape from X”模型，将运动视觉、立体视觉等融入到其中；后期视觉处理是指从二点五维图中获取物体的三维描述，从而将场景中的物体识别处理，确定物体的确切位置和姿态。

1.2 基于知识的视觉理论框架在计算机视觉理论中，基于知识的视觉理论框架，是围绕感知特征群集来进行相关研究的，从而通过人类感知的经验来描述目标，最终确定物体在场景中的真正位置、形态等。相关研究人员认为，基于知识的视觉理论可以通过知识的引导来直接完成三维重建，以将相对应观察方向保持不变动二维特征称作是非偶然性聚类，而人体中视觉识别发挥重要作用的一种感知组织，通过对非偶然性聚类的检测，可以有效辨别出目标。因此，首先是利用感知组织来提取图像中相对于观察方向大范围变化，并且保持不变的分组和结构等；然后，利用概率排队的方法来进行模型匹配，从而缩小检测空间；最后，通过对观察点的未知求解和寻找模型参数对应关系，使三维模型的投影和图像得到最合适的匹配，最终完成三维重建。

1.3 主动视觉理论框架第三种计算机视觉理论框架是中东视觉理论矿坑，是根据人类视觉的主动性特征提出的。由于人类视觉会根据自己的意识选择视野范围内所看见的事物的主次，从而移动身体、转向或者改变视角，因此，人们的视觉过程是与所在环境交互感知和动作的过程。在计算机视觉理论框架的主动视觉框架中，视觉行为不需要三维物体的相关精确信息，就可以完成物体重建。主动视觉系统根据所需的物体对象特征、分析结果和当前要求等，通过控制摄像机的相关操作，如取向、位置、焦距等，就可以完成相关处理任务和信息交换。与此同时，主动视觉还可以用改变摄像机的参数和处理摄像后的数据等，使图像的时间、空间和分辨率等发生变化，从而增强图像的感知效果。

2 计算机视觉理论框架存在的问题

现代发展中，计算机视觉理论框架的提出，是计算机视觉领域研究的重要突破，而在这个发展过程中，存在着如下一些问题，影响计算机视觉理论框架的更完善构建。由于视觉过程是成像过程的逆过程，存在着混合、投影、噪音和畸变等干扰因素，使图像三维重建存在不稳定性和不确定性，因此，从一幅景象到多幅景象的重建存在很多困难，使三维图像的准确性和通用性大大降低。并且，计算视觉理论认为输入是被动的，整个视觉过程自下而上不存在反馈，处理目的没有发生任何改变，因此，对物体的确切位置和形状有一定要求。另外，有关学者提出计算机视觉理论框架没有充分运用知识，对知识表达没有给以高度重视，从而忽略知识推理和知识库的构建，没有对空间约束和场景假设进行充分考虑，从而使场景假设受到局限。并且，没有进行多次的分析和试验，致使计算机视觉理论框架构建存在很多问题。

基于知识的理论框架忽略了计算视觉理论的重要性，认为人类视觉和重建无关，然而，在进行物体尺寸判断、物体距离估算等情况时，光靠识别是不够的，必须要依靠三维重建，才能将物体的确切位置、形状等准确地描述出来。

主动视觉理论没有排除三维重建，通过改变摄像机的参数和角度等，来改变物体空间、时间和分辨率的感知效果，从而对图像出来过程进行相关约束，使很多不稳定和不合适的问题得到有效解决，最终完成三维重建。运用主动视觉理论框架，可以大大降低问题的难度，但主动视觉理论框架仍存在缺乏高层知识指导的问题，导致主动视觉框架还不够完整，使计算机视觉理论框架构建受到一定影响。

3 计算机视觉理论框架构建的新发展

在计算机视觉理论框架的构建过程中，计算视觉理论比较系统地解释了从二维图中获取三维物体形态的方法和可能性，而基于知识的实际理论和主动视觉理论则对计算视觉理论进行了补充和进一步提升。因此，计算机视觉理论框架的新发展，可以以计算视觉理论为主，将基于知识的视觉理论和主动视觉理论结合到一起，从而使计算机视觉系统框架变得更加完善。

在实际应用过程中，将早期视觉处理分为图像分割、图像预处理和二维模式识别等，以对二维图像进行滤波降噪和图像增强等，因此，不需要知识引导和控制视觉目的。在图像分割、二维图像模式识别、中期处理、后期处理和三维模式识别的过程中，没有知识引导和模型匹配，最终得出的图像效果会更好、更完整。在早期视觉处理和后期视觉处理中，二维模式和三维模式的识别，需要根据物体的实际情况来确定，由于特征、模型等各不一样，所以，二维物体和三维物体的描述方式也各不相同。由于二维信息的质量会影响三维信息的效果，因此，在计算机视觉中，二维信息应当给以高度重视。而模型库和视觉目的的应用，为计算机视觉理论框架构建提供了更多的信息。由此可见，在计算机视觉系统中，通过视觉目的来进行物体形象、位置等的输出判断，同时，运用视觉目的可以对图像分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别等进行有效控制，最终使三维重建的图像信息更加完整。

4 结束语

随着高科技信息技术的不断推广，计算机视觉理论框架的研究已经成为目前重点关注对象之一，虽然取得了一定的成绩，但计算机视觉理论框架构建还不够完善。因此，计算机视觉理论框架未来的发展，需要对计算实际理论、基于知识的视觉理论和主动视觉理论进行更深层次的研究，将理论和实践应用紧密结合在一起，从而使计算机视觉理论框架研究的成果可以更加辉煌。

教育期刊网 http://www.jyqkw.com
参考文献：

[1]尹宏鹏.基于计算机视觉的运动目标跟踪算法研究[D].重庆大学,2009.

[2]罗桂娥.双目立体视觉深度感知与三维重建若干问题研究[D].中南大学,2012.

[3]谢飞.基于计算机视觉的自动光学检测关键技术与应用研究[D].南京大学,2013.