航空和卫星的建模和问题探究
时间:2022-09-20 04:58:38
导语:航空和卫星的建模和问题探究一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。
本文作者:SowmyaArArcot工作单位:
1引言
利用摄影测量和遥感为制图和GIS获取数据,传统方法的特点是人工有效地从影像__匕提取高精度的三维数据,在距离_匕这些影像从空间平台获取的图像到近景固定目标图像。一般来说,这些生产程序是费时并且很昂贵。在目前的制图和GIS预算基础上,传统的方法限制了能提取的地形信息的数量和分辨率。另外,山于数据获取当局采用了不合理的数据更新周期,在很多情况下,数据趋向于过时。数据获取系统总是技术驱动的,并且适应最新的方法和设备。将来,当数字系统成为现实时,这将毫无疑问会继续.在提高自动化水平的基础上,数字系统为提取制图和GIS所需信息提供新方法。新方法中也包括计算机视觉中的边缘裁剪技术,该技术利用了人工智能和机器学习等领域知识。凶此,摄影测量与遥感和计算机视觉与人工智能等领域的研究人员触合他们各自的技能来解决这个应用领域的一些具体的问题。在摄影测量与遥感领域自动提取地面地形信息需要过程的简洁表达和压缩影像范围的知识。这是一个很重要的工作,因为影像中储存着极其复杂的信息。摄影测量中获得的地表地形的影像的比例尺可从l:3000到l:90000,而遥感获得的影像的像素分辨率可从!米到30米不等。地形的影像特征的结构很复杂.它是由很多不同的亮度组合而成的,这些亮度可以表达例如,核物、地表、水文等这样的自然特征:也可以表达例如,房屋、道路等人工建筑,还能表达像阴影或亮度所造成影明的人造物体。另外,遥感影像中,一些特征之间的关系比一般照片上的特征之间的关系复杂。这些特征意味着航天和卫星影像的信息提取是很大的挑战。信息提取的研究首先得考虑数据的语义方面的问题。可是,提取的信息的几何性质也必须被考虑,以至于可以确保空间数据的相关规范性。计算机视觉是一门自动和集成广泛可用于可视处理和表达方法的科学,通过建立清晰、有意义的影像上的对象描述,应用方法和技术很广泛,其中包括数字影像处理,模式识别,几何建模,理解和认知处理.计算机视觉本身主要涉及影像解译和图像识别问题,并且试图通过目标和场景识别来解决这些问题。在这个过程中,使用从影像中提取属性和关系的技术、形状表达和描述技术,最后,利用提取和描述的特征进行基于模型的识别。由于影像获取的方法,在从数字遥感影像提取信息的过程中计算机视觉方法的应用是很复杂的,因而,当使用针对普通照片影像的提取方法时,要仔细考虑遥感影像的数据特征。在计算机视觉应用中很难处理的特征,在航空和卫星影像同样也是很难处理。普通的影响因素包括获取影像过程中的噪音,阴影的影响,由于照相机的角度和定位引起的几何变形的影响和光照的影响,由于封闭和部分目标等问题所引起的影响.解译航空(卫星)影像和其他的图像时采用的方法是不同的.三维物体几何形状是航空影像判读过程中的最基本的元素,这并不是因为要提取高程的原因,而且是因为在判读中三维对象可提供更多的信息。是三维还是二维信息更有利于特征的描述,这样的问题便被提出来了。在计算机科学领域里,对大多数研究而言,二维图像数据一般认为是足够的,尽管有研究小组正从事立体视觉和深度信息提取方面的研究。尽管有些例外,但大多数形状和位置描述决定了计算机视觉中的对象模型,对于中、低分辨率的航空影像,使用纂于形状的识别是令人质疑的。然而,上下文信息对遥感影像的解译有很大的作用。比如,桥作为穿过河流的道路的一部分可能很容易被识别。航空影像中的目标很密集,并有很多的组成部分,这一现象己被认识到了。这与计算机视觉最近的发展趋势是一致,计算机视觉识别图像上的目标,首先是分离不同目标的组成部分和它们之间的关系。这篇文章将回顾一些在计算机视觉中己使用的知识描述和建模的方法,并给出他们在研究遥感影像理解方面的例子。方法很多,要讨论这个领域中所有正在被研究者所使用的方法是不可能的。其他方法的讨论可能会涉及其他的领域,如Crevicr和LePage基于知识的影像理解的方法.Hancock和Kittler方法是两种松弛技术,sriniva犯n是人工智能技术在遥感方面的探索等。第二部分将介绍机器视觉领域中的知识的定义、知识表达的方法、控制问题、特征建模方法。第三部分介绍特征表达和特征识别的过程。第四部分介绍知识表达方法在航空测量和遥感中的应用实例.
2知识、表达和模型
2.1知识的定义•MerriamWebsterDictionary把知识定义为己知的事实和条件,知识是通过经验和联想获得,它的范围包括人所获得的信息和理解,是己知的总和。表达是描述的行为,状态和行为的描述.表达成与本质相应的具有特殊特征或品质的符号、副本或图像。模型是事物的仿真表达,是仿真的实例。在计算机视觉和人工智能中,这些术语的应用不是很严格.与它们的字典中的意思和技术定义相适应,很难确切定义。计算机视觉必须获取影像中场景的有用的描述,最初的描述就是图像强度值的阵列。在低层视觉阶段,进行图像的初步处理。中级阶段应用独立的邻域处理方法提取图像的特征和标识不同的部分。高级阶段归纳更多图像特征表达,在这个阶段进行初步识别.为了处理光线和视角的变化、形状和阴影的影响、图像处理如,相机角度和位置的变化和低层处理中的嗓声问题,我们需要现实世界有关图像获取和应用等方面的知识,这些知识是较高层的丰富的表达,这在计算机视觉中称为模型。这些模型解释、描述或抽象了图像信息。图像和模型之间的桥梁就是一定范围的表达,它联结着输入图像和输出解释。(l)生成图像,图像是输入数据的图像和模拟表达例如:二值图像和侧面影像。(2)分割图像,分割后的图像由与实际目标相应的一些像素组成,例如:分割算法的输出。(3)关系模型,它是经过编码后的知识,用于高层推理和解译.每种表达方法有它的应用范围的局限性。所以,在图像解译中,所有四种类型的表达方法都是重要的。我们应该重点放在第四种上,即关系模型,它包含了用于图像理解目的的知识表达和模型。2.2知识表达知识表达的目的是用计算机易于处理的形式表达知识。一个好的计算机表达语言应该易于表达、简洁、意义明了的、独立的。FOL(FirstOrderLoglc)语言是人工智能中表达方案的基础.FOL有规范的语法和语义,在这种语言里,一个句子的解译也就是上面谈及的。FOL的推断过程允许从旧语句中推断出新语句。这种规范的推断过程可以用于自动的从已知的事实中获取正确的结论.逻辑编程语言和产品系统二者都以FOL为基础.像Prolog这样的逻辑编程语言允许用FOL的严格模式描述知识,也能完成推断过程,可以从通用的知识里提取新的信息。逻辑编程语言通常使用“后向链”控制,用后向的逻辑推理法:为证明一些事物,他们发现数据库中的逻辑关系有助于结论的形成。因此,当一个目标确定后,“后向链”是推理中的最佳方式。产品系统由现存的事物的知识库、一组规则或“产品”组成,这些都是用逻辑关系表达的。下面是一个产品系统的例子。如果一个区域是一个长型的、性质相同的目标,那么他属于道路。产品系统以匹配,选择,产生结果这种方式永不停息地循环,应用数据库的知识,产生新的信息。在匹配阶段,系统寻找所有已有的、满足当前数据的法则。在选择阶段,系统运用第一阶段的匹配原则,选择一个规则来执行。选择的规则在结果产生阶段被执行,在这个阶段可能会牵涉知识库里知识的增加或侧除,和数据的输入、输出。在人工智能和航空侧里与遥感领域,框架和语义网络是最近最流行的值时表达结构。它应用隐喻,把对象表达为曲线图中的节点,这些节点用分类的结构组织,节点之间的关系表述为二进制的关系.在框架系统中,二进制的关系被认为是其他框架填充过来的空槽;在语义网络中,它们之间的关系被认作是节点中的有向线。这两个系统的意义和所要完成的任务是相同的.描述逻辑系统是从语义网络发展而来的,最基本的思想是利用目标和类别的复杂定义和它们之间来进行表达和推理。描述逻辑语言提供三种推理支持:(l)概念描述的分类,在特殊的层次中概念的自动整理。(2)对独立目标根据它们的属性分类。(3)知识库所有知识一致性维护。对于这些逻辑所支持的语言几乎无法表达,并且很难详细阐述复杂的制约条件.这些语言的优点是他们有依据推理服务的正式的语义和简单的逻辑操作.简言之,像Prolog这样的逻辑编程语言有一个执行模型,这种执行模型很简单,以至于一个程序设计员就可处理。近来,Pr。109编译器被推荐作为小型人工智能项目一c产品系统的首选开发工具,该产品系统是一个流行的人工建模推理系统;与Prolog不同的是,产品系统不是基于查询的,而是开放的、不间断的系统,它处于连续的操作中。语义系统提供一个比基于文本式的形式主义更容易理解的图形界面。它可以像FOL一样富有表现力,尽管大多数并不是这样,因为这种系统强加严厉的拘束于可以表达的对象之上.他的优点其中包括能表模块方法中的层次关系,并且相对比较简单。描述逻辑把清楚的语义与简单的逻辑操结合起来.所以,当所有的方案都依据FOL语言,就有这种或那种方法的折衷.2.3控制问题不管选择什么样的影像表达,影像数据的处理和影像数据的表达处理可以称为影像数据驱动,称为从下而上的控制,或可称为内部模型控制,叫做从上而下的控制。自下而上的数据驱动包括从影像处理、分割到描述,每一阶段为下阶段准备数据。如果邻域影像处理方法成本底,而且输入的数据是准确、可信的话,从下而上的控制是有用的.马尔(Marr)和Ullman致力于自下而上的方法研究.这种自下而上的方法是基于人类视觉数据不变的自下而上的处理基础上的。Marr认为这个系统导致一个中间描述叫做21/2维的结构,包括地表定位、参考视场中的距离和方位。另外,Ullman假设高水平的处理叫做可视化程序,它检测中间表达中的感兴趣特征。自上而下的模型驱动控制是被知识库里产生的可能性和先决条件驱动的。因而,模型驱动控制尝试用一种目标指向的行为去执行内部的模型证明.一个普通的自上而下的控制方法是假设和证明。这个一般可以控制低层次的操作.好像支持的人类可视化某些方面的关系并不是自上而下,这个发现促进了模型驱动方法的发展。降低低水平处理过程的设想亦如此。在实际操作中,计算机视觉系统趋向于混合使用自上而下和自下而上两中控制方法,系统的重点在方法效率和实用上.并行和串行计算可能在所有的设计中都用上了。自上而下和自下而上这两种控制隐含了一种层次处理关系.在层次控制中,控制程序看作是合作收集和竞争专家,在任何时候,“专家”帮助大多数选择。黑板结构是这种方法的一个例子,在黑板结构中模块化的知识源之间通过一个公共的黑板(存储器)进行通讯,它们可以通过这个公共的黑板进行输入和输出。2.4建模问题在计算机视觉中的基于模型的方法中,在一类图象中可按优先次序定义了一些模型,并利用这些模型来进行目标识别。这些模型对现实世界和应用中的一些外部知识进行编码二目标模型可能是外观模型,形状模型,物理模型等。在目标表达上,每一个模型应该适应一定的变化范围,这些变化可能是由于视角的变化、光照的变化、柔韧目标的形状变化等因素引起的.另外,影像获取本身的多变性、每组对象中单个对象的多变性,也要考虑进去.感兴趣的目标可能是二维的或三维的:这些目标可能是刚性的、有链接的或有韧性的。图像可能是距离图像或是强度图像.识别就是确定图像上不同的特征和在匹配阶段对比模型特征。模型(图像)的关联特征可以用前面己经讨论过的方法中的一种来表达。在一幅没有限制场景的强度图像识别一个三维目标是很困难的,航片和卫星影像就属于这类情况。深度信息的丢失、遮挡和混乱的细节信息产生了很多问题:另外,图像的强度间接与目标的形状相关.
3特征的自动提取
绝大多数影像解译系统的目的是在影像中提取/识别目标.在基于模型的方法中,它通过首先提取目标属性,然后再将他们与模型匹配。3.1特征属性的描述在计算机可视中,目标的属性、性质和可以从影像中提取的场景都叫做特征.这些属性有时被分类为全局属性和局部属性。然而,在摄影测量与遥感领域,“特征”这个术语是指图像上可识别的目标或者结构,如道路、建筑物,特征的分类依赖于具体应用:举个例子,对航空影像来说,全局性的描述可以包括航影像覆盖的地区例如:城区或郊区。避免过多的名字和定义,文章中的混淆就会减少。在这篇文章里,摄影测量中的术语“特征”即是影像中可识别的对象。若涉及对象的性质,我们就要用术语:“属性”了。目标的全局属性可以概括为目标完全可视化部分的信息,如面积、周长、长度等。理论上讲,为了处理多分辨率和多变的图像,这些全局性属性应是缩放和平移不变的。特征不应该重叠,这样可以避免混乱和遮挡:另外,目标每个不同视角需要独立的模型,这样可以处理多视角图像。例如,在摄影测量中,局部属性可能是联结和分割的边缘,这些可以看作特征的独立属性。然而,在计算机可视化中,局部属性大多数时候被看作属性之间的联系,或者是上下文。相关的属性在图表中构成。评价特征属性表达方案的标准是敏感度、范围、稳定性、有效性和独特性.根据这些标准,研究者总结出一个基于模型方法的好的表达,.其中包括局部属性和图像特定区域和目标的组合。这是因为局部属性可以根据输入数据的有限部分有效计算出来;这些属性很稳定,因为表象的一点变化仅仅影响某些属性,目标的局部遮挡仅仅影响局部特征。边缘连接就是边缘分析基础上的局部特征的一个例子.多尺度表达是可取的,因为在大尺度上,两个大体上相似的目标具有相似的描述,即使在小尺度上有一些不同。不管是从影像数据库还是从经过高分辨率重采样的影像上,对于航空影像和卫星影像而言,这种多尺度描述是比较容易获得的。这个选择项并不是对大多数计算机视觉应用都有用。唯一的模型判断标准在特征识别过程中并不重要,因为识别的方法能够允许由于噪音和遮挡等原因造成的错误匹配。比较航空影像、卫星影像和计算机视觉中的图像而言,前者局部特征的定位比较容易,因为前者的外方位元素和相机参数是己知的或者可以推倒出来。对于大多数航空影像计算机视觉研究而言二描述己经是足够的,但是三维模型和匹配经常应用于摄影测量中,例如建筑物形状提取。最后,什么属性对于特征提取或识别有用呢?属性要能表达不同的特征和图像不同的部分之间的区别。第二,属性要能反映外部世界的规律和结构。这样,属性的选择就是与应用无关的了.在遥感中,通过辐射校正、地物的光谱特征和地面的真实情况,所得到的多光谱影像的特征是众所周知的。一些属性的规律将可以从这些特征知识中提取:例如,不同类型的地面覆盖的光谱特性,如不同类型的植被、土壤、矿物质、水和一些人工建筑物经过多年广泛的实验和地面事实已经被确定了。在计算机视觉中,另外一些属性是基于形状和外形的;例如.道路是窄的条带,建筑物是封闭的多边型等。另外一些属性是基于上下文的,例如,建筑物通常位于道路旁,桥一般是跨越在河上的。特征可以一定的结构进行组织。一种方法是用层次的方法组织它们的部分或全部关系,例如基于系统的语义网络。第二种方法根据邻接关系来组织它们。后者对应于空间临近或上下文关系。二者都可以用图形表达。32特征识别计算机视觉中的目标识别与摄影测量中的特征提取相对应。为了从一幅图像上识别单个目标,自下至上的数据驱动控制通常是足够的,其中属性第一次被检测和表达成符号.通过聚集比较原始的属性来确定新的特征.利用这些属性从模型库中选择合适的模型,也称为索引。然后找到与影像属性最匹配的模型属性。最后,利用一些决策程序来校正模型属性.查找过程本质上包括归类、建立索引和匹配等步骤。然而,在包含多个目标,并且有遮挡和重叠的比较复杂的遥感影像中自下至上控制是不适用的,另外,在质量比较差的图像中噪声会产生假属性。对于遥感图像,这是一个非常合适的方案.在这种情况下,自上而下或者混和控制策略是比较有用的.在自上而下的方法中,假设阶段需要利用属性检索模型的组织,使得基于观测的属性和一小部分合适的目标可以被选择.在校正阶段应用选用的模型来识别目标.在混合方法上,两个阶段的联合提高了处理效率。当结果属性比单个属性更丰富时,就可以对属性进行组合.这个过程称为知觉组织.Lowe提出了目标识别中组合问题和属性组合标准。他寻找边缘分割的结构,它应该是在一定的投影方式下具有普遍性。例如同线性和平行边缘。Zerroug和Nevatia应用均匀投影方法把圆柱投影到二维空间。许多研究者己经研制了专业组合方法,例如:steger等的用于路道提取的方案,Hewricsson和Baltsavias等的用于建筑物的提取方案。显然局部上下文信息在属性组合中发挥着重要的作用,因为,为了定义局部上下文信息,人们希望把描述局部属性与其他属性之间的关系作一些特定安排。有关遮挡、透视、几何、物理方面的一般知识对识别来说是必要的.Brooks(1981)建立了一个名为^eRoNYM的目标识别几何推理系统.Matsuyama和H、ang(一985)研制的s一oMA系统,其中包括了几何推理专家模块。Mc引one和Shufelt(1994)在他们的系统中考虑了投影几何,以用于建筑物提取,而Lang和Forstner(1996)在建筑物提取中应用了多态特性.上下文信息在图像理解起着重要的作用。特别在松弛标记方法中,该方法用局部和全局上下文信息来进行图像区域或目标标记。经过分割阶段,场景标记应该与场景知识相对应,并且标记应该是一致的.这个问题用约束传播的方法来解决.局部约束导致局部一致,并且通过迭代的方法,局部一致性与整幅图像的一致性相协调。关于松弛标记方法的详细论述可以参考Hancock和Kittle:的文章。离散的松弛方法很简单,只能处理完整和精确的分割.概率松弛方法是建立在局部不一致性很可能全局解译比一致很有价值但不易于解释的基础上的,可参见早期Rosenfeld等人(1976)关于这种方法的一个例子.为了处理匹配阶段的不确定性,人们应用了多种基于证据的技术,例如:Dompstershafer理论,可靠性估计,模糊逻辑,最小错误原理,可信度估计,随机封闭集,贝叶斯网络等.
4建模和表达方法应用的一些例子
在计算机视觉和摄影测量与遥感领域中的知识表达和建模方法的应用就是前述一些方法的具体化。这些应用的领导者在理论上是机器械视觉的研究者。在摄影测量与遥感领域,所采用的方法紧随计算机视觉领域之后,这些方法己经改进成信息提取的方法了.这些应用表明摄影测量与遥感领域的研究者在人工智能技术上达到了专业水平。这些方法己经从基于规则的系统发展到语义网络,从框架发展到逻辑描述。在这一部分,计算机视觉和摄影测量与遥感领域中的一些应用的回顾就表明了这个趋势.4.1逻辑Reiter和Mackworth是第一批在计算机视觉系统中,应用逻辑作为一种表达方式的研究者.在他们的著作中,他们提议用一个逻辑框架结构来描述和解译图像和场景知识,并且提出二者之间的形式映射关系。他们陈述了影像原理,场景原理和描述原则,这些原理的逻辑模型形成了影像的解译。他们应用一个称为Mapse的简单地图理解系统来说明他们的方法。虽然这种应用具有相对的局限性,但是还没有新的系统被报道。一个原因是计算方法的复杂性。当逻辑提供一个一致的形式来说明约束,特定的研究使用逻辑的效率并不高。另外,FOL本身善长描述数据的不确定性和不完整性,这些存在于图像属性之中。影像元素与影像对象之间的对应并不是一对一的关系,另外的逻辑关系对这些模型是必要的。Matsuyama和Hwang采用了一个逻辑框架结构,在这种结构中,动态产生新的逻辑一致性和规则。4.2基于规则的产品系统Brooks研制了基于模型的影像理解系统一一ACRONYM系统用来检测三维目标,并用它进行了从航空影像上提取人工地物的实验。三维模型使用一个基于框架的表述来储存。对提供的影像进行了分析,ACRONYM系统提取了线段并获得二维圆柱。几何知识和图像条件经过编码,形成规则被用来产生场景的三维模型,然后这些与框架相匹配以便识别人工地物。sIGMA是一种用框架来描述知识,并且使用从上而下和从下而上两种控制方案来提取特征的航空影像理解系统。它包括三个子系统:几何推理专家系统(GRE)、模型选择专家系统(MSE)、低水平视觉专家系统(LIVE)。信息从GRE传至MSE,然后同LIVE进行通讯。SIGMA中的框架使用槽储存一个对象的属性和它与其他对象之间的关系。以框架中空间知识为基础,产生目标的假设并用于影像特征相匹配。与目标外形有关的推理,由MSE子系统来处理,并转换成图像术语传递给LIVE子系统。这种自上而下的影像属性的选择有利于检测到一些小属性,通过从航空影像中提取房屋和路段信息的实验对这个系统进行了测试。Mckeown等提出一个基于规则的系统,用来从航空图像上解译飞机场.这个系统以大约450条规则为基础,分为6组:初始化、用于原始图像片段解译的区域解译、一致性检查、组合图像片段对功能区域的规则和用于建立机场模型的目标生成规则.Mckeown和Harvey研制了称为•schemata一个航空影像解译系统,该系统中包括一个从标准知识集编汇的一些规则。它们从较高的层次模式中自动生成规则,这有利于更好地进行错误处理和更有效的操作。他们的系统包括大约100schemeta,其中每一个都会产生大约5个规则。start和Fischler提出了一个基于知识的系统,用上下文信息进行地形识别。在不同的层次上用规则对上下文进行定义。上下文信息并不一定可靠,结果导致很多冗余.这个解译系统是以三种规则为基础的:候选结果,候选结果评价,一致性确定。在评价过程中,候选结果的比较是基于可靠的候选结果评价的基础上的,在这个过程中评价相关相似性,候选结果是这类结果中的一个.作者认为这样划分知识是为了使其成为便于操作的大小单元。Stilla等描述了一个基于模型的系统,用来从航空影像中自动提取建筑物信息,目标既具有特殊性又具有一般性。该系统中用产品规则和产品描述集来对要识别的目标进行建模.特殊的模型用不变的拓扑逻辑结构来描述目标,而一般的模型更具有普通性.这些系统说明基于规则的系统不能保证知识的添加性和推理的一致性。如果打破单一规则基础而采用多尺度的多规则那么就会使程序模块化程度降低,而且不易于更改。Draper等人建议用黑板系统和基于schema的结构来处理之。4.3黑板系统Nagao和Matsuyama首先陈述了用黑板模型的影像理解的问题,并把它应用到郊区的航空影像中,用于识别汽车、房屋、道路等。他们的系统包括全局的数据库和一组知识源.黑板用层次方法记录由:基本区域、典型区域和目标等组成的数据.黑板还存储一个标记图,它连接原始影像的象素和数据库中的相应区域。基本区域是影像段分割的结果,并用灰度、尺寸、影像中的位置来标记。然后区域中的独特的特征被提取,识别的结果是具有下面的基本属性的区域。1.依据区域尺寸,大的、同类的区域;2.依据区域形状,长的区域:3.依据区域光照,有阴影的区域;4.依据临近区域的定位和太阳的定位,有阴影的区域;5.有植物和水的区域;6.根据纹理信息,高反差纹理区域。这些属性以单独的模式储存在黑板上,然后根据不同区域的特殊特征存在或不存在,知识源会识别出一个特殊的目标.每种知识源都是一个规则,这些规则是在目标识别的图像处理操作过程中的一个条件或是复杂操作的一部分。例如,利用知识源检洲庄稼地就是这样:“如果”是大的同类的区域、植被区域、没有水的区域、没有光照源的区域,“那么”可以证明这片区域是庄稼地。每种知识源单独识别一个目标,且这个可以导致同一个区域识别相互冲突(如庄稼地和草地)。为了解决这个问题,系统自动地计算一个可靠值.然后,取可靠值最高的识别结果奋舍弃其他的识别结果。Fuger等描述了一个基于黑板的数据驱动系统来分析航空影像中人工的目标.一般的目标模型在黑板中用符号表达,单个对象用几个属性描述.模型被许多参数所限制,这种参数被一个用“发展阶段”的封闭的循环系统所决定。stilla提出一个基于黑板影像理解的系统,这种系统适合于航空影像中复杂场景的结构分析。从一个原始对象开始,反复使用中间结果,目标对象就可以一步一步地组成。对象的组成用一个派生的图表来表达和记录.通过二维图像的分割和直线的近似计算来进行图像的分析识别。黑板系统一般趋向于具有一个集中控制的结构,所以效率就成了问题。另外,黑板系统假设所需要的知识源是有效的,所以在计算机视觉应用中应用该方法前提是图像已经被分析过了。4.4框架Hanson和Rieman把框架作为假设的产生的机器。关于目标分类的知识表达为框架。槽描述了目标类别之间二进制几何关系。槽还包括例示其他的对象描述的产品规则,这样,框架可用于控制又可用于表达.Ikeuchi和kanade用来表达三维对象.当明确了目标模型是有用的,处理过程是自上而下的。然后,如果模型比较弱并且有较准确的数据,那么处理过程是自下而上的。其他使用框架的系统包括^eRONYM、sxGMA、Nagao和Matsuyama等人的系统,这些己经在上面介绍过了。4.5语义网络Nicolin和Gabler描述了一个分析航空影像的系统,该系统用语义网络来表达和解译图像。系统由一个短期存储器(STM)、一个方法库(MB)、一个长期存储器(LTM)组成.5丁M的概念地等同于黑板,储存影像解译的部分结果.LTM存储场景的先验知识和特殊领域知识。系统匹配STM的内容和LTM的内容来产生解译结果.这个过程由MB中的推理机模块来完成.STM最墓本的内容是用一种自上而下的方式建立起来的,并且在一种模型驱动阶段状态产生,校验LTM中存储的目标属性的已有部分和缺少的部分。为了基于知识从数字地图中提取目标,Ma}’er已经发展了一个基于语义网络的系统。该系统是建立在语义网络和框架描述相结合的基础上的,在控制上采用模型驱动和数据驱动相结合。模型是由三个层次组成的,一般与自上而下的影像处理过程的各自的层相一致:(l)影像层,如数字地图;(2)影像图表和文本层:(3)语义对象语义网络以图形层的部分元素为基础构建语义对象,这些对象构成了图形对象和地形对象之间的一般或特殊的关系.例如,一个图表对象层中延长的区域特征化为“路的两边”、“人行道”、“道路网”等.虽然其他对象的描述没有给出,但是测试己证明了道路网的提取.用框架被设计来分析不同的概念和他们的属性.对象的提取以模型驱动和数据驱动实例为基础,初始的研究以用户确定的特定目标为基础的。虽然方法是以地图上明确定义的信息提取为基础,但是M叮er认为这个过程对影像信息的提取也是很有用的。Tonjes己使用语义网络从重叠的航空影像来建立影像模型。输出是具有适当植被表示的三维景观。Tonjes认为语义网络适用于表达结构化目标的知识.它的语义网络是用框架描述的,其中包括关系、属性和方法。语义网络有三个层:(l)传感器图层,该层从纹理,条带和图像细节为基础描述分割层。(2)几何和材料层,该层利用传感和地形解译结果来描述三维表面层。(3)影像层,它是要提取的对象。语义网络建立在三层之间。目标描述通过每层来重建,重建是基于数据驱动和模型驱动的。Lang和Forstner把他们的建筑物的提取方法建立在多态的中间层特征的基础上。该方法中应用了部分分层描述的语义模型。各部分之间的关系没有包括在其中。结合应用于顶点原始层的数据驱动模型和用于目标解译、验证假设层的模型驱动方法的基础上,建立了建筑物假设层,应用了四种建筑物类型:平屋顶、非直角平屋顶、人字形屋顶、曲线屋顶.sch川ing和vogtle开发了一个利用已知地图库辅助解译的数字地图史新系统。影像与地图相比较,检测出地图自编辑以来的变化。接着,语义网络分析新的特征。产生了两个网络,一个用场景,另一个用于图像,在其中网络中的典型关系建立在不同的层次上.DoGunst提出了一个数据驱动和模型驱动相结合的方法,用来识别数字地图更新所需的目标,这个方法是建立在用于道路描述的目标导向模型和用于特征识别的基于框架的语义网络基础上的。框架详细定义了目标之间的关系,目标的定义,可选的目标定义和预处理关系。道路的细节包括复杂道路的结合点,这些在知识库中己被描述。这是一个包括几个不同类型的道路特征的非常细节的研究。研究效果很明显,但同时也表明解译如此多细节存在着困难。Quint和sties在一996年,quint在1997年提出了一个叫MOSES的航空影像分析系统,该系统用语义网络作为建模工具,利用从地形图和GIS数据中获取的知识来自动精练。地图和图像中的一般模型的概念是相应的生成的模型概念的特例。对应于特定的场景的特定模型由系统自动产生:它是通过结合用图像的一般模型进行地图分析而产生场景的描述而产生的。一开始,数字化的有用的线段用来作为地图的结构分析,从而获取地图的结构分析结果。这样,结果图像一般模型来产生特殊模型,以用于图像分析,对于结构分析,原始影像用作输入部分。分析是模型驱动的,进行目标识别。在图像分析处理中用价值函数指导研究。总结之,己发现语义网络有很广泛的应用,并且己经应用于航空影像和数字地图的解译中.4.6描述逻辑逻辑描述的方法在摄影测量方面的应用微乎其微.其中一个是Lang和schroder(1994)研制的基于描述逻辑的方法,利用该方法结合从地图上提取的参考信息来解译航空影像的变化。用KL一one相似描述逻辑来描述不同类型的目标知识和可能的变化类型,它在必要和充足的条件下对概念进行描述。用描述逻辑的描述模块对有关场景和解译的实际信息进行描述。用目标概念和变化概念在逻辑上描述空间地物的几何关系和拓扑关系。目标被认为是经过图像处理和属性提取后的目标概念的一个实例。变化概念的概念被定义为识别变化.利用目标导向和许多启发式方法实现快速搜索。然而,这篇文章的例子似乎都以人工影像为基础的。
5结论
这篇文章回顾了计算机视觉、摄影测量与遥感领域里的研究者们研究的知识表达和建模方法一些发展。知识表达方法己经从产品系统经语义网络、框架,发展到描述逻辑阶段。就它们的复杂程度、模块化和操作定义的清晰等方面而言,它们都有各自的优点,这些系统在特定的领域都有应用的实例,且都取得了不同程度的成功。就它们在提取和识别图像特征中与人眼匹配的能力而言,这些实例表明这些知识表达和建模方法仍有待于进一步发展。除了对本文谈及的一些方法的比较外,我们不可能得出哪能种方法最适合于从航空影像和卫星影像上自动提取信息的结论.研究者们正在研究从数字图像上提取数字制图和Gls所需信息的方法,摄影测量与遥感领域的研究者正联合计算机视觉专家来获取知识表达和建模方面的技术,结合图像数据的特点采用特殊的方法。虽然,这个工作正处于发展之中,但已经取得了重大进展。摄影测量与遥感领域和计算机视觉领域的研究者在这项工作上继续合作是十分重要的,这样可以通过联合发挥各自的优势.
- 上一篇:民用飞机航空材料与机制研究
- 下一篇:新时期产品责任的法律问题