图像分析论文范文

时间:2023-03-21 14:54:12

导语:如何才能写好一篇图像分析论文,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

图像分析论文

篇1

1引言

工程图纸扫描图象的识别与理解是目前学术界和工程界研究的热点,在机械、电子、建筑及地理信息系统等应用领域中具有重要的实际意义。图样中有两部分信息,一是图形,由几何图素组成,用来表达产品形体;二是文字,用来定义产品尺寸及描述其它信息,有的附于图形,如尺寸数字等,也有独立存在的,如技术要求等。文字是图样中非常重要的信息。因此,工程图纸扫描图象的字符提取与识别是一个重要问题,对进一步的尺寸理解、图像理解等高层次理解都有较大作用。工程图样中的文字包括多种字符,如汉字、数字、字母及符号等。字符情况较为复杂,有自己的一些特点:字符多为手写,具有一定的随意性,不同于印刷体;具有多种方向,不仅有水平书写,而且有的垂直放置,还有其它各种角度的斜向;有直体与斜体;有时字符与字符及图形粘连,增加了图文分割及字符提取的难度;位置分散,大小不一。上述情况在字符的分割及识别时都必须考虑。所以,工程图样字符提取及识别是一个十分困难的问题。

鉴于工程图样字符的特点,其处理方法与光栅文档具有很大差别,一般的处理过程是:先标识连通体,从中选出字符域,再根据字符域邻近和共线来生成字符串域,并判断方向,然后分割字符域,最后进行字符识别及校正。经过多年研究,工程图样字符的分割及识别算法已有多种:一是基于连通体[1];二是基于轮廓跟踪[2],利用同步边缘特性检测进行轮廓跟踪,分离字符轮廓,采用邻域搜索来生成字符串,最后通过分类树进行字符识别,并根据专业知识作校正;三是行程编码匹配法[3],采用图分割集方法来分割与字符及图形粘连的字符。

本文提出一种基于单义域邻接图的图文分割方法,在二值图象水平黑游程编码基础上,以相关游程线宽和拓扑的一致为约束生成条形域,对其中多义域作分裂获得单义域:线段域和圆弧域,并建立其邻接图。字符笔划可以表示为一个或多个单义域。字符笔划的长度较小,线宽一致。根据这些特点,从单义域中筛选字符笔划域,进行初步图文分离。字符笔划多是邻接的,以字符笔划域为起点,通过遍历邻接图搜索邻接的字符笔划域,来提取字符域。字符结构与图元差别较大,根据字符域特性实现字符进一步筛选。采用字符域外接矩形来标识字符的大小和位置。根据字符域外接矩形相交来判定字符邻近,再加上字符共线为判据来生成字符串域。图样中字符串多是附于图形的,单义域可以很容易获取方向,即可得图形方向。利用共串字符外接矩形中心及所附图形对字符进行定向。然后将非水平字符域旋转至水平,并重新进行水平黑游程编码,以单义域邻接图来表达字符的结构特征,为后续识别作准备。下面进行详细介绍。

2图象的单义域邻接图描述

在工程图形中,既有图元又有字符。图元有多种,如线段、圆弧、圆、箭头等,而且图元多为相交。不同图元需要用一种结构来统一描述,然后通过分析其几何与拓扑特征确定类型来进行矢量化。交点信息对提取同一图元及不同图元之间拓扑关系具有重要指导意义。字符是由笔划组成的,在提取笔划的基础上进行识别是一种很好的方法。但笔划的提取难度较大。现有对图样字符的识别多是处理数字和字母,较少涉及汉字,而我国图纸均有大量汉字信息,还有数字及字母等。因此,需要建立一种模型,既能表达几何数据,还可以描述拓扑关系,便于各种特征提取。

现有图文分离算法多是以象素为单元,进行连通体生成。而连通体对后续识别贡献较小,尤其是对图元的识别。这就要求采用一种模型能够统一描述图形和文字的几何与拓扑信息。基于单义域邻接图的描述模型,可以统一描述图元和文字,不但能提取图元,还为字符识别的笔划特征提取提供启发。下面给出单义域邻接图的建立方法。

对图象作水平黑游程编码,这时对图象的分析单元由象素变为游程,游程连通性反映了图形拓扑关系。如图1.b所示。通过分析游程的拓扑关系,可以获取具有转折意义的游程[4]。这些关键游程为图元分割提供线索。相关游程基于宽度和拓扑一致性可以聚合为一个集合,来表达某一几何与拓扑意义,称之为条形域。条形域具有较强的整体性和宏观性[5]。但是,有的条形域具有多义性,即由线段域和圆弧域组成,对多义域需作分裂得单义域。这时,图象的表达单元变为单义域,如图1.c所示。而单义域首末游程的拓扑则表达了单义域的拓扑关系。单义域邻接图可以完整地表达图象中图元与字符的几何与拓扑信息。如图2所示。

3字符提取

图文分离算法已有多种,主要是基于连通域。多数字符是一个连通域,数字、字母及汉字多是连通的,或是由几个连通域构成的,而且字符域具有许多与几何图元域不同的特征。在实际中多以象素八邻域来进行字符提取,且辅以多种字符属性判断,确认是字符域而不是图形域,并生成其最小外接矩形,用以标识字符域的大小与位置。上述算法主要是分析连通域的特征来确定字符,在生成连通体时,对于图文粘连情况,势必形成一体,需要后续分割或造成图文误分。这主要是因为在形成连通体时只是基于象素。如果能够在确定笔划域的基础上进行图文分割及字符提取,则毫无疑问会提高分割及提取效果。

根据制图规则,图样中的汉字、数字、字母的字体均有规定,在一定扫描率下,可以确定字符的范围阈值,从而确定字符笔划的长度,而字符笔划线宽又是基本一致的,根据这两个条件从单义域中选取字符笔划域。邻接的字符笔划域为一个字符,或是一个字符的部分笔划。字符提取是以字符笔划域为基础的,遍历邻接图搜索邻接的字符笔划域来完成。下面给出具体算法:

(1)取出未访问字符笔划域,设为当前域,新建字符域及其外接矩形,将当前域插入字符域。

(2)如果当前域无邻接的可访问域,则转到(4),否则,取当前域邻接的未访问字符笔划域,设为当前域,插入字符域,字符域外接矩形生长。

(3)返回(2)。

(4)得一字符。

字符结构与图元差别较大,根据字符域特性[1]实现字符进一步筛选。图3.a给出图1.a的字符提取结果,采用外接矩形标识。

4字符串生成

工程图纸中字符多以串的形式存在,组成字符串来表达语义。分析字符的字符串归属能够为字符识别提供方向及上下文等信息。由于图样字符的多向性,字符的方向确定也需从字符串中获取。对于小象素群究竟是小数点还是噪声,只有置身于字符串的上下文中才能作出正确判断。因此,字符串的组合是继字符提取之后的必然要求。

字符串成组通常采用的方法有两种,一种是利用Hough变换进行共线检测[6];另一种是相邻检测,即字符串的生成就是将邻近字符组合在一起。第二种方法有多种作法:一种是以字符外接矩形的中心距为判据的,与某一阈值作比较,若小于阈值则将其归为同一字符串。一般先进行水平、垂直两个方向字符串搜索,再进行斜方向,以字符外接矩形的中心距为判定值,对不同方向采用不同阈值[2]。另一种是以字符外接矩形的角点距为判据的,与某一阈值作比较,若小于阈值则将其归为同一字符串[7]。阈值与方向的关系较大,有时需要同时处理多种情况。

上述方法即使对同一字体由于方向不同(水平、垂直、斜向)需采取不同阈值,对方向较为敏感。本文采用一种矩形求交方法来进行字符邻近判断,可以较好地解决字符邻近判断问题,无需预先设定方向。

4.1字符组合

在图样中,不同大小文字之间的行列间距是不同的,文字列间距与其大小具有一定对应关系。本文根据字符域外接矩形自适应求得字间距,通过膨胀字符外接矩形,即字符外接矩形按字列间距扩大生成膨胀矩形,对膨胀矩形进行求交运算来判定两个字符是否邻近。同一字符串的字符不但是邻近的,而且还应共线(第三个字符起)。下面给出字符组合步骤:

(1)取出未访问字符域i,设为当前域,新建字符串域,将当前域插入字符串域。

(2)如果当前域无邻近且共线的可访问域,则转到(4),否则,取当前域邻近且共线的未访问字符域,设为当前域,并插入字符串域。

(3)返回(2)。

(4)得一字符串。

图3.b可以看出,矩形求交方法可以较好解决字符组合问题,在字符串的生长中无需预设方向。

4.2字符串定向及旋转

工程图样中字符是多向的,其定向问题直接影响识别精度。字符串的方向为其书写的基线方向。多数方法以字符中心连线来确定方向,但,如果字符较少,则误差较大。在工程图纸中,多数字符串附于图形,尤其是线段,而其基线方向与其所附线段的方向一致,如机械图样中的尺寸数字。由于采用单义域邻接图来描述图象中图形和文字,从单义域中可以很容易获得图形的方向信息。对于附于图形的字符串定向,可以采用比较字符串中心线与所附线段来确定字符串的基线方向。如果字符串邻近的某一单义域(线段域)的方向与字符串中字符域中心连线方向一致,则采用线段域方向作为字符串方向。而独立字符串的定向问题可采用文献[1]方法。

对于水平字符串,可以直接取出每个字符进行识别。而对其它方向的字符串,需先对每个字符根据其方向旋转至水平然后进行识别。图3.b给出字符串标识。图3.c给出旋转后结果。

5字符单义域表示

我国图纸多是中西文混合,字符识别的特征提取必须考虑汉字特点,笔划特征明显。字符识别的特征提取方法很多,如果能够提取笔划,则必定会大大提高识别效果[8]。采用单义域邻接图可以较好地提取、表达字符的几何与拓扑信息。图4给出字符单义域表示实例。

6结束语

本文采用单义域邻接图来表达图象信息,在确定笔划域的基础上进行图文分割及字符提取,整体性很强。本研究算法已被应用于我们开发的工程图纸扫描图象识别与理解系统之中,字符提取效果较好。但仍需进一步完善,研究各种复杂情况,以提高字符及其笔划特征提取精度,尤其是研究各种结构汉字,进行以笔划为基础的中西文识别。

参考文献

[1]邹荣金,蔡士杰,张福炎等.字符粘连及字线相交的分割与识别方法.软件学报,1999,10(3):241-247

[2]胡友兰,黄树槐,常明.工程图中字符分离和标注字符串生成技术.华中理工大学学报,1997,25(3):30-33

[3]陈勇,朱林,常明.工程图中粘连字符的提取与分割.华中理工大学学报,1996,24(4):23-26

[4]S.DiZenzo,L.Cinque,andS.Levialdi.Run-BasedAlgorithmsforBinaryImageAnalysisandProcessing.IEEETransactionsonPatternAnalysisandMachineIntelligence,1996,18(1):83-89

[5]王金鹤.基于条形域结构的扫描图样识别理论与方法研究(博士学位论文).大连,大连理工大学,1999.6

[6]江早,刘积仁,刘晋军.工程图纸图象图文自动分割工具SegChar.软件学报,1999,10(6):589-594

[7]李伟青,彭群生.一种新的字符提取和组合算法.工程图学学报,1997,No.2-3:38-45

[8]L.Y.TsengandC.T.Chuang.AnefficientKnowledge-BasedStrokeExtractionMethodforMulti-FontChineseCharacters.PatternRecognition,1992,25(12):1445-1458

AnAlgorithmofExtractingCharactersfromScannedImageofEngineeringDrawingsUsingPrimitiveRegionAdjacencyGraph

篇2

论文摘要:本文从知识管理理论的角度出发,研究了图书馆知识共享的相关问题.并以此作为基点来实证分析图书馆实行知识共享的现状与存在的障碍因素.进而探求克服共享障碍的激励措施。论文分成3个部分:第一部分探讨图书馆知识共享的内涵.并从三个方面阐述图书馆实施知识共享的必要性。第二部分提出并分析了图书馆知识共享实践的障碍。第三部分提出了解决图书馆知识共享障碍的主要途径。

20世纪90年代以来.图书馆面临着新技术特别是信息技术的飞速发展的挑战,信息技术不断改变着社会的文化,图书馆也随之改变管理与服务方式。无论是为促进社会的发展还是为自身的生存。图书馆都应该认真审视周边变化的环境,明确自身的定位和任务。引入知识管理.建立一个实时、开放的知识共享系统。总之。实行知识共享是图书馆在知识经济时代的必然选择。

1、图书馆知识共享的内涵

图书馆知识共享也是图书馆开展的知识共享。这不仅包括图书馆内部人员之间的知识共享,还包括与图书馆紧密相连的外部机构之间、图书馆和图书馆用户之间的知识共享。图书馆内部人员知识共享是指图书馆内部人员个人的知识通过各种交流方式与其他成员所分享从而转化成组织知识的过程;图书馆外部的知识共享主要是图书馆与图书馆用户与其价值链上的组织的知识互补性和协同发展的需要而进行的知识转移的过程。其中图书馆内部人员的知识共享和图书馆与用户之间的知识共享是图书馆知识共享的主要方面,而图书馆与外部机构之间的知识共享是图书馆知识共享的次要方面。

2、目前国内图书馆知识共享实践的障碍

2.1部分读者和馆员提供隐性知识的被动性

图书馆馆员作为知识拥有者,在获得知识的过程中.要付出一定的物力、精力和财力。对于个人来说,馆员对图书馆的价值取决于自身所知道的而其他人并不知晓的知识。个人拥有的独特技能使自己改进工作效率,提高个人在团体中的地位,而共享之后的知识不再为个人独有,自己存在的价值就会减少。

2.2缺乏有效的激励机制

由于对隐性知识的重要性和复杂性认识不足.缺乏对隐性知识的研究和有效管理,图书馆知识共享管理大多不健全。馆员所拥有的隐性知识贮存在头脑中,是否贡献出来供其他人共享,完全取决于馆员的意愿。所以合理的激励机制对促进隐性知识交流和共享极为重要。但目前大多数图书馆采取的分配制度明显不利于隐性知识的交流与共享,缺少由物质、精神等多方面激励形成有效的激励机制,是图书馆隐性知识得不到有效管理的一大障碍。

2.3图书馆利用的复杂性和难度

图书馆对知识的组织和整序是其基本功能,而知识的组织和整序需要的是特殊的专业性技能。因其组织和整序的日益复杂化不可避免地影响用户的检索和利用。这是造成用户利用图书馆难度的根本原因。因为从用户查询利用来说.尽管需要的知识和技能的专业化色彩已经淡化,但仍然会带来不少麻烦。在现代化信息技术条件下,随着复合图书馆、数字图书馆建设的推进。图书馆利用的复杂性和难度没有降低。资源的丰富和复杂性,检索查询的复杂性,图书馆服务设施的复杂性,这些都给用户的利用造成了一定的困难。而图书馆对用户的培训、咨询实际上是把自身的个人知识和技能拿来与用户分享,这种个人知识和技能不是显性知识,而是主观化的隐性知识。

3、解决图书馆知识共享障碍的主要途径。

3.1通过宣传教育广泛达到共识

由于知识共享的研究大多集中在企业中,知识共享对提高组织竞争力具有十分重要的作用,但对图书馆的知识共享却并未引起足够的重视。图书馆是社会文化结构,长期以来一直受财政拨款的扶持,因此竞争意识不强。随着中国加入WTO,图书馆信息服务的职能受到商业机构或信息咨询公司的挑战越来越大,图书馆要想在今后的竞争中立住脚跟,就要重视知识共享和知识创新,增加知识资本,提高工作和业务能力,增强图书馆的整体服务能力和服务效果。图书馆利用教育、培训活动以及通过领导示范、业绩考评等手段把知识共享与图书馆的核心价值观相联系,打破部门思维.帮助成员之间建立合作关系,建立一种学习、合用、开放的文化环境,激励人们以内在的力量和他人进行知识共享。

3.2建立图书馆知识共享协议

图书馆和其他社会组织一样,有工作关系维系的供需链,图书馆与书商、行政管辖部门、社区、用户、本行业及其他文献信息服务部门、技术支持行业及部门,同样也包括其他图书馆。图书馆最重要的使命就是为其用户扩大知识的获取、各图书馆之间的关系是共存共荣的互助协作关系。网络技术和通讯技术的迅猛发展为身处异地的图书馆员知识交流和共享提供了必要的工具,因此在某种程度上说,在全球范围内实现图书馆知识共享是有可能的,主要建立图书馆知识共享协议,这是深度合作和长久合作的必要措施。由于各馆知识资源分布不平衡,所以共享具有差异性。为平衡各馆之间的利益,有必要建立合适的补偿机制。可以对贡献知识的数量、知识的受认可度及运用到工作中所取得的成效进行大致测定,根据测定结果决定补偿力度。利益平衡是知识交流和共享得以持续进行的基石。

3.3建立图书馆知识共享激励机制

3.3.1激励用户知识共享的主要措施

建立知识共享的激励机制,包括物质激励和精神激励。使用户既能获得实际的利益又能得到心理上的满足.从而激发用户的知识学习、创新及知识共享的主动性和积极性,增强其知识交换的意愿。

(1)共同创新机制

创新并不总是来自图书馆内部.很大部分是来自用户。图书馆可以积极地加强与用户的联系,使用户成为图书馆良好的合作者.共同进行信息服务的开发和革新。

(2)共同学习机制

这是一种突出图书馆无形的社会文化价值创造和利用的方式.重点在于促进图书馆和用户之间以及不同用户之间的团队学习。通过这种方式图书馆可以在与用户的互动中创造价值,甚至可以利用用户的知识创造一种全新的价值链或者进行组织结构及流程的再造。同时促进图书馆与用户进行显性和隐性知识的共享。

(3)智力资产共享机制

共享智力资产是图书馆与用户关系最为密切的知识共享方式。把用户视为图书馆的“所有者”,图书馆与用户共同分享双方的智力资产,并且创造出新的智力资产,以获取智力资产的最大收益。用户不仅参与参考咨询服务,还同图书馆一起共同开创图书馆的未来。

3.3.2激励馆员知识共享的主要措施

(1)知识(成果)署名并定期公布制度

对图书馆员工个人或团队的知识成果都加以署名。其它的知识(成果)都定期在图书馆内部公开,并在指定的地方加以公布。这样做一方面是图书馆对员工运用和创造知识的辛勤劳动的肯定和尊重,他们由此也会产生一种自我价值实现感,在以后的工作中就会更加努力地自觉创造出更多的成果与大家分享;另一方面,要求图书馆员申报一定时期内(比如说一个月)以来的知识成果,汇报与其他馆员交流了多少有用的知识,将多少知识应用到实际工作中了。

(2)知识薪酬支付制度

对贡献了知识成果的馆员。通过增发薪水与酬金来激励。对那些贡献了较多经验、技能等隐知识而对经济利益较敏感的馆员,图书馆可将其贡献与奖金等挂钩,或稿酬的方式支付。馆员发表的作品在馆内公布时亦以一定的稿酬鼓励。凡第一次在馆内公布的重要理论观点及技术知识为其付予一定的稿酬。这方面可制定一个详细的标准。

篇3

1形神论的形成及在佛教思想文化中的含义

中国油画艺术中, 形神论这一艺术理论与佛教思想文化存在着一定的联系。中国艺术形神之说自古以来一直是艺术美学的一个重要议题。 形与象二者相互关连,合二为一即为形象。 将其分开来看,可最早追溯到中国的先秦典籍《易经》。 该书这样阐述道易者象也,象也者像也。 这是最早的对形象的理解,将象等同于像。 《系辞传》则肯定了易象的来源是天上万象的写照,并提出观物取象的思想。老子也曾对象加以说明。 他所著的《道德经》中提到道之为我,惟恍惟惚; 惚兮恍兮,其中有象;恍兮惚兮,其中有物。 该句中对象的描述或指对象的具体形态、物象,亦或可能是对宇宙中自然万物变化莫测,气象万千的一种模糊意义上的形容。 但不管怎样,都从不同角度作出了对象的理解。由此看出《易经》和老庄哲学都蕴藏着一定的美学思想,比后来传入中国的佛教思想文化要早很多,它们是中国艺术美学理论形神论形成的必要因素。 随着历史与艺术的发展,佛教思想文化在与儒道等典型文化的既相互排斥又相互渗透、融合的进程中完成了中国化的历程,并与儒道思想文化一起加速了中国艺术美学形神论的成熟与完善。 形象一词在佛家典籍中早已被提极过,但并非对艺术而言。 前者的《易经》与老庄哲学只提到了象,而并未将形与之联系在一起。 而佛教则很好地将二者合二为一。 《高僧传卷八》这样记载道:圣入之资灵妙以应物,体名寂以通神,借微言以津道,托形象以传真。 其中虽然充满了唯心主义思想,但形象一词却却诞生了, 这其中的美学思想不言而喻,而更加推动了形神论之说走向成熟的是佛教的神不灭论,其着力揭示了神是不随形灭的。 形是易朽的东西,神是精极而为灵者也,它是恒常不变的实体(无生) 可以托身异形、随物冥移这些佛教的思想文化点明了神的重要及灵性,也表明了形的暂时性,不恒久性。于此形粗神精的价值观也就随之凸现出来了,这也恰恰体现了艺术美学思想中的形神论。

2形神论之于油画创作的重要意义

形神论在美学上的反映,最突出的就是贵神贱形,即重视画面的神,形则处于从属的地位。 由此,中国艺术美学思想中的形神论理论更为丰富、成熟,集多家思想文化融合互补于一体,但佛教思想文化中的神不灭论的痕迹则尤为明显,由此,绘画艺术理论也就更为丰富多彩了。如以形写神。元代刘见孙的《萧达可文序》中这样阐述道:即神似,虽形不酷似,尤似也。 其意思是说有了神采了,尽管形象上不太吻合,也没有关系,神似则可。 《画论》中说:今人看画,多取形似,不知古人最以形似为末节。 意思是说,时下人们欣赏画作,大多通过形来评判该幅画作的好坏,岂不知古人早已将形的好坏放到了评价标准的最后。 于此同时,形神论的形成与发展也离不开大量的艺术实践。 佛教传入中国后,佛画的大量绘制也很大程度地加速了艺术的发展与艺术理论的成熟与完善。 通过大量的艺术实践,形神论得到了进一步的丰富与发展。形神论的美学思想不仅对中国传统绘画影响深远,同时也直接或间接地影响了中国油画艺术的发展。 具有一定国学基础及文人精神思想的中国艺术家在面对油画创作的时候,只是在材料技法方面稍显陌生,占主导地位的却仍然是人的思想精神,而这恰恰是油画创作标准的最高层面,即神的层面。 中国油画家受传统文化形神论的影响,在油画创作中不断探索,十分注重画面中的形与神。油画艺术对于东西方而言,确实存在着差异。 西方古典的写实性与东方传统的表现性、写意性确实存在着明显的差异性,但这只是二者在形与神上的侧重点不同而已,前者在形上要求严谨性、科学性,理性的成分较多;后者则把形放到次要地位,只求似则可,把神即精神、性灵、神韵列在首位。 二者之间看似冲突,但仔细分析判断后,事实并非如此。 二者只是由于文化差异导致了在油画创作上的侧重点不同,但最终的目的却是一样的,即都是为了满足审美的需求以及表达一定程度的精神世界、思想内涵。 中国众多的油画家们正立足于本民族传统文化的高点上,通过不断探索研究,吸收外来文化的精华,使油画在中国这片土地上快速发展,形神论则一直被高度重视并贯穿于油画创作之中。

当今油画艺术形式繁杂,成多元化趋势。 一部分艺术家吸收西方古典写实性艺术的精华,注重形的处理,并与中国审美文化相结合,创作出了具有东方特色的写实性油画艺术,使画面达到了形神兼备艺术效果,即重视形体,又重视对其神韵的追求。写实画家较多,如冷军、王沂东等。 同时西方艺术家们通过反思古典写实油画的得失,自觉的追求油画语言的变换与变异,向表现性、象征性和抽象性油画艺术方向发展。 比如西方现代主义画家抛弃了古典的写实性,开始追求表现性、象征和抽象性,这些方面都与中国传统文人画接近,即逸笔草草,聊以解胸中逸气。从一定意义上来说,中国传统绘画的写意性与西方现代绘画的主张有异曲同工之妙,都是对神采的追求,对精神性的探索。 尽管东西方思想文化存在着巨大差异,但艺术却是全人类的艺术,中国绘画艺术与西方绘画艺术达到了某种程度的共鸣。 在东方文化氛围之内,艺术家们除古典写实以外,在油画创作中又采用了变形、夸张、抽象等艺术手法,进行更加大胆的艺术尝试,创作出大批优秀的油画作品来。其一个共同点就是艺术家们都没有抛弃东方灿烂辉煌的思想文化,尤其注重对形与神的处理并将其继承、发扬、再创造。这些优秀的艺术家有吴冠中、赵无极等。 吴冠中的绘画艺术极富思想精神性,画面灵动而优雅,色彩丰富而纯净,具有禅的境界。

篇4

关键词:舌诊;舌象客观化;舌体图像分割;图像分析;RGB;动态阈值

中图分类号:TP391文献标识码:A文章编号:1009-3044(2008)14-20910-02

1 引言

自古以来中医有四种诊断疾病的方法,那就是望、闻、问、切四诊。望诊就是医生通过视觉来观察病人的神、色、形和态的变化。总体来说,望诊包括一般望诊和舌诊两部分,一般望诊又包括望神、察色、望形态、望五官等,舌诊包括望舌质、望舌苔。舌质是舌的肌肉部分,舌苔是舌面附着的苔状物,舌质可以反映五脏的虚实,舌苔可以察外协浸入人体的深浅[1-2]。临床上通常把舌质和舌苔变化联系起来综合判断,一般是急性病重舌,慢性病重脉,因为舌象能准确及时的反映机体生理病理状况[3]。望舌诊病是中医长期实践积累的独特诊病手段。

2 舌象客观化的研究

传统的中医舌诊是由中医师根据自己的知识和经验用人眼观察,并在短时间内作出判断,其诊断结果受医生的知识水平、思维方式及诊断技巧的限制,也受光线温度等外界客观因素的影响,因此难免会出现某些误差,把淡黄色误作深黄色,红色误作淡红色等。为了消除人为因素的影响,使用现代数字图像处理及分析技术和现代的智能信息处理技术,使中医舌诊从主观诊断转向客观决策[4],进行舌诊客观化的研究是非常有意义的,具有较好的前沿性和可操作性。

采用数字图像处理技术对舌象进行图像分析的研究始于80年代中期。孙立有等人,先对利用图像处理和模式识别进行舌诊客观化的研究提出了一种想法[5],建议着重分析舌象的色度变化,并且贯彻中医的辩证观及整体观思想,为国内后来的舌诊客观化研究提出了一个方向。苏开娜等首次利用图像处理技术进行了舌苔润燥的分析,采用二分光反射模型讨论了舌苔图像上亮斑象素点在RGB 彩色空间的分布特征及亮度特征。本文主要探讨舌体区域自动分割的一种方法[6]。

3 用动态阈值法分割舌体区域

在舌体图像分割中,一般的分法是利用舌体的颜色与背景颜色的不同,把舌体区域从背景中分割出来。台湾国立中山大学蒋依吾等根据大量的观察实验指出舌体中舌尖舌边的RGB三色分量与周围皮肤由较大差异,提出了的边缘增强公式,进行舌体区域分割取得一定效果[7]。但是由于这种颜色差别仅存在于舌尖和舌边,不适用舌根部位,所以仅用颜色的差值来分割舌体是无法取得好的效果。本文参考上述公式,再利用舌体区域与背景区域存在的丰富边缘,用动态阈值的分法获取边缘并连接,在舌体图像分割中取得较好效果。

3.1 用RGB三色分量差值法分割舌体区域

设RGB色彩空间像素Vc=(r,g,b),r,g,b∈[0…1]则有:

Gate=(r-g)+(b-g)*6+(r+g+b)/3

IF(gate(i,j)

Crf(i,j)=1;

ELSE Crf(i,j)=0;

其中(i,j)指像素在图像矩阵中的位置。gate(i,j)是RGB三色分量差值,Crf(i,j)为参考的二值化图像,Crf(i,j)=1指要分割出的目标区域,Crf(i,j)=0指背景区域。这样可以得到舌体中的舌边和舌尖的边缘,再通过舌体根部与上嘴唇出现的阴影区得到舌根边缘,这样就可以把整个舌体区域分割开来[8]。

3.2 用动态阈值法分割舌体区域

上述分法仅利用了颜色信息,很难把与舌体颜色相近的唇部区域去除,但是大部分舌体与唇部之间都存在一定的边缘,用动态阈值取出图像的灰度边缘,再加上上述方法取出的RGB三色分量差值得到边缘,分割舌体,这种方法会取得更好的效果。具体操作是:首先定位舌中的一点,然后取出沿图像四周的点与舌中此点连线的灰度值,计算连线中的最大梯度,取为待选边缘点。梯度的计算公式是grad(i)=gray(i)-gray(i+I),其中grad(i)指在连线位置i处的梯度值;gray(i)是指在连线位置i处的灰度值。用RGB三色分量差值得到的舌体边缘点,将其记为coloredge (i)。最后比较灰度梯度得到的边缘点与用RGB三色分量差值得到的边缘点,选择最终边缘点,连接这些点,形成闭合区域,分割出舌体区域[9]。根据经验,选择最终边缘点的公式:

IF(rgad(i)

edge(i)=grad(i);

ELSEedge(i)=colordege(i);

4 结论

根据中医对分割出的图像的评价,把图像质量分为5个等级:优等,较好,中等,分割失败,未分割[10]。实验样本中基本涵盖了各种情况的舌图像,有舌面完全伸出覆盖下嘴唇的图像,也有未完全伸出的图像,也有露出上腭的图像。我们用上述的3.1和3.2方法分别对舌体区域进行分割实验。实验证明,3.1方法对于舌面伸出覆盖下嘴唇的图像有较好的效果,但对于舌面未完全伸出未覆盖下唇的图像分割效果很差。3.2方法对于上述两种图像都有较好的效果,但对于舌边缘模糊的图像分割效果较差。两种分割方法得到的效果图如下:

5 结束语

近年来计算机技术的迅猛发展,使舌诊客观化研究在方法上有了很大的进展,但仍存在许多问题亟待解决。在中医理论指导下和临床实践的参与下,利用计算机和图像处理技术对舌象作进一步的定性、定量分析,建立舌诊的客观统一识别标准,提高了舌象特征自动分析的准确性和实用性,推动了舌诊客观化系统的发展,这将是我们进一步研究的重点。

参考文献:

[1] 刘庆,岳小强.舌诊现代化研究的回顾与展望[J].中西医结合学报,2003,5(1):66-70.

[2] 沈兰荪,王爱民,王卫国,等.图像分析技术在舌诊客观化中的应用[J].电子学报,2001,12(A):1762-1765.

[3] 朱洁华,阮邦志,励俊雄,等.舌诊客观化研究的一种图象处理方法[J].中国生物医学工程学报,2001,20(2):132-137.

[4] 王爱民,赵忠旭,沈兰荪.中医舌象自动分析中舌色、苔色分类方法的研究[J].北京生物医学工程,2000,19(3):136-142.

[5] 孙立有.利用计算机图像识别技术进行舌诊客观化研究的探讨[J].安徽中医学院学报,1989,5(4):5-7.

[6] 苏开娜,卢翔飞.基于图象处理的舌苔润燥分析方法的研究[J].中国图象图形学报,1999,4(增刊):345-348.

[7] 蒋依吾,陈建仲.电脑化中医舌诊系统[J].中国中西医结合杂志,2002,20(2).

[8] 沈兰荪,赵忠旭.基于图像处理的中医舌像分析仪的研究[J].国外电子测量技术,1999(6):33-35.

[9] 王爱民.用于舌诊客观化的图像分析技术的研究[D].博士学位论文,北京:北京工业大学,2001.

篇5

    1.1.1医学图像处理的特点及重要性

    医学图像处理技术包括很多方面,如:图像恢复、图像重建、图像分割、图像提取、图象融合、图象配准、图像分析、图像识别等等。进行医学图像处理的最终目的是实际应用于医学辅助、工业区生产、科学研究等方面,所以其具有较广泛的应用价值和研究意义。医学图像处理的对象是各种不同模态的医学影像。在医学临床的使用中,医学影像主要有超声波(UI)、X-射线(X-CT)、核磁共振成像(MRI)、核医学成像(NMI)等。随着计算机技术的发展,医学影像技术已成为一门新兴交叉学科,目前是计算技术与医学结合技术中发展最快的领域之一。借助有力的医学图像处理技术手段,极大的改善了医学影像的质量和显示方法,其成果使临床医生能更直接、更清晰地观察人体内部组织及病变部位,确诊率也得到了提高。这不仅使医学临床诊断水平在现有的医疗设备的基础上得到极大地提高,并且能使医学研究与教学、医学培训、计算机辅助临床外科手术等实现数字化应用,从而为医学研究与发展提供坚实的基础,在医学应用中具有不可估量的实用价值。

    医学图像与普通图像相比,具有以下几方面的特点(1)医学图像具有灰度上的含糊性。表现为两方面:一方面是由于成像技术上的原因带来的噪声扰,往往使物体边缘的高频信号被模糊化;另一方面,由于人体组织的螺动等现象会造成图像在一定程度上产生模糊效应。(2)局部体效应。处于边界上的像素中,通常同时包含了边界和物质,使得难以精确地描述图像中物体的边缘、拐角及区域间的关系,加之假如出现病变组织,则其会侵袭周围正常组织,导致其边缘无法明确界定。

    1.2论文的研究目标及工作

    1.2.1论文主要涉及的三方面基础理论

    论文主要涉及马尔科夫随机场(MRF)理论、模糊集理论及Dempster-shafe证据理论三个方面的基础理论,下面分别作介绍:1)马尔科夫随机场(MRF)理论基于随机场的图像分割方法是一类考虑像素点间的空间关联性的统计学方法。其实质是从统计学的角度出发,将图像中各像素点的灰度值看作是具有一定概率分布的随机变量,从而对数字图像进行建模。Cristian Lorenz等人,在医学图像分割中提出了一种可应用于任意拓扑结构的新型统计模型。根据马尔科夫随机场图像模型,利用最大后验概率准则(MAP),提出一种迭代松弛算法。MRF模型能够区分不同纹理的分布,其特别适用于纹理图像的分割。但使用MRF模型进行分割的关键问题在于参数估计,所以分割的效果往往取决于对参数估计的准确度。为此通常在分割与参数估计间进行轮流迭代计算,例如:先初始化参数,在此基础上分割,再利用分割的结果对参数进行进一步的估计,然后再分割,如此直到满足收敛条件。然而此类方法只能利用单一的图像信息,不能综合利用多种图像信息。

    第二章马尔科夫随机场(MRF、理论及其应用

    马尔科夫随机场简称,是英文Morkov Random Fields的缩写。它包含了两层意思:一个是马尔科夫(Morkov)性质;一个是随机场性质。它是基于统计学的分割方法在医学图像分割的应用中,最为常用的一种方法。图像具有高度的空间信息相关性,而马尔科夫随机场(肿)恰好具有有效描述空间信息相关性的特点,加之其具有完善的数学理论和性质,所以广泛的被应用于图像的处理中,如:图像的恢复、纹理的提取、模板的匹配和图像的分割等。娜于图像的分割,对噪声有很好的抑制作用;同时是基于模型的方法,所以容易与其它方法结合是它的优点。在本文中主要用于脑部—图像的预处理及前期的分割。下面介绍马尔科夫随机场(MRF )的基本理论及其在本文中的应用。

    2.1马尔科夫随机场CMRF )基本理论

    2.1.1一维马尔科夫(MARKOV)随机过程

    过程(或系统)在Zg时刻(即? = /q)的状态己知,若过程在/Q后面的时刻,即的状态与过程在时刻之前(即

    2.2图像中马尔科夫随机场、MRF )模型的建立

    2.2.1邻域系统与势团(Cliques)

    由本文2.1.2小节中马尔科夫随机场(娜)的定义中,任何满足条件1)非负性的概率都由条件2)中的描述马尔科夫(MARKOV)性的条件概率所唯一确定。条件2)中的条件概率所描述的也称为随机场F (本文中也即数字图像)的局部特性。而条件2)中的条件概率的直接求得是很困难的,由概率论中条件概率的公式可知要求的尸C/i    需要知道即需要知道随机场的联合分布,而马尔科夫随机场)是用条件概率来定义的,不能很好反映的联合分布。也就意味着由马尔科夫随机场(MRF )的局部特性来定义整个场的全局特性是存在困难的。以上问题的解决要归功于Hammersley-Clifford定理,该定理给出了马尔科夫随机场随机场(MRF )与吉布斯随机场(GRF )的等价关系,从而可以用吉布斯(Gibbs)分布来求解中的概率分布问题。

    1.1论文研究的目的和意义………………1

    1.1.1医学图像处理的特点及重要性………………       1

    1.1.2医学图像分割中存在的问题、现状及发展………2

    1.1.3医学图像分割的方法………………

    1.2论文的研究目标及工作………………6

    1.3本文组织结构………………9

    第二章马尔科夫随机场(MRF、理论及其应用………………11

    2.1马尔科夫随机场、MRF )基本理论………………    11

    2.2图像中马尔科夫随机场QMRF )模型的建立………12

    2.3估计准则与优化算法………………16

    2.4本章小结………………19

篇6

关键词:遥感 计算机解译 影像分类 湿地调查

中图分类号:P23 文献标识码:A 文章编号:1672-3791(2013)03(a)-0039-02

天津市地处渤海湾顶,九河下梢,有数万公顷浅海域和沼泽、滩涂,水库和纵横交错的河流,星罗棋布的坑塘洼淀。天津市湿地含有海岸湿地、河流湿地、湖泊湿地等,为物种多样性提供了良好的生态环境。北大港、团泊洼、大黄堡、尔王庄、七里海等湿地按国际评判标准的分类,都属于相当重要的等级。如何保护和合理开发利用湿地,成为保护天津城市生态环境与促进天津经济持续发展重要课题,本人提出了利用遥感技术监测天津湿地的状况,希望为相关部门提供参考作用。

1 湿地的分类

湿地分为人工湿地和天然湿地两大类详细分类如表1所示。本论文研究的湿地范围仅为天津海岸线以上的湿地,并不包括海岸线以下至低潮时水深不超过6 m的水域。

2 湿地地物光谱特征与识别研究

湿地的光谱特征主要是由水本身物质的组成决定的,但是又受到了各种水状态的影响。水体的反射主要在蓝绿光波段,其他波段吸收都很强,特别到了近红外波段吸收就更强。地表较纯洁的自然水体对0.4~2.5μm 波段的电磁波吸收明显高于绝大多数其它地物。

3 监测的数据源

SPOT卫星是法国空间研究中心(CNES)研制的一种地球观测卫星系统。“SPOT”系法文Systeme Probatoire d’Observation dela Tarre的缩写,意即地球观测系统。

每一影像覆盖面积60×60km2。当进行侧向(可达27°)扫描时,每一影像覆盖面积为80×80 km。

SPOT卫星的普段参数:(1)绿谱段(500~590 nm):该谱段位于植被叶绿素光谱反射曲线最大值的波长附近,同时位于水体最小衰减值的长波一边,这样就能探测水的混浊度和10~20 m的水深。(2)红谱段(610~680 nm):它可用来提供作物识别、土壤和岩石表面的情况。(3)近红外谱段(790~890 nm):能够很好的穿透大气层。在该谱段,植被表现的特别明亮,水体表现的非常黑。红和近红外谱段的综合应用对植被和生物的研究是相当有利的。

此次监测实验用的是2011年的SPOT卫星数据,包含红、绿、和近红外3个波段。

4 湿地信息提取

4.1 监督分类法

采用监督分类的方法,利用航天遥感数据通过内业判读,依照湿地分类在影像上提取2011年的湿地信息。监督分类 (supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。常用算法有:判别分析、最大似然分析、特征分析、序贯分析和图形识别等。

这里采用最大似然法:假定每个波段中的每类的统计都呈现正态分布,并将计算出给定象元都被归到概率最大的哪一类里。

4.2 湿地信息提取实验

为了便于有效地分析和研究,通常选择能够反映地物信息的最佳的波段,它们反映了图像中基本的重要的信息,称之为图像的特征。图像特征是图像分析的重要依据。特征提取是对分类精度和可靠性影响最大的因素之一。本论文实验根据湿地的光谱特征用的是4、3、2假彩色波段,将根据影像反映的光谱特性基于监督分类来提取信息。

图1是根据遥感影像分类的获得的湿地分类图像在这里分水体、植被、树木、居民地4类,输出结果图像。蓝色为湿地、红色为居民地、绿色为植被树木。

参考文献

[1] 李建平,张柏,张泠,等.湿地遥感监测研究现状与展望[J].地球科学进展,2007,26.

[2] 张晓龙,李培英,李萍,等.中国滨海湿地研究现状与展望[J].海洋科学进展,2005(1).

[3] 牛明香,赵庚星.南四湖区湿地信息遥感提取技术研究[J].国土与自然资源研究,2004(1).

[4] 赵萍,傅云飞,郑刘根,等.B.Satyanarayana;基于分类回归树分析的遥感影像土地利用/覆被分类研究[J].遥感学报,2005(6).

[5] 周昕薇,宫辉力,赵文吉,等.北京地区湿地资源动态监测与分析[J].地理学报,2006(6).

[6] 张东水,兰樟仁,邱荣祖.“3S”技术在福建省湿地研究中应用进展[J].福建林业科技,2006(2).

[7] 杨柳.基于ETM+影像的扎龙湿地遥感分类研究[D].东北师范大学,2003.

篇7

【关键词】自动录播;图像跟踪;主动红外;空间网格

【中图分类号】G40-057 【文献标识码】A 【论文编号】1009―8097(2009)07―0114―02

由于教育部对精品课程建设及一般高校基于网络的教学资源库建设的共同需求,各高校都在加紧进行精品课程建设的课堂录像工作,《课堂教学自动录播系统》正在大部分高校中兴建。该系统包括诸多高端技术,图像跟踪技术是其主要技术之一。

图像跟踪,是一个较复杂的过程,包含多种技术在内。本文提到的图像跟踪技术,不是指跟踪的全过程,仅指能够触发并指挥摄像机移动的技术,即只是告诉摄像机去哪里,至于去不去、该谁去、怎么去在这里暂不做分析。首先对自动录播系统中图像跟踪方式的现状作一简单分析。

一 录播系统中图像跟踪方式的现状及存在的问题

在自动录播系统中,图像跟踪技术主要包括两个方面,即教师图像跟踪技术与学生图像跟踪技术。

1 教师图像跟踪技术

当前教师图像跟踪技术主要有基于信号的探测方式和基于图像分析和运动检测的人像识别方式两大类。

(1) 基于信号的探测方式

基于信号的探测方式主要有两个:

被动式红外探测技术――将红外发射装置放置在被跟踪对象身上,接收装置安放在摄像机旁,摄像机根据红外接收装置接收的红外信号的方向决定摄像机拍摄方位[1]。该方式的主要优点是技术较成熟、成本较低、施工较简单。主要缺点是抗干扰能力较差;教师侧身或转背红外信号丢失,无法判断拍摄方向;拍摄高度无法自动调整;无法判断被拍摄对象的距离从而设置出中景、远景、近景等效果。

主动式超声波探测技术――将多个具有特殊频率的超声波发射和接收装置安装在黑板的下方,根据超声波接收装置接收的反射波变化来决定摄像机拍摄的方向。该方式的主要优点是技术较成熟,可判断被拍摄对象与黑板的距离。由于超声波发射角度偏大,所以拍摄方位的精度不太高,易出现视频信号来回切或摄像机不断左右摆的误操作,同时它无法判断被拍摄对象的高度从而自动调整摄像机的拍摄高度。

(2) 基于图像分析和运动检测的人像识别方式

该方式是依靠计算机的专门软件,对摄像机捕获的人像进行分析处理,将其设定为跟踪对象,使其始终处于摄像机的拍摄范围内,实现人像的自动跟踪,并可实现镜头的推、拉变化等。由于其设备的大幅减少和施工难度、复杂度的降低,很受用户欢迎。这是当前技术含量较高的跟踪技术,也是课堂教学录播系统跟踪技术的最终解决方案。

由于基于图像分析和运动检测方式的跟踪系统技术含量高,造成设备成本较高,很多该方面的新技术还没有真正应用于一般产品中,使得现阶段该技术在使用中频繁出现跟丢和乱跟的现象,对多个目标的识别分析难度就更大,所以还没有广泛的应用于课堂教学的录播系统中。

2学生图像跟踪技术

目前,对学生图像的跟踪绝大多数厂商都选取了较为简单的无线按钮、有线或无线话筒等开关方式。每个按钮与摄像机的一个预置位对应,按下某个按钮,摄像机自动对准一个已预设好的方向,以此“定位”进行拍摄[2],关掉按钮,摄像机返回教师摄像机拍摄方式;话筒跟踪方式是打开某个话筒开关,话筒发射红外光,学生摄像机被触发,摄像机采用被动式红外探测技术跟踪进行拍摄。关闭话筒,摄像机返回教师摄像机拍摄方式。

上述技术除无线话筒本身存在的缺陷:学生手持话筒影响课堂录像真实感,电池更换不便等外,最大的缺陷是上课时学生好奇不断乱按按钮或话筒打开忘了关,噪声和图像会不断干扰正常的课堂录像。在以往的课堂录像中多数都需进行课后补录,并重新编辑,给课堂教学录播带来极大不便。

二 一个较好的解决方案

以上提到的图像跟踪技术或多或少存在缺陷,基于图像分析和运动检测方式的人像跟踪技术,虽然是最终解决图像跟踪的技术方案,但目前应用还存在一定的难度。经共同研究和实践我们认为采用“主动红外+空间网格”技术是当前较好的解决方案之一。

图1中矩形方块为红外发射头,横向的水平与交叉的虚线(较粗),为安装在教室后方吊顶上“教师红外发射头”发射的红外光覆盖范围,主要负责教师的图像跟踪,由教师任一动作触发,摄像机的拍摄方向及景别由教师所处的具置确定;纵向的垂直与交叉的虚线(较细),为水平安装在教室左右高度为1.4米处的“学生红外发射头”发射的红外光覆盖范围,主要负责起立回答问题的学生图像跟踪,当学生起立回答问题时,由于学生高度的变化触发红外探测信号,使录播计算机的录像内容自动切换到学生摄像机,摄像机的拍摄方向及景别由起立的学生所处的具置确定,学生回答完问题坐下后,触发录播计算机恢复到教师摄像机拍摄方式。两个覆盖区也可联合使用。

1 “主动红外”

所谓“主动红外”是指安装在录播教室的左、右及后方的多个红外发射装置,按一定角度主动发射红外波长的光波,由固定在墙上的长条型红外光接收装置接收该光波信号。如图2,由于红外发射装置安装的高度和位置不同,在教室内可形成一个红外光的三维空间。教师或学生在该空间出现和移动,都会使红外接收装置接收的信号发生变化,由此启动录播系统和改变摄像机拍摄方向。

2 “空间网格”

所谓“空间网格”,简单的讲就是在系统中将教室变成一个由若干个矩形网格组成的三维空间(如图1)。安装在墙上的红外接收条装置(粗实线)是由多个红外接收器组成,每隔10厘米左右一个,根据教学现场的实际,利用系统软件可对教室讲台和学生座位区进行网格划分,一般是边长为一米左右的矩形。根据人像投影等技术,系统可对其中的目标(教师和学生)进行准确的空间网格定位,包括上下、左右及前后。上下、左右决定摄像机云台的转动方向,前后则可以支持摄像机镜头的推、拉。这样空间网格划分,在录播时就可设计多个远景、近景等平滑变焦的策略,增加了画面的景别变化,提升了录制效果。

空间网格技术是将整个教室空间三维网格化,无论是老师还是学生,系统都可以准确的感知目标的空间位置,实现跟踪“无盲区”。教师不再限制在讲台上,学生不再需要按话筒开关或按钮,无论老师走到教室的哪个位置,无论学生在哪个位置起立回答问题,只要空间网格中某个红外接收信号有所改变,系统都可以准确的感知,配合合理的策略,可以轻松解决“互动”。

空间网格技术通过提前对不同网格的属性定义,系统不仅可以准确的感知到目标的空间位置,还可以通过网格的属性对目标的动作做出分析和判断。系统在这样的分析判断的基础上导入拍摄思想,指导摄像机拍摄,就可形成自动录播的智能策略。

“主动红外+空间网格”技术是一项较新的专利技术,较好的解决了当前课堂教学自动录播系统中教师和学生的图像跟踪问题。当然,它也存在设备成本较高,安装、调试较复杂等不足,整体美观和稳定性也有待进一步改进。一个好的技术还必须与好的策略相配合,教师讲课的类型很多,各有其特点,跟踪技术怎样满足各类教师教学的拍摄需求,设计出合理的跟踪策略还有大量的工作值得分析研究。

参考文献

篇8

【关键词】小波变换;边缘检测;模极大值

1.基于视频的车辆检测方法

车辆检测是交通图像监控系统的关键,而图像最基本的特征是边缘。所谓边缘是指其周围像素灰度有阶跃变化或屋顶状变化的那些像素的集合。边缘也可以定义为图像局部特性的不连续性。例如,灰度级的突变,纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始。边缘信息对图像分析和人的视觉都是十分重要的。它是图像分割所依据的最重要的特征,也是纹理特征的重要信息源和形状特征的基础,而图像的纹理形状特征的提取又常常要依赖于图像分割。图像的边缘提取也是图像匹配的基础;因为它是位置的标志,对灰度的变化不敏感,它可作为图像匹配的特征点。

运动边缘的检测可通过计算图像在空间和时间上的差分获取。空间上的差分可用各种已有的边缘检测算法得到,这方面的算法研究已经很成熟, 可以应用现有的算法, 比如Sobel 、Roberts、Prewitt、Canny、拉普拉斯算子等,这些算子在算法复杂度以及效果上有很大的差别,一般的边缘检测方法是对原始车辆图像的每个像素考察它的某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律检测边缘,例如基于微分的边缘检测算子,一阶微分算子有Roberts算子、Sobel算子、Prewitt算子、Canny算子等,二阶微分算子有拉普拉斯算子、Logo算子等。微分算子的一个明显缺点是对噪声较为敏感。由于原始图像往往含有各种噪声,所以用这类算子进行运动车辆边缘检测时常常会有困难,于是只能人为地根据实际情况选用合适的算子。

2.基于小波变换的边缘检测理论

从小波理论入手,构造适当的小波,从多尺度的角度,通过模极大值的方法提取其边缘这种方法可以取得较好的效果,但对选择小波有较为严格的要求。图像的二维小波变换可以分别在图像的行和列的方向上做一维小波变换来得到,在图像的二维小波变换中,为了便于计算,常用的是正交(或双正交),且具紧支撑和至少一阶消失矩的二进小波变换。

首先考虑连续小波变换,假设光滑函数 满足:

3.基于小波变换的边缘检测算法

下面在二进小波变换的基础上定义小波变换在每个尺度上的梯度方向和模:

由于小波变换的结果,通常使图像的能量集中在边缘附近,且在图像灰度值的突变点取得局部极大值,其小波模的极大值反映了边缘点的奇异性,所以通过小波变换可以检测出图像的边缘点。在不同尺度下作小波变换其实质就是用不同频率的带通滤波器对信号作滤波,因此把主要反映噪声频率的那些尺度的小波变换去掉,再把剩余各尺度的小波变换结合起来作反变换,就能得到较好地抑制了噪声的信号。对于图像的边缘检测,求模的局部极大值实质上就是求梯度向量模极大。求出该小波变换的模的局部极大值点,就可以找出图像的边缘点。

4.改进的小波变换模局部极大值点算法

篇9

论文摘要 目的:探讨糖尿病足中医辨证分型与血管细胞核增殖相关抗原的表达差异。方法:对32例截肢的糖尿病足患者按中医辨证分为气血两虚瘀阻证、脉络瘀热证、脉络热毒证和气阴两虚瘀阻证,分别对其截肢肢体的胫后动脉应用免疫组化法对细胞核增殖相关抗原(Ki67)的表达进行观察、分析。结果:Ki67的阳性表达与糖尿病足动脉硬化闭塞程度呈负相关,与血管炎症病变程度呈正相关。结论:炎症在糖尿症的大血管病变的过程中起到了重要的作用。

糠尿病足是糖尿病的严重并发症,据统计1996年全球糖尿病患者1.2亿,预计到2025年,将达到2.5亿以上,而大约15%的糖尿病患者将在其生活的某一时间发生足溃疡或坏疽[1]。目前对于糖尿病足病因及发病机制虽然还不是完全清楚,但大家公认糖尿病合并大血管病变导致动脉粥样硬化是糖尿病足发病的最主要因素。现将2004年10月~2005年5月间我们收治的32例糖尿病足患者的截肢动脉标本的血管细胞核增殖相关抗原(Ki67)与其中医辨证分型的相关性研究情况报告如下。

1 临床资料

1.1 一般资料:32例均为天津医科大学代谢病医院和天津中医学院第一附属医院2004年10月~2005年5月间的住院患者,其中男性24例,女性8例;年龄50~86岁,平均年龄69.2岁;糖尿病病程最长30年,最短6年,平均18±2.4年。

1.2 诊断标准:糖尿病足的诊断标准采用2000年中华医学会糖尿病学会第二届糖尿病足会议所制订的“糖尿病足(肢端坏疽)检查方法及诊断标准”。

1.3 截肢标准:参照国际糖尿病足工作组编写的《糖尿病足国际共识》中关于“大截肢的定义、标准和指标”[2]执行。

1.4 中医辨证分型标准:参照《中医外科学(第七版)》及《中药新药临床研究指导原则·脱疽》之中医辨证分型方案分为气阴两虚瘀阻证、脉络瘀热证、气血两虚瘀阻证、脉络热毒证四型。

2 观察方法

2.1 标本取材:坏疽截肢标本32例,其中按中医辨证分型气血两虚瘀阻组10例,脉络瘀热组10例,气阴两虚瘀阻组4例,脉络热毒组8例,取各例标本下肢胫后动脉。标本经过10%福尔马林固定,常规石蜡包埋,备用。

2.2 设备、试剂:美国PENGUIN-600CL自动图像分析系统,细胞核增殖相关抗原(Ki67)抗体PV9000试剂盒DAB购于北京中山生物技术有限公司。

2.3 免疫组织化学法:标本常规石蜡包埋,4μm连续切片,采用PV法进行免疫组化染色,染色过程严格按试剂盒染色程序进行,选取已知的阳性切片作阳性对照,PBS代替一抗作为阴性对照。观察细胞核增殖相关抗原(Ki67),阳性物质呈棕黄色细颗粒状于细胞核表达,采用美国PENGUIN-600CL图像分析系统进行图像分析,选取病变处每500个细胞Ki67的阳性表达率作为其阳性表达指数。统计学处理应用SPSS10.0软件包进行方差分析。

3 结果

3.1 中医各证型所占比例以及年龄、性别分布:各证型比例,气血两虚瘀阻组10例(31.25%),脉络瘀热组10

例(31.25%),气阴两虚瘀阻组4例(12.5%),脉络热毒组8例(25.0%)。年龄、性别分布情况,见表1。

表1 32例患者年龄、性别分布 n(%)

性别n50~60岁61~70岁71~80岁80岁以上男24( 75.0)4(12.5) 8(25.0)11(34.4)1(3.1)女 8( 25.0)1( 3.1) 3( 9.3) 4(12.5)0 总计32(100.0)5(15.6)11(34.4)15(46.9)1(3.1)3.2 免疫组织化学法观察各证型Ki67表达差异:具体情况见表2。

表2 各证型Ki67阳性表达指数比较 (%)

证型Ki67阳性表达指数脉络热毒 4.87±1.01*气阴两虚瘀阻1.86±0.47脉络瘀热1.49±0.13气血两虚瘀阻0.30±0.18注:与气血两虚瘀阻型比较,*P

气血两虚瘀阻证、脉络热毒证、脉络瘀热证、气阴两虚瘀阻证中均可见部分细胞Ki67呈阳性表达,在脉络热毒证中表达指数最高,气血两虚瘀阻证中表达指数最低,二者比较具有显著性差异(P

4 讨论

Ki67抗原为细胞核内与细胞分裂增殖相关的蛋白抗原,分子量为345kd和395kd,其编码基因位于第10号染色体上。Ki67的表达出现于G1中期到晚期,S期和G2期逐渐增加,有丝分裂期达高峰,分裂后迅速降解或丢失抗原决定簇,到G0期则不表达,半衰期为lh或更短[3]。有人认为它可能是具有蛋白结合特性的重要结构,在有丝分裂中起着维持DNA规则结构的重要作用[4],是一个反映细胞增殖的敏感指标。

在糖尿病足的不同辨证分型中气血两虚瘀阻证、脉络热毒证、脉络瘀热证、气阴两虚瘀阻证中Ki67表达均呈阳性,在脉络热毒证中表达最强、气血两虚瘀阻证中表达最弱,二者相比具有显著性差异(P<0.05)。根据Ki67阳性指数可以判断细胞增殖的活性,指明细胞增殖与糖尿病足动脉病变的关系。在糖尿病足的不同辨证分型中动脉的硬化闭塞程度由轻到重依次是脉络热毒证、气阴两虚瘀阻证、脉络瘀热证、气血两虚瘀阻证。Ki67的阳性表达与糖尿病足动脉硬化闭塞程度呈负相关。而在通过对32例糖尿病足截肢的动脉进行病理学观察的过程中发现糖尿病足血管病变主要体现在中动脉的病理学变化,其中脉络热毒、气阴两虚瘀阻两证型以动脉周围及全层的炎症性改变为主;脉络瘀热、气血两虚瘀阻证以中膜钙化、平滑肌细胞萎缩、变性、坏死及胶原纤维增多及内膜粥样斑块形成为主,炎症表现不明显;而Ki67的阳性指数与血管炎症病变程度呈正相关。这说明炎症在糖尿病的大血管病变的过程中起了重要的作用,特别是在脉络热毒证、气阴两虚瘀阻证两型,这对临床具有重要的指导意义。

5 参考文献

1 Boulton A J. The diabetic foot:a global view. Diabetel Metab Res Rev,2000,16(1):2.

2 许樟荣,敬华.糖尿病足国际共识.中华糖尿病学会第二届足病第一次足病研讨会.2002,435.

篇10

关键词:图像拼接 图像配准 图像融合 虚拟现实

中图分类号:TP3 文献标识码:A 文章编号:1672-3791(2015)01(a)-0000-00

1 引言

图像拼接是将一组已经在空间上配准的、相互之间存在重叠部分的图像序列,经过图像变换、重采样和图像融合后形成一幅包含每个图像序列的宽视角或360度视角的全景图像的技术[1]。目前,图像拼接技术的应用方向主要包括以下四个方面:

1.1 虚拟现实

将图像拼接技术应用于虚拟现实系统中,实现动态或者交互式虚拟的3D环境,可以利用多个图像源实时合成视频,能呈现远程会诊和手术参与的三维场景,音乐会或体育赛事,或参加远程教育和虚拟教室等。

1.2 提高图像的分辨率

利用具有重叠区域的多幅图像或者视频图像序列可以生成超分辨率图像,因为图像的重叠区域包含实际场景的很多冗余信息。

1.3 增大光学系统的视场角

为了有效地提高视场光学系统,多传感器可用于捕捉不同角度的图像,然后使用领域的图像拼接技术的实时拼接这些图像,形成了较大的实地查看图像。

通过获取场景和目标更多的信息生成大场景图像或三维立体图像,以利于图像的检索、编辑、分析和理解。朱云芳[2]提出通过构造视频的全景图,利用手工与计算机相结合的方法对全景图进行编辑,实现对视频内容的检索和编辑。

2 图像拼接的关键技术

图像拼接的一般流程包括图像预处理、图像配准和图像融合三步:

2.1图像预处理

由于硬件设备自身缺陷,有很多不同的噪声使得捕获的图像达不到图像质量的要求,因此需要对原始图像进行去噪、修正等图像预处理工作。图像预处理阶段的精度对最后拼接图像的质量有着很大的影响。图像拼接预处理的主要目的就是保证图像配准的精度,简化图像配准的难度。常见的预处理方法包括以下几种[3]:

2.1.1 图像平滑与边缘锐化处理

由于图像的拍摄视角不同、折叠变换不同以及存在随机噪声,使得具有重叠区域的图像序列在重叠部分的细节上并不完全相同。因此,只能选取轮廓或其它主要边缘来做特征匹配的垂直边缘。

2.1.2 相位相关算法

如果图像存在平移,那么可以将平移转化到频域,并且计算相位差。在平移运动坐标上的脉冲就是这个相位差的傅立叶反变换,在对齐两幅图像的位移位置后,两幅图像的对齐点可以通过搜索最大值的位置得到。

2.1.3 灰度图投影算法

如果垂直方向上的平移可以忽略,而且水平方向上平移较小的时候,可以使用灰度图投影算法对相邻的两幅图像进行粗略定位。以便在进行精确配准时,减小误,差缩小搜索范围。首先,一个彩色图像转换为灰度,然后将其转换为二进制图像的灰度图像,所有像素的灰度值,然后到垂直方向,预计到积累,通过比较相邻的曲线大致可以匹配的位置图像的投影。

2.1.4视频序列子集的筛选

进行基于视频的图像拼接时,需要首先对视频序列图像进行筛选。由于视频序列图像有很充裕的重叠信息可以利用,因为它们相互之间的位移量很小。因此,为了既可以降低配准误差和拼接图像的不连续性,又能减小计算量,可以只选取它的一个子集,而不使用全部的视频序列图像。

2.1.5 基于模板匹配的算法

基于模板匹配的过程是将一幅图像中位于重叠区域的一块作为模板,在另一幅图像中搜索和模板具有相同或相似值的对应块,这样就可以确定两幅图像的重叠范围。通常情况下,如果模板面积越大,这种算法的精度就越高,但是其计算复杂度也会很高。此外,也可以使用以图像的重叠在另一个为模板与图像的最佳匹配的搜索两个相邻像素的比例为模板,然后一部分,有效地降低计算量。然而,在很多的分割计算所需的比例,将减少准确性。

2.1.6 遗传算法估计碎片图像的拓扑排列

如果原始图像是一些碎片图像,并且相机的运动方式未知或不规则(如医学图像,海底或者太空探测图像),或者不知道它们的拓扑排列顺序时可以使用对原始图像序列的拓扑排列进行估计的方法。

图像拼接的预处理是为下一步的精确配准做准备,许多预处理算法和配准算法是紧密相关的。可以根据选定的图像配准算法来选择相应地的预处理算法,从而提高图像拼接精度和速度。此外,拼接图像变换模型的选定还可以根据原始图像的特性来,这样就可以选择合适的图像拼接预处理算法和图像配准算法。

2.2 图像配准

图像配准的定义是关于同一目标的两幅或者多幅图像在空间位置上的对准。如果对同一目标的两个图像是相同的,即可完成图像配准并不难。图像配准是一个非常复杂的技术过程。由于捕捉到不同时刻,不同视场和不同的成像传感器随着亮度的噪音和各种不同的成像过程的耦合,而是具有某种程度的相似性两个图像[4]。图像配准的过程主要包括以下几个步骤:

2.2.1 选择特征空间

可以根据待配准图像的各种不同特征来实现匹配,主要包括图像本身的亮度,图像的边缘、曲线、角点、直线交点、高曲率点,图像的不变矩、重心等。

2.2.2选择相似性测度

图像配准中最重要的步骤是相似性测度的选择,因为相似性测度的结果决定了两幅图像是否匹配,而且决定了如何确定匹配位置。

2.2.3 选择搜索空间与策略

搜索空间的目的是找到图像配准的最佳位置的集合。在很多情况下,减少测量的数量是很重要的,因为误匹配位置越多,计算量就越大,问题就越严重。在有些情况下,可以利用一些已知信息去掉不可能匹配的搜索子空间,从而达到减少计算量的目的。为了减少计算量,匹配时还需要选择合适的搜索策略。

图像配准算法与图像拼接算法的准确率、拼接精度和拼接速度直接相关,是图像拼接技术的关键部分。目前,学者主要从以上几个方面进行研究,以改进图像配准算法的性能,即减少配准的时间、提高配准的精度。

2.3 图像融合

得到图像序列之间精确的空间变换关系在经过图像配准之后,为了把多幅原始图像拼合成一幅全景图还需要进行图像融合。图像融合的主要过程包括:邻近地区的拼接图像对齐缝合,以消除由全球累积误差和图像失真造成的多个图像重叠区域,绘制了全景拼接图像的过程[5]。

图像拼接预处理是为图像配准做准备的,以提高图像配准的精度和速度,在一些情况下可以省略预处理过程;图像配准是图像拼接的核心和关键技术;图像融合是为了保证拼接图像的质量,消除图像的亮度差异、拼接缝隙和鬼影问题等。

3 图像拼接的研究进展

目前,图像拼接技术已经被广泛应用于军事和民用领域,如虚拟现实、卫星遥感、海底勘探、机器人视觉、无人机监视和搜索、视频监控、医学探查等 [6]。

3.1 实时图像拼接

实时图像拼接系统能够实时进行图像采集、实时完成图像拼接和拼接图像的输出、显示。为了提高系统处理图像数据的速度,实时拼接在低层次的语言在图像拼接算法的核心处理单元的嵌入式图像拼接的形式在运算速度用于满足实时应用的要求算法,甚至是硬件图像系统要求。

实时图像拼接技术的巨大推动力来源于众多的实际应用需求,图像拼接算法,人们深入研究和微电子技术的飞速发展,使得具体应用的发展,图像处理的图像拼接算法的效率和稳健进入高速处理单元,在可能的核嵌入式实时图像马赛克镶嵌图像系统及其应用的热点技术。

3.2 自动图像拼接

虽然人类获取和存储图像数据的能力在不断增强,并且巨大的数据仓库已经形成,但是还很欠缺高效地处理这些数据的能力。例如:由无人机采集的视频仍然需要人类实时监视,并以回放的方式进行分析。因为图像分析人员数量很少,而且这种工作非常的艰难,于是要求计算机能够自动进行图像拼接,并且能够跟踪图像中用户感兴趣的目标,并进行标记和注释。

关于自动图像拼接的研究主要包括两个方面:①自动判断参考图像与待拼接图像是否能够进行拼接。②根据待拼接图像的类型自动选择合适的拼接算法,然后自动进行图像配准和融合,最后采用客观的图像质量评价方法,自动判断拼接后的图像质量是否满足用户的要求。

3.3 彩色图像拼接

彩色图像比灰度图像更能够满足人类视觉感知要求,因为它能够提供更多的图像信息。而且,更有利于图像的彩色图像分析和目标识别与跟踪,彩色图像拼接技术已成为一个重要方面。

3.4 3D立体图像拼接

如果不同观看影像或三维立体的图像拼接大量冗余信息的视频序列的使用,可以使图像浏览,分析和理解更加容易。由于图像拼接技术与很多学科的理论和技术相关联,使得图像拼接技术的研究和发展不是那么迅速。近些年来,国内外学者进行了大量的研究和开发工作,并取得了丰硕的成果,有效地提高图像拼接的质量和鲁棒性。

4 结语

图像拼接技术是虚拟现实和图像绘制技术研究重点,随着图像拼接技术的不断发展,其在工作和生活中的应用将会越来越广泛,将会对经济社会发展产生较大影响。

参考文献

[1] 强赞霞,彭嘉雄,王洪群.基于傅里叶变换的遥感图像配准算法[J].红外与激光工程,2004,33(4):385-387.

[2] 朱云芳.基于图像拼接的视频编辑[D].浙江:浙江大学博士论文,2006.

[3] 张朝伟,周焰,吴思励,等.基于SIFT特征匹配的监控图像自动拼接[J].计算机应用,2008,28(1):191-194.