计算机视觉发展报告范文
时间:2024-01-05 17:42:18
导语:如何才能写好一篇计算机视觉发展报告,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
1、引言
随着经济的迅猛发展,汽车的迅速普及,根据社会对汽车产业的要求,车辆的各方面指标都受到人们越来越多地关注,汽车涂装过程中的瑕疵直接影响汽车的外观质量,因此如何在生产过程中利用计算机视觉检测技术检测出并及时修补汽车涂装过程中产生的瑕疵就成了首要的任务[1]。本文的研究内容是首先了解计算机视觉检测系统的工作原理,汽车涂装瑕疵的种类,然后结合两者的特点,应用计算机视觉检测系统检测汽车涂装瑕疵。该研究的价值在于两方面:①对于汽车生产的自动化和过程自动化,计算机视觉是现实真正意义的自动的基础和一种重要的质量控制的手段;②对于汽车涂装瑕疵的修补可以提高其修补的精度。
2、汽车涂装瑕疵的计算机视觉检测系统
汽车涂装瑕疵检测系统主要包括照明系统、图像采集卡、CCD摄像机、计算机以及软件处理等几个主要部分[2]。综合计算机视觉检测系统的构成和线结构光测量的原理,基于计算机视觉的汽车涂装瑕疵的检测系统大致是这样构成的:将线结构光投射到被测物上,所形成的光斑作为传感信号,用CCD摄像机采集光斑图像,采集到的图像信号被传输到计算机,根据图像处理和计算机视觉检测系统的处理产生处理结果,返回到涂装生产线,对车身的涂装进行修正,从而提高产品质量。汽车涂装瑕疵的视觉检测系统如图1所示[3]。
3、计算机视觉检测
计算机视觉是计算机对图像进行自动处理并报告“图像中有什么”的过程,也就是说它识别图像中的内容。图像中的内容往往是某些机器零件,而处理的目标不仅要能对机器零件定位,还要能对其进行检验。计算机视觉系统基本原理:机器视觉系统通常采用CCD相机摄取图像,将其转化为数字信号,再采用先进的计算机硬件与软件技术对图像数字信号进行处理,从而得到所需要的各种目标图像特征值,并在此基础上实现模式识别、坐标计算、灰度分布图等多种功能。计算机视觉系统能够根据其检测结果快速地显示图像、输出数据、指令,执行机构可以配合其完成指令的实施。计算机视觉系统主要由图像获取、图像分析和处理、输出显示或控制三个功能模块组成[4]。视觉检测按其所处理的数据类型可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测。另外,还有X射线检测、超声波检测和红外线检测。一个完整视觉检测系统包括:图像采集、图像分割、零件识别、模型匹配和决策判断。Newman[5]等描述了利用深度图像进行零件检测的AVI系统,具有一定的代表性。一个典型的AVI系统如图2所示。
4、汽车涂装瑕疵的检测算法
由于汽车涂膜中一些缺陷的边界比较模糊,例如:气泡、爆裂气泡孔、气泡针孔、抽缩等等。边缘处灰度变化很小,直接用传统的微分边缘检测算法无法有效的检测出来。所以对缺陷模糊边缘的检测成为了算法的关键[6]。本文介绍了基于线结构光的边缘检测方法。汽车涂装表面被光源投射器发出的线结构光照射,反射出的图像被CCD摄像机所接收传输到计算机视觉检测系统中。若涂装表面没有瑕疵,则产生图3的图像。若涂装表面有瑕疵,则产生图4的图像[7]。
篇2
关键词:数据融合传感器无损检测精确林业应用
多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域[1,2]。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。
1数据融合
1.1概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等[3]。
1.2基本内容
信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测[4]。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等[5,6]。
1.3处理模型
美国数据融合工作小组提出的数据融合处理模型[7],当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
2多传感器在林业中的应用
2.1在森林防火中的应用
在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度[8]。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2森林蓄积特征的估计
HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计[9]。
KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3用非垂直航空摄像数据融合GIS信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。
TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正[10]。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
3数据融合在林业中的应用展望
3.1在木材检测中的应用
3.1.1木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法[11,12]。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等[13]。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。
在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析[14]。
X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷[15,16]。
基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。
目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。
南京林业大学提出了“精确林业工程系统”[17]。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。
[参考文献]
[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.
[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.
[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.
[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.
[5]王耀南,李树涛.多传感器信息融合及其应用综述[J].控制与决策,2001,16(5):518-52.
[6]许军,罗飞路,张耀辉.多传感器信息融合技术在无损检测中的应用研究[J].无损检测,2000,22(8):342-344.
[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.
[8]余启刚.数据融合技术在“3S”森林防火中的应用[J].森林工程,2003,19(4):5-6.
[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.
[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.
[11]杨春梅,胡万义,白帆,等.木材缺陷检测理论及方法的发展[J].林业机械与木工设备,2004,32(3):8-10.
[12]胡英成,顾继友,王逢瑚.木材及人造板物理力学性能无损检测技术研究的发展与展望[J].世界林业研究,2002,15(4):39-46.
[13]肖忠平,卢晓宁,陆继圣.木质材料X射线与超声检测技术研究的发展与展望[J].木材加工机械,2004,15(1):25-27.
[14]王金满,周秀荣.刨花板施胶效果计算机视觉分析方法[J].东北林业大学学报,1994,22(3):25-26.
[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.
篇3
论文关键词:数据融合 传感器 无损检测 精确林业 应用
论文摘要:介绍了数据融合技术的基本概念和内容,分析了该技术在森林防火、森林蓄积特征的估计和更新、森林资源调查等方面的应用,提出该技术可应用于木材无损检测及精确林业。融合机器视觉、X射线等单一传感器技术检测木材及木制品,可以更准确地实时检测出木材的各种缺陷;集成GPS、GIS、RS及各种实时传感器信息,利用智能决策支持系统以及可变量技术,能够实现基于自然界生物及其赖以生存的环境资源的时空变异性的客观现实,建立基于信息流融合的精确林业系统。
多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域[1,2]。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。
1 数据融合
1.1 概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等[3]。
1.2 基本内容
信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测[4]。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等[5,6]。
1.3 处理模型
美国数据融合工作小组提出的数据融合处理模型[7],当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
2 多传感器在林业中的应用
2.1 在森林防火中的应用
在用MODIS(Moderate Resolution Imaging Spectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1 000 m的热辐射通道的数据外加入空间分辨率为250 m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度[8]。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2 森林蓄积特征的估计
Hampus Holmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-II VHFSAR传感器的雷达数据进行了融合,采用KNN(k nearest neighbor )方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计[9]。
KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3 用非垂直航空摄像数据融合GIS信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。
Trevor J Davis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正[10]。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
3 数据融合在林业中的应用展望
3.1 在木材检测中的应用
3.1.1 木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2 单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法[11,12]。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等[13]。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。
在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析[14]。
X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3 数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷[15,16]。
基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2 在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。
目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。
南京林业大学提出了“精确林业工程系统”[17]。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。
[参考文献]
[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.
[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.
[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.
[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.
[5]王耀南,李树涛.多传感器信息融合及其应用综述[J].控制与决策,2001,16(5):518-52.
[6]许 军,罗飞路,张耀辉.多传感器信息融合技术在无损检测中的应用研究[J].无损检测,2000,22(8):342-344.
[7] White F E. Data fusion lexicon:Data fusion subpanel of the joint directors of laboratories technical panel for C3[R].San Diego,1991.
[8]余启刚.数据融合技术在“3S”森林防火中的应用[J].森林工程,2003,19(4):5-6.
[9] Hampus Holmstrom, Johan E S Fransson. Combining remotely sensed optical and radar data in KNN-estimation of forest[J]. Forest Science, 2003, 49(3): 409-418.
[10] Trevor J Davis, Brian Klinkenberg, Peter Keller C. Updating inventory: Using oblique videogrammetry & data fusion[J].Journalof Forestry, 2002, 100(2):45-50.
[11]杨春梅,胡万义,白 帆,等.木材缺陷检测理论及方法的发展[J].林业机械与木工设备,2004,32(3):8-10.
[12]胡英成,顾继友,王逢瑚.木材及人造板物理力学性能无损检测技术研究的发展与展望[J].世界林业研究,2002,15(4):39-46.
[13]肖忠平,卢晓宁,陆继圣.木质材料X射线与超声检测技术研究的发展与展望[J].木材加工机械,2004,15(1):25-27.
[14]王金满,周秀荣.刨花板施胶效果计算机视觉分析方法[J].东北林业大学学报,1994,22(3):25-26.
[15] Klinkhachorn P. Prototyping an automated lumber processing system[J]. Forest Products Journal, 1993 (2): 11-18.
篇4
1研究方向
到2007年底,每秒钟能进行1000万亿次浮点运算的超级计算机将要问世,这是计算机科学家的最新杰作!但是,即便是如此强大的超级计算机,目前还无法实现人脑能够轻而易举完成的许多感知信息处理任务。例如,在混杂的车站里辨认熟人面孔、在热闹的晚宴里同朋友自由交谈、在国际会议上娴熟地用外语与各国同行讨论研究成果,等。因此,为了建立计算机与人更加友好、自然的用户界面,我们必须创建新的智能计算理论与方法。我们认为将计算机科学与脑科学相结合,研究仿脑计算理论与模型将是通向这一终极目标的一条理想之路。“上海交通大学-微软智能计算及智能系统实验室”的主要研究目标就是为了突破传统数字计算机在智能信息处理的瓶颈,联合实验室汇集了上海交通大学计算机科学与工程系、自动化系和电子工程系的相关领域的10余名教授、副教授,拟在下列方向开展合作研究:
仿脑计算理论与模型
超并列机器学习理论与算法
基于人类视觉信息处理的计算机视觉理论与方法
脑-计算机接口技术
机器人技术
多媒体信息获取技术
无缝媒体通讯技术
这里需要强调的是,微软亚洲研究院汤晓鸥博士为联合实验室研究方向的确定和研究课题的筛选作出了重要贡献。汤晓鸥博士在联合实验室成立之初,就来上海交通大学为我们作了一场精彩的学术报告,不仅介绍了微软亚洲研究院在计算机视觉领域最新的研究成果,而且为我们的学生详细介绍了如何脚踏实地、一步一步地开展高水平的科学研究,使同学们受益匪浅。自联合实验室成立以来,微软亚洲研究院的多名国际知名专家来上海交通大学讲学,他们是“深蓝项目”之父许峰雄博士、系统结构专家张峥博士和自然语言处理专家周明博士。
2006年度微软亚洲研究院资助了联合实验室在机器学习、机器人和多媒体通信三个方向的研究课题,具体内容如表1所示。
2研究成果
联合实验室成立一年多来,取得了多项创新性的研究成果,已在国内外学术刊物和会议上30余篇。由于篇幅限制,下面仅对部分成果作简要介绍。
(1) 超并列机器学习理论与算法
上海交通大学计算机科学与工程系吕宝粮教授在仿脑计算、机器学习和脑-计算机接口等方向与微软亚洲研究院系统结构组、文本组和图像组有着密切的合作与交流,他们共同致力于研究大规模分布式超并列机器学习理论与算法,并将其研究成果应用于人脸识别、自然语言处理、生物信息学和脑-计算机接口等领域。在此期间共同进行博士和硕士研究生以及本科生的培养,联合发表学术论文。与微软研究院的文本组、图像组和机器学习组定期交流和选派学生实习。通过双方真诚的合作,智能信息处理方向已有2名博士生和5名硕士顺利通过答辩。目前上海交通大学有1名博士后、3名博士生、5名硕士生和4名ACM班的本科三年级学生投入到合作研究课题中,来自微软亚洲研究院的1名优秀青年员工在机器学习方向作为博士生进行联合培养。
(2) 无缝媒体通讯技术
上海交通大学电子工程系熊红凯副教授在无缝媒体通信方向,与微软亚洲研究院网络多媒体IM组已经进行了多年的合作研究,他们共同致力于无缝媒体通信的良好远景,主要研究视频信号多元化智能处理与传输,工作包括可伸缩视频编码、分布式视频编码、网络编码,等。微软研究院IM组吴枫等研究人员与他们在此期间共同进行博士和硕士研究生的培养,支持他们参与国际技术标准MPEG-21和JVT的制订,联合提交技术提案和发表学术论文。
通过合作研究,媒体通信方向已有2名博士生、3名硕士生顺利毕业;目前上海交通大学在此方向有2名博士生、4名硕士生投入到合作课题中;微软亚洲研究院有2名优秀员工在媒体通信方向作为博士生进行联合培养,实现一体化技术合作。合作研究的积累,使得该团队获得了2005年和2006年度国家自然科学基金面上和重点项目的相关课题资助。另外,2007年获得了国家“十一五”863计划专题。
(3) 移动机器人的视觉定位技术
服务机器人是一个新兴的快速发展的研究领域。服务机器人的首要问题是其必须在执行任务中应付复杂的环境。复杂环境中的目标定位技术成为其中一项挑战性课题。
项目组提出了一种新的单目摄像头实时定位算法,可以实时计算摄像头的三维运动轨迹。该算法基于视觉路标,集成了目标识别、特征跟踪和3D定位算法。其核心思想是:识别场景中的视觉路标,并主动跟踪匹配特征点,计算摄像机的3D运动轨迹。为了提高算法实时性,相对耗时的目标识别模块只在初始化时寻找和识别路标,接着跟踪算子跟踪匹配特征点,转入实时跟踪过程,同时输出3D轨迹。
实验表明,结合目标识别、跟踪和3D定位,本文算法可以主动发现和实时跟踪感兴趣目标,对于普通PC和USB摄像头,能以30帧/s跟踪运动目标。3D定位也有较好的精度,准确跟踪时,定位误差一般在5cm之内。此外由于每帧都单独计算位姿,因此不存在累积误差,目标丢失后也能快速被识别和跟踪。
3人才培养
联合实验室成立伊始,双方就将人才培养作为合作的重中之重,经过双方的共同努力和友好合作,在一年多的时间里,已经实施了下列三个具有特色人才培养项目。
(1) 博士生联合培养项目
上海交通大学与微软亚洲研究院的博士生联合培养项目是实验室在人才培养方面的合作亮点。该项目主要包含两方面的内容,一方面上海交通大学聘用微软亚洲研究院的资深研究员为上海交通大学博士生导师并与上海交通大学的教授一起联合指导博士研究生;另一方面微软亚洲研究院选派具有硕士学位的优秀员工到上海交通大学攻读博士学位。目前有六位微软研究员被聘为上海交通大学客座教授,其中沈向洋博士、洪小文博士、张峥博士、宋歌平博士和汤晓鸥博士为博士生导师。2006年4月微软亚洲研究院选送了六位优秀青年员工来上海交通大学攻读博士学位,这些博士生首先在上海交通大学完成学位课程的学习,之后他们将在上海交通大学导师的指导下在微软亚洲研究院进行博士学位论文的研究工作。这六名博士生的导师分别是上海交通大学计算机科学与工程系的张申生教授、俞勇教授和吕宝粮教授;电子工程系的张文军教授和孙军教授。博士生联合培养项目的实施,既是微软亚洲研究院对优秀青年员工继续发展的支持和鼓励,同时通过双方深入的交流,将微软亚洲研究院的研究理念和企业需求带到上海交通大学,为双方的共同发展作出了贡献。
(2) 卡内基・梅隆大学联合人才培养项目
微软亚洲研究院联手上海交通大学和美国卡内基・梅隆大学联合培养高素质人才。根据“卡内基・梅隆大学-上海交通大学-微软亚洲研究院”三方达成的协议,上海交通大学、卡内基・梅隆大学每年将互换5名优秀本科学生进行为期一学期的学习,在两校学习之后,这些学生将到微软亚洲研究院进行为期三个月的实习,其间他们将参与实际项目的研发工作。这一“产学研”跨国合作的模式,将为中国培养高素质的“IT国际人”提供一种有效的便捷渠道。到目前为止,上海交通大学电子信息与电气工程学院经过严格挑选,已选派了十多位优秀的本科生去卡内基・梅隆大学电子与计算机工程系学习,这些学生分别来自计算机科学与工程系、自动化系和电子工程系。卡内基・梅隆大学也已选派了多名交换生来上海交通大学和微软亚洲研究院学习和实习。经过三方的联合培养,不仅拓宽了学生的视野,而且进一步提升了学生的综合素质。在参加该项目的学生中,有的同学已在本领域高水平的国际杂志和会议上发表了多篇学术论文。此外随着三方合作的进一步深入和上海交通大学国际化办学的进一步深化,将会使上海交通大学更多的本科生同学有机会亲密接触世界知名学府和研究院。
篇5
【关键词】视觉测量 数字图像处理 开放性实验
【中图分类号】G642 【文献标识码】A 【文章编号】1006-9682(2012)10-0001-03
一、引 言
数字图像处理作为一门学科大约形成于20世纪60年代初期,并首次在航空航天领域取得了成功应用。数字图像处理技术的发展除了与计算机技术、信息技术的快速发展密切相关以外,还得益于其在航空航天、工业、生物医学、军事、通信工程、商务、环境、林业等诸多领域的广泛应用,正是这些应用需求,促进了数字图像处理技术的深入研究和快速发展。“数字图像处理”课程是随着计算机和信息技术发展应运而生的一门新兴课程,已成为信息类专业本科生的重要专业课。通过该课程的学习,要求学生掌握数字图像处理的基本概念和原理,能够对图像进行各种处理,如图像增强、图像运算、图像编码、边缘检测等,为图像通信、模式识别、计算机视觉以及其他交叉学科等工程领域的应用奠定基础。
“数字图像处理”课程的理论教学很抽象,仅仅通过理论教学学生很难掌握数字图像处理的基本原理。如果把数字图像处理的广泛应用引入课堂理论教学,将具体知识点与其在实践中的使用相结合,同时为学生提供边学边实践的机会,不仅可以提高学生的学习兴趣,加深对抽象理论知识的理解,增强其动手实践的能力,还可以拓展学生的视野,与目前学科前沿技术相衔接。
二、视觉测量技术
在现代三维测量新技术中,视觉测量是由计算机视觉、图像处理、模式识别等多学科交叉结合而形成的科学。图1所示,视觉测量是一种非接触性测量手段,以数字图像作为信息载体,对被测目标进行成像,通过提取多个像面的二维像点信息,标定相机内、外参数,并重建、优化被测目标的三维信息,实现测量。视觉测量基于严谨的理论和现代的硬软件设施,可以达到相当高的精度和可靠性,便于对大型工件、设备的尺寸、位置、三维轮廓等进行高精度测量,而且移动方便,可快速灵活地构建适于不同测量对象的系统,进行现场测量。目前,视觉测量技术已经广泛应用于建筑工程、航空航天、汽车制造、生物医学、考古等各个领域。[1~5]因此,视觉测量技术正在深入工业生产和社会生活的各个领域,研究和应用新的基于光学、数字图像和视觉信息融合的三维测量方法,既具有重要的理论意义,又具有重大的实用价值,应用前景非常广阔。
根据视觉测量的基本原理,利用数字图像处理技术获取的二维信息是视觉测量中相机标定、三维重建等环节的基础,对于系统的测量精度、稳定性等方面具有决定性的影响,是视觉测量领域的关键技术。在长期的数字图像处理课程教学以及视觉测量研究工作中发现,可以将视觉测量中关于数字图像处理的应用内容引入课堂教学中,与具体理论知识相结合,加深学生对于课程理论的理解,使其接触到科学研究的前沿内容。此外,通过设置开放性实验等环节,引导有兴趣和能力的学生进行实践能力的培养,使学到的知识“活”起来。
三、视觉测量与数字图像处理课程的融合
为了改善数字图像处理课程的教学效果,提高教学效率,将视觉测量技术与数字图像处理课程相融合,本文主要在教学方法和教学手段改革、视觉测量需求与理论知识点结合、实践动手能力提高等方面进行了研究。
1.教学方法和教学手段改革
为了贯彻学生是教育主体的教育思路,使学生学会学习,并充分激发学生的创新能力和素质培养,促进学生个性的发展,同时有利于师生彼此促进共同进步的原则,针对数字图像处理课程的特点,采取了以下措施:
(1)重视数字图像处理课程的基础理论教学。数字图像处理内容丰富,应用灵活广泛,但学生在掌握某些具体应用技术时感到理解困难。因此,在实际教学上,首先需要注重相关的基础理论教学。[6]例如,数字图像的本质是数字信号,所以在课程前期阶段,专门有针对性地复习和讲解了信号分析与处理方面的基本理论,包括数字信号处理的常用方法、离散傅里叶变换和快速傅里叶变换、离散余弦变换等,这些理论在数字图像处理课程中有具体应用。这不仅有利于对数字图像处理内容的掌握,也可以反过来加深对相关理论的理解。另一方面注意授课内容的精选,内容不在于多,而在于少而精,突出重点,使学生在有限学时内有最大的收获。例如,在频域空间进行图像增强时,不能将频域空间的所有方法都对学生讲授,而是突出讲解了关于频域空间与时域空间处理之间的关系,针对频域图像平滑介绍一种低频滤波器,分析其原理和特点。这样不仅节省了教学时间,而且重点突出,同时也引导学生查阅其他相关方法,让他们自己去动脑思考,提高其思维能力。
(2)完善和改革课堂教学方法。在课堂教学过程中,我们始终重视启发式教学,遵循“提出问题”、“启发式思考”、“解决问题”的教学过程,使用“问题教学法”引导学生去思考、分析问题,激发学生学习的积极性,提高教学效果。课堂开始时,根据授课内容,提前向学生抛出相关问题,在讲课过程中则围绕该问题讲解课程内容,最后提出问题的解决方法。例如,在讲解“直方图均衡化图像增强技术”一节内容时,首先向学生展示了两幅曝光不足和曝光过量的图片,并且为了提高学生的学习兴趣,认识数字图像处理的实际应用,图片取自于视觉测量、航空交会对接定位等领域的实际图片,向学生提问,“如果实际应用中,由于环境光的影响,拍摄到了这样的图片,应该怎么办?”课堂讲解过程中,随着直方图、直方图增强技术的理论、直方图均衡化方法等内容的展开,使学生逐渐理解并掌握直方图均衡化方法,最后,给学生演示了直方图均衡化方法的实现,并看到了利用该方法对图片增强前后的图片效果。这种启发引导式的课堂教学方法,取得了良好的效果。
(3)传统和现代化教学手段相结合。随着计算机、通信技术应用的迅速普及,国内高校的课堂教学已普遍采用了多媒体技术,利用计算机、投影仪、幻灯机等现代化教学设备,结合计算机辅助教学(CAI)展示教学内容。这些现代化技术的确为课堂带来了很多丰富多彩的教学手段。数字图像处理是以图像为处理对象,其输出的形式主要以图像和图形为主,该课程也十分适宜将教学内容制成课件,采用多媒体计算机开展现代化教学。借助多媒体,使学生较直观地看到各种图像的处理需求、处理过程、处理效果等,这是普通教材和参考资料所无法比拟的。因此,我们针对课堂教学需求,进行了多媒体课程教学资源建设,如教学大纲、教学日历、授课教案和课件等通过多媒体平成,便于讲课,同时也便于学生课后的复习。例如,将视觉测量原理、过程等,通过多媒体课件的形式演示出来,相比较口头介绍等方法具有更加直观的效果。除了多媒体教学手段,传统的板书式教学作为补充手段也在数字图像处理课程中得到应用,主要用在课堂教学内容框架展示、理论推导等方面。
2.视觉测量与理论知识点结合
为了提高算法对于目标特征的识别效果,视觉测量通常采用圆形或方形特征点(图2),在获取的图像中对特征的成像位置进行识别和精确定位。视觉测量对于图像处理的要求主要包括图像预处理、特征粗定位、特征精定位等内容,对应数字图像处理课程中的图像增强、边缘检测、特征识别、几何运算等知识点。[7]
图2 视觉测量常用特征点
(1)图像预处理。图像预处理的主要方法包括彩色图像灰度化、图像增强等,为此,在讲解彩色图像内容时,介绍了RGB、HSI等彩色模型以及不同彩色模型之间的转换,并引出如何将彩色信息转换成灰度信息。通过分析彩色表示模型,建立了彩色到灰度图像的转换。
向学生展示常用视觉测量图像效果的基础上,为了减少图像噪声的影响、提高图像识别效果,提出改善图像质量的目标,需要进行图像增强。结合图像增强中常用的直方图增强技术、空域和频域图像增强方法在视觉测量图像处理中的实际应用,给学生展示直观的处理效果,加深对图像增强方法的理解。
(2)特征点粗定位。数字图像处理的边缘检测是该课程比较重要的一部分内容,边缘检测中包含了多种方法,便于学生对不同边缘检测算法的作用效果有直观印象,将各种算法应用于视觉测量图像征点的边缘检测,并有针对性地选择相应参数,使学生不仅学习了各种边缘检测算法的使用,也看到了算法的特点。
根据视觉成像的特点,圆形特征点成像后一般为椭圆,所以,利用边缘检测得到的边缘像点数据,讲解用边缘点进行指定特征识别的方法,如基于Hough变换的特征检测方法。为了引导学生思考,采用启发式讲课方法,讲解了Hough变换检测直线的方法,引出如何用Hough变换检测像面上的圆或椭圆,并鼓励有能力的学生实现相应算法。
(3)特征点精定位。特征点精定位的目的是在实现特征点粗定位的基础上,对圆形特征点中心在像面上的精确坐标进行定位。精确定位主要设计到数字图像处理中的点运算,但需要考虑采用的具体定位算法,如灰度重心法、加权灰度重心法、椭圆拟合法等。引导学生通过文献资料查找和实现相关定位算法,并且与国际领先的专业软件进行定位精度对比。通过比较,可以使学生发现不同算法之间的区别,并分析不同的原因。进一步,引导学生尝试对定位算法做一定的改进,这种改进,不需要从算法根本上做出很大的创新,只是从某一方面进行微小的变化,使其能够适合特定的应用需求。例如,如果对视觉测量像面上特征点定位采用加权灰度重心法时,通过调整加权系数,得到不用的效果,从而分析加权系数对于定位精度的影响,并据此得出适用于该需求的结论。
四、开放性实验
长期以来,“数字图像处理”课程教学主要采用课堂理论教学,教学内容也多为经典的内容,很难反映课程内容的时代特征。实验教学是高等教育的重要组成部分,是抽象思维与形象思维、传授知识与训练技能相结合的过程,在人才培养中具有课堂理论教学环节不可替代的作用,对培养理工科大学生的创造性是不可缺少的。虽然目前大多数课程都设置了实践环节,但也普遍存在着很多问题,[8]例如,实验课成绩占课程成绩比例小,学生对实验的重视度不够,存在着抄袭他人实验结果和报告的现象;实验模式单一,实验内容陈旧、呆板,多为验证性实验,缺乏创新性和挑战性,学生完全处于被动状态,最终导致实验不认真,敷衍了事,所学的知识和操作技术遗忘快;不能保证每个学生都有充分的时间和机会做实验,个别学生逐渐养成依赖心理,最终只有一部分学生得到了锻炼;理论课与实验课教学老师分离,造成理论和实践环节脱节等。
针对目前“数字图像处理”课程实验的现状,根据视觉测量像面特征点定位需求,开设相关开放性实验项目“视觉测量特征点提取定位实验”,实验要求学生结合数字图像处理课程知识理论,对视觉测量采集的数字图像进行处理,提取相关特征点。针对视觉测量中常用的特征点(圆形、方形)进行自动检测,并实现高精度定位,主要实验内容包括:图像预处理、特征点粗定位、特征点精定位、算法设计与实现、实验结果分析等。
教师在开放性实验项目中承担的角色主要是方案设计和实施过程中的指导、监督,对方案的具体实现方法不做限制性要求,主要由学生结合课堂教学内容以及查阅文献资料来设计并完成。为了提高项目完成的效率,教师可以通过适当的引导为学生指出主要方向。
对于单个学生来说,这样的实验项目有些困难,“团队合作”也是新时期对科技人才素质的要求,所以可以通过建立项目小组的方式开展实验。小组成员将实验内容进行分工,每人负责不同的部分,通过相互合作、帮助,完成整个实验项目。通过这种形式,也在某种程度上锻炼了学生的团队合作意识和合作方法。
五、结束语
通过将视觉测量领域研究成果引入“数字图像处理”课程,并在教学方法、教学手段、教学内容、开放性实践等方面的改革和尝试,逐步做到科学研究成果与课堂理论教学的有机结合,不仅丰富了课程的教学内容,提高了学生的学习兴趣,加深了对理论知识的理解,而且使学生接触到科学研究的前沿领域,开拓了视野,对创新能力的培养锻炼等方面也具有重要意义。
参考文献
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季铮、盛庆红.基于近景数字视觉测量的飞机表面模型重建[J].地理空间信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 刘常杰、邾继贵、叶声华.汽车白车身机器视觉检测系统[J].汽车工程,2000(6):373~376
5 彭三城、孙星明、刘国华.三维人体自动测量技术综述[J].计算机应用研究,2005(4):1~5
6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011
篇6
关键词:数字图像处理;教学改革;试验教学
0 引言
《数字图像处理》是一门汇聚光电探测、电子学、数学和计算机等众多领域技术的综合叉学科,通过对原始图像的加工,可以使图像具备更好的视觉效果,同时满足某些应用的特定需要。《数字图像处理》是一门偏重于应用的工程学科,经过半个多世纪的发展,目前已广泛应用于工业检测、医疗保健、航空航天、军事等各个领域,其巨大成就表现在航空航天遥感和医学图像的处理方面。在航天领域,为太空探测成功处理了数万张照片在生物医学领域,为开辟了无损诊断的先河,体现出其远大的发展前景。数字图像处理是模式识别、计算机视觉、图像通信、多媒体技术等学科的基础,已经成为高等院校电子信息工程、通信工程、信号与信息处理、计算机应用与软件等学科的一门重要专业课程。
对于工科类应用型高校,主要是培养具有创新意识和竞争力、符合市场需求的实用型人才,强调学生的应用动手能力。在《数字图像处理》课程的教学过程中,我们主要从授课内容、授课方式、试验课设计以及考核方式进行了改革,培养学生学习兴趣,掌握图像处理最基本的流程和基础知识,通过主动查阅文献资料与团队协作培养学生分析問题与解决問题的能力。近几年,我们对课程教学内容体系、教学方法与手段以及教师队伍等方面的进一步建设,不断进行科技创新,将工程与项目的开发与设计理念引入课堂与试验,取得了较明显的效果,最为显著的是学生在大四毕业设计中,具备扎实的图像处理相关基础知识,能很好地完成与图像处理相关的毕业设计课题。
1 授课内容改革
随着科学技术的发展以及信息时代的到来,图像处理的新理论和新方法层出不穷,并逐步应用于实践。《数字图像处理》课程教学的侧重点和教学内容也必须发生相应变化以适应时代对应用型人才培养的需求。
1.1优化整合教学内容
在众多的《数字图像处理》类教材中,选择了西安电子科技大学许录平编写的《数字图像处理》教材为主。主要考虑到该教材内容全面、知识新颖,在内容阐述上重点突出,实践性强,有较多的实例来帮助学生理解图像处理的理论和算法。同时以清华大学章毓晋编写的《图像工程(上册)图像处理和分析》与冈萨雷斯的《数字图像处理》作为我们的辅助教材。
该教材共分八章三大部分,第一部分是数字图像处理基础,包括绪论、图像处理基础和图象变换共三章。第二部分介绍图像处理基本方法和技术,包括图象增强、图像恢复和重建、图像压缩编码共三章。第三部分讲述数字图像分析的基本原理和技术,包括图象分割和图像描述共二章。对于应用型本科教学,我们对教材内容进行适当增删、重组。并划分成如下内容模块:图像基础知识(图像采集、量化与人眼视觉系统)、图像变换、图像增强、图像恢复、压缩编码、图像分割、图像描述与图像分类识别。课程教学的主要任务是系统地讲授各个模块的基本概念、基本原理与典型方法。目的是让学生掌握图像处理的基本理论和技术,建立一个比较完整的图像处理和分析的理论体系,并了解和掌握常用的图像处理和分析技术。
根据几年的教学实践经验,图像描述与图像分类识别应该属于图像理解的范畴,作为图像工程的高一级别的内容,可以在本科阶段略讲:而图像基本概念、各种图像变换、灰度图像增强、图像平滑、图像锐化和彩色图像处理的应用性比较强,且在生活中经常会遇到此类的应用需求,应尽量详讲;频域增强、图像复原、图像编码和图像分割的地位比较特殊,这些部分的数学知识比较多,现实中具有很大应用价值,应该予以讲授。
1.2补充学课前沿知识
在每个模块的内容讲授安排上,在注重基础知识与经典算法讲授的前提下,按照由浅入深、由易到难的顺序逐渐展开,并适当补充本领域中的一些新技术、新方法、新成果。例如:在讲授图像变换模块时,其中的Fourier变换与离散余弦变换(DCT),学生在其他前期课程中有所接触,相对来说学生容易接受与理解。在这个模块我们要补充的前沿知识就是“小波变换”。小波分析是当前应用数学与工程学科中一个迅速发展的新领域,经过近十年的探索研究,重要的数学形式化体系已经建立。理论基础更加扎实。与Fourier变换、DCT变换相比,小波变换是时间(空间)频率的局部细化分析,它通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细化,低频处频率细化,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了Fourier变通的困难問题,成为继Fouri-er变换以来在科学方法上的重大突破,有人把小波变换称为“数学显微镜”。小波变换联系了应用数学、物理学、计算机科学、信号与信息处理、图像处理、地震勘探等多个学科。它在信号分析、语音合成、图像识别、计算机视觉、数据压缩等方面的研究都取得了许多具有重大科学意义和应用价值的成果。再例如:在讲授图像平滑去噪模块时,除了讲解教材的均值滤波、中值滤波算法之外,还补充基于偏微分方程(PDE)的图像去噪方法。在图像处理与计算机视觉中采用PDE方法,是近些年以来图像处理领域中的一个重要分支,因为它在图像处理中具有更强的局部适应性(Local Adaptability)与高度的灵活性(Flexibility),并且日益成为相关领域研究者关注的一个热点,在图像去噪、边缘检测与图像分割方面积累了丰富成果。
通过在课堂上适当地补充学科前沿知识,不但可以开阔学生的视野,丰富学生的知识面,让学生明白更多、更新的方法在教材之外,要学会查阅相关文献,而不要局限于书本,从而激发学生的创新意识。同时,在各个模块内容的设计中要注重知识点之间、模块之间以及本课程与其他课程之间的内在联系,既体现知识的内涵,又关注知识产生的过程。既引导学生对当前所学内容举一反三,又能将新旧知识融会贯通。
2 教学过程的改革
2.1教学方式的选择
《数字图像处理》课程是一门既具有较强理论性又具有较强实践性的学科,其中不但有基本概念与理论。还有许多具体的算法与应用举例。所以,在教学过程中采用以“多媒体”为主,“粉笔+黑板”为辅的教学方式。多媒体教学手段的采用能使教学内容由平面到立体,由抽象到具体,由文字到声音图像,这一教学手段的运用极大地增强了课堂教学的直观性、互动性,调动了学生学习的主动性。而“粉笔+黑板”的板书可以用来进行公式的推导与演算,加强学生对公式的理解与记忆。
2.2项目式教学
为了有效地培养学生的应用能力,把基于项目式的教学策略引人课堂之中,以促进学生高级认知技能和問题解决策略的形成,将理论联系实际,培养学生分析問题与解决問题的能力。这一策略的主要方法就是:在讲授教材的知识点或具体算法时,先引入一个具体工程项目,通过对此项目的需求进行分析,让学生知道我们将要学习的知识在项目的哪个环节可以得到应用。这样既可以激发学生的求知欲,又能增强学生的学习兴趣,调动学习的主动性。例如:在讲授“图像增强”这个模块时,我们就以“视频监控”项目为背景,因为受光照条件、天气变化(雨雪、大雾)等因素影响,采集的视频图像往往不清晰,视觉效果很差,但是,通过我们将要学习的图像增强方法,可以大幅度地改善图像的视觉效果,提高图像的质量,如图1所示。
由于这一真实项目引领整个“图像增强”模块的学习过程,能够有效提高学生的学习积极性,也有利于学生掌握该知识点的具体应用价值,提高学生对理论知识的综合运用能力,从而提高学生分析与解决实际問题的能力。
3 试验教学的改革
在以住《数字图像处理》的试验课中,通常都是在MatLab环境中,对课本中的一些算法进行重复性验证,试验内容简单枯燥,无法引起学生学习的兴趣,更加不能使学生将所学的知识与实际生活中的应用需求相联系。
针对上述問题,我们进行了如下改革:
(1)设置具有应用性的“学期项目”让学生开发,激发他们的学习兴趣。俗话说“兴趣是最好的老师”,只要能够激发学生的学习兴趣,就能调动学生学习的主动性与积极性。为了调动学生的学习兴趣,我们选择兼具应用性与兴趣性的试验题目——例如“基于肤色特征的人脸分割”、“基于视觉相似性的图像快速检索”、“监控图像的增强与锐化”与“运动模糊图像的恢复”等,学生根据这些“学期项目”,分成多个小组,每个成员在组内具有明确的分工与任务,各负其责,共同完成“学期项目”软件开发。
(2)在“学期项目”软件开发时,鼓励学生多采用教材之外的新理论与新方法,培养开拓创新能力。要求学生在了解试验目的前提下,自己进行方案设计,选择适当的算法。近些年以来,各种类型的图像处理新理论与新方法层出不穷,在不同的应用场合,各自的优点与缺点互不相同。鼓励学生通过互联网与学校的图书馆,查阅最新文献,形成自己的特点,培养学生的科技创新能力。在试验成功后,不但要进行试验结果与算法性能分析,还要书写软件设计方案等文档。
(3)组建图像处理兴趣小组。因为受课程学时限制,仅仅只利用课内时间,则非常有限。我们就组建了图像处理兴趣小组,让他们参加到教师的科研与项目中来,使学生在真实的项目研发中锻炼自己的综合能力。
最后,在期末之前安排两周的时间对学生的“学期项目”进行集中检查,检查的内容主要包括:①系统演示;②功能方面是否正确完整;③算法的适应能力是否鲁棒;④算法的效率是否高效;⑤程序代码是否规范;⑥试验分析报告与PPT汇报。然后,根据这些方面的检查情况,对学生的学习情况与动手能力进行评分。这是基于项目试验教学改革的重要环节,不但可以督促“学期项目”完成的质量,还能提高学生分析問题与解决問题的能力。
4 评价机制的改革
对于公选课的《数字图像处理》课程,我们采用了“笔试+课堂表现+试验考核”的一种综合考核方式。其中笔试环节重点考察学生教材上的基本概念、基本算法等知识点记忆与掌握程度:课堂表现主要考察学生的学习态度,主要包括出勤率与读书心得等内容:试验考核主要是考察学生综合应用能力,其中包括所选“学期项目”的完成质量与试验分析报告与软件设计文档。
《数字图像处理》作为一门实践性、应用性都很强的课程,在考核时,要加大平时考查在最终成绩认定中的比重,要重点突出“学期项目”完成质量在学习中的重要性,从而激发学生实践学习的主动性,提高学生的实践能力、创新能力,最终达不到理想的教学效果。
此外,由于选修本门课程学生基础各异,专业背景相差较大,采取“分层评价”也是一种应该提倡的方法。“分层评价”也是教学过程中的一个重要环节,它是根据学生的知识水平和学习能力的差异,对不同专业的学生采取不同的评价标准以及对他们的期望值。
5 结语
篇7
“国家优秀自费留学生奖学金”从2005年设立至今,已评选了三届。该奖项已经成为祖国关爱自费留学生的知名品牌,受到国内外权威媒体和有关人士的普遍关注和广泛赞誉。
广大自费留学生是国家宝贵的人才资源,为了进一步加强他们与祖国的联系,弘扬优秀自费留学人员奋力拼搏的精神,本刊从2006年第1期开始,向广大读者介绍部分获奖者。同时近期我们又开辟了“我的自费留学经历”专题,真诚欢迎更多的自费留学生将你们留学中的酸甜苦辣与心得写给我们。
本栏目联系电话:010-62257722转208
传真:010-62252501
电子信箱:baiyu48@sina.com
叶海涛,2003年获奖者,留学英国。现任英国伦敦大学学院(UCL)纳米研究中心博士后研究员,与劳斯莱斯公司(Rolls-Royce plc)合作共同研发飞机引擎内部的高温功率放大器。1998年西安交通大学本科毕业,曾获得“好来西”企业奖学金、首届美国联合科技公司(UTC)容闳科技教育奖。2000年新加坡南洋理工大学(NTU)硕士毕业,获新加坡Tan Chin Tuan国际交流奖学金及李氏基金(Lee Foundation)。2004年英国伦敦大学博士毕业,主要专业方向为金刚石由子学及纳米器件2004~2005年被聘为日本电信电话株式会社国际研究员,从事单晶金刚石场效应管的研发。现已发表国际期刊论文20多篇及国际会议论文40多篇,多次应邀参加国际学术会议并做大会专题报告。在攻读博士期间,连续三年荣获英国大学校长委员会颁发的海外研究生奖学金(ORS)、英国EPSRC奖学金和香港王宽成奖学金(KCWong),并被吸收为英国材料学会(IOM3)(2000年)、英国物理学会(10P)(2001年)及英国电子工程师学会(IEE)的会员,(2003年、2006)年当选为旅英中国工程师协会的理事,并应邀成为以色列国家科学基金委的特约评审人。
而立之年的叶海涛表示:“一定不会辜负祖国的期望,不断提升和完善自己,脚踏实地做好每一份工作,心系祖国,愿为祖国的繁荣和发展贡献自己的青春和智慧。”
谢向华,2004年获奖者,留学英国。2000年毕业于上海同济大学环境科学与工程学院,2001年9月赴英国布里斯托尔大学攻读计算机硕士学位,一年后顺利完成“高级计算科学”课程,并获得理学硕士学位。2003年11月开始在布里斯托尔大学计算机科学系媒体计算科研小组攻读博士学位,同时担任“研究助理”一职从事科研工作。2006年3月通过博士论文答辩。自2006年2月起,在布里斯托尔大学计算机系做博士后,从事一项由欧盟委员会(European Commission)资助的旨在开发帮助盲人和视力严重损伤的病人与外界交互的计算机认知系统的研究项目(CASBliP)。其研究主要为立体计算机视觉系统,动态曲线分割模型,计算机材质分析,自动缺陷识别和医学图像。他在计算机视觉与图形处理领域的国际性刊物和国际性学术研讨会上以第一作者发表了10多篇论文。2004年,应美国玛柯尼医疗系统(Marconi Medical System,Inc.)苏里博士的邀请,在《医学图像分析手册高级图形分割与图像注册模型》一书中撰写章节――“区域支持的几何彩色动态曲线分割模型”。谢向华现参与《材质分析手册》一书的编撰工作,该书将于2007年出版。2006年初,他与默曼迪博士的PRINS研究方案得到了英国Levelhulm研究基金会为期两年的资助。他现担任多个国际性学术期刊的评委,并是英国“医学图像分析与认知”年会等多个国际性学术协会的会员。谢向华认为,获得“国家优秀自费留学生奖学金”是祖国对自己在海外多年努力学习的莫大鼓励与肯定,同时也让所有海外的莘莘学子看到祖国对于他们的重视与厚望。在今后的研究工作中,他将继续努力学习尖端技术,为祖国将来的科技发展贡献微薄之力。
姚小军,2004年获奖者,留学法国,研究方向为化学信息学。1994年就读于兰州大学化学系,2002年1月获“促进科学技术研究中法协会信息科学奖学金”资助,作为兰州大学与巴黎第七大学联合培养的博士生,赴法国留学,师从法国巴黎第七大学ITODYS研究所化学信息学和分子模型实验室主任范波涛教授和兰州大学胡之德教授。在范教授和胡教授的共同指导下,主要开展了以下两个方面的研究:(1)新的机器学习算法在QSAR/QSPR中的应用;(2)计算机辅助分子设计。他在国际知名学术刊物上发表了30余篇论文并被多次引用,所做的工作曾多次在国际会议上介绍,得到了同行的广泛好评。留学法国期间,曾获得2002年“法国华人青年企业家协会”教育基金会第二届“优秀中国留学人员奖”和2004年中国国家留学基金委“国家优秀自费留学生奖学金”以及2005年“促进科学技术研究中法协会信息科学奖”。2004年12月获得博士学位。获得学位后,姚小军响应国家西部大开发战略,怀着对母校的深厚感情,决定回到兰州大学,从事教学和科研工作,为国家的西部大开发战略和母校的发展贡献自己的力量。获奖后,他深深地感谢国家对海外留学生的关心和支持。他表示将会继续努力,争取更大的成绩,更好地报效国家。
篇8
关键词 智能化 视频分析 系统设计 监控
中图分类号: TP37 文献标识码:A
1 引言
进入21世纪以来,经济和社会的发展促使着人们不断提高安防意识,对于安防监控的业务需求不断增大,如何通过经济的、高效的、智能的和可行的技术手段来提高安防监控,保障公众安全和财产安全,成为了智能监控领域内普遍关注的热点问题。
传统的利用摄像头和录像监视设备组成的监控系统存在着诸多问题:例如需求操作人员进行查看和管理维护,只能作为事后取证的工具,无法解决快速报警、目标跟踪及定位等问题。智能视频分析技术是一种新的技术,是在视频监控系统发展到一定程度时市场自然提出的要求。
2 智能视频分析技术
智能视频分析技术属于模式识别技术的一种,就是指采用智能化的视频分析算法,利用计算机对视野范围内的目标的特定行为进行分析和提取,让计算机判断出这些个体进行了一些什么行为,进而可以判断这些行为是否符合某些规则,是否属于“某一类型”的行为,而这些类型的行为是应该提醒监控人员注意的“可疑行为”。当发现存在符合某种规则的行为(如定向运动、越界、游荡、遗留等)发生时,自动向监控系统发出提示信号,采取某种对应措施(如声光报警器报警)或通知监控人员进行人工干预等。智能视频分析技术实现用计算机“代替”人进行分析,也即实现了“自动分析”或是“智能分析”。
智能视频主要技术包括以下几个方面:
(1)目标检测
在视频监控系统中,目标检测处于智能分析的低层,包括动目标以及静目标检测,是各种后续处理的基础。
(2)目标跟踪
目标跟踪即对监控区域内的运动目标的轨迹进行跟踪,是目标监控的最基本的应用,也是其他事件监测的基础,处于智能视频分析的中层。
(3)目标分类和识别
属于智能视频分析的中高层。目标分类指根据检测到目标的形状、外观、轮廓等特征进行分类(如行人、车辆、动物等),目标识别指对目标的身份进行甄别,实际应用中,如人脸识别,步态识别,车牌识别等。
(4)视频内容分析和理解
属于高级智能视频分析,是真正实现监控智能化的关键。在上述低级处理的基础上,进一步对场景中的行为,复杂事件等进行分析和识别,并用自然语言等加以描述。其中最典型的是对场景中的运动目标特别是人的行为的理解和描述。
(5)系统设计
智能视频分析系统是以基于图像处理、模式识别技术的计算机视觉技术为核心,结合多媒体技术、计算机网络技术的一种主动监控分析系统。
本文中基于ARM Cortex的智能视频分析系统,旨在打造基于智能视频分析技术的成套安防报警管理系统解决方案。本系统借助计算机强大的数据处理功能,对视频画面中的海量数据进行高速分析,以数字化、网络化视频监控为基础,采用ARM Cortex嵌入式多任务系统技术、数字图像压缩/处理技术、智能视频分析等技术,提供了入侵检测、徘徊检测、遗弃物检测、物品搬移检测、自动跟踪检测、非法停车检测、烟火检测以及防尾随、人流统计和智能监控异常检测等功能。该系统中所做的智能视频分析能够识别不同的物体,发现监控画面中的异常情况,并能够以最快和最佳的方式发出警报和提供有用信息,从而能够更加有效地协助安全人员处理危机,并最大限度的降低误报和漏报现象。
本文中所设计的智能视频分析系统可以划分为几个子模块:
(1)ARM Cortex处理平台
实际应用环境中越来越复杂的算法带来了巨大的计算量,目前广泛应用在智能分析设备中DSP芯片计算能力有限,已经不能满足某些复杂算法的需要。并且无法植入嵌入式操作系统,无法成为一个独立的嵌入式终端。本系统采用TI公司的以ARM Cortex-A9为核心的OMAP4430处理器,该处理器具有双核对称处理器、1GHZ的运算速度。ARM NEON技术将DSP和媒体处理能力提高了近4倍,并支持改良的浮点运算,满足下一代3D图形、游戏物理应用以及传统嵌入式控制应用的需求。本系统充分利用其对于图像处理的优化支持和开发工具,完成视频分析算法的移植和运行工作。基于ARM Cortex的硬件平台使用的关键技术包括核心芯片技术和ARM Cortex嵌入式实时多任务处理系统技术,以实现网路升级、许可证管理等各项功能,节约在更新换代时购置新设备成本。
(2)算法分析模块
运用数字视频处理技术与智能分析技术,对已有的算法进行改进,开发具有自主知识产权的智能视频分析算法,并使用VC6.0实现,完成入侵检测、围栏入侵检测、区域入侵检测、徘徊检测、遗弃物检测、物品搬移检测、自动跟踪检测、非法停车检测、车牌自动识别、人流(车流)统计、烟火检测、智能监控防尾随、智能分析之异常检测。
(3)视频传输与控制信号的架设
关键技术包括MPEG-4编码与解码;媒体数据传输和控制协议;SIP协议开发。RTP提供具有实时特征的、端到端的数据传输服务。在视频数据前插入包含有载荷标识、序号、时间戳和同步源标识符的RTP包头,然后利用数据报套接字(UDP)在IP网络上传输RTP包。RTCP负责管理传输质量在当前应用进程之间交换控制信息。在RTP会话期间,各参与者周期性地传送RTCP包,包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料。SIP服务器可以利用这些信息动态地改变传输速率,甚至改变有效载荷类型。RTP/RTCP可视为应用程序,集成于嵌入式终端的应用程序中。SIP协议开发是在摄像头所级联的嵌入式终端中,基于ARM实现SIP协议编程。
(4)手持终端设备无线视频通信
在基于ARM Cortex的智能视频分析系统中,网络通讯是非常重要的一部分,无线视频通信技术,采用了基于IEEE 802.11b标准的无线局域网络,提供了宽带图像传输环境。采用了MPEG-4压缩技术,在高图像质量的前提下,可实现高压缩效率。本无线视频通信方案可有效地权衡视频通信中有效性和可靠性的矛盾,保证图像高质量和实时性强地传输。
3 应用前景
智能视频分析系统还属于新兴领域,根据权威的IDC报告称:智能视频分析系统在中国的市场普及率还未达到5%。目前国内智能视频分析系统已经应用于高速公路、地铁、商场、银行和住宅小区等场所,服务于安全防卫、交通管理或者行为分析等应用。随着安防发展的不断加快,人们的安全防范意识不断增强,将会对智能视频分析提出更高的要求。不同行业对于智能视频分析的要求是不同的,不同行业间检测行为类型与异常事件的特殊性也是智能视频分析技术研究中不得不面临的问题。智能视频分析技术只要结合行业实际应用,针对不同行业具体要求,满足用户需求,必然会在各行业中逐步显现威力。虽然目前智能视频分析技术对环境适应性有一定限制,但随着图像处理、图像分析以及计算机视觉等学科的发展,众多优秀算法的提出将使得智能视频分析更加智能。智能视频分析是监控领域最新的、最具发展潜力的方向,随着投入力量的不断增加,智能视频监控产品必定会有更加广阔的前景。
参考文献
[1] 蔡立公,浅析智能视频分析系统的设计[J], 黑龙江科技信息,2011(30).
[2] 陈冬冬,张曼琳,贾平,汪永强,智能视频分析技术在综合安防系统中的应用[J],计算机系统应用,2011(5).
[3] Gantz JF, Reinsel D, Chute C, et al. The expanding digital universe: A forecast of worldwide information growth through 2010. An Internet Data Center (IDC) White Paper,sponsored by EMC, 2010.
篇9
[关键词]物联网 智能视频技术 现状和分析
中图分类号:TP393 文献标识码:A 文章编号:1009-914X(2016)05-0358-01
引言
视频监控是物联网中的重要组成部分。在以往的安防行业中视频监控只是其一个重要的应用领域,并没有将系统、互联网这些概念掺杂其中。而随着我国经济的不断发展,越来越多的领域需要视频监控,从而也将视频监控原本只是安防行业的传统狭窄领域给打破,越来越多的新需求也在物联网的背景下被人们所提出来。信息的采集点是摄像头的本质,而编码设备的本质则在于数字信息化的变化,而将摄像头和编码设备进行有效的结合,也就形成的第一步功能的物联网。而随着第一步功能的完成接下来就是全面的IT化互联网化,也就是对架构、系统以及技术的IP化[1]。在当下物联网的趋势和背景下,有效的结合IT和安防是必须要做的工作,因此,联网对于监控来说也是必不可少的。
1.物联网中智能视频的作用和发展现状
1.1 智能视频的发展作用
随着我国科技的不断发展,全数字化时代已经在视频监控中得到全面使用,也就是当下视频监控系统的网络化,它是通过标准的TCP/IP协议而建立的,因此它又叫做IP监控系统,是在2001年被发明并使用的。视频监控的数字化的优点就在于可以使模拟闭路电视监控的局限性得到很好的解决,例如可以在计算机网络上不受距离限制的传输数字化视频的图像数据,而且也不会干扰到传输信号,使图像的品质和稳定性得到大幅度的提升;视频监控的数字化可以很好的运用计算机网络进行联网,可以重复使用网络宽带,而且对于网线的布置上也可以不用重新布置;数字化存储功能也得以实现,通过对视频数据的压缩处理,使其可以有效的在磁盘阵列中得到存储或者在光盘中得以保存,从而更加方便快捷的进行数据查询[2]。
在智能化方面,目前的视频监控系统都试图对摄像机采集的视频信息上运用计算机视觉技术来进行理解、分析和处理,过滤和排除掉一些无关紧要的信息,报告给监控人员处理的都是一些提取出的有用信息,从而让预警、防范以及主动监测等功能得到实现,进而使代替人来进行监控任务的目的得以实现。
1.2 智能视频技术的应用领域
目前,智能视频技术已经得到了广泛的应用,很多行业都开始依赖智能视频技术来促进行业的发展。例如,(1)高级视频的移动侦测:在雨雪或者大风、大雾等复杂环境中,可以对一个或者多个物体的动作方向、运动特征等一系列的运动情况做到精准的侦测和识别。(2)物体追踪:在对移动物体侦测到后,可以结合物体的运动状况自动的进行控制指令的发送,从而使的摄像机可以对物体进行自动跟踪,而当跟踪物体超出跟踪范围后还能自动的对物体所在区域的摄像机发出通知,从而让物体区域的摄像机进行再次跟踪和监控。(3)识别任务的面部:通过对任务的面部特征进行识别,将人物的面部特征和数据库进行对比,从而对人物的身份进行识别和验证。这种面部识别主要分为两种,一种是需要人物在摄像机面前停留一段时间,在一些门禁系统中比较普遍,还有一种是在一群人中对一些特定的个体进行识别,这种在机场、火车站等安防工作中的运用比较普遍。除此之外还有很多地方都得到了广泛的应用,如通过对车辆的形状等信息进行识别、对交通流量进行控制等[3]。
2.智能视频监控技术的技术介绍
所谓的运动目标检测是从视频序列的图像中将目标物体所在区域给分离出来。在对目标物体进行正确检测盒识别的基础上进行后续工作中的运动目标提取、跟踪以及行为理解。可以说视频监控中运动目标的检测是前导工作。在运动目标的检测中主要分为两种检测,分别是背景检测和目标检测。
当下的背景检测方法主要有四种:背景模型法、背景统计法、卡尔曼滤波法以及Surendra背景更新算法。背景模型法是建立各个像素点的统计模型,通过对像素点的灰度分别来找出最为符合的概率分布,例如非参数化模型。背景统计法是对像素点的灰度进行统计,在结合其平均值估计背景点的灰度,对剧烈变化的部分进行过滤。卡尔曼滤波法是通过将灰度的时间序列看成具有噪音的观测值,结合时域递归低通滤波对缓变的实际图像进行估计[4]。Surendra背景更新算法是对侦察图像进行计算,得出物体运动的区域,保持区域的背景的不变,更新非运动区域,从而估计背景图像。
目标检测算法中光流法、帧间差分法以及背景减法最为常用。光流法是对运动目标的光流特点,通过对光流场进行计算,从而进行运动目标的提取。这种方法在计算上较为复杂,且耗时比较长,对一些实时性检测很难满足。帧间差分法对相邻两个图像灰度值存在的差异进行对比进行运动目标的提取。这种方法在计算上较为简单,也能很好的感应到运动物体区域的变化,但是会拉伸检测出的物体运动方向,不能明确的确定运动目标位置,还会去除掉部分运动目标的信息数据,使得运动目标不能被完整的提取出来。背景减法对当前的帧图像与背景图像之间的数据进行相减,若某个像素点比域值要大,则这个点出现在运动目标上,目标的位置、形状以及大小等信息都通过相减的结果而确定。这种方法可以很好的估计和更新出背景,却对运动物体的定位也非常的精准,但是对一些变化的光照以及环境非常的敏感[5]。
3.总结
总而言之,物联网实现智能交通、智能安防、智能监控以及一些其他智能化控制的方法就是物体和物体之间相连的庞大网络。在物联网中最早得到应用的重要技术之一就是智能视频监控。因此,物联网能够直接影响到职能视频监控的发展。智能视觉监控技术所涉及到的诸多领域的研究,属于综合性跨学科问题,是非常具有挑战性的一种前沿课题。当下,对智能视频技术的相关研究依旧还存在于探索和研究的一个阶段,需要大量的工作才能真正的使监控技术的智能化得以实现。
参考文献
[1] 李万才.物联网中智能视频技术的现状与分析[J].警察技术,2010,06:8-10.
[2] 沈沛意,杨刚,张亮,肖潇,张小平,常启鹏,于公.物联网的智能视频接入终端――高清晰智能相机的研制与应用[J].物联网技术,2011,03:41-45.
[3] 朱方,吴莉,陈飞凌,袁卫忠.智能视频监控终端在物联网中的应用和发展研究[J].中国电子科学研究院学报,2011,06:561-566.
[4] 奚吉,蒋银忠.基于物联网和视频分析技术的监狱智能监控系统[J].电子器件,2014,06:1183-1188.
[5] 雷玉堂.浅析几种视频异常事件的智能视频分析技术与方法[J].中国公共安全,2013,12:129-132+134-136+138+140.
篇10
1 符号计算
计算机最主要的用途之一就是科学计算,科学计算可分为两类:一类是纯数值的计算,例如求函数的值,方程的数值解,比如天气预报、油藏模拟、航天等领 域;。另一类是符号计算,又称代数运算,这是一种智能化的计算,处理的是符号。符号可以代表整数、有理数、实数和复数,也可以代表多项式,函数,集合 等。。长期以来,人们一直盼望有一个可以进行符号计算的计算机软件系统。。早在50年代末,人们就开始对此研究。。进入80年代后,随着计算机的普及和人 工智能的发展,相继出现了多种功能齐全的计算机代数系统软件,其中Mathematica和Maple是它们的代表,由于它们都是用C语言写成的,所以可 以在绝大多数计算机上使用。。Mathematica是第一个将符号运算,数值计算和图形显示很好地结合在一起的数学软件,用户能够方便地用它进行多种形 式的数学处理。
计算机代数系统的优越性主要在于它能够进行大规模的代数运算。。通常我们用笔和纸进行代数运算只能处理符号较少的算式,当算式的符号上升到百位数 后,手工计算就很困难了,这时用计算机代数系统进行运算就可以做到准确,快捷,有效。。 现在符号计算软件有一些共同的特点就是在可以进行符号运算、数值计算和图形显示等同时,还具有高效的可编程功能。在操作界面上一般都支持交互式处理,人们 通过键盘输入命令,计算机处理后即显示结果。并且人机界面友好,命令输入方便灵活,很容易寻求帮助。
尽管计算机代数系统在代替人繁琐的符号运算上有着无比的优越性,但是,计算机毕竟是机器,它只能执行人们给它的指令,有一定的局限性。首先,多数计 算机代数系统对计算机硬件有较高的要求,在进行符号运算时,通常需要很大的内存和较长的计算时间,而精确的代数运算以时间和空间为代价的。第二个问题是用 计算机代数系统进行数值计算,虽然计算精度可以到任意位,但由于计算机代数系统是用软件本身浮点运算代替硬件算术运算,所以在速度要比用Fortran语 言算同样的问题慢百倍甚至千倍。另外,虽然计算机代数系统包含大量的数学知识,但这仅仅是数学中的一小部分,目前仍有许多数学领域未能被计算机代数系统涉 及。计算机代数系统仍在不断地发展、完善之中。
2 模式识别
模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。这里,我们把环境与客体统称为“模式”,随着计算机技术的发展,人类有可能研究 复杂的信息处理过程。用计算机实现模式(文字、声音、人物、物体等)的自动识别,是开发智能机器的一个最关键的突破口,也为人类认识自身智能提供线索。信 息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识 别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别系统 (Optical Character Recognition,OCR)、语音识别系统等。
计算机识别的显著特点是速度快、准确性和效率高。识别过程与人类的学习过程相似。
以“汉字识别”为例:首先将汉字图象进行处理,抽取主要表达特征并将其特征与汉字的代码存在计算机中。就象把老师教我们这个字叫什么、如何写的知识 记忆在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图像经处理后与计算机中所保存的全部汉字进行比较,找出最相近的字作为识别结果,这一过程 叫做“匹配”。
语音识别就是让计算机能听懂人说的话,一个重要的例子就是七国语言(英、日、意、韩、法、德、中)口语自动翻译系统。其中,中文部分的实验平台设立 在中国科学院自动化所的模式识别国家重点实验室,这是口语翻译研究跨入世界领先水平的标志。该系统实现后,人们出国预定旅馆、购买机票、在餐馆对话和兑换 外币时,只要利用电话网络和国际互联网,就可用手机、电话等与“老外”通话。
指纹是人体的一个重要特征,具有唯一性。北京大学有关专家对数字图像的离散几何性质进行了深入研究,建立了从指纹灰度图像精确计算纹线局部方向、进 而提取指纹特征信息的理论与算法,随后研究成功了适于民用身份鉴定的全自动指纹鉴定系统,以及适于公安刑事侦破的指纹鉴定系统。从而开创了我国指纹自动识 别系统应用的先河。北大指纹自动识别系统的推出,使我国公安干警从指纹查对的繁重人工处理中解放出来。浙江省从1997年开始使用北大指纹自动识别系统, 采取省地(市)二级建库、省地(市)县三级查询的方式,形成了独特的“浙江模式”。省公安厅现已建立了100多万人的指纹库,是目前国内的第二大库。在 100多万人的指纹库中,检索一枚现场指纹仅需4分钟左右。2000年浙江省用指纹自动识别系统直接破案3063起,连带破案12000多起。破案率为全 国第一,并遥遥领先于国内其它指纹识别系统,被公安部树为指纹系统建设应用样板。
这里介绍一个综合应用的例子,一汽集团公司与国防科技大学最近合作研制成功“红旗轿车自主驾驶系统”(即无人驾驶系统),它标志着我国研制高速智能 汽车的能力已达到当今世界先进水平。汽车自主驾驶技术是集模式识别、智能控制、计算机学和汽车操纵动力学等多门学科于一体的综合性技术,代表着一个国家控 制技术的水平。红旗车自主驾驶系统采用计算机视觉导航方式,并采用仿人控制,实现了对红旗车的操纵控制。首先,摄像机将车前方的道路和车辆行驶情况输入到 图像处理和图像识别系统。该系统识别出道路状况、前方车辆的相对距离和相对车速。接着,路径规划系统根据这些信息规划出一条合适路径,即决定如何开车。然 后,路径跟踪系统根据需跟踪的路径,结合车辆行驶状态参数和车辆驾驶动力学约束,形成控制命令,控制方向盘和油门开启机构产生相应动作,使汽车按照规划好 的路径前进,即按自主驾驶系统的规划路径前进。
3 专家系统
专家系统是一种模拟人类专家解决领域问题的计算机程序系统。专家系统内部含有大量的某个领域的专家水平的知识与经验,能够运用人类专家的知识和解决 问题的方法进行推理和判断,模拟人类专家的决策过程,来解决该领域的复杂问题。专家系统是人工智能应用研究最活跃和最广泛的应用领域之一,涉及到社会各个 方面,各种专家系统已遍布各个专业领域,取得很大的成功。根据专家系统处理的问题的类型,把专家系统分为解释型、诊断型、调试型、维修型、教育型、预测 型、规划型、设计型和控制型等10种类型。具体应用就很多了,例如血液凝结疾病诊断系统、电话电缆维护专家系统、花布图案设计和花布印染专家系统等等。
为了实现专家系统,必须要存储有该专门领域中经过事先总结、分析并按某种模式表示的专家知识(组成知识库),以及拥有类似于领域专家解决实际问题的 推理机制(构成推理机)。系统能对输入信息进行处理,并运用知识进行推理,做出决策和判断,其解决问题的水平达到或接近专家的水平,因此能起到专家或专家 助手的作用。
开发专家系统的关键是表示和运用专家知识,即来自领域专家的己被证明对解决有关领域内的典型问题有用的事实和过程。目前,专家系统主要采用基于规则 的知识表示和推理技术。由于领域的知识更多是不精确或不确定的,因此,不确定的知识表示与知识推理是专家系统开发与研究的重要课题。此外,专家系统开发工 具的研制发展也很迅速,这对扩大专家系统的应用范围,加快专家系统的开发过程,将起到积极地促进作用。随着计算机科学技术整体水平的提高,分布式专家系 统、协同式专家系统等新一代专家系统的研究也发展很快。在新一代专家系统中,不但采用基于规则的推理方法,而且采用了诸如人工神经网络的方法与技术。
4 机器翻译
机器翻译是利用计算机把一种自然语言转变成另一种自然语言的过程,用以完成这一过程的软件系统叫做机器翻译系统。几十年来,国内外许多专家、学者为 机器翻译的研究付出了大量的心血和汗水。虽然至今还没有一个实用、全面、高质量的自动翻译系统出现,不过也取得了很大的进展,特别是作为人们的辅助翻译工 具,机器翻译已经得到大多数人的认可。目前,国内的机器翻译软件不下百种,根据这些软件的翻译特点,大致可以分为三大类:词典翻译类、汉化翻译类和专业翻 译类。词典类翻译软件代表是“金山词霸”了,堪称是多快好省的电子词典,它可以迅速查询英文单词或词组的词义,并提供单词的发音,为用户了解单词或词组含 义提供了极大的便利。汉化翻译软件的典型代表是“东方快车2000”,它首先提出了“智能汉化”的概念,使翻译软件的辅助翻译作用更加明显。以“译星”、 “雅信译霸”为代表的专业翻译系统,是面对专业或行业用户的翻译软件,但其专业翻译的质量与人们的实用性还有不少差距,有人评价说“满篇英文难不住,满篇 中文看不懂”,该说法虽然比较极端,但机译译文的质量确实却一直是个老大难问题。这里,我们不妨对现有的机译和人译过程作一比较,从中可以看出一些原因。
机器翻译:
1.一句一句处理,上下文缺乏联系;
2.对源语言的分析只是求解句法关系,完全不是意义上的理解;
3.缺乏领域知识,从计算机到医学,从化工到法律都通用,就换专业词典;
4.译文转换是基于源语言的句法结构的,受源语言的句法结构的束缚;
5.翻译只是句法结构的和词汇的机械对应。
人工翻译:
1.一般会先通读全文,会前后照应;
2.对源语言是求得意义上的理解;
3.只有专业翻译人员,而没有万能翻译人员;
4.译文是基于他对源语言的理解,不受源语言的句法结构的束缚;
5.翻译是一个再创造的过程。
在目前的情况下,计算机辅助翻译应该是一个比较好的实际选择。事实上,在很多领域中,计算机辅助人类工作的方式已经得到了广泛的应用,例如CAD软 件。如果计算机辅助技术用于语言的翻译研究,应该同样可以起到很大的辅助作用,这就是所谓的“计算机辅助翻译”。它集机器记忆式翻译、语法分析式翻译和人 际交互式翻译为一体,把翻译过程中机械、重复、琐碎的工作交给计算机来完成。这样,翻译者只需将精力集中在创造性的思考上,有利于工作效率的提高。
机器翻译研究归根结底是一个知识处理问题,它涉及到有关语言内的知识、语言间的知识、以及语言外的世界知识,其中包括常识和相关领域的专门知识。随 着因特网的普及与发展,机器翻译的应用前景十分广阔。作为人类探索自己智能和操作知识的机制的窗口,机器翻译的研究与应用将更加诱人。国际上有关专家分析 认为机器翻译要想达到类似人工翻译一样的流畅程度,至少还要经历15年时间的持续研究,但在人类对语言研究还没有清楚“人脑是如何进行语言的模糊识别和判 断”的情况下,机器翻译要想达到100%的准确率是不可能的。
5 人工智能思想的应用:在家里寻找外星人
人工智能的基本思想已经在许多领域中得到了应用,“在家里寻找外星人”(SETI@home)项目就是利用人工智能的神经网络和网格计算思想的一个成功案例。SETI@home是Search for Extra Terrestrial Intelligence at Home的缩写,意为:在家里寻找外星文明。该项目由美国行星学会和美国加州大学伯克利分校于1999年5月17日开始启动,它利用特定的PC机屏幕保护 程序,来调用全球上网的个人计算机的闲置能力,分析世界上最大的射电望远镜获得的数据,帮助科学家探索外星生物。其计算模式的实质就是网格计算。
SETI@home项目的大致流程是这样的:
1.政府或者研究部门将一项需要巨大运算量的任务以程序和数据的形式提交给服务器。
2.服务器将数据和程序代码分成更小的部分,也称“子任务”。
3.在志愿者的PC机上安装一种特殊的客户程序(事实上是一个屏幕保护程序),它能自动同服务器联络,自动下载和处理子任务。
4.子任务处理完后的结果被送回服务器。然后,客户程序下载新的子任务,继续处理。
5.一旦所有的子任务处理完毕,服务器就将各种结果汇总,生成最后的报告,并把最终结果发回提交人。