计算机视觉主要任务范文
时间:2023-12-29 17:44:23
导语:如何才能写好一篇计算机视觉主要任务,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
1计算机视觉的概述及基本体系结构
1.1计算机视觉概述
通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。
1.2计算机视觉领域基本体系结构
提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。
2计算机视觉在交通领域的应用
2.1牌照识别
车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。
2.2车辆检测
目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。
2.3统计公交乘客人数
城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。
2.4对车道偏离程度和驾驶员工作状态判断
交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。
2.5路面破损检测
最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。
3结论
本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。
作者:夏栋 单位:同济大学软件学院
参考文献:
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).
[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).
[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).
篇2
关键词:对象轮廓;分水岭;支持向量机;场景标注
DOIDOI:10.11907/rjdk.171167
中图分类号:TP301
文献标识码:A 文章编号:1672-7800(2017)006-0015-04
0 引言
在计算机视觉领域,场景标注[1]作为图像分析的一个重要环节受到广泛关注。场景标注的主要任务是识别图像中每个像素所属类别。由于图像常会受到不同光照强度、对象遮挡以及对象种类繁多和复杂的场景问题,导致像素标注错误,无法很好地标注对象轮廓,最终导致场景标注效果不理想。因此,如何有效提取图像中对象的整体信息,描述图像对象轮廓,一直都是值得研究的问题。
当前的场景标注方法是直接在图像像素的基础上训练模型,而单纯在像素上训练模型很难描述对象轮廓,从而使场景标注难以获得理想效果。基于此,本文提出一种基于支持向量机的场景标注方法SVM-SLM(Scene labeling method based on support vector machine),通^训练图像块,有效解决了基于图像中对象轮廓的描述问题,在像素精确度上也有良好表现。
2 SVM-SLM方法描述
传统的基于像素训练的场景标注模型无法描述对象轮廓,会出现预测对象丢失和对象不完整的问题,从而影响像素精度。文献[2]、[ 3]、[4]研究的场景标注方法时间开销过大,并且精确度不高。针对以上问题本文提出了SVM-SLM方法,具体步骤如下:①采用结构森林方法[5]生成图像的边缘概率图;②将上述生成的边缘概率图用分水岭方法将图像划分为初始图像块;③为防止分水岭方法过度分割并且减少接下来的训练开支,通过UCM算法选取阈值,优化图像块;④对图像块提取特征,利用支持向量机训练图像块得到场景标注结果,并实现具有良好精确度及轮廓效果的场景标注方法。
3 生成图像块
边缘检测是计算机视觉系统中的一个重要环节,包括对象检测[6]、目标预测[7-8]以及场景分析[9]。边缘形状是目标对象几何形态描述的重要表现内容,图像中对象的轮廓往往来自于图像的边缘信息,所以有效提取图像边缘信息方法是关键。
传统的水平集模型需把轮廓曲线演化的能量方程转化为微分方程,进而借助梯度下降法求得方程最优解。这一过程不仅耗时,而且导致计算结果不稳定。考虑到一般图像块对图像的局部特征表现效果很好,本文利用图像块对边缘学习能力很强的特点,提出结构森林[5]与分水岭相结合的方法。首先利用结构森林的学习方法建立随机决策森林,学习每个像素的边缘概率,生成边缘概率图,此过程不但解决了耗时问题还取得了良好的边缘检测效果;再将边缘概率带入分水岭方法生成初始图像块,得到包含轮廓信息的初始图像块,效果如图2所示(彩图见封二)。图2(a)和图2(d)测试为图像,图2(b)和图2(e)为对应的边缘概率图,图2(c)和图2(f)为初始图像块。
4 训练SVM模型
传统的像素训练无法保留图像中对象的轮廓信息,训练时单纯对像素提取特征,忽略了像素之间的局部空间信息,不能很好表达图像中像素之间的区域结构信息。本文通过对带有对象轮廓信息的图像块进行训练,在进行语义标注的同时保留了对象轮廓信息。
采用核描述、核匹配方法,通过2*2网格模型提取像素的纹理特征、颜色特征和梯度特征,对应于同一图像块的像素特征加权合并为图像块特征。随机提取10块图像块生成特征图,利用支持向量机算法对图像块进行训练,如图4所示。
5 实验结果及分析
为了验证方法的有效性,图像数据集采用Stanford Background数据库[11],数据库共715幅复杂的户外场景图片,每张图像大小为320×240像素,附有标注好的正确语义图片。每个像素划分为一类,共8个类别,总计5 491万多像素标记样本,类别分别为天空、树、马路、草地、水、建筑物、山脉和前景对象。
实验随机提取五组训练集和测试集依次带入公共图像块阈值[0.1,0.2,0.3,0.4,0.5]进行评估,每组训练集提取572个图片,运用本文方法分割成若干图像块,平均每组图片被分割成5万多块图像块,运用支持向量机对这些图像块进行训练。用剩余143个图片作为测试集,平均分割成1万多个图像块进行测试,并对每个像素进行语义标注。实验效果如图5所示(彩图见封二)。图5(a)为部分测试图像,图5(b)为数据库正确标注图像,图5(c)为本文方法的场景标注图像,图5(d)为标注失准图,标注错误的像素呈黑色,正确的为白色。图5下方8个色块分别代表8个不同的类别。
利用结构森林生成边缘概率图,将图像边缘作为对象轮廓候选区,提高了场景标注对对象轮廓的标注能力。再通过UCM算法优化图像块,最终场景标注结果如图6所示。图6表明,本文方法在人物、车辆、动物等重要的前景对象轮廓细节上有较好的描述。
6 结语
场景标注是计算机视觉技术的关键步骤。针对像素训练模型容易忽略图像空间结构信息,无法描述对象轮廓的问题,提出一种基于支持向量机的场景标注方法。通过结构森林/UCM生成图像块,构建支持向量机模型,训练得到场景标注结果。实验表明该方法较好地描述了图像中的对象轮廓,获得了良好的精确度和标注效果。但是,由于特征描述采用核描述提取特征,对部分图像块不能有效提取特征,导致部分图像块标注不正确,影响了总体精确度。下一步的工作目标是提高有效特征的提取,以获取更高的精确度及场景标注效果。
参考文献:
[1]顾广华,韩晰瑛,陈春霞,等.图像场景语义分类研究进展综述[J].系统工程与电子技术,2016 (4):936-948.
[2]马成虎,董洪伟.一种基于深度学习的多尺度深度网络的场景标注算法[J].计算机工程与科学,2016,38(7):58-63.
[3]MUNOZ D,BAGNELL J,HEBERT M.Stacked hierarchical labeling[C].European Conference on Computer Vision,2010:57-70.
[4]TIGHE J,LAZEBNIK S.Superparsing:scalable nonparametric image parsing with superpixels[J].European Conference on Computer Vision,2010,63(15):352-365.
[5]DOLLAR P,ZITNICK C L.Structured forests for fast edge detection[C].The IEEE International Conference on Computer Vision (ICCV),2013:1841-1848.
[6]GALL J,LEMPITSKY V.Class-specific hough forests for object detection[C].The IEEE Conference on Computer Vision and Pattern Recognition,2009:143-157.
[7]ARBELAEZ P,JORDI P T,T BARRON J,et al.Multiscale combinatorial grouping[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2014:328-335.
[8]JORDI P T,ARBELAEZ P,BARRON J,et al.Multiscale combinatorial grouping for image segmentation and object proposal generation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016.
[9]KUMAR P,KOLLER D.Efficiently selecting regions for scene understanding[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2010:3217-3224.
篇3
关键词:磁瓦 起级缺陷 缺陷识别 纹理分析
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2011)12-0176-02
纹理特点是自然或人造物体所具有的在一定的尺度空间,以一定的形式变化而产生的图案(模式)。在磁瓦的生产过程中,由于在打磨时砂轮打滑引起的打磨不均匀容易产生起级缺陷。缺陷部分具有典型的线性条纹纹理特征(如图1)。这种缺陷影响了磁瓦的使用质量,摩擦大,容易磨损,影响装配后电器的稳定。但由于目前缺陷检测主要是以目视检测为主,效率不高;并且容易因为工人的视觉疲劳,进而引起缺陷的漏检。计算机视觉技术的应用很好地解决了这个问题。它具有检测速度快,效率高,漏检率低,稳定性好的特点。要进行起级缺陷的检测,首先应用Laplacian算子进行图像的预处理,获得了较好的缺陷识别图像,使缺陷得到锐化,从而有利于缺陷检测与识别。然后,根据缺陷的纹理特点,求得基于局部范围内的熵矩阵,然后对熵矩阵进行基于纹理的图像分割,得到二值化图像。最后,进行缺陷特征的提取,并利用缺陷检测准则进行缺陷检测和识别。
1、图像纹理分析方法
物体表面的粗糙程度反映的图像上,由于光照以及光的反射形成了图像中的纹理特征。纹理是具有相同或相似像素点的组合在一定空间内的组合。纹理特征是识别物体和缺陷的一个重要特征。目前纹理分析在空域和频域主要有统计法、结构法和频谱法。机械加工在工件表面形成了规则的纹理,内部的一些缺陷也在工件表面表现为一定的纹理特征。纹理分析在工件表面的粗糙程度控制以及缺陷的识别等方面具有很强的应用和研究价值。
基于熵的图像纹理分析是基于空域统计原理的纹理分析方法。
科学家已经发明了测量无序的量,它称作熵,熵也是混沌度,是内部无序结构的总量。熵值越大混沌程度越强,也就是图像结构越复杂;反之图像结构简单。基于局部熵值矩阵的图像纹理分割方法就是利用了熵原理,对图像求取N*N窗口内的局域上作为中心像素点的值,获得熵值矩阵。选定恰当的窗口,在纹理边缘处会有较大的熵值。选择一定的阈值可以进行阈值分割,实现纹理的分割。
基于局域熵的图像纹理分析原理:
熵值公式:
其中:,(i=1,2,......,L),是为保证p(i)不为0的实数;L灰度级,n,m图像的长和宽; ni灰度级为i的像素的个数。
对于局部熵值的计算,m*n为模板窗口的大小。为减少计算量,窗口内灰度级出现的概率p的大小取区域内最大灰度值max和最小灰度值min得差。也即:,(j=0,1,......,max-min)。基于熵原理的图像纹理分析,计算简单,能够较快的获得图像的熵值矩阵。
2、缺陷磁瓦图片处理
2.1 缺陷磁瓦图像特征分析
磁瓦缺陷是由纹理基元按一定的规则排列组合而成的,并且缺陷纵贯磁瓦表面。对于缺陷的识别,主要任务是确定是否存在缺陷以及定位缺陷的位置。按照统计学原理,抽取磁瓦内表面的一块条形区域,如果存在起级缺陷,就可以确定磁瓦存在起级缺陷。这样即减少了图像处理的数据量和处理时间,又可减少磁瓦图像受光照和噪声等因素的影响,可以快速提取缺陷特征。
2.2 获取感兴趣区域(Region Of Interest,ROI)
由于磁瓦图像中存在两个目标,磁瓦和背景。如果提取的抽样区域存在背景会影响缺陷识别的效果。因此必须确定磁瓦存在的区域(如图1.A中标示区域),在此最小区域内抽取样本。为确定最小磁瓦区域坐标,先获取图像1/2宽x处的行数据,并绘制这个一维信号,纵坐标为灰度值,横坐标为索引号,如图2(a)。可以发现一维信号图有两处存在明显的灰度阶跃,这是由于在边界处背景和磁瓦灰度突变产生的结果。因此可以以此来获取最小区域的纵坐标。设为y1,y2、抽样宽度为h,则可以得到最小区域的两个坐标(x,y1),(x,y2)。最终的抽样区域以及抽样区域的均值一维信号如图2(c)。
虽然,图像的一维信号可以显示出缺陷的区域,但是由于磁瓦内表面容易存在污渍、暗斑等噪声,也会引起灰度值的突变,表现为一个较长的谷。因此一维信号不能作为缺陷识别的依据,只能用来校正缺陷的识别结果。
2.3 基于熵的磁瓦图像处理
利用公式(1)对取得的ROI图像区域进行熵值处理。灰度调整后,图像如图3(1)。图像中较亮的部分熵值较大,表明在这个区域信息变化剧烈。但是由于污渍等噪声的影响,在两线附近存在亮区域,不能根据亮区域,二值化后的区域标示缺陷边界。必须经过灰度调整,然后选择相应的阈值再二值化。增强结果如图3(2);应用大律法选择阈值,进行图像二值化并利用数学形态学操作滤波去噪,结果如图3(3),(4):
该方法对于光照均匀,磁瓦表面无污渍缺陷明显的图像有良好的识别效果。但是对于有污渍或暗条纹形成了一定纹理,图像预处理和形态学操作,边界跟踪,存在多个标示区域(如图3(5)),对缺陷有误识别。因此,必须对识别结果进行校正,结果如图3(6)。具体方法:
(1)计算ROI抽样信号的平均值,记为AverageROI。横向扫描图3(4),记录每个白色区域的起始坐标和终止坐标,获得数组A;
(2)组合A中的坐标,取坐标记录的第i,i+1个坐标(i=2,4,S-1,S为白色区域矩形边的个数的个数);
(3)获得组合坐标之间的ROI中的图像数据,求的平均灰度值Average,并与AverageROI比较。如果小于,则检测组合坐标对应的点在ROI抽样信号中是否是在图2(c)中的一个长为Long的谷内。如果不在,则转到下一个组合坐标。否则,标示组合坐标之间的区域,记录缺陷位置。若i
(4)若检测记录存在缺陷,显示缺陷位置标示图像。否则,提示无缺陷。
3、结语
磁瓦起级缺陷是因打磨不均匀造成的缺陷,在磁瓦的制造过程中比较常见。本文使用基于图像信息熵的理论对磁瓦图像文理分析,制订了缺陷识别和矫正规则,对缺陷进行识别,获得了较好的识别效果,并用Matlab进行了仿真实验。每片磁瓦的均处理时间为0.09秒,识别率达到了93%,能够满足实际生产的在线检测要求。
参考文献
[1]章毓晋.图象工程[M].北京:清华大学出版社,2005.
[2]任仙怡,张桂林,陈朝阳等.基于纹理谱的纹理分割方法[J].中国图象图形学报,1998,3(12):983~986.
篇4
关键词:车牌识别系统; 智能交通; 技术
中图分类号: TP391.4文献标识码:A文章编号:1009-3044(2008)18-20ppp-0c
Research on Licence Plate Recognition System
YI Lian-jie
(Loudi Vocational and Technical College Loudi Huanan417000)
Abstract: The licence plate recognition system has an importantrole of morden intelligent traffic system. This paper narrated the key technology ofthe licence plate recognition system and discussed the existing problems and development of the licence plate recognition system.
Keywords: the licence plate recognition system; intelligent traffic system; technology
车牌识别系统是智能交通系统的关键部分,可广泛应用于交通管理、监控和电子收费等场合。车牌识别系统就是以车牌作为车辆的唯一标识,采用计算机视觉和模式识别技术对汽车车牌的自动识别。
1 车牌识别系统的组成
典型的车牌识别系统由车辆检测、图像采集、车牌识别等部分组成(图1)。车辆检测就是使用车辆传感器或红外线检测等来判断车辆是否通过某一位置。当车辆驶过探测部位时,CCD摄像机拍摄车辆图像,由图像采集卡采集图像并输入计算机。车牌识别部分由计算机和识别软件组成,从由CCD摄像机采集的图像中自动寻找车牌,然后对找到的车牌进行字符切分和识别,最后获得车牌号码,并将识别结果送至监控中心等场合。
图1车牌识别系统的组成
在整个识别系统中,以车牌识别最为关键。识别过程有两个步骤,首先从图像中找出确切的车牌位置,即车牌定位,然后对找出的车牌进行字符切分和识别。车牌识别过程包含两大关键技术:1.车牌区域定位技术;2.车牌字符切分和识别技术。
2 车牌定位技术
图像输入计算机后,系统要自动找出车牌的准确位置。车牌区域定位是车牌字符切分和识别的基础,是提高系统识别率的关键。车牌定位过程包括三个步骤:图像预处理、车牌搜索和车牌纠偏。
2.1 图像预处理
图像预处理的作用:平滑去噪和车牌特征增强。
平滑去噪就是消除图像上由于光照、车牌污损等产生的噪声干扰。平滑方法主要有平均滤波、中值滤波和指数函数滤波等方法。中值滤波和指数滤波平滑效果好且能较好保持牌照和字符边缘,但在平滑效果和处理速度方面不如平均滤波。
通常的车牌定位算法是依据车牌特征从图像中找出车牌,因此必须使车牌区域显示出与非车牌区域不同的独有的特征,车牌特征增强使图像中车牌区域明显突出。通常有下述增强方法:边缘检测法、二值化法、量化法、数学形态学法。
具有不同灰度的相邻区域之间存在边缘,在车牌区域存在车牌边框边缘和车牌字符边缘。边缘检测法就是要检测出这些边缘。有关边缘检测的算法很多,考虑实时性要求,采用简单的微分算子,如一阶微分算等。这些算子采用小区域模板与图像卷积实现边缘检测。文献[1]提出一种牌照字符边缘特征增强的方法,该方法使用线性滤波器函数将每一行中多个连续的水平方向梯度值相加,使得字符的垂直边缘增强。微分算子对噪声较为敏感,因此在使用之前需要平滑去噪。LOG算子是高斯指数平滑法与Laplacian算子相结合的边缘检测方法,既能消除噪声又能很好的突出车牌字符的边缘。
二值化增强法先确定一个阈值,然后将图像中各个像素的灰度值都与这个阈值比较,根据比较结果将整个图像的像素点分为两类,车牌区域归为一类,便于车牌搜索。为了满足实时性要求,采用简单、快速的二值化法,如平均阈值法,反积分自适应阈值法等。
文献[3]使用神经网络来对彩色图像量化,使得车牌区域的字符为一种特定的颜色,然后进行颜色过滤或线扫描,借此提取车牌。该方法首先必须选取车牌样本图像,并且要把RGB颜色模式转换为HSI模式,以HSI各分量值作为输入对神经网络进行训练,再以训练好的神经网络对图像的各像素点量化分类,该方法抗干扰能力强,量化前可不要求平滑,
数学形态学表示以形态为基础对图像进行分析的数学工具,它的基本思想使用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。数学形态学有四种基本的运算:膨胀,腐蚀,开启和闭合。出于以下两个意图而使用形态学方法:1.将开启和闭合结合起来,消除二值化后的车牌区域中存在的细小空洞;2.采用水平线段的结构元素膨胀,使二值化后的车牌区域成为一连通区域。
需要说明的是,上述方法往往不是单独使用,如二值化法是对边缘检测后的图像进行,而形态学方法是在二值化图上实现。不能简单的评价图像预处理方法的优劣,因为这与所对应的车牌搜索方法紧密相关。
2.2 车牌搜索
车牌搜索就是根据车牌区域特征在图像中寻找车牌的过程。根据搜索的方式可把车牌搜索方法分为以下几种:投影统计法、线扫描法、模板匹配法和反Hough变换法等。车牌搜索法要与相应的车牌增强法配合使用(见表2)。
表2车牌增强法用于不同搜索法的情况
投影统计法对边缘化或二值化图像进行水平和垂直累加投影,根据投影直方图呈现的连续峰、谷、峰的分布的特征来提取车牌,或对由形态学膨胀运算后的图像水平和垂直投影,在投影图上寻找波峰和波谷而确定车牌位置。文献[24]提出的采用高斯指数函数对投影图平滑,能有效消除投影图的毛刺,使车牌位置为明显的波峰,提高车牌定位的精度。
线扫描搜索法则是对边缘化或二值化后的图像逐行水平扫描,穿过车牌区域的扫描线因为字符边缘的存在,灰度呈现起伏的峰、谷、峰的变化,或频繁交替出现亮基元、暗基元的特征,以提取车牌。文献[3]用神经网络对彩色图像量化之后,再逐行水平扫描,分别获取颜色向量和长度向量,能与标准车牌区域的颜色向量和长度向量匹配的为车牌区域。
模板匹配搜索法是以特定的模板在图像区域滑动,以与模板匹配的局部区域为车牌。使用的模板有线模板、倒”L”角模板、矩形框模板。线模板以水平线段或垂直线段为模板,来检测车牌的边框角点;倒“L”模板以倒“L”结构为模板来寻找车牌边框的左上角;矩形框模板以一个与车牌长宽比例相当的矩形框作为模板,在整个图像区域滑动,以符合某一判别函数值的区域作为车牌区域。
反Hough变换搜索法是基于车牌形状特征的方法,先对图像进行Hough变换,然后在Hough参数空间寻找车牌的四个端点。
上述搜索法可以结合使用,如文献[25]提出的自适应边界搜索法,先用倒”L”模板寻找车牌边框的左上角,然后用水平线扫描和垂直线扫描找出下边框和右边框。投影统计搜索法和线扫描搜索法处理速度快,能对大小不同的车牌识别,但定位精度不高和出现虚假车牌的情况,需要提高定位精度和去除虚假车牌的后续工作。模板匹配搜索法能比较准确的找到车牌位置,但难以满足实时性要求,可以采用神经网络或遗传算法来加快搜索进程。反Hough变换搜索法除了能准确找到车牌位置,还能确定车牌的倾斜角度,对噪声、轮廓线中断不敏感,但在有直线干扰下可能实效,文献[28]提出的快速Hough变换的策略能满足实时性要求。
2.3 车牌纠偏
由于车辆运行轨迹不定、摄像机位置偏斜等原因,使得图像中车牌扭曲,为了后续正确的车牌字符切分和识别,就须对车牌纠偏,使车牌达到规范的位置和大小。采用的纠偏方法通常先是用Hough变换确定水平边框倾斜角度和垂直边框倾斜角度,然后纠偏。文献[22]提出使用Rodan 变换可用来确定倾斜角度。
3 车牌字符识别技术
车牌定位之后就要对车牌字符识别。这一过程包含下列几个步骤(见图2):车牌二值化,字符切分,字符特征提取和字符识别。这里只讨论后三个步骤。
图2 车牌字符识别步骤
3.1 字符切分
字符切分把车牌上的字符分开,得到一个个的字符图像。常用的字符切分方法有投影法、模板匹配法、区域生长法、聚类分析法等。
投影法把车牌图像垂直累加投影,形成峰谷交替的投影直方图,找到投影图的各个谷就能把字符分开。模板匹配法以字符大小的矩形作为模板,根据字符的宽度初步确定每个字符的起始位置,然后以此模板在初定位置附近滑动,找到最佳匹配位置而切分字符。区域生长法对每个需要分割的字符找一个像素作为生长起点的种子,将种子像素周围邻域中与之相同或相近性质的像素合并到种子像素所在的区域,然后将这些新像素当作新的种子继续进行上述过程,直到再没有满足条件的像素可被包含进来。基于聚类分析的方法对车牌图像从上到下逐行扫描,如属于字符类的两像素间距离小于阈值,可认为两像素为同一字符,由此而得字符像素的聚类。
3.2 字符特征提取和车牌字符识别
目前使用的车牌字符特征提取的方法可归纳为下述三种:1.基于字符统计特征。计算字符图像的多阶原点矩,多阶中心矩以及中心惯性矩,以中心矩与中心惯性矩的比值作为字符特征向量,这样提取的特征量具有平移,旋转和尺度不变性,但运算量大;也有把字符在多个方向上的投影(如水平方向,垂直方向,右斜方向,左斜方向)和二阶中心矩的比值作为特征向量。2.基于结构特征。轮廓特征,粗网格特征,层次轮廓特征以及字符特征点.这类特征提取计算量较少,但对噪声和位置变化比较敏感,需要去噪和对字符归一化。3.基于变换。对原始特征(像素点矩阵)进行傅里叶变换、K-L变换或小波变换等,提取的特征向量反映字符的结构特征和统计特征,相似字符的特征矢量距离较大,效果较好。实际应用中往往是多种特征的提取,多种特征提取方法的使用。
对车牌字符特征提取之后,就把相应的特征值输入分类器识别,目前对于车牌字符的分类识别方法归纳为下列几种。(1)模板匹配。该方法首先对待识字符进行二值化并将其缩放为字符数据库中模板大小,然后与所有的字符模板比较匹配,计算相似度,以最大相似度者为识别结果。(2)PCA子空间分类器。子空间分类器由训练样本相关矩阵的特征向量构成,单个模式的子空间建立彼此独立,相互之间没有联系,以待识别字符的特征向量与所对应的子空间距离最小作为结果。(3)基于人工神经网络。人工神经网络有抗噪声、容错、自适应、自学习能力强的特点。多隐含层的BP神经网络,BAM(Bidirectional association memories)神经网络方法,自谐振ART神经网络识别等是此方法的典范。(4)基于逻辑规则推理的识别方法。文献[18]提出基于归纳推理的字符识别,该方法在训练时自动生成识别规则。(5)基于随机场图像模拟的识别方法。该方法识别率高,并且可对灰度图像直接提取字符特征,抗干扰性强。另外使用感知器的识别,通常感知器只用于相似字符对的识别,作为其他识别方法的补充。
4 总结与展望
从已有车牌识别系统的性能分析来看,正确识别率和识别速度两者难以同时兼顾。其中原因包括目前的车牌识别技术还不够成熟,又受到摄像设备、计算机性能的影响。
现代交通飞速发展,LPR系统的应用范围不断扩宽,对车牌识别系统的性能要求将更高。对现有的算法优化或寻找识别精度高、处理速度快、应用于多种场合的算法将是研究的主要任务。
参考文献:
[1] 廖金周,宣国荣.车辆牌照的自动分割[J].微型电脑应用,1999(7):32-34.
[2] 刘智勇.车牌识别中的图像提取及分割[J].中文信息文报,2000(3):29-34.
[3] Wu Wei,Mingjun Wang.An Automatic Method of Location for Number_Plate Using Color Features IEEE 2001.
[4] 郭捷,施鹏飞.基于颜色和纹理分析的车牌定位方法[J].中国图像图形学报,2002,7(5):473-476.
[5] 章毓晋.图像工程(上)――图像处理与分析[M].清华大学出版社.
篇5
【关键词】测绘;工程建设;数字化技术;量技术
测绘事业的跨越式发展,已成为国家重要的基础地理信息产业,其服务领域也已渗透到社会的方方面面。它为国家建设和管理提供与地理位置有关的各种专题性和综合性的基础信息,其成果是进行环境监测、农业建设、交通、水利等大型工程建设、城乡规划建设、重大灾害监测预报和科学研究以及国防建设等必不可少的基础资料。
1. 测绘工程概述
测绘是采集、量测、处理、分析、解释、描述、利用和评价与地理和空间分布有关数据的一门科学、工艺、技术和经济实体,具有基础性、前期性和公益性和特点。测绘产品是反映地表上的自然、人工要素及其在地理空间的位置和属性信息的,而这些信息是社会发展和经济建设的各行各业需要利用和必须依赖的基础。而工程测绘是把工程地区各种地面物体的位置和形状,以及地面的起伏状态,用各种图例符号,依照规定的比例尺测绘成地形图,或者用数字表示出来,为工程建设的规划设计提供必要的图纸和资料。要测绘的地球表面形态以及地物地貌虽然复杂多样,但其形状和大小均可看作是由一些特征点的平面位置和高程所决定的。测绘工程的主要任务有控制测量,碎部测绘,线路测绘,施工放样,数据处理等工作。
1.1控制测量。
(1)制测量就是在测区范围内建立统一的控制网,以便统一各局部的地形测量工作,使所测的地形图能相互拼接构成整体,而且精度均匀。控制网分为平面控制网和高程控制网两类都遵循从整体到局部、分级布网,逐级加密的原则进行布设。平面控制网常规布设方法有两种,即GPS测量和导线测量。高程控制网常规布设方法有三种,即GPS测量,三角高程测量和水准测量。
(2)平面控制点点位应选在土质坚实的地方或坚固稳定的高建筑物顶面上,便于造标、埋石和观测,并能永久保存。埋高永久性的标石坑底填以砂石,捣固夯实或浇灌混凝土底层。标志中心应具有明显、耐久的中心点。GPS点宜取村名、山名、地名、单位名作为点名,并应向当地政府和人民群众进行仔细调查后确定。同一测区有相同的点名应加以区别。
(3)高程控制网布设范围应与平面控制网相适应。测区内只应建立一个统一的高程系统,应采用1985年国家高程基准或沿用1956年黄海高程系统。首级网应布设成闭合环线,加密网可布设成附合路线、结点网和闭合环。水准路线直以起止地点的简称为线名,起止地名的顺序为“起西止东”或“起北止南”。环线名称取环线内最大的地名后加“环”字命名。水准路线的等级,分别以II,III,IV书写于线名之前表示。水准点编号应自路线的起点开始,按1,2,3……顺序编定点号。
1.2碎部测绘。
(1)碎部测绘就是在测区内用精密的仪器和方法测量地形地物特征点的三维坐标,然后绘制出图形来。现代碎部测绘以数字测绘为主,即数据的采集,存储,传输,计算,绘图等以计算机为核心,人工干预为辅。数据采集过程是一个多源数据集成的过程。外业数据的采集与作业区的自然环境、人文环境、经济发展状况有着密切的关系。地形数据的采集遵循“先控制,后碎部”的原则,范围的划定应尽量以自然线状地物的中心以及行政界线进行划分,确保实地的测绘不重不漏,以保证地形图数据的完整性和准确性。
(2)地形图的绘图要求:第一、绘制轮廓符号应符合下列规定:依比例绘制的轮廓符号,应保持轮廓位置的精度,轮廓内的说明符号,应按图式规定配置。第二、图面注记的配置,应符合下列规定:文字注记应使所指示的地物能明确判读。一般情况下,字头应朝北。道路河流名称,可随线状弯曲的方向排列。第三、居民地的绘制,应符合下列的规定:城镇和农村的街区、房屋,均应按外轮廓线准确绘制;街区与道路的衔接处,应0.2mm的间隔。第四、水系的绘制,应符合下列规定:水系应先绘桥、闸,其次绘双线河、湖泊、渠、海岸线、单线河,然后绘堤岸、陡岸、沙滩和渡口等;当河流遇桥梁时应中断;单线沟渠与双线河相交时,应将水涯线断开,弯曲交于一点。第五、道路网的绘制,应符合下列规定:当绘制道路时,应先绘铁路,再绘公路及大车路等;当实线道路与虚线道路、虚线道路与虚线道路相交时,应实部相交;当公路遇桥梁时,公路与桥梁应0.2mm的间隔。第六、等高线的绘制,应符合下列规定:必须保证精度,不得跑线变形。当单色图上的等高线遇双线河、渠和不依比例绘制的符号时,应中断;当多色图上的等高线遇双线河、渠时,应中断,遇其他地物时,不得中断。第七、境界线的绘制,应符合下列规定:凡绘制有国界线的图,必须符合国务院批准的有关国境界线的绘制规定;境界线的转角处,不得有间断,并应在转角上绘出点或曲折线。
1.3线路测绘。“线路”是管道、道路、渠道及输电线路等的总称。线路测量包括两方面的任务:一是为线路工程设计提供地形图和断面图;二是进行线路工程施工测量。具体内容有:中线测量,根据规划设计的平面位置,将线路工程的中线包括起点、转折点和终点标定于实地,并测定其转向角,设置里程桩,有的还要测设曲线;纵横断面图,以了解其纵向及横向的地面起伏情况;测绘线路沿线一定宽度的带状地形图,供设计和施工用;施工测量,根据施工要求,为不同的施工阶段提供各种测量定位标志;测绘竣工图,供日后管理和维修用。
1.4施工放样。施工放样是把图纸上己设计好的建筑物等按设计要求在现场标定出来,作为施工的依据。
1.5数据处理。数据处理包括控制测量的观测数据的整理,计算,平差等;碎部测绘的原始数据的整理,计算,修改等;属性数据采集后的整理等。
2. 测绘工程的特点及发展趋势
2.1现代测绘工程的特点。现代测绘工程的主要特点概括起来就是“六化”和“十六字”。“六化”即测量内外业作业的一体化、数据获取及处理的自动化、测量过程控制和系统行为的智能化、测量成果和产品的数字化、测量信息管理的可视化、信息共享和传播的网络化。“十六字”是精确、快速、可靠、实时(动态)、遥测(遥控、遥传)、集成、简便、安全。组织测绘工作应遵循的原则是“从整体到局部”、“先控制后碎部”,这样可以减少误差的累积,保证测图的精度,可以分幅或分区测绘,加快测图进度。
2.2现代测绘工程的发展趋势。
2.2.1现代测绘工程的发展趋势:
(1)以测量机器人为代表的智能和自动化系统的广泛应用; (2)基于知识和数据挖掘的工程信息系统; (3)从土木工程测量和三维工业测量到人体医学测量; (4)多传感器的集成和混合系统; (5)GPS、GIS、RS,TPS和激光扫描系统等多S技术集成与融合; (6)大面积空间数据的快速采集和处理; (7)精密数据处理和海量数据处理方面的数学物理建模; (8)信息服务的网络化和可视化。
2.2.2传统工程测量技术的服务领域主要包括水利、交通、建筑等行业,随着计算机、网络技术的发展、测量仪器的智能化,数字化测绘技术得到了广泛的应用,而全球定位系统(GPS)、地理信息系统(GIS)、摄影测量与遥感(RS)以及数字化测绘和地面测量先进技术的发展,测量数据采集和处理的逐渐自动化、实时化和数字化,工程测量的服务领域也应进一步延伸,以满足不断提高的社会需要。
3. 数字化技术在原图处理中的应用
3.1原图数字化处理。
在建立各种GIS 系统时,需要对原有地图进行数字化处理,对于原始地图,若其现势性、精度和比例尺能满足要求,就可以利用数字化仪对其进行数字化处理工作。当前主要有手扶跟踪数字化和扫描矢量化、GPS数据输入三种方法,手扶跟踪数字化需要的仪器为计算机,数字化仪及相关软件,是较早的一种数字化输入方法,输入速度较慢,劳动强度也较大。扫描矢量化是通过扫描仪输入扫描图像,然后通过矢量跟踪,确定实体的空间位置。随着扫描仪的普及和矢量化软件的不断升级,其作业方法越来越趋于自动化,它是一种省时,高效的数据输入方法。GPS输入是依据GPS工具能确定地球表面图形精确位置, 由于它测定的是三维空间位置的数字,因此不需作任何转换,可直接输入数据库,目前主要是应用RTK(Real Time Kinematics-实时动态)技术,它是在GPS 基础上发展起来的、能够实时提供流动站在指定坐标系中的三维定位结果,并在一定范围内达到厘米级精度的一种新的GPS 定位测量方式,通过将1台GPS 接收机安装在已知点上对GPS 卫星进行观测,将采集的载波相位观测量调制到基准站电台的载波上,再通过基准站电台发射出去;流动站在对GPS 卫星进行观测并采集载波相位观测量的同时,也接收由基准站电台发射的信号,经解调得到基准站的载波相位观测量,流动站的GPS 接收机再利用0TF(运动中求解整周模糊度)技术由基准站的载波相位观测量和流动站的载波相位观测量来求解整周模糊度,最后求出厘米级精度流动站的位置。应用这种测量方法测量可以不布设各级控制点,仅依据一定数量的基准控制点,便可以高精度快速地测定图根控制点、界址点、地形点、地物点的坐标,利用测图软件可以在野外一次生成电子地图。同时,也可以根据已有的数据成果快速地进行施工放样。而实际应用得较多的主要是数字扫描矢量化软件,针对大比例尺地形图,大多数扫描矢量化软件能自动提取多边形信息,高效、便捷、保真的对地图进行数字化处理。下面简单介绍MAPCAD软件的原图数字化处理作业流程。
3.2数字化原图作业流程。
由于MAPCAD软件扫描矢量化输入方法具有图像清晰、编辑方便、易于转换等特点一般外设精度都能满足,所以地形图的精度主要取决于人工跟踪精度和输出设备精度,而人工跟踪精度主要取决于作业人员的技能掌握熟练程度和工作态度,所以必须在加强作业人员基本技能培训上下工夫,要求工作人员严格按矢量化方案作业,确保图件的精度和质量高于国家现行数字化测图规范所规定的数字化精度和质量。在工程测量实践中,要做好地形图外业测点与数字化图缩放相结合、符号图层的划分子图、线型符号库的设计等工作保证满足工程进度的同时又节约项目经费,设计出的数字地图简单易用、美观整洁、易于使用地形图的工作人员判读。
4. 数字化绘图
4.1数字化绘图的特点。
4.1.1大比例尺地形图和工程图的测绘是传统工程测量的重要内容,数字化绘图克服了手工绘图存在的许多弊端,如工作量大,作业艰苦,作业程序复杂,烦琐的内业数据处理和绘图工作,成图周期长,产品单一等缺点,符合现代飞速发展的工程需要。目前,数字化成图技术主要有内外业一体化和电子平板两种模式。内外业一体化是一种外业数据采集方法,主要设备是全站仪、电子手簿等,其特点是精度高、内外业分工明确、便于人员分配,从而具有较高的成图效率。
4.1.2具有以下的特点:
(1)一测多用:如在一些综合性较强的工程中需要对同一地形图绘制不同比例尺的地形图,过去的平板测图方法则需要重复工作,而数字化测图则可以同时根据完成的地形图绘制不同比例尺的多个地形图,因为往往小比例尺包含了大比例尺地形图测图范围。仅需先测大比例尺图范围,再补充小比例尺测图范围即可满足各不同专业人员对不同比例尺的地形图的需要。
(2)精度高:数字化成图系统在外业采集数据时,利用全站仪现场自动采集地形地物点的三维坐标,并自动存储,在内业数据处理时,完全保持了外业测量的精度,消除了人为的错误及误差来源,而且外业工作省略了读数、计算、展点绘图等外业工序,减少了作业人员,外业工效大大提高,时间缩短,直接生产成本大幅度下降。
(3)劳动强度:小数字化成图的过程,减轻了作业人员的劳动强度,使生产周期大大缩短,能及时满足用户的要求。
(4)便于保存管理及更新方便:数字化产品既可以存储在软盘上,也可以通过绘图仪绘在所需的图纸上,线条、线划粗细均匀,注记、字体工整,图面整齐、美观。且便于修改,能更好地保证图形的现势性和不变形性,避免重复测绘造成的浪费,增加地形图的实用性和用户的广泛性。
4.2外业数据的采集。
在采集数据时,数据采集人员要准确应用地物代码,以免在内业成图时出现错误;在观测开始时,相关工作人员需严格按照要求应对测站点进行检查,跑尺人员应严格按照自动成图的要求作业,确保能完整地描述地形地貌的特征点,必须通过绘制草图来表明各个地物碎部点的属性及相互关系,测量坎子时,要量取坎子比高,坎下也要进行地形点采集。当一个测区完成后,如果有必要可把数据备份。
4.3绘制内业数据处理。
无论是工程进程各阶段的测量工作,还是不同工程的测量工作,都需要根据误差分析和测量平差理论选择适当的测量手段,并对测量成果进行处理和分析。
5. 工程测量中的数字摄影测量技术
(1)数字摄影测量是基于数字影像与摄影测量的基本原理,应用计算机技术、数字影像处理、影像匹配、模式识别等多学科的理论与方法。就摄影测量本身而言,从测绘的角度上来看数字摄影测量还是利用影像来进行测绘的科学与技术;而从信息科学和计算机视觉科学的角度来看,它是利用影像来重建三维表面模型的科学与技术,也就是在“室内”重建地形的三维表面模型,然后在模型上进行测绘,从本质上来说, 它与原来的摄影测量没有区别。因而,在数字摄影测量系统中,整个的生产流程与作业方式,和传统的摄影测量差别似乎不大,但是它给传统的摄影测量带来了重大的变革。
(2)目前通过在空中利用数字摄影机所获得的数字影像,内业使用专门的航测软件处理,进行的航空摄影测量是大面积、大比例尺地形测图、地籍测量的重要手段与方法,在计算机上对数字影像进行像对匹配,建立地面的数字模型,再通过专用的软件来获得数字地图。该方法的特点是可将大量的外业测量工作移到室内完成,它具有成图速度快、精度高而均匀、成本低,不受气候及季节的限制等优点。特别适合于城市密集地区的大面积成图。但是该方法的初期投入较大,如果一个测区较小,它的成本就显得较高。但可以说是今后数字测图的一个重要发展方向,未来社会要求的是可以提供数字的、影像的、线划的等多种形式的地图产品。并且随着全数字摄影工作站的出现,加上GPS 技术在摄影测量中的应用,使得摄影测量向自动化、数字化方向迈进。
6. 结语