阈值分割的基本原理范文
时间:2023-11-14 17:36:44
导语:如何才能写好一篇阈值分割的基本原理,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
图像分割是根据图像的某些局部特征(如灰度级、纹理、彩色或统计特征、频谱特征等)的相似性和互斥性,将图像分割成若干子区域,在每个子区域内部具有相似(相同或相近)特征,而相邻子区域不相同(互斥性)。因此,图像局部特征的相似性和互斥性是图像分割的依据[1]。
一、阈值图像分割的基本原理
阈值化图像分割是一种最基本的图像分割方法,其基本原理就是选取一个或多个处于灰度图像范围之中的灰度阈值,然后将图像中各个像素的灰度值与阈值比较,并根据比较的结果将图像中的对应像素分成两类或多类,从而把图像划分成互不重叠的区域集合,达成图像分割的目的[2]。
无论是单阈值分割还是多阈值分割,都是选取一个比较合理的阈值,以确定图像中每个像素点应该属于目标区域还是背景区域,从而产生相应的二值图像。
二、传统分割方法
双峰法和最大类方差法区域分割技术, 是图像分割中最重要而且有效的技术之一, 在实际的图像处理系统中得到了广泛应用。这些都只是传统的分割方法,是全局阈值分割中较好的方法。下面我对这两种方法进行简要的介绍。
2.1 双峰法
双峰法是一种典型的全局单阈值分割方法。当图像的灰度级具有较为典型的双峰特性时,选取双峰间的谷底对应的灰度级作为阈值。假如北景的灰度值在整个图像中可以合理看作是恒定,而且所有的物体与背景具有几乎相同的对比度,那么选取一个固定的较好的全局阈值会有一个较好的效果[3]。
2.2最大类间方差法(Otsu)
最大类间方差法又名大津阈值分割法,其基本思路是:选取的最佳的阈值t,该值应当使得不同类间的分离性最好。首先要计算出基于直方图得到分割特征值的发生概率,并以阈值变量t将分割特征值分割为两类;然后求出每一类的类内方差和类间方差;最后选取使得类间方差最大、类内方差最小的t为最佳阈值T,[4]。
三、小波图像阈值分割法
基于小波变换的阈值分割法的基本原理是:先由二进制小波变换把图像的直方图分解为各层次的小波系数,然后按照一定的分割准则和小波系数选取阈值门限,最终利用阈值标出图像分割的区域。整个分割过程是由粗到细,通过尺度变化来控制,起始分割由 子空间上投影的直方图来实现。若分割不理想,则用直方图在子空间的小波系数逐步细化图像分割。分割算法的计算量和图像尺寸的大小是线性关系。
基于小波变换的阈值法图像分割技术能够有效弥补传统的图像阈值法分割方法的不足,具有较强的抗噪声性能,对于直方图为多峰值时,可利用小波的多分辨率特性,合理选择灰度阈值,对图像进行分割处理[5]。
分割算法的计算量与图像尺寸大小呈线性变化,本论文介绍直方图的多分辨率分析。对于每个整数j∈Z(Z整数集合),表示在j分辨率下的二进制有理数。因此,对于任何j∈Z,是一组在实数轴上的等间隔采样点集合,如果ij,则表示高分辨率(较细)的采样点。假定f表示为一幅图像,g是图像f中最大灰度,则直方图表示为
(11)
步骤如下:
步骤1:预设分割区域为M,分解级数,L为图像最大灰度值;
步骤2:小波分解曲线,得到,令j=0,;
步骤3:,将大于j分解层次的系数设置为0,用式(14)重建,在重建直方图中,找出满足和 条件的标号l(灰度),并且统计标号l的个数n;
步骤4:如果n
步骤5:从重建直方图 中,找到阈值;
步骤6:像素值与阈值比较,标出所在区域。
四、实验结果分析
4.1实验结果分析
信噪比是信号与噪声的功率谱之比,但通常功率谱难以计算,有一种方法可以近似估计图象信噪比,即信号与噪声的方差之比。首先计算图象所有象素的局部方差,然后将局部方差的最大值认为是信号方差,最小值是噪声方差,最后求出它们的比值。信噪比越大,说明混在信号里的噪声越小,信号质量越好。
峰值信噪比一般是用于最大值信号和背景噪音之间的一个工程项目。通常在经过影像压缩之后,输出的影像通常都会有某种程度与原始影像不一样。为了衡量经过处理后的影像品质,我们通常会参考PSNR值来认定某个处理程序够不够令人满意。PSNR值越大,就代表失真越少。
通过以上的实验结果和我们对传统阈值分割与小波阈值分割方法的比较我们可以得到以下结论:
全局二值化的方法由于采用的是用一个固定门限值来分割,门限的选取十分重要。这种在对象物和背景灰度值的差较大的时候效果明显,而在光照不均匀和需要提取多个复杂特征的物体的时候难以得到较为理想的效果。自适应二值化方法由于采用了自动取阈值的方法,避免了采用固定阈值的弊病,但是图像分割后局限性太大,效果不佳。
就分割的速度而言,二值化方法一般速度较快,但是二值化后图像信息丢失严重,由此得到的边缘轮廓可能会不精确。因此,可以用速度较快的二值化方法来获得一个关于图像分割结果的较粗略的描述。
篇2
【关键词】数字图像处理 图像分割技术 应用研究
在数字图像处理中,涉及到的技术较多,其中的图像分割技术引起了人们的高度关注,图像分割的方法有千余种。本文接下来对图像分割技术方法分类进行阐述,并对其实际应用进行分析。
1 图像分割技术及其分类
1.1 图像分割技术
人们把自己对图像中感兴趣部分对应的特定区域叫作图像的背景。为实现更好地辨识该目标,需要将目标从图像中分离出去,这是图像分割技术研究的问题。所谓图像分割就是把数字图像划分成为不重叠区域的过程,这些区域具有不相互交叉的特点。图像分割技术将在实践中得到大范围应用。
1.2 图像分割技术方法分类
对于图像分割而言,至今没有一个确定且唯一的标准,分割成功的准则也没有作出明确规定。常见的分割、描述方法包括下面几种。
1.2.1 灰度阈值法实现图像分割
灰度阈值法使用的关键是直方图是否使用合理。该方法的本质是使用合理的阀值去辨别物体和背景。换句话说,也就是图像的灰度值超过一定阀值,那么可确定为物体,否则就是背景。该方法在物体和背景之间的区域分界比较明显的情况下比较适用,也就是说在物体和背景的灰度值差异非常明显的前提之下,这样才好分割。
1.2.2 区域法实现图像分割
区域法实现图像分割的原理是选取区域的方式现分割,该分割法的约束为子区域全部像素灰度相同、子区域不重合且相连接等。
1.2.3 边界法实现图像分割
通过计算一幅图像的梯度大小从而找到边界的图像分割方法。求梯度大小最终是为了要找到图像中灰度变化最大的位置,也就是物体的边界。
1.2.4 边缘法实现图像分割
利用一阶导数的大小检测边缘所在并用一阶导数的方向将小的边缘连结成边界的方法。
2 图像分割技术应用
2.1 在汽车车牌自动识别系统中的应用
车票自动识别系统的实质就是监控大门过往车辆的识别系统,它可自动识别哪些车辆是属于本单位,哪些车辆不属于本单位,从而判断是否需要打开铁门。该系统可提醒工作人员,还可以将新增车辆添加到车辆自动识别系统。该系统具有识别速度迅速、准确率高、耗费成本较低的特征。
2.2 在遥感工程方面中的应用
2.2.1 油库目标的遥感光学图像分割
图像分割技术在遥感工程方面中的应用可大量应用于城市规划和军事上。通过分析光学遥感图像,可对油罐的特征进行识别,这是因为油罐的颜色单一化,而且其形状一般是椭圆状。在对油库检测定位的时候,可使用对椭圆的基于区域生长原理聚类的方法,这是因为油罐目标相对集中而虚假目标相对较离散的分布特征。其基本原理是将椭圆视为像素,将聚集在一起的椭圆通过区域生长聚成一类。使用该聚类方法之后,可以更准确地定位油库区域,计算速度很快。
2.2.2 机场的遥感图像分割
机场附属区域的图像分割可通过机场跑道各波段的灰度特征和直线特征来下手。其操作的基本原理是使用跑道的灰度特征首先针对整个图像二值化,接着做Hough变换。然后针对该变换做统计,从而使机场主干跑道得以呈现。然后,基于此,可继续分割得到机场附属设施区域。实践证明,该算法具有可行性和可实现性。如图1所示。
2.3 在火灾的预防和探测中的应用
从人类诞生以来,人类一直在跟火灾进行斗争。在一些公共场所,火灾的预防和治理一直是一个难题。当前,很多场所使用的是感烟、感温、感光探测器来对火灾进行探测,但是该方法的缺陷是如果场所的面积较大的情况下,这些设备很难发挥其应有的作用。数字图像处理中的分割技术则可以发挥其效用。通过使用该技术,可模拟人眼功能实现人眼功能。该技术可广泛应用于卫星遥感、医疗诊断等领域,经过广泛实践证明,该方法非常有效。图像型火灾探测报警系统通过相关技术对火灾火焰的图像特性进行识别和探测,这样就可以达到自动火灾报警的功能了。
3 结束语
从20世纪八十年代到二十一世纪,图像分割理论进展很缓慢,这是因为该问题的研究比较困难的原因。现在,在数字多媒体时代,图像数字处理成为了一项基本的技术。其中的图像分割技术的新理论和新算法不断出现,其实践应用的发展前景是一片光明的。今后,数字图像处理中的图像分割技术以后的发展趋势可能有三个方向:多方法结合起来使用、加入人工智能技术应用、人机交互。本文对数字图像处理中的图像分割技术在汽车车牌自动识别系统、遥感工程方面、火灾的预防和探测中的应用这些方面的研究可以为该技术的更多应用拓展提供一定的思路参考。
参考文献
[1]刘中合,王瑞雪,王锋德等.数字图像处理技术现状与展望[J].计算机时代,2005 (09).
[2]绍纲.数字图像处理[M].成都:西南交通大学出版社,2001.
[3]高建平,张小东,蒋锐.基于图像处理的交通信息采集[J].重庆交通学院学报,2006.
[4]谭优,王泽勇.图像阈值分割算法实用技术研究与比较[J].微计算机信息,2007,23(08):298-299.
[5]蔡红苹,蒋咏梅,粟毅.一种基于区域生长原理的油库目标聚类定位方法[J].遥感学报2006,10(03):416-420.
[6]李红俊,韩冀皖.数字图像处理技术及其应用.计算机测量与控制,2002,10(09).
作者简介
宋美萍(1988-),女,黑龙江省大庆市人。硕士学位。现为东北石油大学讲师。研究方向为图像信息处理。
篇3
关键词:计算机视觉分析;微小尺寸;精密校正;阈值;图像分割
中图分类号:TP274.4
计算机视觉分析理论是基于精密模式识别和人工智能程序化校验技能进行综合整编的方法,利用光学信息对真实物理结构的实时反映,配合人机协调手段进行二维图像的呈现。在工件表面进行质量检测和图片制备要素分析的系统环节中,阐述物体在空间环境之间的关系样式,争取三维场景的科学搭建。集合要素内容包括边缘、线条和曲面的配备,建立以工业部件为中心的坐标体系,并适当运用不同符号表现模式实现必要三维结构和空间关系的调整,促进精密仪器细节检验工作质量的不断提高。
1 计算机视觉检测技术的相关理论研究
1.1 技术原理分析
渗透性计算机辅助支持结构的视觉鉴定技术在被测实体中的图像显示支持功能基础形势上进行质量状况的把控,这其实就是根据既定的偏差标准实现规模物件的逐个排查。细致的检测工作在深度零件的诱导性特征和完整性配件的支持下,对整体完好效果的几何制备模型进行测量[1]。近阶段的视觉规范系统利用电耦合器件和摄像机进行主题元素的捕捉,并利用计算机内部程序的数字信号转化工具实现图像的并行处理。采用目标图像的特殊坐标记录,利用灰度分布图内的多种综合功能处理系统改善的要务。常规视觉下的检测过程相对比较繁琐,主要是将被检测物体放置于照明效果相对均匀的可控制背景环境中,联结CCD技术和图像卡实现被测部件和数字图像的共性要素融合,保证计算机自动化处理程序的录入。当然,这类研究系统是需要利用相关软体进行放大的,其主要必备功能就是进行图像的预处理、识别和有效分析,将整个过程内部的实际结果数值,包括被测部件的自身缺陷、尺寸等进行整理。
1.2 计算机视觉微小尺寸精密检测工业应用技术的现状
在科学设计信息内容和工业加工制备要领集成化对待的环节中,通常不会直接进行部件表面的接触,一般运用计算机程序下的扫描认知和图像即时呈现功能进行快速的比对检测,整体信号抗干扰能力较强,因此在现代工业生产技术领域内部广受好评。电子工业是在建立计算机视觉分析工艺之后表现最为活跃的行业类型,在此基础上衍生的印刷电板路和集成电路芯片就是利用标准模型的整改,实现规模工序的紧密排列。目前,时下流行的汽车生产、纺织、商品包装等也逐渐向这类手段靠拢,全面改善了现代化工业制备的应用效果。
2 应用视觉微小尺寸分析技术内部拓展机能的补充
灰度图像的主要分割方法包括灰度阈值校正、边缘检测制备等手段。
2.1 灰度阈值校正
这是区域分割方法中一种常见的手段,主要配合多个或单个阈值将图像自身的灰度级别划分为几个项目组,对相同像素的单位数据进行整编。根据实效范围进行分类,包括局部和全局阈值探究两种手段,全局规模下的阈值分析方法就是利用整幅图的灰度直方分布图进行内部最优阈值分割,包括单阈值和多阈值两种形式;同时还可以将初始分析的图像进行子元素的拆解,之后利用单个子图像的既定阈值范围进行最优化分割[2]。分割的基本原理公式为:
其中,合理阈值的选取是非常重要的,目前阈值确定的手段主要包括直方图双峰对照法和最大类间方差累积法等。这种利用灰度阈值实现精准质量的划分手段,计算执行工作相对比较简单,并且实际工作效率水平较高,即便是实际需要分割的物体与图像背景对比深度较强也可以收放自如,但唯一的缺点就是缺少对空间信息的掌控,涉及亮度不足的图像问题,这种阈值分割技术的施工质量往往不会太高。
2.2 边缘检测制备工序
图像内部元素的分割其实就是进行部件边界效益的提取,而边缘检测制备工序则是利用像元及邻域的整体状态进行物体边界相关结构的搭建。边缘检测分割制备技术具体包括并行和串行两种模式,并行手法是运用梯度信息的提取实现不同类别算子的整理;串行边界分割原理则是根据适当强度标准和相似走向的两个边缘端点位置实现连接,主要代表算法包括启发式智能搜索手段等。这种串行算法较并行边界积累统计原则来说具有更强的抗干扰能力,但实际的边缘检测同样不能完好地维持连续效果,需要利用其余技术内容进行边缘制备技巧的修复。
(1)原始图像 (2)Robert算子边缘检测 (3)Sobel算子边缘检测
(4)Prewitt算子边缘检测 (5)Kirsch算子边缘检测 (6)Gauss-Laplace算子检测
图1 微小双联齿轮边缘检测
3 视觉检测系统的创新性改进
根据以上现状问题,创新式视觉整改校验系统利用照明光源、摄像机和图像采集卡等结构实现计算机输出结果质量的补充。其主要运行过程如下:利用被测部件在均匀照明背景的全面优化控制基础,实现物体结构的全面清晰呈现,使用摄像机对相关图像信号进行梳理并转化为电荷信号,配合相关的图像资源采集卡进行部件数字化图像的格式转化;计算机内部软体操作程序将得到的数字图像进行处理和识别,并将最终结果数据输出,实现现代工业技术整体质量规模控制的既定要求。
系统硬件在实现部件转化图像信息的环节中,连接检测机理下的连续软件规划和照明光源等相关设备进行图像适当分辨率的调整,维持图像较为清晰的对比效果。全面控制获取数字图像的时间,抵抗不良因素的干扰影响,维持内部成本经济规模的合理控制,促进科技应用和可持续发展经济战略双重价值标准的同步进展。其中,光源设备的选择必须落实到部件既定的几何形状条件下,利用相关性能参数进行实际工作要求的提供,包括光源位置、亮度、寿命特性等因素的堆积,常用的可见光源包括水银灯、荧光灯等,但这类光源使用寿命有限,因此现下多配用LED光源进行快捷反应、小功耗标准的补充,并且长期使用后的照明效果比较稳定[3]。而摄像机等结构主要还是校正参数的表达方式,进行图像合理分辨率的整改,促进图像采集数字化协调功能的发展,提高系统工作速度等。
4 结束语
计算机视觉检测系统在进行一定部件性能评比的活动中有着很高的贡献,不仅配合硬件的照明、参数制备要领制备功能,同时促进数字化图像对比的速度,使得工业生产环节中的部件检查工序得到大范围整改,满足可持续发展战略规模的视觉意义,促进现代智能化分析处理技术的全面覆盖。
参考文献:
[1]陆春梅.基于数字图像处理技术的接杆激光环焊焊缝视觉检测系统研究[D].上海交通大学,2008.
[2]罗敏.基于机器视觉的黑片缺陷检测图像边缘提取算法研究[D].沈阳理工大学,2010.
篇4
关键词:遥感影像;车辆提取;交通检测
中图分类号:TP751 文献标识码:A 文章编号:1009-3044(2016)36-0173-02
1 前言
当前,遥感技术迅速发展,高分辨率遥感影像的研究工作更加广泛且有效,由于其清晰度高、信息存储丰富以及现实性强等特点,使得遥感影像已成为人类获取地球空间信息的重要数据源。同时基于高分影像对小尺寸的目标提取逐渐成为研究热点,如对车辆目标的识别,依据目标的光谱特征、空间几何特性等获取道路车辆的点信息,从而利用一定范围内点密度信息的分析对城市地区拥堵问题具有实际应用价值。但由于影像存在复杂的结构使本身所包含自然特征和人工地物的关系繁琐,提取信息会受到各类噪声的影响,例如在本文针对北京城区交通道路上车辆提取的研究中,诸如路面上的交通线、建筑物、绿化树木的阴影、行人等路面噪声变得不可忽视,因为这些噪声所带来的误差使所提取的车辆信息不完整且存在个别错误。
2 技术原理
车辆信息的提取工作主要是利用了遥感影像中车辆所具有的光谱特征和块状特征。块状特征即遥感影像中的车辆所表现出来的规则的大小方块,车辆的形状近似矩形,而且面积偏小且范围集中,车顶的纹理材质也与周围地物有所区别,故利用其矩形方块特征能很好与道路分界护栏、交通车站站顶等区分开。然而,在遥感影像的获取和传输过程中,噪声及光照等不可避免地会使影像丢失一些细节,从而造成了图质退化,对于后期图像信息的提取和处理影响较大,故而对影像的增强处理必不可少。该操作可以有效改善影像质量,对影像中某些特性的视觉增强效果显著。然后,经过低通滤波处理,可以去掉影像中一些高频的噪声点,再恰当地使用锐化高通滤波突出边缘特征,更加方便后续车辆信息的提取工作。
接着,对试验区域的车辆信息采用影像分割技术进行提取,目前所知的图像分割方法有基于区域分割方法、阈值的分割方法、边缘检测方法等,而本文基于envi的车辆提取研究主要采用基于边缘的分割算法,这种算法计算效率高,而且要产生多尺度分割结果仅需一个输入参数。在进行分割操作时,首先要_定分割阈值,由于分割后的图斑多少与尺度的选择紧密相关,为了能尽量分出很少的图斑通常选择高尺度影像分割。分割效果的好坏一定程度决定了分类效果的精确度,通过不断的试验选择一个理想的分割阀值,通过选取合适的阈值可以去除很多零散的噪声点,尽量分割出较好、较完整的边缘特征,其基本原理是通过不同阈值的设定,将影像的像素点拆分若干类。在整个过程中,较难处理的就是图像平滑过程中会隐去一些边缘信息,而锐化过程又会增加很多不必要的噪声,在多次实验中发现依经验手动选取阈值的效果往往比较好。
最后,要提取出感兴趣的车辆信息,使用边缘提取算法效果不错。在基于envi的实验中采用了基于边缘检测分割,较完整的提取出道路中的车辆信息,包括其中较暗的一些车辆,可以达到最佳效果;而如果采用基于亮度的检测算法则会漏掉许多光谱信息不满足的车辆,造成实验效果的不准确、不理想。
3 技术流程
对影像通过rpc矫正、配准和融合后,即可通过特征提取方法对高分遥感影像中较拥堵路段的车辆进行提取。此部分选用2015年2月17日上午11时22分影像中崇文门内大街路段作为试验对象,展开本文的研究。
1)对影像中崇文门内大街区域的车辆信息进行增强操作。为减少错误提取及漏检率,提高车辆提取操作的准确性,我们需要采用影像增强的办法突出影像中一些较暗的车辆信息,并加强车辆与其他地物的差别。根据试验要求,我们采用了直方图均衡化、线性滤波及同态滤波三种增强方法进行试验比较,以选择效果较好的一种作为试验依据。通过试验发现,利用直方图均衡化方法处理影像后,影像的整体亮度增加,原本较暗的车辆信息变得明显,但是由于直方图处理是整体拉伸凸显的灰度,所以在原本较亮的车辆周围的地物也变得比较亮;而同态滤波对影像的增强操作效果也不错,与直方图处理相比,仅仅是车辆的信息更明显,这主要是因为反射量在不同地物的交界处是急剧变化的,但是在车辆周围产生了许多细小的噪声点,这些噪声点对车辆的提取也会有一定程度的阻碍;线性滤波增强较之前两种方法产生的噪声点相对较少,并较好反映了车辆与地物的光谱差别,而车辆信息的显示效果也有明显的增强,故通过比较认为,选用线性增强的方法更为适合。如下图1、图2所示,未经线性增强和经线性增强后的影像中的车辆信息明显度差别较大:
2)对所选影像区域进行图像分割。该实验根据临近像素亮度、颜色、纹理等对影像进行分割,通过基于边缘检测的算法较好完成了图像分割的操作,如图3所示。
3)在完成对影像的分割操作后,接着提取该影像的总车辆特征。在试验中,为提取得到车辆信息,主要利用了与几何形状、面积等相关的特征以及光谱、纹理特征。 在多次试验中,首先使用矩形度和面积等特征找出影像中与车辆面积和形状相近的对象,再利用光谱特征进一步优化提取要素,发现一些前两步没有找出的对象,最终得到试验区域(崇文门内大街)整体的车辆提取shp文件,如图4所示。
在特征规则的选取过程中,要达到较好的效果,一定需要反复多次细致地调节参数,得到信息提取效果图如图5所示。
通过基于规则的特征提取方法得到如上图的提取结果后,接下来便是对车辆信息进行量化分析,以判断该条道路上的交通拥堵级别。该部分试验主要基于arcgis的空间分析功能,载入对崇文门内大街试验影像进行提取操作后所得到的车辆信息shp文件,利用feature to point工具将车辆的面状信息转化为点信息,如图6所示:
4 结论
本论文以高分二号遥感卫星影像作为研究来源,采用边缘检测算法和规则分类办法对道路车辆信息进行提取,并利用该提取信息进行空间分析得到道路交通拥堵状况。从实验结果看,高分辨率遥感影像通过线性增强后排除了噪声影响并强化了车辆与其他地物的灰度差别,后采用边缘检测算法分割影像能更有效地提取车辆信息,结果的正确率和识别率都保持在80%以上。但是,现阶段在高分辨率遥感影像上提取车辆信息依旧面临较多问题,试验中发现,在对一定范围内、特定时刻的车辆信息的提取过程中,在树荫、楼房阴影、立交桥上车量信息在影像上是看不见的,在某些对比度很高的影像上,如果车辆正好处于房屋的阴影区,也是很难被检测到的。所以在这些方面,还需要某些特定的算法对影像对象的特征进一步的试验和总结。
参考文献:
[1] 张素兰.基于卫星遥感影像的交通状态判别研究[D].北京交通大学,2010.
篇5
关键词:机器视觉;四轴飞行器;位姿估计
DOIDOI:10.11907/rjdk.171358
中图分类号:TP319
文献标识码:A 文章编号:1672-7800(2017)006-0120-04
0 引言
视觉导航技术具有设备简单、信息量大、抗电子对抗和无源性强等特点,其作为自主飞行器的辅助导航技术已经受到业界人士的高度重视,是目前无人飞行器导航技术领域中的研究热点。机载摄像机是飞行器的“眼睛”,通过它,飞行器可以实现避障、位姿估计以及目标识别等。因此,将计算机视觉运用行器辅助导航具有明显优势[1-2]。
基于特征点的视觉导航方法,是近年来视觉导航领域研究较为活跃的内容之一。其基本原理为:将摄像机装载在飞行器上,并在参考目标上预先设置已知的特征点,通过提取已知特征点对应的图像坐标,根据摄像机透视投影模型,实时估计出摄像机相对于参考目标的位置姿态。
本文设计了由3个黑色正方形和1个黑色三角形组成的平面着陆目标图案,以正方形和三角形顶点为图像特征点,提出了一种基于平面单应性变换的图形特征点实时提取标记方法,利用提取的特征点图像坐标及对应的世界坐标,实时估计摄像机的位置参数,将其作为飞行器视觉导航信号。
1 着陆标志物及特征点标记
本文设计的着陆图案如图1(a)所示。着陆图案的边长为60mm,其中小正方形的边长为20mm,等腰直角三角形的直角边长为20mm。在着陆图案中,黑白相间的角点即为设计的特征标记点集。着陆图案可以分成4个部分,形状包括两种类型:I型和II型。如图1(b)所示,定义着陆目标图案的中心为世界坐标系原点,类型I的区域中心处于世界坐标系的X轴正半轴,类型II的区域中心依次分布在其余轴线上,采用右手法则来确定Z轴,可以看到各特征点在世界坐标系中的坐标是明确的。
针对所设计的着陆目标图案,图像处理的目的是确定标志点的位置,然后提取和标识出这些特征点。本文中的图像处理算法流程如图2所示,这里首先使用摄像机获取图像,然后对图像进行预处理,主要包括图像滤波、阈值分割等,最后检测与提取特征点,使用标记算法对其进行标记。
主要算法如下:
(1)阈值分割。阈值分割是指根据像素的灰度、颜色、纹理等特性按照一定的原则将一副图像或景物分割成若干个特定的、具有独特性质的部分或者子集,并提取出感兴趣目标的技术和过程。阈值分割后图像如图3(b)所示。
(2)边缘检测。边缘是不同区域的分界线,是图像局部强度变化最显著的那些像素的集合。本文边缘检测的目的是提取图像中3个四边形的边缘和1个三角形的边缘。边缘提取后图像如图3(c)所示。
(3)角点检测。图像中的角点是指图像中具有高曲率的点,本文使用的是Harris角点检测算法[3]。角点检测后图像如图3(d)所示。
(4)分割标志图案上的三角形。首先筛选出连通区域轮廓,对提取的轮廓进行直线简化,然后计算4个区域轮廓的周长为:Ci(i=1~4)。搜索4个周长中的最小值min(Ci),则min(Ci)所对应的区域I即为三角形区域。
3 实验
得到特征点的像素坐标系的坐标(u,v)及世界坐标系的坐标(xw,yw,zw)后,根据两步法标定原理,利用Matlab/GUI工具 [9],得到位姿估计模型GUI界面如图6所示。
本文采用如下方案来验证所建立的位姿估计模型的正确性[10],在着陆目标平板上绘制两个相同的特征图案,如图7所示,设定它们的距离分别为100mm、150mm、200mm、250cm和300mm。
将摄像机(摄像机为Prosilica GT2750 CCD工业相机、16mm镜头,图像大小为像素)固定在着陆目标图案的上方对该着陆目标图案进行拍照,然后利用上述位姿估计模型解算出相对位置估计测量值,得到表1的测量结果。由表1可知,位置估计误差在11mm以内,本文建立的位姿估计模型基本满足位置估计要求。
4 结语
本文以飞行器自主着陆阶段为研究对象,根据摄像机透视投影成像关系,建立了飞行器视觉位姿估计模型,设计了一种着陆目标图案,并对其进行图像处理、角点提取和特征点标记,利用两步法摄像机标定原理对摄像机位姿进行了解算,使用Matlab/GUI工具对该算法加以实现,最后利用实验室现有的条件对其进行了验证。结果证明,本文提出的图像处理及相关位姿估计算法具有一定的导航精度。但是由于需要进行大量的图像处理,耗时较多,还很难满足飞行器自主着陆阶段实时性的要求,因此缩短图像处理时间将是后续研究的重点。
参考文献:
[1]SRIKANTH SARIPALLI,JAMES F MONTGOMERY,et al.Vision-based autonomous landing of an unmanned aerial vehicle[C].Proceedings of the 2002 IEEE International Conference on Robotics & Automation,2002: 2799-2804.
[2]COURTNEY S SHARP,OMID SHAKENIA,S SHANKAR SASTRY.A vision system for landing an unmanned aerial vehicle[C].Proceedings of the 2001 IEEE International Conference on Robotics & Automation,2001:1720-1727.
[3]赵文斌,张艳宁.角点检测技术综述[J].计算机应用研究,2006,10(1):17-20.
[4]邱力为,宋子善,沈为群.用于无人直升机着舰控制的计算机视觉技术研究[J].航空学报,2003,24(4):351-354.
[5]TSAI R Y.An efficient and accurate camera calibration technique for 3D machine vision[C].In Proc.CVPR,1986:364-374.
[6]w明.基于图像的物体尺寸测量算法研究[J].软件导刊,2016,15(11):48-52.
[7]樊冬雪.四轴飞行器视觉导航系统的设计[J].计算机技术与用,2014,40(8):140.
[8]阮利锋.小型无人直升机自主着陆视觉导航系统设计及仿真[D].上海:上海交通大学,2009.
篇6
【关键词】四帧差分 边缘检测 阈值分割
1 引言
运动目标检测处于智能视频监控系统的最底层,其检测结果的好坏将直接影响后续的处理效果,故其技术发展和应用前景受到广泛关注。目前常用的运功目标检测算法有:背景差分法、光流法及帧间差分法。背景差分法能够较完整的提取出运动目标,但对光照及外部条件引起的动态场景变化过于敏感;光流法是基于对光流场的估算进行检测分割的方法,计算复杂,须有特殊硬件设备支持,实时性差;帧差法是根据图像中像素点的灰度差计算出运动物体的位置和形状等信息,这种方法对于动态环境有很好的适应性,算法简单,易于实现,但不能提取出较完整的运动目标。
视频图像的边缘信息抗干扰性能好,其不易受亮度突变及噪声的影响,因此本文融合图像边缘信息与四帧差分对运动目标进行检测,计算简单,实验结果表明该算法可以有效改善传统帧间差分算法出现的空洞现象。
2 融合边缘检测的四帧差分运动目标检测
2.1 预处理
众所周知,灰度图像的处理效率高于彩色图像,因此首先对图像进行灰度化。另外,图像获取过程中不可避免的存在诸如斑点噪声及椒盐噪声等一系列噪声影响,为了有效抑制噪声影响,本文采用中值滤波法对原始图像进行滤波处理。最后本文采用直方图均衡化及梯度化操作,使得图像轮廓更为清晰,以增强抗干扰能力。
2.2 Canny 边缘检测算法
边缘作为图像的最基本特征广泛存在于目标物与背景之间、目标物与目标物之间,在图像处理中有着重要的作用和广泛的应用。目前常用的边缘检测算子包括 Robets 算子、Sobel算子、Prewwits 算子、 Log 算子、二阶Laplace 算子等。这些算子简单,易于实现且具有很好的实时性,但抗干扰性能差,对噪声较敏感且边缘的精度有待提高。基于最优化算法的 Canny 边缘检测算子,是先采用高斯函数对图像进行平滑处理,再进行边缘检测,提取的边缘线形连接较为完整,定位准确性较高,效果较好。本文采用此方法对序列帧图像进行边缘提取。.
Canny算子的基本原理是通过查找图像梯度强度局部的最大值的方法来得到边缘信息,图像梯度的计算采用Gauss滤波器。为了消除噪声干扰、提高边缘检测的精度,Canny采用双阈值来提取边缘像素点。如果梯度强度不满足高阈值的检测条件,但是与己检测出的较强边缘点相连接,并且满足低阈值条件,则确定为弱边缘点。双阈值法使得采用Canny算子提取边缘点更具有鲁棒性。
Canny算法的实现步骤如下:
(1)高斯滤波:选取合适的Gauss窗函数和尺度,用Gauss滤波器对需要处理的图像进行平滑滤波,得到平滑图像;
(2)梯度计算:用一阶偏导的有限差分来计算梯度的幅值和方向;
(3)量化梯度方向:对梯度方向进行量化,使其只有8个方向,即0?、45?、90?、135?、180?、225?、270?、315?;
(4)梯度非最大值抑制:对于每一个梯度强度非零的像素点,查找沿其量化后的梯度方向的两个相邻像素点,然后通过阈值判断为非边缘点还是候选边缘点;
(5)双阈值判决:设定双阂值,进一步判断候选边缘点为强边缘点、弱边缘点还是非边缘点;
(6)边缘连接:对于弱边缘点,如果它与强边缘点在8连通区域相连,则该点记为弱边缘点,同时将其边缘提取置为1,所有标记为1的点就成了最后的边缘。
2.3 连续四帧差分算法基本原理
传统的三帧差分算法虽然能够快速检测出运动目标的轮廓,但其所检测出的轮廓往往不连续且存在较大的空洞现象,同时传统三帧差分算法不能完整提取目标信息。本文采用如下改进帧间差分法,即连续四帧差分算法,可以在一定程度上克服传统三帧差分算法的不足。设预处理后的连续四帧图像f1(x,y)、f2(x,y)、f3(x,y)、f4(x,y),首先分别将f1(x,y)与f3(x,y)以及f2(x,y)与f4(x,y)做差分运算,得到差分结果:
(1)
(2)
然后将差分后的结果D1与D2二值化处理后进行“与”运算,得到结果DA=D1D2,“与”运算能够有效的克制目标重叠现象。
2.4 本文算法
本文算法融合图像边缘信息与四帧差分对运动目标进行检测,首先采用Canny边缘检测算法快速提取连续四帧图像的边缘图像,然后利用四帧差分算法得到较为完整的运动目标轮廓,最后通过后期一系列处理提取出准确完整的运动目标区域。本文算法整体流程如图1所示。
2.5 形态学处理
由于干扰因素的存在,导致我们得到的二值化图像中往往会出现噪声及空洞,可以通过数学形态学对其进行后处理。首先采用腐蚀运算消除二值图像中的孤立噪声点,再采用膨胀运算来填充运动目标的边缘空洞。
3 实验对比
本文采用 Matlab 进行仿真实验,为验证算法的有效性,分别利用传统三帧差分法、四帧差分法以及本文算法对同一组 AVI 视频序列图像进行测试。检测结果如图2所示。
分别采用传统三帧差分算法、四帧差分算法及本文算法对原始图像进行处理,原始图像中右边白色衣服人物是静止不动的,处理结果如图2所示。由图可知,采用传统三帧差分算法检测到的目标轮廓不连续,四帧差分法得到的图像目标轮廓更清晰,内容更为丰富,但轮廓依然不完整,而采用本文算法检测得到的目标轮廓更加完整清晰,结果准确。
4 结论
本文融合图像边缘信息与四帧差分对运动目标进行检测,首先采用Canny边缘检测算法快速提取连续四帧图像的边缘图像,然后利用四帧差分算法得到较为完整的运动目标轮廓,最后通过后期一系列处理提取出准确完整的运动目标区域。实验结果表明本文算法能够快速准确检测出运动目标,进一步改进了传统三帧差分目标轮廓不连续现象,计算简单,可满足实时性检测需求。
参考文献
[1]罗志升,王黎,高晓蓉,王泽勇,赵全轲.序列图像中运动目标检测与跟踪方法分析[J].现代电子技术,2009.
[2]蒋.人体运动目标检测与跟踪关系问题研究[D].中南林业科技大学,2013.
[3]刘辰飞.智能视频监控系统中运动目标的检测与跟踪[D].济南大学,2012.
[4]舒欣,李东新, 薛东伟.五帧差分和边缘检测的运动目标检测[J].计算机系统应用,2014,23(1).
[5]许录平.数字图像处理[M].北京:科学出版社,2007.
[6]张德丰.MATLAB 数字图像处理[M].北京:机械工业出版社,2009.
[7]邵广安.视频监控中运动目标检测与跟踪方法的研究[D].南昌大学,2013.
[8]赵洁,李玮,郝志鹏,彭慧卿.基于改进 Canny 算子与图像形态学融合的边缘检测方法[J].微型机与应用,2011,30(10)
作者简介
张鹏(1988-),男,现为西华大学电气信息学院硕士研究生。主要研究方向为信号与信息处理、图像处理。
李思岑(1989-),女,现为西华大学电气信息学院硕士研究生。主要研究方向为嵌入式技术及应用、图像处理。
杨燕翔(1963-),男,现为西华大学电气信息学院硕士生导师。主要研究方向为现代信号处理、嵌入式技术及应用。
篇7
关键字:计算机视觉; 公路标识线; 图像分割; 数学形态学; 识别
1.引言
20世纪80年代,伴随着与机器人技术密切相关的计算机、电子、通信技术的飞速发展,智能车辆进入了深入、系统、大规模研究阶段并且取得了突破性的发展[1,2],如国外的有德国的VaMP车辆系统[3]、美国的NavLab系统[4,5]等,国内的有清华大学的THMR-V[6]、吉林大学最新研制的JLUIV-IV等。在智能车辆导航技术方面,计算机视觉系统与初期的地下埋电缆的方式以及道路中间铺设磁块导航的方式等相比有着价格低廉,用途多样,结构简单,能方便与其他传感器进行数据融合等特点,所以有着广泛的应用前景。智能车辆导航的第一步是道路的检测与识别。高速公路运输的高效率、大运量、低成本等优势使研究智能车辆面向高速公路的道路的检测与识别算法很有必要。道路识别就是分析智能车辆的预瞄图像,检测出车辆相对于车道的偏差,并将偏差信息送给车辆系统,从而实现汽车“防偏安全行驶”。本文描述的一种对预瞄图像进行图像分割、数学形态学滤波、轮廓提取,改进的区域填充等识别出道路标识线的算法,实验表明具有良好的实时性、可靠性。
本文所用的图像处理方法并不需要考虑图像降质的原因,只将图像中感兴趣的特征能有选择地突出,衰减其不需要的特征。为了减少运算时间我们首先将图像由24位的RGB格式转为256色的灰度图像,整个实验的处理流程如图1所示,下面分别阐述各部分的原理。
2.1 图像分割f (x,y)
图像分割是对图像进一步分析、识别的前提,分割的准确性将直接影响后续处理技术的有效性。图像分割的方法有多种,比如阈值分割,区域分裂与合并以及区域生长等。本文选用的是阈值分割,阈值分割时最常用的一种图像分割技术,其特点是操作简单,基本原理是通过设定不同的特征阈值,把图像像素点分为若干类。设初始图像为f (x,y),按照一定的准则在f (x,y)中找到特征值T,将图像分割为两个部分――前景或者背景,分割后的图像为:若取b0=0(黑),b1=1(白)即为我们通常所说的图像二值化。然而T的选择将直接影响分割的准确性以及由此产生的图像描述、分析的正确性。确定T的方法有多种,比如直方图变化法,Otsu法,迭代阈值算法等。本文主要研究并实现了迭代阈值法[7],算法步骤为:
2.2 数学形态学
腐蚀是一种最基本的数学形态运算,其作用是消除物体边界点,使边界向内部收缩过程,可以把小于结构元素的物体去除。这样选取不同大小的结构元素,就可以去除不同大小的物体。每当在目标图像中找到一个与结构元素相同的子图像时,就把该子图像中结构元素的原点位置对应的那个像素位置标注出来,目标图像上被标注出来的所有像素组成的集合,即为腐蚀运算的结果。其实质就是在目标图像中标出那些与结构元素相同的自图像的原点位置的像素。设a为目标图像,b为结构元素,则目标图像a被结构元素b腐蚀的数学表达式为:
其中,x表示集合平移的位移量, 是腐蚀运算的运算符。
膨胀是数学形态学的另一种基本运算。膨胀的作用与腐蚀刚好相反,其作用是是对二值化物体边界点进行扩充,将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程。如果两个物体之间的距离比较近,则膨胀运算可能会把两个物体连通到一起,膨胀对填补图像分割后物体中的空洞很有用。其实质就是先对结构元素b做关于其原点的反射得到反射集合bv,然后在目标图像a上将bv平移x,则那些bv平移后与目标图像a至少有一个非零公共元素相交时,对应的原点位置所组成的集合就是膨胀运算的结果。
设a为目标图像,b为结构元素,则目标图像a被结构元素b膨胀的数学表达式为:
其中,x表示集合平移的位移量, 是膨胀运算的运算符。
开运算也是数学形态学中的一种基本运算,使用同一个结构元素对目标图像先进行腐蚀运算,再进行膨胀运算的过程。原图经过开运算后,能够去除孤立的小点、毛刺和小的连通区域,去除小物体,平滑大物体的边界,同时并不明显改变面积。设a为目标图像,b为结构元素,则结构元素b对目标图像a的开运算数学表达式为:
2.3 轮廓提取与边界跟踪
轮廓提取的目的是获取目标区域的外部轮廓特征,为形状分析和目标识别做准备。二值图像的轮廓提取算法很简单,就是掏空目标区域的内部点。假设图像的目标像素是白色,背景像素是黑色,则如果图像中的某个像素为黑色,且它的8个邻点都是黑色时,表明该点是内部点,否则是边界点。将判断出的内部像素置为背景色,对所有内部像素执行操作便可完成图像轮廓的提取。所谓的边界跟踪就是依次记录下边界上的各个像素,是按照某种顺序依次找出物体上的其余像素,直到又回到起始点,完成整条边界的跟踪。本文按照从左到右,从上到下的顺序扫描图像,找到目标物体最左边的边界点P0,显然,这个点的左侧及上侧都不可能存在边界点,因此不妨从左下方向逆时针开始探查,如左下方的点是黑点,直接跟踪至此边界点,否则探查方向逆时针45度,直至找到第一个黑点为止,跟踪至此边界点。找到边界点后,在当前探查方向的基础上顺时针回转90度,继续用上述方法搜索下一个边界点,直到探查又回到初始过程的边界点P0,则可完成整条边界的跟踪[8]。
2.4 种子区域填充
种子区域填充就是在已有的边界内取一点,从改点开始填充整个边界包围的区域,取得该点就是“种子”。对于4连通的边界,其围成的内部区域是8连通的,而8连通的边界围成的内部区域却是4连通的。其算法概要如下:
种子的选取时种子区域填充的关键所在,一般的情况下是将种子点选在图像的中间或通过人工选择种子点,这些都不能满足智能车辆的要求。由于本文研究的是高速公路的道路识别,因其道路平坦,障碍物少等原因,我们可以通过先验知识将车载摄像头的角度调制到一定角度以减少我们不感兴趣的区域。本文通过研究与实验发现将种子点设置为高度的1/2,宽度的1/5能达到本文的要求。具体效果在实验分析可见。
3.实验结果与分析
在进行图像分割后可以获得道路的二值图。图2针对此二值图依次进行数学形态学滤波,轮廓提取与边界跟踪,种子区域填充,开运算去除噪声。下面是每步运行完的效果图以及最终的道路标志线识别图。
4.结论
本文对车载摄像系统采集的图像进行图像分割、数学形态学滤波、轮廓提取,改进的区域填充等算法识别出道路标识线,通过调节车载摄像机的角度获取感兴趣区域,减少图像处理时间和提高道路识别的可靠性。实验表明,该算法在弯道和直道的道路标志线的识别具有良好的实时性、可靠性。
参考文献
[1] Figueiredo L, Jesus I,Machado, J A T_ Towards the development of intelligent transportation systems [C].Intelligent Transportation Systems, Proceedings IEEE, 2001:1206-1211.
[2] 杨东凯,吴令培,张其善. 智能交通系统(工TS)的发展及其模型化研究[J]. 北京航空航天大学学报,2000,26(1): 22-25.
[3] Dickmanns E D, etc. The Seeing Passenger Car‘VaMoRs-P’[C]. Proceedings 1994 IEEE Symposia on Intelligent Vehicle. IEEE Press Piscataway, N J, 1994:68-73.
[4] Jochem T M, Balu}a S. A Massively Parallel Road Follower[C] .Computer Architectures for Machine Perception, 1993:2-12.
[5] Thorpe C, Hebert M H, etc. Vision and Navigation for the Carnegie- Mellon Navlab [J]. IEEE Transaction on Pattern and Machine Intelligence. 1988, PAMI-10(3):362-373.
[6] ,徐光. 视觉导航的多尺度全方位时空图像综合理解[J]. 清华大学学报(自然科学版),1997.37(3): 12-15.
篇8
关键字:片剂;表面缺陷;边缘检测;算法比较
中图分类号:TP391.41 文献标识码:A文章编号:1007-9599 (2011) 11-0000-02
Edge Detection Algorithm Comparison and Implementation in Tablet Surface Defect Detection Method
Li Guopei Xiao Lijing Zeng Jiexian
(Jiangxi Nanchang Hangkong University,Nanchang330063,China)
Abstract:This paper analyzes several edge detection algorithm and the basic principles,
comparing the advantages and disadvantages of each operator by VC + + programming tools for the operator above the tablet surface defect image edge extraction,and the experimental results concluded,Sobel operator in this project better than the other operators.Thus,in a different edge detection programs should be based on the actual situation,choose the most suitable edge detection for image processing in order to obtain the best experimental results.
Keywords:Tablets;Surface defects;Edge detection;Algorithm comparison
一、引言
边缘检测在图像处理与计算机视觉中占有特殊的位置,它是底层视觉处理中重要的环节之一,也是实现基于边界的图像分割的基础 [1]。一直以来,学者对这一问题做了很多的的研究,除了常用的局部算子及以后在此基础上发展起来的种种改进方法外,又提出了许多新的技术,其中突出的有LOG、用Facet模型检测边缘、Canny的最佳边缘检测、统计滤波检测以及随断层技术兴起的三维边缘检测[2,3]。在片剂的缺陷检测与识别中,提取片剂图像边缘和缺陷边缘是研究的重点,也是缺陷识别的基础,因此,做好对片剂图像边缘的检测和提取非常有必要。
二、边缘检测算法原理
边缘检测的实质是采用某种算法来提取出图像中对象与背景间的交界线。我们将边缘定义为图像中灰度发生急剧变化的区域边界。图像灰度的变化情况可以用图像灰度分布的梯度来反映,因此我们可以用局部图像微分技术来获得边缘检测算子。经典的边界提取技术大都基于微分运算。首先通过平滑来滤除图像中的噪声,然后进行一阶微分或二阶微分运算,求得梯度最大值或二阶导数的过零点,最后选取适当的阈值来提取边界。经典的边缘检测算子包括:Roberts算子,Prewitt算子,Sobel算子,Log (Laplacian of Gaussian)算子等,下面将这些算子进行介绍:
(一)Roberts边缘算子。Roberts算子是一种利用局部差分算子寻找边缘的算子,由下式给出:
(2-1)
其中 是具有整数像素坐标的输入图像,平方根运算使该处理类似于在人类视觉系统中发生的过程。
(二)Sobel边缘算子。Sobel边缘算子的卷积和如图2.1所示,图像中的每个像素都用这两个核做卷积。这两个核分别对垂直边缘和水平边缘响应最大,两个卷积的最大值作为该点的输出位。运算结果是一幅边缘幅度图像。
Sobel算子认为邻域的像素对当前像素产生的影响不是等价的,所以距离不同的像素具有不同的权值,对算子结果产生的影响也不同。一般来说,距离越大,产生的影响越小。
(三)Prewitt边缘算子。Prewitt边缘算子的卷积和如图2.2所示,图像中的每个像素都用这两个核做卷积,取最大值作为输出,也产生一幅边缘幅度图像。
Prewitt算子在一个方向求微分,而在另一个方向求平均,因而对噪声相对不敏感,有抑制噪声作用。
(四)Laplacian边缘算子。拉普拉斯算子一种二阶边缘检测算子,它是一个线性的、移不变算子。是对二维函数进行运算的二阶导数算子,对一个连续函数 它在图像中的位置 ,拉普拉斯值定义为:
(2-2)
Laplacian算子利用二阶导数信息,具有各向同性,即与坐标轴方向无关,坐标轴旋转后梯度结果不变。使得图像经过二阶微分后,在边缘处产生一个陡峭的零交叉点,根据这个对零交叉点判断边缘。其4邻域系统和8邻域系统的Laplacian算子的模板分别如图2.3和图2.4所示。
通常使用的拉普拉斯算子3×3模板如图2.5所示:
(五)Log边缘算子。马尔(Marr)和希尔得勒斯(Hildreth)根据人类视觉特性提出了一种边缘检测的方法,该方法将高斯滤波和拉普拉斯检测算子结合在一起进行边缘检测的方法,故称为Log(Laplacian of Gassian )算法。也称之为拉普拉斯高斯算法。该算法的主要思路是:先用高斯函数对图像滤波,然后对滤波后的图像进行拉普拉斯运算,算得的值等于零的点认为是边界点。用数学公式表示为:
(2-3)
在实际使用中,常常对LOG算子进行简化,使用差分高斯函数(DOG)代替LOG算子。
(2-4)
拉普拉斯算子对图像中的噪声相当敏感,而且它常产生双像素宽的边缘,也不能提供边缘方向的信息。高斯-拉普拉斯算子是效果较好的边沿检测器,常用的5×5模板的高斯-拉普拉斯算子如图2.6所示:
(六)Canny边缘算子。Canny边缘检测基本原理:具有既能滤去噪声又保持边缘特性的边缘检测最优滤波器,其采用一阶微分滤波器。采用二维高斯函数的任意方向上的一阶方向导数为噪声滤波器,通过与图像卷积进行滤波;然后对滤波后的图像寻找图像梯度的局部最大值,以此来确定图像边缘。根据对信噪比与定位乘积进行测度,得到最优化逼近算子。Canny类似于LOG边缘检测方法,也属于先平滑后求导数的方法。
Canny边缘检测算法:首先,用高斯滤波器平滑图象;其次,用一阶偏导的有限差分来计算梯度的幅值和方向;再其次,对梯度幅值进行非极大值抑制;最后,用双阈值算法检测和连接边缘。
三、对片剂表面图像实验及结果分析
本次实验的边缘检测程序由Visual C++语言编写[4],本项目通过使用以上各算子对片剂进行边缘检测,并挑选出经典的几种检测出的结果进行比较。
通过对以上实验图的比较,可以看出,Laplacian of Gassian算子检测出的边缘存在很多噪声,轮廓不清晰,产生了很多虚假边缘;prewitt算子能较全面地检测出边缘,但边缘不够细锐,而且模糊;sobel算子检测出的边缘轮廓清晰,虚假边缘少,更易于后期的缺陷提取和识别。
四、结论
通过边缘检测算子理论和实验的各种分析比较,各种不同的算子对同一片剂图像会产生不同的边缘提取效果,且边缘检测算子各有优缺点,但是针对于不同的实验应该选取不同的边缘检测算子,比如Canny算子虽然是基于最优化思想推导出的边缘检测算子,但实际效果并不一定最优。Laplacian of Gassian算子对噪声很敏感,产生了很多虚假的边缘。Sobel算子检测的效果明显优于其它算子,适合本项目的边缘检测。
参考文献:
[1]张德丰.数字图像处理.北京:人民邮电出版社,2009,10
[2]Sharifi M,Fathy M,Mahmoudi M T.A Classified and Com-parative Study of Edge Detection Algorithms[A].Information Technology:Coding and Computing,2002,International Conference[C].[s.l.]:[s.n.],2002:117-120
[3]刘晨,张东.边缘检测算子研究及其在医学图像中的应用[J].计算机技术与发展,2006,8
[4]张宏林.精通Visual C++数字图像处理典型算法及实现(第二版)[M].北京:人民邮电出版社,2008:325-348
篇9
关键词:运动目标检测,帧差法,中值滤波法,混合高斯分布法
目前背景提取的算法很多,有基于时间轴的滤波方法,如中值滤波;有基于统计模型的方法,如混合高斯分布模型。虽然方法很多,但是很难找到一种在各种情况下都表现最好的算法。本文主要比较帧差法,中值滤波,混合高斯滤波在不同情况下的性能优劣。
1 帧差法
帧差法是最为常用的运动目标检测和分割方法之一,基本原理就是利用基于时间序列图像中相邻两帧或者几帧图像逐个像素进行对比得到一副差值图像,然后通过事先确定的阈值对差值图像进行二值化处理。在环境亮度变化不大的情况下,如果对应像素值变化小于事先确定的阈值时,可以认为此处为背景像素如果图像区域的像素值变化很大,可以认为这是由于图像中运动物体引起的,将这些区域标记为前景像素,利用标记的像素区域可以确定运动目标在图像中的位置。
简单的两帧差对噪声有一定的敏感性,而且对象运动的速度不能太快,否则由于背景被运动物体的遮挡和重现使得计算出的运动区域的掩模要大于运动物体的尺寸。两帧间运动物体的位移越大,这种差距就越大。由于相邻两帧间的时间间隔非常短,用前一帧图像作为当前帧的背景模型具有较好的实时性,其背景不积累,且更新速度快、算法简单、计算量小。
2中值滤波
选择像素灰度,通过包含运动目标的序列帧提取初始背景。对视频中的任意一个像素点,只有在前景运动目标通过该点时,它的灰度值才会发生明显变化,其余大部分时间处,该点的灰度值是基本保持不变的,总是在一个区域内波动,因此可以用这个区域内的中值作为该点的背景值。
若有L帧视频图像,只有当L帧图像内有一半以上是背景的灰度值,目标灰度和噪声很少的情况下,该算法才具有可行性。在该算法中,L的选择很关键,如果取值过大,算法的运算时间较长,若小,检测运动缓慢的目标时将会产生漏检,甚至出现空洞现象。
3混合高斯
建立背景模型,假定初始背景中不含运动目标。其基本思想是:对于每个像素,定义K(基本为3~5个,K值越大处理波动的能力越强)个高斯模型来表征图像中各个像素点的特征,在新一帧图像获得后更新混合高斯模型。用当前图像中的每个像素点与混合高斯模型匹配,如果成功则判定该点为背景点.否则为前景点。若每个像素点颜色取值用变量 表示,其概率密度函数为:
4 实验结果与分析
本文所用仿真软件是MATLAB2012b,图4.1研究了将彩色图像转换成灰度图像,然后通过帧差法进行背景建模。算法的不足在于对环境噪声较为敏感,对于比较大的、颜色一致的运动目标,有可能在目标内部产生空洞,无法完整地提取运动目标。帧间差分法只能应用在摄像机静止情况下的动态目标检测。
图4.1 视频traffic1中的第九帧 (帧差法)
图4.2研究了将彩色图像转换成灰度图像,然后通过灰度值的中值来进行背景建模。总体来说中值法的效果比帧差法的效果理想。该算法存在的问题在于:图像帧的像素点大多以数万,数十万的数量级出现,而用于取中值的图像帧数量L也应该比较大。对如此大的数组进行排序取出中值,实现时计算量较大,处理较慢。同时需要占用大量的内存单元用于存储数据。
图4.2 视频traffic1中的第九帧(中值法)
图4.3利用混合高斯法进行背景建模。混合高斯适应背景随时间的缓慢变化,能描述背景中的一些较大的周期性扰动,能适应背景内容的变化。但是无法精确提取缓慢运动的目标,不能适应背景的突然变化,存在噪声,阴影时容易导致误检或者漏检的现象。混合高斯更适应于外部环境比较复杂的情况。
图4.3 视频traffic1中的第九帧(混合高斯法)
5 结束语
通过实验发现,帧差法和中值滤波法适合特定的场合,即外部扰动比较小的情况,混合高斯法在外部环境变化较大的情况下效果更好。
参考文献:
[1] R. Cucchiara, M. Piccardi, and A. Prati, "Detecting moving objects, ghosts, and shadows in video streams," IEEE Transactions on Pattern Analysis and Machine Intelligence 25, pp. 1337-1342, Oct 2003.
[2] B. Lo and S. Velastin, "Automatic congestion detection system for underground platforms," in Proceedings of 2001 International symposium on intelligent multimedia, video, and speech processing, pp. 158-161, (Hong Kong), May2001.
[3] Q. Zhou and J. Aggarwal, "Tracking and classifying moving objects from videos," in Proceedings of IEEE Workshop on Performance Evaluation of Tracking and Surveillance, 2001.
篇10
扫描志愿者的人体尺寸基于中国标准化研究院2009年进行的中国成年人人体尺寸测量结果,该测量的样本容量为3,000人,年龄跨度为18~70岁,测量项目共计161项。该志愿者的尺寸选择参照与测量结果中的中国成年人男性50百分位的尺寸,由于志愿者很难达到每一项都完全符合50百分位,因此着重考虑其中6项,即身高、体重、胸围、腰围、臀围及肩峰宽,该6项较为重要的人体尺寸的2009年中国标准化研究院最新测量结果以及目前最新的所公布的1988年中国成年人人体尺寸数据见表1。
2志愿者扫描
CT的全称为computedtomography,即电子计算机断层扫描,最早起源于1967年,由Hounsfield设计研发。CT扫描的基本原理是人体内各组织器官对X射线具有不同的透过与吸收比,基于该透过与吸收比通过高灵敏度的相关仪器进行测量,然后通过电子计算机保存所测量的数据并进行相关处理,即可得到所测量的组织或器官的断面图像。CT扫描对生物医学中复杂结构重建可以提供良好的断面成像。以中国标准化研究院2009年的人体尺寸测量结果为目标,选择了一名身体各器官、骨骼等组织均无病变及相关病史且符合中国成年人男性50百分位尺寸的健康男性志愿者作为CT扫描对象。志愿者各项人体尺寸的测量方法与标准化研究院的尺寸测量方法一致,具体参考GB5703-2010《人体测量方法》[2]与GJB4856《中国男性飞行员人体尺寸测量》[3],但由于缺乏专业的测量设备,因此只能按照相关的测量方法(如图1所示)大致进行尺寸测量。经过实地测量,该志愿者的主要6项人体尺寸与2009年中国标准化研究院所测量的中国成年人男性50百分位、45百分位及55百分位的尺寸对比如图2所示,可知该志愿者的主要6项尺寸与中国成年人男性50百分位尺寸均较为符合。CT扫描如图3所示,所使用的机器为美国通用多螺旋CT机,型号为LightSpeedVCT,扫描的具体参数为:管电压120kV,管电流10mA,层厚0.625mm,层间距0.625mm,床速78.74mm/sec。全身CT扫描共计1,529张断层图像,以DICOM格式存储,DICOM是美国国家电气制造商协会制定的医学图像储存与交换的标准格式,相比于CT扫描的胶片,DICOM格式的图像更加清晰、储存更加便捷,且所有像素点的坐标均可保证准确无误[4]。图4为具有代表性的志愿者CT扫描断层图像。通过CT扫描的断层图像对于胸腹部内脏等器官组织的建模较难实现,还需借助于MRI磁共振成像扫描。MRI磁共振成像是用于检查身体解剖学及生理学的医用图像技术,利用磁场及无线电波来对身体进行成像,可以更清晰地重现内脏及韧带等组织器官。对该志愿者进行d胸腹部内脏的MRI扫描如图5所示,扫描仪器型号为SIEMENSMAGNETOMAera1.5T,层厚为1.5mm。
3提取扫描点云数据
将CT及MRI扫描的DICOM数据导入医学影响处理软件Mimics中,通过阈值分割,基于骨骼、内脏等在扫描图像中的不同灰度值可分别进行提取,提取的点云数据可用于三维CAD几何建模。图6为基于该CT扫描的胸腹部骨骼的三维重建点云模型示例。
4结语
- 上一篇:儿童的创造性思维及其培养
- 下一篇:学校安全管理的几点思考