计算机视觉的方向范文
时间:2024-01-09 17:33:17
导语:如何才能写好一篇计算机视觉的方向,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:计算机技术;轮廓提取;视觉测量
计算机视觉测量技术是一种综合技术,融合了光电子技术、计算机技术、图像处理技术等多种技术。在对采集对象进行处理之后,就可以得到目标物体的几何特征参数。想要得到准确的图像,就必须重视目标物体的轮廓提取参数。在计算机视觉测量系统中,为了保障测量的精准度,选取合适的轮廓提取方法也是很重要的。边缘检测法是轮廓提取方法中主要的内容,该方法借助于空域微分算子,使图像和模板完成卷积。边缘检测方法中的局部算子法,具有实现简单、运算速度快等优点。梯度算子、Sobel算子、Roberts算子、canny算子,都是经典局部算子法。本文提出了基于灰度阈值法的原理,根据链码跟踪技术对轮廓信息进行存储,实现图像轮廓的提取。这种方法具有准确度高、稳定性好等优势,在工程上的应用十分广泛。
1 轮廓提取的原理
轮廓提取指的是从物体图像上得到物体外形,它能够有效保障测量的精确度。由于计算机视觉测量图像只含有目标和背景2类区域,应该利用阈值分析法对图像进行分割。为了确保二维图像中没有噪音,可以利用非线性的滤波能力消除噪音。为了实现轮廓提取,将会掏空图像内部的点。通过链码跟踪技术对轮廓的信息进行存储,使图像的轮廓处理工作量得以减轻。轮廓提取的工作流程是:首先对原始图像进行预处理,消除噪音后可以得到平滑的图像。然后,对图像进行阈值分割得到二维图像。对二值图像进行轮廓提取,就可以得到图像的边界点。最后,再根据跟踪算法将轮廓存储为链码序列的形式。
2 图像轮廓提取的关键技术
轮廓提取技术是计算机视觉测量技术中的重要组成部分,轮廓提取技术主要包括图像预处理技术、阈值分割技术、轮廓提取技术和链码跟踪技术等内容。本文将具体介绍几种关键的图像的轮廓提取技术。
2.1 图像预处理技术
通过光学成像系统产生的二维图像经常含有各种噪音。为了提高计算机的视觉能力,增加计算机的分析和识别能力,必须消除掉这些二维图像中的噪音。有目的地显示出有用的信息,消除掉无用的信息,这种方法就是图像预处理技术。图像预处理技术能够有效增加图像的清晰度,是一种关键的计算机视觉测量技术。图像的预处理技术是指在图像输入过程中对图像进行处理,从而得到清晰图像的技术。图像的预处理技术的内容很多,比如图像中如果含有噪音,就需要除掉图像中的杂音,提高图像的语音效果。对于一些比度比较小的图像,就需要对其进行灰度变换。对于已经模糊的图像,应该进行各种复原处理。对于失真的图像,应该采用几何方法来校正。
计算机视觉测量中的图像预处理技术,能够有效地提高图像的画面质量,让图像便于处理,更易于测量。图像预处理的方法有很多,通常情况下,主要采用图像平滑处理、图像锐化处理、图像边缘增强等技术。
2.2 阈值分割技术
由于计算机视觉测量技术中只有目标和背景两类区域,本文将采用单阈值法来分割图像。阈值分割法在实施的过程中,先要确定分割阈值,再将分割阈值与像素的灰度进行比较。
阈值分割法的原理是:首先设定图像的灰度区间在z的最大值和z的最小值之间。在该区间设定一个阈值Z,阈值Z的大小在z最小值与最大值之间,令图像中所有灰度值小于或等于Z的像素,将它们的新灰度值设定为0,大于Z的像素新灰度值设定为1。经过这样的阈值分割,就可以得到输出的二值图像。
阈值分割的工作尽量保留原图像,在此基础上,应该去掉一些冗余信息。但阈值分割法中最为关键的就是阈值z的确定,这是灰度值的突变点。本文将采用迭代法来确定阈值Z,根据灰度直方图来确定初始阈值,将图像分割为目标和背景,计算目标和背景灰度的平均值,可以利用循环迭代的方法求出差值较小的阈值,该阈值就是灰度阈值Z。这种方法求灰度值算法简单,便于实现,其具体的步骤是:首先,求出图像的最大阈值与最小阈值,令初始阈值为最大阈值与最小阈值和的一半。然后,再利用初始阈值将图像分割为目标和背景,分别求出目标和背景的平均灰度值Zo与Zb。Zo与Zb和的一般就是新阈值Z,如果新阈值Z与初始阈值相等,那么新阈值Z即为所求阈值。
2.3 轮廓提取技术
通过对阈值分割后的图像进行缺陷修补,还需要利用轮廓提取技术,最后才能得到图像中目标的二维轮廓。本文将采用掏空内部点的方法对二维图形进行轮廓提取。假定背景颜色为黑色,目标颜色为白色。当目标中有1个点为白色,这个内部点周围的8个点都为白色时,就可以将这个点和它周围8个点都删除,把内部点全部掏空。
在二值图像中,假设背景的灰度为0,目标灰度为l,那么边界轮廓的提取方法如下:如果中心像素值为O,那么其余相连8个像素均规定为1;如果其余相连8个像素为1,那么将把中心像素值改为0;除此之外,中心像素将一律设定为1。根据这样的规则,就可以得到图像的轮廓。
2.4 链码跟踪技术
链码是一种改进的坐标序列存储结构,链码用指向中心像素P的8个方向来表示,每个方向都存在着45度的夹角。对于轮廓图像来说,除了起始像素以外,所有的像素都可以用8个像素方向来确定。轮廓跟踪是以链码的方向来进行的,上一个轮廓点将会影响到下一个跟踪点。这种方法能够加快像素扫描的速度,能够有效地提高跟踪效率。
链码的跟踪过程如下:(1)通过扫描得到初始轮廓点,将该点的坐标定位(x,y),进入步骤(2),如果扫描之后得不到轮廓点,那么进入步骤(4)。(2)按照链码的方向来扫描当前与相邻的8个区域,如果遇到轮廓点,用“-”设置停止扫描跟踪,并记录该店的链码值,转进步骤(3);如果扫描过程中没有遇到轮廓点,则设置结束跟踪标志,将扫描点重新设置到起始点(x,y)坐标上,转退步骤(1)。(3)用底色填充扫描轮廓点,将当前点设置为跟踪到的轮廓处,转退步骤(2)。(4)用“-”设置结束所有轮廓跟踪。
根据上述步骤,不仅可以算出链码序列,还能够求出链码序列中的坐标、方向,甚至能求出链码的具体值。为了区别链码序列中的不同轮廓,要使用特殊标志将它们分开。为了找出封闭轮廓的起始点,应先标出链码方向序列,将轮廓结束标志最后标出。在自闭式轮廓跟踪系统中,序列的记录工作是根据轮廓线条顺序进行的,这将大大方便后续轮廓处理工作。
通过链码的解密工作,可以求出链码表示的轮廓值,解码的过程和编码的过程相同。链码和像素之间存在一一对应关系,可以用数组的方法来解决解码问题。对于X坐标的数组,可以将它们设定为X[8],X[8]={1,1,0,-1,-1,-1,0,1}。对于Y坐标的数组,可以将它们设定为Y[8],Y[8]={0,1,1,1,0,-1,-1,-1)。通过处理这种链码序列,可以求出不同轮廓的坐标值。
3 图像轮廓提取效果分析
如果图像在没有受到干扰的情况下,就能够提取到较为清晰的轮廓。但是如果存在某种敏感性因素时,就会严重影响图像的轮廓提取效果。利用20%的椒盐噪声影响一个花瓶图像,在预处理环节对其滤波之后,会产生出图像5(c)。以这种图像为检验标准,对其进行轮廓提取试验。同时,也可以利用Sobel,Robets,Canny等算子对该图像进行边缘提取试验,将实验得出的结构图像,与轮廓提取试验中得到的图像相比较,可得到图1。
根据图1可以看到,Sobel算子、Robets算子、Canny算子在受到干扰的情况下,对图像轮廓的提取效果不是很好,会出现断线、噪声等问题。而采用本文方法的轮廓则能保持较高的清晰度,这种方法适用性强,无噪音,未来必将会得到广泛应用。
篇2
在我国市场经济不断发展的盛况下,我国科技发展水平也紧随其后,成为世界上的科技强国之一。在计算机水平的不断提高下,计算机视觉技术应运而生。其中,计算机视觉技术被应用与各个领域,并在各个领域都得到广泛有效的应用,比如军事领域、医疗领域、工业领域等。本文针对计算机视觉技术在交通领域中的应用进行分析。
【关键词】计算机视觉 交通领域 探究
近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。
1 计算机视觉的概述及基本体系结构
1.1 计算机视觉概述
通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。
计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。
计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。
1.2 计算机视觉领域基本体系结构
提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。
2 计算机视觉在交通领域的应用
2.1 牌照识别
车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。
2.2 车辆检测
目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。
2.3 统计公交乘客人数
城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。
2.4 对车道偏离程度和驾驶员工作状态判断
交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。
2.5 路面破损检测
最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。
3 结论
本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。
参考文献
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).
[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).
[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).
[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.
[6]王大勇.关于计算机视觉在交通领域中的应用分析[J].科技与企业,2013(01):115.
作者简介
夏栋(1988-),男,湖北省孝感市人。现为同济大学软件学院在读硕士。研究方向为计算机视觉。
篇3
1.1计算机在和艺术融合时
有效结合图像、文本、声音、动画等因素,在丰富艺术语言表现形式时,也使作品更具有感染力。当计算机视觉艺术与数字媒体结合在一起时,使人们在观看画面时,不仅是欣赏画面,也能够感受到声、色等。数字媒体通过计算机视觉艺术利用高度仿真的视觉、触觉和听觉,使大众在观看电影或玩游戏时,能够真实感受到虚拟世界,同时还可以通过肢体语言、动作以及视线的转移,与计算机进行有效交流。比如在2010年开展的上海世博会上,德国馆所开展的动力之源”金属球表演1.3吨重、装有40万根LED发光二极管的互动金属球。在互动开始时,观众被分成两批跟着解说员的指令呼喊,金属球自动找到声音最响亮的那个方向。然后,哪边的呼喊声大,互动球向那一边的摇摆也更为剧烈,同时,球体表面上,亦不断展现出一幅幅城市的美好愿景。使大众不仅是单独欣赏电影,而是可以参与到视觉艺术表演中。数字媒体通过计算机视觉艺术,在最大程度上满足艺术创作对感受的表现。
1.2计算机视觉艺术在数字媒体中的应用
丰富了艺术的表达形式。交互技术的发展与成熟,使计算机视觉艺术的领域得到很好的拓展,并在各种数字媒体艺术中得到广泛应用。比如在网页、游戏等内容。交互技术的应用,使人们不再是被动的欣赏,而是参与到视觉艺术中,让大众去参与、选择和判断,而且可以通过不同的选择将过程和结局进行不同的呈现,调动观众的兴趣,提高大众的参与度。
1.3计算机视觉艺术在电子游戏中的应用
首先是大型电子游戏应用的计算机视觉艺术。比如日本科乐美公司在推出警匪枪战射击《警察官2》游戏时,就受到许多玩家的欢迎。在游戏中,玩家不再只是使用鼠标和键盘来进行游戏,而是玩家可以通过身体行动,比如“蹲、闪及侧身等行为以此进行移动。机器通过摄像机部捕捉到玩家的身体动作,玩家可以有效操作与机器相连的手枪,将屏幕中的对象进行射中。其次是手机上的小型电子游戏,比如在《神庙逃亡》,玩家只需要用手指向左、向右滑动屏幕,可以人物向左或向右转向;而向上、向下滑动则可以让人物跳跃或下滑过各种障碍。另外在需要游戏人物在左侧或右侧奔跑时,只需要侧一下手机就可以,并且游戏画面有着充足的声光效果,可进行互动,有着极高的震撼力,对提高大众的参与度有着积极的促进作用。
1.4计算机视觉艺术在数字媒体中的应用
使数字媒体技术将艺术进行有效表现,并在纯艺术和实用艺术中应用到数字媒体,而数字媒体技术可以将单纯的个人视觉进行有效的创造,并将艺术转化为社会性视觉产品,并可以获得经济效益。而大众可以利用拷贝、剪切等方式将数字媒体中的视觉艺术进行获取,然后将艺术资源进行转化,为个人视觉艺术的创作奠定了坚实的基础。随着大众对独特性以及个性化的艺术要求越来越高,在追求独特的视觉艺术时,追求刺激的视觉艺术时,也提高了对视觉艺术作品的评价标准。计算机视觉艺术在数字媒体中的应用,给大众带来美的享受,使大众在观看视觉艺术时可以怀着愉悦、舒适的感觉进行欣赏,也可以获得相应的审美评价,在潜移默化中改变着人的精神追求。计算机视觉艺术在数字媒体中应用时,没有掺杂其他因素,使计算机视觉因素只是追求视觉形式和视觉美感,能够在最大程度上体现艺术的本质。并且数字媒体本身就具有美的品格,与计算机视觉艺术相结合,使数字媒体艺术在具备了美时,也可以体现真。因此,计算机视觉艺术在数字媒体中的应用,提高了审美价值,大众通过感受、体悟数字媒体所体现出的视觉艺术,领悟到视觉艺术中的美,能够在很大程度上满足大众对美的追求。
2总结
篇4
关键词:计算机视觉;教学应用;教学改革
计算机视觉是人工智能学科中的一门重要课程。随着相关应用在多个领域中的出现,越来越多的学生开始对这门课产生了浓厚的兴趣。如何让学生能够在整个课程中保持盎然的兴趣,并为有志于深入研究计算机视觉的学生指明方向,成为我们教师首先应注重的问题。
在实际的教学工作中,通过不断摸索总结,我们认为,以实际应用引导学生的学习兴趣,既满足了学生想了解计算机视觉实际应用的需求,又加深了学生对于算法的理解,把算法放在一个实际应用中,学生可以理解怎么用,为什么这么用。在这样的目标导引下,我们从选择教材开始,准备教学内容(包括合理的应用实例的选择)、制作PPT、探索教学方法,形成了目前以实际应用为主导的创新教学体系,非常受学生欢迎。在此,我们对这期间遇到的问题,解决方法、心得体会做一个总结和思考,希望能对同行有些许参考作用。
1选择教材
在我们这个专业,每年的上研率基本都保持在50%左右。在本专业的研究生阶段,也开设了双语教学的计算机视觉课程。另外,毕业后选择参加工作的同学也基本都进入和本专业非常相关的一些单位,所从事的工作,都是和在学校学习的知识密切相关。
因此,如何让这门课程的教学既兼顾本科毕业就参加工作的那部分同学,又兼顾继续深造的学生的需求,也是在这门课程讲授的过程中,需要特别注意的一个问题。对于本科毕业就要参加工作的同学而言,需要“广度”,需要了解计算机视觉这门课在各个领域中的应用,在实际中接触到相关的项目或工作时,能够知道去哪里可以找到自己需要的参考资料;而对于要进一步深造的同学而言,则需要一定的“深度”,为研究生阶段的研究打下基础。
全盘考虑到这些学生毕业之后的去向,我们选择了两本教材。一本是贾云得教授编著,科学出版社于 2000年出版的《机器学习》[2],这是一部顺应了时代与教学发展要求的教材,对计算机视觉中的基本概念、基本算法、基本算法的应用、经典应用进行了由浅入深的介绍。内容涵盖了所有经典的数字图像处理与机器视觉方法,也对一些已经得到非常好实际应用的方法,如光流法等作了简要介绍。另外还选择了一本英文原版的计算机视觉的经典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],机械工业出版社于2003年出版。这是国内外非常推崇的一本计算机视觉著作,该教材条理清晰,深入浅出,对计算机视觉的基本原理、算法、应用的介绍非常详尽。
在教学中,我们采用了英文的PPT,但主要用的教材是贾云得教授的《机器视觉》,这样中英文对照讲解,一方面加深学生对教学内容的理解,另一方面也为学生今后阅读专业的英文论了相应准备。
2教学内容和工程实例的选取
2.1选取教学内容
本课程之前,大学二年级的本科生已开设数字图像处理课程,但所讲的基本原理和算法都非常浅显,所以在教学内容的安排上,分为两大部分:数字图像处理部分和视觉部分。数字信号处理部分主要讲解在视觉部分会用到的一些基本算法,为后面进入计算机视觉部分打基础。这部分约占总课时的1/3。视觉部分的课时也分为两部分:算法讲解与实例讲解。在算法讲解部分,对计算机视觉的基本算法、经典算法都做了深入浅出的讲解。实例部分则选择了经典的工业应用,让学生能够对所学算法进一步加以理解。
2.2选取适当的工程实例
就计算机视觉的教学内容而言,各个孤立的算法和方法对本科生来讲,有些抽象不好理解。如果在教学上仅仅通过老师在课堂上的讲解,很难让学生深入地理解相关的教学内容,而选择一个触手可及且简单好理解的工程实例往往就会达到意想不到的教学结果,学生可以把课堂上所学的枯燥理论与现实中活生生的事物联系起来,从而加深对教学内容的理解。
通过反复比对、反复论证,我们选择了在讲解基本原理和算法之后,在课程结束前,专门留出课时讲解手机制造这个例子。手机现在是人手一部,是这些年青学子再熟悉不过的事物了,通过对手机主板、手机键盘的制造过程的讲解,把所学的算法都融合进来,学生在觉得有趣的同时,不知不觉就加深了对所学算法的理解。
另外,在教学的过程中,我们还不断穿插其他学生耳熟能详的实例,如数码相机原理中的一些算法的讲解,我们和学生一起探讨应该怎么选择数码相机。再有,滤波器算法、在课堂上对Photoshop功能的演示,与所学算法关联起来,学生都很容易理解接受。
3教学点滴
3.1点睛之笔
在第一节课的讲述中,我们的重点不在于Marr理论,而是告诉学生:
人工智能就是要让计算机像人一样,能够会听、会看……
我们这门课程就是要让计算机“会看”,要像人一样会看。进而展示给学生一些我们精心挑选的图片,让学生自己判断,是不是自己的眼睛“骗了”自己,人眼和计算机看到的到底有什么不一样。
每次讲到这里,学生都会进行热烈的讨论,每个人都有不同的看法,每个人都有自己的坚持,不知不觉中,对这门课就产生了浓厚的兴趣,有了继续深入学习下去的愿望。在课堂讨论的最后,比较人眼对图片的判断以及计算机的判断后,让学生自己总结归纳,我们这门课到底要研究些什么,都有可能应用在哪些方面,然后对争议比较大的提议一一探讨。每到这个时候,大家的积极性就都被激发出来,在不断的争论与思想碰撞中找出正确的结论。
3.2拿身边的事物说“事”
计算机视觉课程的前半部分,多涉及到图像处理的一些常见算法。在讲授各种各样的滤波器和算子时,并没有针对各个滤波器和算子摆出一堆示例图片,让学生比较滤波前后的差异,从而很生硬地理解滤波器与算子的功能。取而代之的,我们首先以现在人手一台的数码相机为例提出问题,你为什么要选择你手里的这台数码相机?当初选这个品牌和型号时,你的考虑是什么?历年学生的回答几乎都是看网上测评,或者在网上看别人怎么说。这时列出我们收集到的各个品牌相机的测评报告,列出它们的优缺点,然后引导学生去思考,例如这个品牌的相机的缺点是照片发灰,不是很鲜亮,而另一个品牌的相机则绿的特别绿,红的特别红,为什么?那么有可能是哪部分的算法不够完善,为什么?
通过如此简单的对比,学生的积极性被完全激发。原来,数码相机这个几乎人人都有,大家都熟悉的“玩具”竟然和自己在课堂上学到的知识这么密切相关。
再有,就是利用学生们都熟悉的PS(Photoshop),演示现在所谓的“完美证件照”是怎么来的。为什么可以把疙疙瘩瘩的脸部皮肤变得光滑?在PS中,你就是点了一下鼠标,其实在后台,是加入了一个滤波器进行了滤波。各种这样的演示,学生都非常喜闻乐见。因为他们突然发现,原来那些事物,和我自己接触到这些看似枯燥的理论之间,还有这么深刻的联系。
还有一个很受学生欢迎的例子就是对于“鼓形失真”的讲解。我们的老师每次讲到这里,都不会简单告诉学生“鼓形失真”发生的原因是什么,应该怎么解决?老师都会问学生,明星为什么都一窝蜂去减肥?现在的女明星为什么都要去弄个“锥子脸”?课堂上就会出现一个小,男同学和女同学的看法各异,彼此之间开始争论不休。此时再趁热打铁地问学生,如果拿着相机,离自己的鼻子一公分,会拍出什么样的效果?有学生开始拿出手机对着自己和别人开拍,有的学生开始头头是道地分析。每到这种学生都开始热烈讨论的时候,就可以适时引导学生往正确的方向去,让他们自己找到正确的分析解决方法,往往这个时候,学生都会颇有成就感,对于问题的理解也会特别的深刻。
3.3选择合适的实际应用
在所有理论讲解结束后,我们会留出2~4次课讲述计算机视觉在工业上的应用。这些年来,对于手机制造这样一个工业应用,非常受学生欢迎。正如“数码相机”这个例子一样,现在学生都是人手一部手机,是大家再熟悉不过的东西。这个例子涉及到了在前面理论讲述中的大部分算法,如二值图像的处理、模板匹配、高斯滤波器等。学生通过对这个工业应用的理解,更进一步加深了对算法的理解。
以讲解手机键盘的制造过程为例,向学生提出和前面所讲内容相关的问题,引导学生自发思考,如为什么选择模板匹配法,而不是采用其他更复杂更精确的方法等等。每到这个时候,课堂气氛总是分外热烈,学生各抒己见,在不断争论中,更进一步加深对课本上枯燥理论的认识。
在这里需要注意的问题是一定要一步一步提出问题,循循善诱,引导学生一层一层地深入思考。如果问题的答案过于“深藏不露”,则有可能触发学生的抵触情绪,无法继续深入地思考。
4结语
通过多年的教学摸索,我们认为,在计算机视觉课程的讲述中,以实际应用引导学生这样的教学方法非常可取,而且也收到了很好的效果。另外,除了制定好的教学大纲,并选择合适的教材外,根据学校现在的时间情况,我们选择了多媒体手段辅助教学,充分利用Matlab和大屏幕投影等方方面面的优势,结合多种方法进行教学,对讲好计算机视觉这门课,非常有益。
参考文献:
[1] 林尧瑞,马少萍. 人工智能导论[M]. 北京:清华大学出版社,1989.
[2] 贾云得. 机器视觉[M]. 北京:科学出版社,2000.
[3] Ramesh Jain. Machine Vision[M]. 北京:机械工业出版社,2003.
[4] 蔡自兴. 智能控制原理与应用[M]. 北京:清华大学出版社,2007.
Innovation in the Course of Computer Vision
HAN Hong, JIAO Li-cheng
(School of Electronic Engineering, Xidian University, Xi’an 710071, China)
篇5
关键词:计算机视觉;智能交通;监控系统
中图分类号:TP277
近些年来,随着我国人民生活水平提高,使私家车辆的数目急剧增长,并且车辆的增长速度远远超出市政建设的力度。这样的事实导致城市交通拥堵、违规通车、车祸增加,所以迫切的要求加快市政建设,实施高效率的交通监控措施,基于计算机视觉的智能交通监控系统也由此得到了相应的广泛的发展和应用。那么,计算机视觉技术下的智能交通监管系统究竟应该如何设计与实现呢?
1 计算机视觉下的智能交通监控系统
1.1 计算机视觉技术
计算机视觉技术即利用各种图像摄录设备将通过对视觉目标进行识别、跟踪、测量并将由此获取的视觉信息传输至计算机并进而利用图像技术进行视觉信息处理以达到进一步进行智能化处理的视觉处理技术。
1.2 智能交通系统(ITS)
智能交通系统(ITS)是指通过现代化的网络信息技术、自动控制技术等有效综合手段在一定范围内建立的全方位发挥作用的交通运输综合管理和控制系统。作为交通运输管理体系的一场新的革命,近年来,由此技术进一步开发形成的监控系统已经在各个道路的关键路口、路段和其他交通繁忙地域普遍建立,为交通运输管理提供了自动化、智能化的信息收集和处理等多方面的服务。但是,随着城市建设的迅猛发展和人流、车流量的猛增,更加智能化的交通管理系统的开发和利用显然也成为了当务之急。
2 计算机视觉下的智能交通监管系统的建立
正是基于新的发展需要,我们有必要把计算机视觉和智能交通监控系统进一步结合起来,首先通过计算机视觉分别对各个道路的关键路口、路段和其他交通繁忙地域等相应位置实时进行交通信息采集,然后,通过信息传输系统、或者进行处理后存入服务器并将处理过的实时交通信息及时传输到监控指挥系统,以实现对于各个道路的关键路口、路段和其他交通繁忙地域的实时监控和管理。由此,显然就需要设计以下各个子系统并共同构建为一个完整的体系。
计算机视觉下的智能交通监管系统
实时交通信息收集系统
监控指挥系统
高质量信息存储传输系统
图1 计算机视觉下的智能交通监管系统工作程序示意图
3 智能交通监控系统的实现
计算机视觉下的智能交通监管系统实现的第一步是通过实时交通信息收集系统实时进行交通信息采集,即通过对于运动物体的分割,在图像找出有意义的部分,抽出运动目标的特征,进而通过连续画面间的变化判断目标的运动状况。在这一系统运行中,首先可以“摄像头读入”的初始视频,使用相应的算法提取“背景”,然后通过原图与背景运算形成相应的“前景”,由此即可进一步通过矩形框的使用来达到“运动目标检测”与信息采录的目的。
图2 视觉监控系统原理图
3.1 系统功能实现
对运动物体的检测主要有光流法以及差分法两种方法,由于光流法比较复杂和耗时,实时检测很难实现,因而,现有实时交通信息收集系统一般通过差分法的应用来进行开发和实现。
3.1.1 帧间差分法
帧间差分法对运动目标进行分割处理过程中使用较多也最为简单实用的一种方法,其基本原理就是通过在连续的图像序列中两个或三个相邻帧间采用基于像素的帧间差分并且阈值化来提取图像的运动区域,进而通过逐象素比较获取前后两帧图像之间的差别来判断运动物体的移动状况。在实际操作中,一般可以假设用于获取序列图像的视频设备为静止物体,设视频中连续两帧的图像为It(x,y)和It+1(x,y),然后通过对连续两帧的图像相应的像素进行比较,利用Dt(x,y)=It+1 (x,y)-It(x,y)这一方程求出相应的阈值来检测出运动物体的移动状况:
Mt(x,y)=
当然,必须注意的是,由于帧间差分法所得到的差分图像在现实中并非由理想封闭的轮廓区域组成的,因而,运动目标的轮廓自然也就往往是局部的、不连续的,且其误差往往随着运动物体速度的增大而增大,因而,这一方法并不适于对于高速运动目标的有效检测。
3.1.2 背景差分法
与帧间差分法不同,背景差分法则是利用当前图像与背景图像的差分来检测物体运动状况一种方法。其基本原理是在可控制环境下,通过对于运动背景的固定假设,设待检测运动物体的图像为I(x,y),背景图像为B(x,y),通过输入图像与背景模型进行比较,利用D(x,y)=I(x,y)-B(x,y)这一方程求得到图像中的各像素的变化信息,进而检测运动物体的移动状况:
Mt(x,y)=
当然,在实际运用中,背景差分法的关键,是要建立一个背景模型,并更新模型。
3.2 程序功能的实现
本程序功能实现所主要使用的是OpenCV函数。OpenCV能够实现对图像数据的操作,包括分配、释放、复制、设置和转换数据,以及对摄像头的定标、对运动的分析等。在函数实现上,用到了Cv图像处理的连接部件函数,运动分析与对象跟踪中的背景统计量的累积相关函数等相关的函数。本系统就是运用图3介绍使用到的函数名及其功能和使用格式等来实现对视频流的运动车辆的轮廓检测的。
图3 寻找轮廓程序主要算法流程
实验证明,本系统能够较好地实现对视频流的运动目标的轮廓检测和对象跟踪,并能实时更新背景,车辆跟踪正确率在95%以上,虽然存在着轮廓检测正确率稍差的缺点,但其主要原因是由于摄像头所处的角度和运动目标靠近程度的影响,从根本上并不影响对于运动目标的实际检测。
4 结束语
加快城镇化进程是我国发展的大趋势,在这一趋势下,城市病的治理当然可以离不开现代化的科学技术。但是,必须注意的是,无论多么先进的管理系统,最终都只有通过人的行为才能够发挥有效的作用,在这个意义上,设计与使用先进的交通监控系统固然是解决交通问题的技术条件,但是,交通问题的解决,最终还必须依赖于人的素质的全面提高。
参考文献:
[1]戴俊乔.城市道路交通视频监控系统架构和性能的研究[J].科技与创新,2014(06).
[2]张伟龙,李刚,王雨翔.基于计算机视觉的智能交通监控系统[J].小型微型计算机系统,2014(07).
[3]庞其富.浅谈城市轨道交通视频监控系统设计方案[J].通讯世界,2014(01).
篇6
关键词:OpenCV;人脸检测;实时
中图分类号:TP391.41
人脸检测(Face Detection)是指对于给定的图像或视频,采用一定的策略对其进行搜索以确定其中是否含有人脸,如果是则返回一脸的位置、大小和姿态。人脸检测是人脸识别的重要环节,运用摄像机或摄像头采集含有人脸的视频流,并进行实时的人脸检测是目前主流的应用。
OpenCV(Open Source Computer Vision Library)是开源的计算机视觉代码库,它轻量级而且高效,由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉的接口,实现了图像处理和计算机视觉方面的很多通用算法[1]。
1 系统设计
本系统采用了OpenCV的基于boost筛选式级联Haar分类器,该分类器是通过成千上万的物体各个角度的训练图像训练出来的,它先对图像进行直方图均衡化处理,并将图像归一化到同样大小,然后标记是否包含要检测的物体,在人脸检测方面比较擅长。系统加载分类器后,利用OpenCV的视频捕获函数实时捕获连接在电脑上的摄像头读入的视频流,并将抓取的视频帧转换为图像,然后对图像进行人脸检测和标定,具体流程图如图1所示:
图1 系统流程图
2 系统实现
本系统在WindowsXP操作系统下使用VC++6.0基于OpenCV1.0进行开发。系统具体实现如下:
(1)初始化声明。通过CvMemStorage*captureFaceStorage=cvCreateMemStorage(0);语句创建一个内存存储器,来统一管理各种动态对象的内存,参数为0时创建的内存块默认大小为64k。然后分别声明分类器对象、图像对象级联名称及识别函数等成员:
Static CvHaar Classifier Cascade* cascade=0;
Ipl Image *frame,*frame_copy=0;
Char* capture Face Cascade_name=haarcascade_frontalface_alt2.xml;
(2)加载分类器。通过cvLoad函数,加载调用CvHaarClassifierCascade类的分类器文件“haarcascade_frontalface_alt2.xml”:
cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);
(3)捕获视频。通过cvCreateCameraCapture函数捕获摄像头,捕获视频后循环执行抓取帧操作cvGrabFrame(cap)和获取图像操作cvRetrieveFrame(cap)操作,从而将帧转换成图像,以便于处理。
(4)图像格式转换。一般从硬盘读入的图片或者通过cvCreateImage方法创建的IplImage图片默认的origin属性为0,即显示的时候都是正的。而由摄像头或者视频文件获取的帧图像origin属性为1,此时显示的图像扫描顺序是从下到上,它会将帧图像的第i行赋值给图像的第height-i行,因此采集的图像会出现倒立现象,为此,应将复制的图像的origin属性调整为与帧图像的origin属性一致。此时需要使用cvFlip(frame,frame_copy,0)函数,实现对帧图像沿X轴的翻转。
(5)识别与检测人脸。本部分主要实现人脸检测功能,首先将从实时视频中提取的图像进行灰度化处理:
然后调整新图像gray,使它精确匹配目标small_img的大小,并利用cvEqualizeHist函数进行灰度图像直方图均衡化处理,最终通过cvHaarDetectObjects函数检测出人脸:
(6)标定检出的的人脸。绘制目标圆形区域,标定出检测出的人脸:
最后通过cvShowImage("result",img)显示出检测后的图像,如果检测到人脸,显示效果图。
3 结束语
基于的摄像头实时人脸检测系统的实现充分说明了OpenCV技术在实现人脸检测方面的效率高、功能强的特点,OpenCV必将在计算机视觉、图形图像处理领域有着广泛地应用前景。
参考文献:
[1]Gray Bradski,Adrian Kaebler.Learning OpenCV:Computer Vision with the OpenCV Library[M].USA:O Reilly media,2008.
[2]梁路宏.人脸检测研究综述[J].计算机学报,2002(05):449-458.
作者简介:徐占鹏(1979.01-),男,山东栖霞人,讲师,硕士,研究方向:计算机应用、计算机图形图像处理和计算机视觉。
篇7
【关键词】视频;图像处理;智能交通系统
交通视频监控系统是一个国家交通正常运行的有力保障。随着我国城镇化进程的不断推进和汽车的普及,交通问题日益严峻,道路拥挤、事故频发,加上不遵守交通规则的人比比皆是,使交通问题成为一直困扰我国的难题。而由于交通系统是一个相当复杂的庞大系统,所以监控起来十分困难。
随着计算机技术的发展,计算机视觉处理技术兴盛起来。计算机视觉处理技术是模拟人类视觉系统的一种技术,人类可以通过对视觉中感知到的信息进行适当的组合和联想以达到对外界信息进行判断的能力,计算机视觉处理技术就是要用计算机代替人类的大脑实现对采集到的信息进行处理,从而使计算机具有外部感知的能力,这对于交通视频监控系统具有非常重要的意义。
在智能交通系统中,基于计算机视觉的图像处理技术扮演着重要的角色,它以视频图像为分析对象,利用先进的算法去除干扰,具有直观、高效、精度高等特点。
1 交通视频中进行图像处理的重要性
交通视频检测系统的摄像机在工作时面临的是自然气象条件,这就意味着它要受到各种自然条件的干扰,比如强光、雾霾、粉尘、街灯等,由于光照条件不同所引起的图像差异远远大于由于人的不同所引起的图像差异,即使是在相同光照条件下,由于镜面反射的存在,同一物体的不同表面对光的反射不同,再加上粉尘、雾霾等的影响,从不同视角反映出来的图像有很大差异。外界光照的方向和强度还会随着时间不断发生变化,这些因素会导致采集的图像不清晰、重影、有阴影等,给基于视频的检测带来很大的难度。而视觉检测必须借助外界光线才能够获取图像信息,所以要把图像中的车辆信息完整清晰的反应出来,就要对静止的视频图像序列(即每帧图像)进行预处理。这些处理会涵盖图像色彩模式转换、格式转换、算法处理等。
2 交通视频监控系统的组成
交通视频监控系统一般由采集、传输、控制、显示四部分组成。
2.1 图像采集
图像采集工作由前端的摄像机完成,采集质量的好坏将直接影响视频图像处理的效果。如果视频图像中的车辆信息清楚,对比度好,无干扰信息或干扰信息少,将有利于车辆的检测和跟踪,反之,将不利于车辆的检测和跟踪。
2.2 传输
根据摄像机和控制中心之间距离的长短,会采用不同的传输设备,一般的传输方式包括视频基带传输、射频有线传输、光纤传输、电话线传输等。
2.3 控制
控制部分是整个交通视频监控系统的中心,由总控制台组成。总控制台可以进行信号的缩放、矫正、补偿、切换、遥控、记录存储图像等。
2.4 显示
显示部分的功能就是把传送过来的图像显示出来,由若干台监视器组成。
3 交通视频监控系统中视频图像处理技术的应用
3.1 车辆检测
对运动车辆的检测是交通视频监控系统的核心功能,通过对视频图像中的连续画面的变化分析能抽出运动车辆的特征,从而实现检测。但是由于运动的车辆受光线、灰尘、雾霾、阴影等因素的影响,给图像分割带来很大的困难。所以在进行车辆检测时,要对获得的视频图像进行处理,来提取目标车辆信息,常用的方法有帧间差分法、背景差分法、边缘检测法等。
3.2 车辆跟踪
对车辆进行检测的目的是辨别运动车辆,然而要想了解目标的运动参数,还要对车辆进行跟踪。车辆跟踪的核心内容是根据目标运动车辆的某些特征在不同的图像帧中进行目标匹配,用于匹配的特征包括位置、大小、形状,以及局部的点、线特征和整体轮廓特征等[1]。常用的车辆跟踪方法有基于区域的方法、基于特征的方法、基于运动估计的方法、基于模型的方法、基于轮廓的方法等。
3.3 阴影检测
阴影检测是交通视频监控系统的一项重要且具有挑战性的工作。运动目标车辆由于受各种光源的影响会产生阴影,而阴影与运动目标车辆具有相似的视觉特征和运动特征,所以前面介绍的车辆检测方法都不能有效地将阴影检测出来。阴影的存在会使车辆检测和跟踪产生误差,给交通参数的提取带来很大误差,因而阴影的检测与去除是视频检测的重点和难点。根据阴影形成的不同原理可以把阴影分成不同的类型,而不同类型的阴影又有不同的特点,这给阴影的检测和提取提供了可能。目前,阴影检测方法通常包括两大类:一类是基于阴影属性如颜色不变性、纹理不变性、低频性质等属性的检测技术,另一类是基于应用场景先验知识的模型的阴影检测[2]。
3.4 交通参数的检测
交通参数可以分为两类,一类是针对某一具体车辆的,如该车辆的车型、颜色、车牌、速度、重量等;另一类是针对某一具体路段的,如该这段的固定时间内的车流量、平均速度、车辆密度、车辆数目、路面占有率等。基于图像处理的交通参数检测需要实时处理大量的图像数据,这些参数的获得可以为交通执法提供依据,增加交通道路的容量。目前应用较为广泛的交通参数获取方法为虚拟线圈检测方法,很多学者都在此基础之上设计算法更加精密的检测系统。
3.5 车牌识别
车牌识别技术(Vehicle License Plate Recognition,VLPR) 是计算机视频图像识别技术在车辆牌照识别中的一种应用。车牌识别是现代智能交通系统中的重要组成部分之一,应用十分广泛。它以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者视频序列进行分析,得到每一辆汽车唯一的车牌号码,从而完成识别过程。通过车牌识别可以实现对停车场的收费管理、车辆定位、交通违法行为监控等功能,对于维护交通安全、实现交通自动化管理有很重要的意义。
视频图像处理技术在交通视频监控系统中应用的已经十分广泛,随着计算机视觉、人工智能理论的发展,对包含运动目标的图像序列进行分析和处理,能够实现交通管理的高效智能化。随着视频图像处理技术硬件的不断发展,我们所面临的挑战是如何找出与硬件相匹配的高效的软件技术(即先进的算法),使智能交通系统的功能更加强大和完善。
【参考文献】
[1]梁晓爱.基于视频的车辆检测与跟踪技术研究[D].山东师范大学,2010.
[2]许洁琼.基于视频图像处理的车辆检测与跟踪方法研究[D].中国海洋大学,2012.
[3]卫小伟.视频图像处理技术在智能交通系统中的运用[J].电子测试,2015(6).
[4]姜旭.视频图像处理技术在智能交通系统中的应用[D].苏州大学,2009.
篇8
【关键词】自动控制技术;农业自动化
由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距,已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术,如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展,从而形成了一系列适合我国农业特点的自动化控制技术。
1.已有的农业机械及装置的部分自动化控制
自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上,成功研制出6CRK-55型可编程控制加压茶叶揉捻机,它利用计算机控制电功加压机构,能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制,是机电一体化技术在茶叶机械上的首次成功应用。
1.1应用于拖拉机
在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。
1.2应用于施肥播种机
根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。
1.3应用于谷物干燥机
不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时,自动掐断燃料供给的装置。
2.微灌自动控制技术
我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年,全国共有节水灌溉工程面积0.133亿m2,其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段,高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况,对灌溉用水进行动态监测预报,实现灌溉用水管理的自动化和动态管理。在微灌技术领域,我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备,总结出了一套基本适合我国国情的微灌设计参数和计算方法,建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统,可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。
3.自动控制技术在精准农业中的应用
篇9
关键词:果蔬;商品化;机械采收;自动化技术;视觉技术
中图分类号:S667.3 文献标识码:A
商品化处理将采后的果蔬转化为商品的一个重要环节。利用科学恰当的商品化处理方法将果蔬从原产地完好无损地转移到消费市场,并利用贮藏技术进行保鲜处理。果蔬一旦脱离本枝就会很快变质,丧失原有的鲜味,还会生成有毒物质,这对于商品化处理中的保鲜技术提出了考验,很多农户或者农产品加工企业正是没有熟练掌握这类技术,导致不能进一步扩大经营规模,其积极性也不高,严重制约了果蔬产品化产业的发展。
随着经济全球化的发展进程,果蔬产品跨区域流通进一步加大,有的产品远销国外,实现了跨洲际流通,国外其他国家和地区的果蔬产品也得以流通到国内消费市场进行销售,这对于我国果蔬产品产业形成了很大的冲击,新形势要求我们必须尽快发展完善目前的果蔬产品采后商品化处理技术,只有发展商品化处理技术达到国际先进水平,才能在面向国际的市场竞争中立于不败之地[1]。
1 各种果蔬机械采收技术分析
目前国际通用的果蔬采收是利用机器人来实现。应义斌等根据苹果的形状特征研发采摘机械,能够在不受自然光和果实颜色影响的情况下准确地找到果实。由于果实和枝条、叶片之间存在着一定的温差,通过摄取红外图像,可以提高采摘的准确度。结果表明,从热红外图像中检测到的苹果的位置和尺寸与实测结果一致,即使光照和温度发生改变,机器人依然可以准确得完成苹果采摘作业而不受影响。此外,根据在自然光线下拍摄的柑橘树图像,分析研究其色度与亮度信息,建立一个利用彩色图像颜色信息从树枝间识别橘子的分类模型,果实的识别率可以达到75%的准确率,果实形心的误差为6%,虽然速度可以达到实际工作需要,但是精确度还有待提高。半自动果品采收机是由甘肃省庆阳市农业机械化技术推广站研发的一种面向包括番茄、西瓜、猕猴桃、李子等20多种果实开展作业的机械采摘技术装置。由一个人对机械进行操作,可以对5m以下,10cm果径以内的果蔬进行随意采收,并顺利输送到纸箱或者果袋。半自动果品采收机的使用,减轻了劳动强度和作业环节,提升了果品摘净回收率,果品也能得到完好的保存,同时还不会对树枝造成损伤,是一种非常环保、实用的自动化采摘机械,值得大力推广。
王桂琴等[4]通过计算机视觉系统将西瓜彩色图像由RGB转换为HIS,通过对其色调和饱和度的对比研究发现图像饱和度的平均0值随西瓜成熟度提高而下降。对于难以被发现的隐蔽西瓜,还可以利用送风装置扇动叶子,采集和处理其产生的连续动态图像信息。梁喜凤等报道了番茄收获机器人的系统组成和技术,通过分析番茄收获机器人各部分的功能和工作原理,对番茄收获机器人通用性、可靠性、工作效率、采摘质量与机械手性能等方面进行了研究。张瑞合等在番茄收获过程中采用了双目立体视觉技术,对番茄树冠进行摄像,将图像中的颜色分布用二维直方图进行描述,再进行灰度变换后提取背景区边缘。在具体确定番茄的准确位置时,用曲线分割法将番茄的图像分离出来,连同两幅二维图像的信息一起确定番茄的三维空间坐标。如果图像色彩对比明显,直方图的曲线分割法能较好地将绿色叶片背景下的红色番茄分割出来。当计算机视觉系统准确地确定目标后,即引导机械手接近果实并采摘。实验结果表明,摄像机与目标相距0.3~0.4m时,计算机视觉系统较准确,相对误差可控制在3%~4%,但如果超过上述界限,双目视觉技术难以发挥作用。对其他红色果实如樱桃、辣椒等,具体使用时只需要做简单调整。荷兰研制成功的移动式黄瓜收获机器人由行走车、机械手、视觉系统和末梢执行器4个部分组成。该机器人能够在行走车的辅助下准确快速地到达作业位置,其视觉系统可以准确定位黄瓜的精确位置,并能够检测出黄瓜的成熟度,其末梢执行器功能则是将成熟黄瓜从茎秆上摘下。蘑菇自动化采摘系统是由周云山等研发。在图像处理和模式识别的基础上,确定蘑菇位置并将机械手移动到指定位置,再按照抓取控制系统的指令完成抓取动作,最后根据抓取的蘑菇尺寸,由计算机控制气动伺服机构带动机械手运动到适合的容器位置将蘑菇投入其中。在这个过程中,必须要求计算机视觉系统能够提供准确可靠的信息,才能指导机械手成功到达采摘位置迅速开展工作,防止抓取失败或损伤蘑菇。
2 果蔬采后商品化处理技术发展趋势
随着市场全球一体化,果蔬产品的采后处理已经成为了体现果蔬价值最重要的技术环节,能否使局部区域的特产畅销于更远更大的市场取决于采后商品化处理技术。果蔬的商品化处理技术的研究和运用得到越来越多的重视,尤其是无毒无害的物理处理方式。基于安全无毒、经济可行、实用性强、易于推广的采后商品化处理技术成为了各国研究的热门方向之一。
参考文献
[1] 杨福馨.农产品保鲜包装技术[M].北京: 化学工业出版社,2004:328-329.
[2] 应义斌,章文英,蒋亦元,等.机器视觉技术在农产品收获和加工自动化中的应用[J].农业机械学报,2000,31(3):112-115.
篇10
关键词:计算机视觉;果蔬分类;应用;挑战;展望
自“农业4.0”时代的来临,以“互联网+”为驱动的农业技术已成为发展农业强有力的支撑。在果蔬业中,果蔬分类通常由经过训练的人员人工评估农产品或农作物的质量。但是,人工分类会带来许多相关的限制,工作人员需要熟悉果蔬的许多特征,并且高强度的机械性工作带来的失误不可避免,因而分类技术的提高是农产品质量提升的关键。计算机视觉技术具有效率高、非接触、抗干扰能力强等优点,在多个领域已经广泛应用,能实现农产品快速无损检测的要求[1]。果蔬分级效率的提升对我国产品质量提升、农民增产增收具有重要意义。
1图像处理技术在果蔬分类领域的应用
本文对基于计算机视觉技术的果蔬分类进行了比较调查,发现研究人员多使用一种或者多种传感器或者机器学习技术进行农产品的分类与分级,但是由于相同水果品种不同造成形状、大小与颜色的不同,果蔬的分类依然面临着许多挑战[2]。为解决这些问题研究人员已经进行了多种实验,其中结合机器学习技术对于系统有明显提升。通过使用传感器捕获水果与蔬菜的特征,使用机器学习对任务进行优化,以提高系统整体性能[3]。
2果蔬分类的主要挑战
虽然已经在多个产业中实现目标分类,但将果蔬作为对象进行分类仍然是一项复杂的问题。在实际过程中,环境、光及空间等因素制约了系统的优化,使系统的时间与准确性方面受到限制。光照方向及亮度、色温以及背景所造成的镜面反射与漫反射都会制约系统的进一步优化,并且不同种类果蔬的特征并不相同,这也使果蔬分类系统没有被广泛地开发。
2.1缺乏合适的传感器
分类任务的一个关键步骤就是选择适合场景的传感器用于数据采集。在果蔬的分类任务中视觉传感器与非视觉传感器已经广泛地应用,但是由于各种传感器性质不同其所适用的应用场景亦有不同[4-6]。例如超声波传感器与触觉传感器都不太适合易损的目标物[7]。因为这些传感器需要物理接触果蔬以获取数据。另外,视觉传感器对许多因素高度敏感,例如照明条件和背景环境。这些基本因素是许多复杂因素的结合,包括反射、折射、缩放、旋转和平移,这在系统实际的设计中需要深入考虑。传感器大致分为视觉传感器和非视觉传感器。由于每个传感器具有一定的局限性,例如视觉传感器对照明条件和背景颜色高度敏感。高光谱相机可以得出物体反射特性,检测具有相似颜色或背景的不同对象的固有特性,其对许多颜色等因素不敏感,并且高光谱信息与水果的其他特征相结合,可以提高系统性能。最近,热红外分析已用于许多领域,例如植物病害检测、冷藏对果实的冷害、农作物成熟度估算和农作物产量估算[8]。然而,由于蔬菜和背景的热物理性质大致相似,并且这种技术对温度变化敏感,因而热红外分析仍不能很好地完成绿颜色水果和多叶蔬菜的分类任务。
2.2难以准确选择特征
特征是用于与其他物体区分的物理特征。果蔬具有多种物理特征,例如颜色、质地、形状和大小,这些都是可以用作分类的特征参数,并且果蔬具有类间和类内的同异性。类别间的变化是主要变化,即颜色、纹理和形状的变化,而类别内的变化更难以发现,特征更加难以区分。理想的系统能够进行类间和类内分类。研究表明,单个特征不能有效地对果蔬或物体进行有效分类。计算机视觉是用于图像分类和识别的一种技术,可以设计算法通过多种方式对果蔬进行分类,通常分类是基于神经网络完成。在任何机器学习应用程序中选择合适的算法至关重要,但是由于果蔬的类间相似性,算法优化尤为重要。数字图像中某些与特性有关信息的识别、分类、检索、重建称为特征描述,果蔬具有相关的独特视觉特征。果蔬的分类和识别最常用的特征是颜色、形状、大小和质地,可以根据整体或局部图像特征来选择特征描述是全局或者局部的特征。特别是对于对象识别,全局图像特征描述整个对象,具有良好的不变性,而局部图像特征则易于实现快速匹配。因此,通常将局部和全局图像特征配合使用以提高整体性能。在图像经过去噪、平滑等操作之后,图像的细节将不可避免地丢失,因而需要更加注意特征的选取。这些因素对特征描述的选取造成了一些限制。
3展望
- 上一篇:公路养护调研方案
- 下一篇:社区个人工作总结汇报