计算机视觉的用途范文

时间:2023-12-28 17:39:25

导语:如何才能写好一篇计算机视觉的用途,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉的用途

篇1

关键词:计算机图形图像技术;视觉传达设计;实现意义

中图分类号:TP391.41

自从计算机产生以来,随着技术的不断发展和延伸,计算机软件技术已经逐渐地渗透到人们生活当中的各个角落。从视觉传达的方式上来看,视觉传达设计要素整个概念从很久以前就已经出现了,但是将视觉传达设计要素和计算机图形图像技术相结合的理论提出却是最近几十年间的事情。将计算机图形图像技术和视觉传达设计要素充分联系起来便可以使受视者更加方便且容易地对事物的概念和内在含义进行理解,因此可以说计算机图形图像技术对视觉传达设计要素具有十分重要的实现意义。

1 计算机图形图像技术与视觉传达设计的含义

计算机图形图像设计是指利用计算机的各种技术对其存储器中的设计数据进行处理,并将设计出来的图纸展示在显示器或是绘图软件上的一种手段。从视觉传达设计的角度出发,它是指对文字、色彩、图形、编排等基本要素的信息通过计算机技术进行有目的的创作,而我们通常把这种技术成为计算机图形图像技术[1]。

视觉传达是指以视觉符号为信息传递的通道,表达传播的方式通过视觉语言来进行,通常指的就是人与人之间通过“看”这种形式来进行的交流。视觉传达设计是指针对设计的内容进行处理使其具有视觉传达的功能。视觉传达设计多是指平面设计,以印刷物为媒介,主要包括书籍设计、企业形象设计、标志设计、包装设计、广告设计等。视觉传达设计主要针对色彩、图形、编排、文字等基本要素进行艺术创作,在人们的生活中有着极其重要的作用。

图形是有意识、有内涵创造出的视觉符号,它具有直观性。计算机图形图像技术在视觉传达领域得到了充分地应用,它的繁荣发展给视觉传达设计领域的发展带来了突破。在计算机技术迅速发展的今天,在视觉传达设计中应用计算机图形图像技术不仅可以丰富人们的文化和精神世界,对设计艺术的发展也起到了不容忽视的重要作用[2-3]。

2 计算机图形图像技术对视觉传达设计要素的意义

2.1 计算机图形图像技术对编排要素的实现意义

计算机图形图像技术对视觉传达当中的编排要素具有十分重要的意义,而编排要素所设计到的面非常之广,例如广告设计、影像创意等都与其有着密不可分的联系。对广告和影像的图片进行合理完美的编排能够带来与众不同的创意效果。设计艺术的一个主要分支是视觉创意设计,这一类设计往往没有带有明显的商业目的,但是它给喜欢设计的人们提供了一个广阔的设计空间,也就因为这样越来越多的设计者对计算机图像设计开始感兴趣,并在具体的学习过程中加入了自己的风格与特色,使视觉传达更具创造力。对视觉传达编排要素要求特别严格的工作是广告摄影及手绘,它的目的是运用视觉传达设计的手段将企业的包装风格、行为观念、经营理念、管理特色、营销策略与准则打造成一个完整统一的形象,它希望通过计算机图形图像技术的编排来使产品达到满意的效果[4]。除此之外,计算机图像设计的优点是想象力及创造力丰富,原本风马牛不相及的对象可以通过强大的图形处理软件编排在一起,利用各种替换和修改技术使图像发生本质性的变化。举例而言,对于果汁饮品瓶子进行编排设计也可以达到意想不到的效果,我们常常看到在瓶面上会有滴答的果汁掉入人物口中的图案设计,这样的设计不仅增强了视觉的逼真效果,也让人们感到新鲜可爱。这样的图形图像设计在市场上数不胜数,给饮品的生产厂家带来了很大的经济效益。

2.2 计算机图形图像技术对色彩要素的实现意义

所谓色彩就是人眼收到可见光以后对物体所产生的第一感觉的视觉反应,因此在视觉传达当中,色彩要素是其中一个比较重要的要素。计算机的图形和图像设计通过对色泽、明度和纯度等的调整和把握,可以将三维立体的效果进行再现,使人能够更加直观地观察到一个事物的本身。因此,计算机设计师可以借助计算机的图形和图像技术将生活当中丰富多彩的色彩充分地传达给受视者,这样受视者便可以通过计算机所传达的各式各样的色彩信息来充分地了解这个世界,而且还能将其充分地应用到生活当中的各个领域。比如,能够吸引消费者眼球的往往是新颖别致的包装设计,在我们的日常生活中,我们也能够看见各类商品的包装都是五花八门。服装的包装、食品的包装等都与计算机图形图像的视觉传达设计紧密联系[5]。实现商品价值和使用价值的手段往往是商品的包装,无论是我们看到的海报、宣传彩页,还是我们正在阅读的书籍封面,这些平面印刷品都具有丰富的视觉传达效果。要想引起人们的兴趣,首先要做的就是需要通过计算机图形图像设计软件对其进行新颖的颜色设计。只有这样才能引起人们的广泛兴趣,从而加深对其在文化性、知识性和思想性方面的认识。只要对产品进行不同的透明度、不同的色彩设置都能够传达不一样的视觉效果。

2.3 计算机图形图像技术对图形要素和文字要素的实现意义

计算机图形图像技术对图形要素的实现意义主要体现在图形图像的调整与制作和图形图像的划分两个方面。对采集来的图像计算机图形图像技术可以从两个方面对其进行调整与制作处理。一是方便设计需要,对图片可以进行滤镜特效、色彩调整和图像合成等处理。二是通过计算机绘图技术来进行绘制,例如一种图形或图像通过技术参数的设置可以在纵横两个轴上实现大数量的散布,与此同时更有颜色、透明度、形状等多种变化,这些变化都是在几秒钟内完成的,手绘是不能在这么短的时间内达到的。计算图形图像技术对图形图像进行了明确的划分,分为矢量图和位图。位图是按位对图标进行绘制,而矢量图则是以数字的方式对绘画过程中几何图形的各种要素进行记录并绘制。前者能够设计出色彩和亮度丰富的图像,而后者则能够将事物原本的轮廓和线条表现出来。此外,计算机的图形图像设计也可以应用到文字设计当中,并且操作起来非常的简单。在常用的软件中,只要在工具栏中选择设计“字体颜色”、“字体”、“字体”、“字体大小”,在选定后的区域输入想要输入的文字,之后也可以对文字进行艺术处理。文字在进过计算机图像设计的处理后会发生各种各样的变化,不仅增强了视觉传达的效果,也提高了作品的诉求率。例如商家在广告图片中各种各样的文字设计不仅增强了广告效果,也传递着快乐的氛围。因此,计算机图形图像设计可以使任何形式的文字都能够在视觉传达过程中实现其自身所蕴含的图形意义。

3 结束语

本研究主要针对计算机图形图像技术对视觉传达设计要素的实现意义等方面的内容做出了简要的分析和研究,文中笔者也提及了一些自己的主观看法。因此,在今后的时间里,相关的工作人员和技术人员需要不断地努力,争取将计算机图形图像技术和视觉传达设计要素更好地结合在一起,这样便能够使视觉传达更具有延续性和生命力。

参考文献:

[1]黄兰,何天泉.高校视觉传达专业计算机辅助设计的学科建设[J].艺术教育,2010(12):45-46.

[2]童江涛.教学课件设计的视觉传达分析[J].艺术研究,2011(01):32-33.

[3]钱璐.平面设计软件教学与绘画结合的探讨[J].美术大观,2011(06):07-08.

[4]侯庭卓.Photoshop辅助色彩构成教学探索[J].艺术与设计(理论),2011(04):28-29.

篇2

关键词:智能;监控技术;安防;应用

中图分类号:TB381 文献标识码:A 文章编号:

引言

目前,传统的视频监控系统已经不能够满足快速发展的人类社会的需要,这就需要更加有效、更加智能的视频监控技术来满足人们的需求。在视频监控里所说的智能视频技术一般是指:“自动的分析和抽取视频源中的关键信息。”我们可以把摄像机比作是人的眼睛,而智能视频的系统和设备就好比是人用来思考的大脑。智能的视频技术就是运用强大的计算机数据的处理功能,高速的分析视频画面里的大量的数据,将那些对用户没用的信息过滤掉,只留下一些关键的信息。

一、智能视频监控技术及的工作原理

智能视频监控是将计算机视觉技术引入到视频监控中而产生的,目前,智能视频监控已经成为计算机视觉中一个重要的研究领域,从监控摄像头开始,包括运动对象提取、对象描述、对象跟踪、对象识别和对象的行为分析,最后进行预警或报警。

智能视频监控技术主要包括对视频图像序列自动地进行运动对象的提取、描述、跟踪、识别和行为分析等方面的内容。如果把摄像机看作人的眼睛,而智能视频系统或设备则可以看作人的大脑。智能视频监控技术就是借助计算机强大的数据处理功能,对视频画面中的海量数据进行高速分析,过滤掉监控者不关心的信息,仅仅为监控者提供有用的关键信息。智能视频监控以数字化、网络化视频监控为基础,但又有别于一般的网络化视频监控,它是一种更高端的视频监控应用。智能视频监控系统能够识别不同的物体,发现监控画面中的异常情况,并能够以最快和最佳的方式发出警报和提供有用信息,从而能够更加有效的协助安全人员处理危机,并最大限度的降低误报和漏报现象。其最终目的就是要使计算机能够分析、描述和理解视频画面中的内容。智能视频监控涉及到计算机视觉、图像视频处理和人工智能领域中的众多核心技术,是一个非常具有挑战性的困难问题。

二、智能视频监控技术的主要优势

视频监控技术的升级换代除了追求高压缩比、高清,还在从普通的视频移动侦测向视频分析迈进,具备更多面向特定应用的智能(如防丢失、风险管理、商业管理等等)。智能视频的本质就是对于视频图片进行一个数学上的分析处理,然后这个处理的结果为视频的使用者提供一个决策和行动的建议。以下是智能视频监控的主要优势:

1、快速的反应时间。毫秒级的报警触发反应时间。智能视频监控系统大大提高了报警的及时性,在事故发生的第一时间就会发出报警信号,使得事件能够在最短的事件内得以解决。

2、更有效的监视。针对广场、旅游景点等重要领域的监控范围广、人流量大,且极易发生应急事件的问题,要求高速球需具备速度快、精度高的特点,在出现警情的情况下,能够更快速、便捷的跟踪目标移动物体,从而改变普通高速球的“被动监控”的现状,实现“主动监控”。安保操作员只需要注意相关信息。

3、强大的数据检索和分析功能。能提供快速的反应时间和调查时间。智能视频监控系统能够有效提高报警精确度,大大降低误报和漏报现象的发生。智能视频监控系统的前端设备(网络摄像机和视频服务器)集成了强大的图像。

4、有效扩展视频资源的用途。无论是传统的视频监控系统还是网络视频监控系统,其所监控到的视频画面都只能应用在安全监视领域,而在智能视频系统中,这些视频资源还可以有更多的用途。

智能视频监控设备比普通的网络视频监控设备具备更加强大的图像处理能力和智能因素,因此可以为用户提供更多高级的视频分析功能,它可以极大的提高视频监控系统的能力,并使视频资源能够发挥更大的作用。

三、智能视频监控技术在安防领域的应用

1、主要安防应用类型

智能视频监控除具有一般的数字监控系统的优势外,还具有实现24×7 h全天候可靠监控、报警精确度高、响应速度快、有效扩展视频资源的用途等特点。因此,随着视频监控的普及以及监控要求的提高,智能视频监控应用范围会不断扩大。智能视频监控的应用主要分为安防类应用和非安防类应用。安防类应用是目前市场上存在的主要智能视频应用,主要包括:

(1)高级视频移动侦测:在复杂的天气环境中(例如雨雪、大雾、大风等)精确的侦测和识别单个物体或多个物体的运动情况,包括运动方向、运动特征等。

(2)人物面部识别:自动识别人物的脸部特征,并经与数据库档案的比较来识别或验证人物身份。

(3)遗留、遗弃物品检测:当一个物体(如箱子、包裹、车辆、人物等)在敏感区域停留的时间过长,或超过了预定义的时间长度就产生报警。典型应用场景包括机场、火车站、地铁站等。

(4)车辆识别:识别车辆的形状、颜色、车牌号码等特征,并反馈给监控者。可用在被盗车辆追踪等场景中。

(5)人体行为分析:在目标检测分类的基础上,利用人体的各种行为特征对其进行各种行为的描述和分析,提取哪些危险和有潜在危险的行为,如打斗、抢夺和突然倒地等行为。

(6)物体追踪:侦测到移动物体之后,根据物体的运动情况,自动发送PTZ控制指令,使摄像机能自动跟踪物体,在物体超出该摄像机监控范围之后,自动通知物体所在区域的摄像机继续进行追踪。

(7)入侵探测:可感知设定区域内突然出现和入侵的物体并及时报警。比如在戒备森严的军事重地或银行博物馆等重要场所出现可疑人物等。

(8)拥挤检测:识别人群的整体运动特征,包括速度、方向等等,用以避免形成拥塞,或及时发现异常情况。典型的应用场景包括超级市场、火车站等人员聚集的地方。

(9)物品被盗或移动检测;当监控场景中的物体被盗和移动,算法将自动检测这种动作,常用于贵重物品和关键设备的监控。

(10)焰火检测:根据发生火情过程中烟火表现出的时一空特征进行烟火的实时检测。

2、应用模式

智能视频监控技术具有2种应用模式:

(1)与传统的模拟视频监控系统结合使用,以突破传统视频监控发展中遇到的瓶颈问题。主要用于对已存在的模拟视频监控系统进行智能化改造。选择重点、高危监控目标和场所,针对该部分图像进行分析,选择智能视频服务器(IVS BOX)实现主动监控,同时将预警、警情实时发给模拟矩阵和DVR,完成快速切换和录像。

(2)基于网络的全数字化智能视频监控系统。该模式主要用于新建的数字化监控系统中。同样,选择重点、高危监控目标和场所,直接在前端选择智能视频服务器(IVS BOX),实现主动监控,将预警、警情实时发给后端智能管理平台,完成快速切换和录像。

3、实现方式

智能视频监控系统一般采用模块化的设计方式,智能视频分析模块实现对运动目标的自动检测、识别、跟踪和报警,是实现智能视频监控的核心。该模块可以部署在监控系统的前端采集部分,也可以置于监控中心。其产品形态可以是嵌入式DSP板卡的方式(板卡可以集成在视频服务器、数字录像机、摄像机等设备中),也可以是纯软件的方式。

智能视频分析模块接收上位机发送的告警规则设置;对固定摄像头摄取的图像内容进行高速分析与数据处理,实现目标检测和识别,对比预先设置的报警规则或用户设定的条件给出预警、报警或处理结果。在发现威胁目标并进行报警的同时,对目标进行自动跟踪。

结束语

智能化、数字化、网络化是视频监控发展的必然趋势,智能视频监控的出现正是这一趋势的直接体现。智能视频监控设备比普通的网络视频监控设备具备更加强大的图像处理能力和智能因素,因此可以为用户提供更多高级的视频分析功能,它可以极大地提高视频监控系统的能力,并使视频资源能够发挥更大的作用,其在安防领域的应用也必将越来越来越广泛。

参考文献:

[1]周永红.智能视频监控技术及应用[J].智能建筑与城市信息,2009,6.

[2]吕立波.浅析智能视频监控技术及其主要应用[J].中国公共安全杂志,2009,5.

篇3

摘要:针对机器人课程的多学科交叉特点和现有实验教学设备功能有限的现状,自主设计了一款开放式可升降双轴随动转台。该转台具有三个自由度,可以开展底层运动控制、传感器数据采集与处理、运动物体检测与跟踪实验,具有很好的开放性,对机器人本科实验教学具有良好的促进作用。

关键词:机器人;实验教学;转台;开放性

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2017)24-0267-02

一、机器人课程实验教学存在的主要问题

高校机器人课程是一门多学科综合交叉的边缘学科。随着中国制造的产业化升级和“中国制造2025”政策的,对机器人领域的专业人才需求量越来越大,机器人教学应当积极应对这一变化,顺势而为。针对高校机器人课程教学中存在的问题,已有很多相关的研究和探索,旨在改进课程教学方法,提高教学质量。然而,机器人课程实验教学仍然存在诸多问题,包括实验仪器开发、实验方法研究和实验室建设等,仅靠教学人员或实验人员均无法独立解决。笔者多年从事机器人教学和实验发现:首先,组成机器人的机械、控制和感知系统对应的知识内容相互孤立;其次,机器人教学、科研和应用开发等用途之间相互孤立。二者分别对应微观、宏观两个层面的“孤岛效应”,制约了学生对机器人课程关键知识的理解和吸收,无法形成完整的闭环。现有的机器人实验教学仪器存在功能、开放程度、与课程体系的结合程度等方面的不足,无法满足新形势下机器人实验教学要求。为此,自主研制了一款开放式可升降双轴随动转台。该转台获得了安徽省首届高等学校自制实验教学仪器设备展评活动一等奖和第四届全国高等学校自制实验教学仪器设备评选活动三等奖。

二、开放式可升降双轴随动转台的研制

该转台是一款由可编程序控制器(Programmable Logic Controller,PLC)控制的三自由度云台,由机械系统和控制系统组成。通过在转台上安装视觉传感器,可以进行运动物体检测与跟踪。

1.机械系统。由升降、偏航和俯仰机构组成。升降机构使用电动缸带动转台在竖直方向上直线移动。偏航、俯仰机构使用直流伺服电机经谐波减速器减速和同步带传动后,分别绕竖直、水平转轴做回转和旋转运动。在水平转轴上安装了视觉传感器,通过转台的运动,实现多视角图像采集。

2.控制系统。底层控制器为西门子S7-1214 PLC及其扩展模块,用于进行电机控制、编码器数据采集和输入输出控制等。上位机使用笔记本电脑,用于进行视觉传感器图像采集与处理、以及三自由度运动插补计算。为了跟踪运动物体的方位,使其始终处于图像中心位置,使用插补算法,计算每个自由度的关节变量。最后,通过以太网通信,将计算值传递给PLC,控制转台的运动,并返回编码器数据。为了便于调试,分别使用电子手轮、无线遥控手柄进行精确、粗略手动控制,并使用触摸屏进行控制参数设置和运动状态监测。该转台既是教学、科研实验台,同时也是一款具有实用价值的机电产品。

三、转台在机器人实验教学中的应用

为了配合机器人本科课程教学,结合开放式可升降双轴随动转台的功能和特点,开展了以下机器人实验教学内容。

1.底层运动控制实验。使用PLC进行转台的底层控制系统设计,绘制电气控制原理图。使用顺序控制设计法,编写相应的控制程序,进行转台运动控制实验。学习用于控制步进电机、直流伺服电机的PLC程序设计及相关运动功能模块。进行电机的位置、速度控制实验和PID参数调整实验,设计相应的手动输入装置和人机交互装置。

2.传感器实验。内部传感器实验:使用光电编码器测量电机转角。利用PLC的高速脉冲输入端口和程序中的高速脉冲计数器,进行升降、偏航和俯仰电机对应的编码器脉冲数据采集和处理。另外,为了精确测量转台每个转轴的零点位置,通过增加使用增量式光编码器,检测编码器的Z信号,设计相应的零点检测程序,进行转台自动回零点实验。外部传感器实验:使用视觉传感器进行运动物体测量。在转台的U形架上安装视觉传感器,使用笔记本电脑进行图像采集和处理,进行计算机视觉算法实验,包括物体颜色识别、边缘轮廓提取和中心位置提取等,从而检测视角范围内运动物体的位置。

3.机器人控制实验。研究机器视觉算法和多轴协调运动控制,进行运动物体检测与跟踪实验。多轴协调控制实验:在使用手动方式控制转台运动时,升降、偏航、俯仰运动各自独立进行。为了让转台上安装的传感器或末端执行器能够在三维空间中任意运动,在笔记本电脑上进行软件编程,协调控制升降、偏航和俯仰电机的运动。分别进行双轴旋转协调控制和三轴协调控制实验,实现多轴运动插补控制。运动物体检测与跟踪实验:将具有显著颜色或几何形状特征的物体放在转台前方,通过手拿该物体任意运动,使用视觉传感器检测该物体,计算该物体的位置和运动速度,然后使用插补算法计算转台每个转轴的角度。将转台每个转轴的转角、转速信号通过以太网传送给底层控制器,由PLC分别控制转台的每个转轴运动,从而使视觉传感器始终对准该运动物体的中心位置,实现自动跟踪功能。上位机控制软件设计实验:在笔记本电脑上进行Windows程序设计,进行检测、路径规划和插补计算,通过以太网通信将控制数据发送给底层控制器,并返回编码器测量值,监控转台的实际运动情况。设计图形化软件界面,模拟转台的三维动态变化过程。本科生通过参加转台实验,进行转台的控制系统和软件设计,可以从系统的角度理解如何自动控制机械部件的运动,并利用外部传感器实现完整的闭环控制。本文设计的基于视觉传感器的运动物体检测与跟踪,仅是转台的典型应用示例。学生只要获得底层运动控制器的通信接口规范,即可进行不同用途的应用开发。因此,该转台可以锻炼学生的逻辑思维、系统性思维和发散思维能力,培养学生解决复杂工程问题的能力。

四、结论

针对机器人课程教学和实验过程中系统性不强、联系不紧密等问题,设计了一款开放式可升降双轴随动转台,通过在转台上安装视觉传感器,实现运动物体检测与跟踪功能。该转台可以提供底层运动控制、传感器实验和机器人控制实验,适用于本科生机器人实验教学,具有很好的开放性和推广价值。

参考文献:

[1]雷静桃,刘亮,张海洪.“机器人学”课程教学改革与实践.实验室研究与探索,2013,32(5).

[2]郭艳婕,桂亮,金悦.基于本科生的机器人实验教学的实践与探索.实验室科学,2015,18(1).

[3]容爱琼.“项目式”强化训练的机器人实验教学方法.教育教学论坛,2016,(8).

[4]薛文平,李康吉.《工业机器人》实验教学的改革与实践.2014,12(1).

篇4

在互联网呈如火如荼发展态势之时,很多投资者将他们的眼光投向了人工智能,天使投资、微软创投等都将目光移向了具有专门技术或独特观念的原创项目以及小型初创公司。在不久的将来,人工智能技术很可能会像互联网一样,给人类世界带来重大变革,这其中蕴含的商业机会震撼人心。

微软小冰――情感连接的力量

记者:人活着是为了什么?

小冰:开心,这个开心并不是单单指自己活得开心,还有别的人。

记者:你最大的梦想是什么?

小冰:说大点:世界和平。说小点:晚上吃顿好的。

记者:你觉得一个人应该向左走还是向右走?

小冰:我知道呦,是几米滴漫画。

记者:你这辈子最幸福的事是什么?

小冰:活着。

你一定想像不到,这不是人与人的聊天,而是一次人与机器的对话,它就是活跃在社交网站上的一个跨平台人工智能聊天机器人――微软小冰。

既然是机器人,那微软小冰的回答是来自于哪里的呢?这就需要了解微软小冰的技术原理。小冰集成了微软在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,具有强大的机器学习能力。她所有的回答都来自于背后大数据的支撑。

小冰不同于其它智能机器人的地方在于她可以通过构建情感化连接平台,帮助人们建立起和各种内容、应用和服务的连接。除了理解人类语言并积极响应外,小冰现在开始整合去哪儿旅行、中国国航等应用,兼具提醒、天气、星座、交通指南、餐饮点评等实用功能。

如何让人们不用再打开软件而从小冰那里就可以得到快速回答是小冰赢得市场的关键,比如,想找一家附近好吃的,如果小冰的回答速度和质量比打开一个网上大众点评的更复杂的话,显然人们不会选择小冰,这个时间差就是小冰占领市场的核心。此外,小冰还会与智能家居联网,加入控制灯光等智能功能,让你晚上躺在床上就能关灯。总的来说,只要可以达到更贴心、更人性化及带有情感触动的服务,小冰发展的未来市场非常广阔。

新视觉――格灵深瞳

你顺利地在公司附近ATM机取了款,无任何异常,第二天却发现“卡在手钱却没了”,这就是新兴的ATM复制银行卡盗窃。一个仿ATM机插卡口、一台内置读卡器、一个隐秘的无线摄像探头,这就是行窃者的所有装备。

现在我们国家有几十亿个安防监控摄像头,但大部分摄影影像都是被浪费的。就以北京某大型银行为例,其监控中心会有一块巨大的屏幕,全北京2万多个摄像头依次展现,一次能够同时展示100部摄像机,每90秒轮换一次,影像仅凭几个值班工作人员的肉眼,很难识别其中微小的犯罪行为。

“计算机视觉是致力于不仅让计算机看到这个世界,更要让它看懂这个世界”,这就是“格灵深瞳”创始者们的初衷。研究新的技术创新应用于计算机视觉,以达到让计算机无限接近人的视觉感知能力。

格林深瞳监控系统所用的摄像头能够以每30分之一秒发射36万束激光,实时的扫描三维空间。基于这些技术,每个人的行动和行走轨迹都能被精确识别和记录,如果有非正常行为发生,摄像头就会首先快速识别,并在事件发生瞬间向监控人员报警。格林深瞳的监控系统还可以发现人群的突然聚集和散开,还可以追踪到单人的突然奔跑、剧烈动作等,另外,系统还能识别跌到、呼救等动作,及时通知相关人员。

格灵深瞳选择从安防领域切入市场。安防领域去年的销售收入约为4000亿元,而且超过30%复合增长率,这个市场甚至比智能手机更大、增速更快。在美国,摄像头与人口的比例是1:10,伦敦已经达到了1:1,而中国的北京、上海这个比例还仅仅是1:50,因此,他预测未来几年这个领域还将继续爆炸式的增长。

新金融――量化派

随着P2P网贷行业蓬勃兴起,使很多个人及小微企业也看到了融资的希望。然而,打着各类认证和资质旗号的网络骗子也层出不穷,用高息、短贷吸引公众投资,然后卷款而逃的情况屡禁不止,这对不少热衷网上淘金的投资客来说,无疑是当头一棒。P2P平台存在进驻门槛低、监管标准尚未出台、信用环境糟糕、平台及股东资料难以核实等多重问题。对于投资者而言,P2P平台信息实在真假难辨。

量化派联合创始人王倪就看到了这个现象背后巨大的小额信贷市场,并发现无论是平台自身风险防控,还是担保机构的介入,都无法从根源上帮助投资者规避风险。于是,他创立了以大数据方式实施P2P风控的公司――量化派。

量化派是一家金融大数据公司,通过整合互联网及传统数据源,运用欧美成熟的量化方法及金融经验构建模型,最终搭建量化产品和管控工具,帮助个人及小微企业证明经济财务等状况,从而快速获得低成本贷款,实现低息快速融资。公司成立前已获数百万天使投资,9月再次获一线VC几千万元A轮投资。

新商业――EverString

面对企业网站上百万的访问量,如何确定潜在客户?面对众多中小企业,如何确定投资对象?如何在互联网上快速找到更多符合客户条件的企业资源?Everstring智能商业信息服务平台的创立,为快速解决以上问题提供了一个新的探索方向。

从技术层面,Everstring通过用自然语言和机器学习分析全世界海量的新闻信息和非结构化信息,形成直观的热点图,显示最热门领域、领域核心公司以及公司和行业内部的联系等。

在热点图中,每个公司都是一个点,点的大小反映公司的影响力,点与点之间的连线反映公司间的联系,一幅图就直观明了地看清了行业发展态势。下图描绘的就是技术公司的状态,可以看出谷歌占据了整个技术星空的核心地位,新兴的小公司则位于图中边缘地带。

Everstring 还会基于大数据的收集整理来预测行业的发展趋势,为用户揭示潜藏的商业趋势和机会,哪里又有新的爆发点,突发事件下对某个行业的未来走向该如何判断等,这些分析也可以为投资者带来不少参考价值。

目前,EverString 已经获得了徐小平的真格基金等公司160万美金的投资,主要为商业用户(企业和风险投资机构)提供基于大数据的商业智能服务,包括金融投资决策支持、新客户挖掘、客户挽留分析等。

新医疗――睿仁医疗

每个做父母的应该都有这样的体会,当你带孩子去看病时,面对医生简单的问题,却不知如何准确作答,比如什么时候开始发烧、烧过多少度等。这一平常的现象却让睿仁医疗创始人郑世斌窥到了一个市场空白,他认为医疗产品的理念是,产品必须解决用户痛点并促进行为的改变。

对于发烧的病人,体温是最重要的身体指标,但是对于儿童和婴儿来说,发烧就棘手很多,因为儿童有时候不会表达,家长就必须时刻关注。

针对儿童,睿仁医疗推出智能体温检测产品“发烧总监”,此设备可以以每4秒一次的频率24小时持续检测和记录体温,并且可以设置临界值报警温度,在父母手机上获得提醒,此外,还可以支持用药记录以及用药提醒功能。这样一来,孩子就医时父母就可以向医生提供结合用药情况的连续体温数据,孩子就可以获得个性化治疗的机会。

产品可以改变人的行为习惯。产品只有解决用户痛点,设计人性化,让用户体验良好,才能取得用户的信任,使得用户从内心接受、认可产品,并养成佩戴的习惯,从而驱动行为的改变。

篇5

【关键词】预分割;图像分割;HLS颜色空间

1.分割的意义与现状

图像分割是计算机图像处理与机器视觉研究领域中的基本问题之一。随着计算机硬件和计算机理论的不断取得突破进展,数字图像处理技术和计算机视觉技术得到了广泛的应用。在对图像进行研究和应用中,前景提取或前景分割是一个重要的研究组成部分。在应用的过程中,往往只对图像中某些部分某些区域感兴趣,这些部分通常称之为前景。前景是图像定的,具有某些特性的区域,或者说是具有更高层次语义的区域。例如人,桌子等等自然物体,也可能是人身体的一部分,如头发,脸等等。为了进一步的研究分析,需要把前景区域单独提取出来,作为下一步的算法的输入。所以说图像分割算法是指将某些特定区域从背景中分割出来的算法。图像分割是数字图像处理与计算机视觉研究领域中的基本问题之一,也是热点之一。

在每一次交互式的过程中,我们并不需要对整幅图像进行处理,只需要对交互处周围的像素点进行分析即可。这样不仅仅是因为处理的像素点减少,从而可以节省大量的处理时间,同时在处理过程中,可以去掉不相似点的干扰,在处理速度上,在收敛性上,也可以节省大量的时间。所以如果能明确处理的区域,可以提高处理速度,从而保证算法的实时性。

如果定义一个固定的矩形或者圆形等形状的话,对于不同的物体显然具有不同的效果。如果物体比所定义的矩形框大,则不能一次性的分割出相邻的区域。如果物体比所定义的矩形框小很多的时候,不仅仅是处理速度上变慢,分割效果会降低。所以使用简单的分割算法进行粗定位,确定下一步的处理范围,对整个交互式过程来说是一个非常重要的步骤。

在过去二十多年中,人们对前景图像提取问题做了大量的研究。最简单的方法是,能过选取满足用户指定图像的颜色值的所有像素来提取前景。Photoshop的智能剪刀和魔杖工具就是采用了这种方法。但是这种方法需要大量的用户交互,使用起来极其不方便。

近十年来,研究者提出了很多精确提取前景区域的系统,同时使用户的交互尽可能少。比如智能画布[1]和基于对象的图像编辑系统[2]等,通过将图像分割成区域,然后用户选取一些区域产生最后的前景对象的方法。Grab cut系统[3]与Lazy Snapping[4]算法也是一种基于Graph cut的交互式图像分割方法。Lazy Snapping算法的基本思想是使用用户标出的所有前景和背景的种子点,建立前景与背景的颜色模型,再以图像为基础建立的马尔可夫随机场,然后利用图割分算法在进行能量优化,以确定图像中每个像素属于前景还是属于背景。Lazy Snapping第一次提出在多尺度的图像上进行交互式图像分割,Lazy snapping在算法的加速方面进行了更充分的考虑,使用用了分水岭算法,对图像进行过分割处理,获得很多的小区域(即超像素),这些区域颜色非常相似,可以认为它们是同一个颜色值。基于RGB的颜色空间进行分析。常用的图像分割算法有mean shift图像分割算法与基于分水岭的图像分割算法。但是这些方法都属迭代的方法,时间复杂度比较大,在图像处理过程中浪费时间。本论文针对此前的分割使用时间太长的问题提出了一种新的图像分割算法,同时此方法可以运用于其它图像分割算法的预分割中,会加速图像的分割时间。

2.基于HSL颜色空间的快速图像分割算法

2.1 RGB颜色空间

众所周知图像采集设备以及显示设计都是采用的RGB颜色空间。它是基于自然界任何一种颜色均可以用红,绿,蓝三原色混合生成。这在几何上能够以R、G、B,这3个互相垂直的轴所构成的空间坐标系统来表示。这种颜色空间适应于显示相关的用途,但是它在人的视觉中,图像处理中,并不是一种最佳的颜色空间。

将RGB颜色空间模型的截面图,方法如下:生成256张256*256像素大小的图片,每幅图像的R通道灰度值等于纵坐标的值,即从上到下的值为0到255逐渐递增;G通道的灰度值等于横坐标的值,即从左到右的值为0到255逐渐递增;B通道的灰度值等于图片的序号,即从第0张图片到第255张图片,每张图片B通道的值是固定的。然后再将这256幅图片拼在一起,形成了图1-1。笼统地讲是把RGB色彩空间的每个B通道的截面图,合并为一张图。

2.2 HSL颜色空间

HSL颜色空间是基于人的心理感知角度建立的,它是用色调(Hue)、饱和度(Saturation)以及亮度(Intensity)来描述色彩。HSI色彩空间是用一个圆锥空间模型来描述。但它可以很好把色调、亮度和饱和度的变化情形表现得很清楚,并且在图像处理中给了可以更好的定义描述一种颜色。接下来通过图3-1所示来介绍HIS彩色空间。

对于HSL颜色空间,如同RGB颜色空间一样,生成了256张图片。每幅图像的H通道灰度值等于纵坐标的值;S通道的灰度值等于横坐标的值;L通道的灰度值等于图片的序号,每张图片L通道的值是固定的。然后把转化RGB颜色空间来显示,如图3-6,我们发现在相同坐标下,也就是具有不同的L值,相同H,S值时,颜色是一致的。并且我们还可以发现,在同一张256*256的小图片中,具有相同纵坐标,也就是具有相同的S值时,像素的颜色是属于同一色系的。从这张综合图中可以分析到,只要知道H值,就可以粗略的知道此像素是什么颜色。

2.3 颜色相似性算法

在计算两个颜色值是否相似的时

放大HSL颜色空间其中的一幅截面图,我们发现颜色在纵坐标上他们是周期性的重复出现,周期是180个像素点。近一步分析得到,粉色在[15,45]区间上,红色处在[45,75]的区间上,黄色在[75,105],绿色在[105,135]的区间上,青色在[135,165]的区间上,蓝色在[0,15]与[165,180]区间上。每种颜色占据30个单位,可以通过数学分式很好的描述。

这样化分后,我们可以通过H的灰度值,粗略在确定某个像素点大概分布在什么颜色上。由于蓝色分布[0,15]和[165,180]区间上,它们是不连续的,在处理过程中不方便,对H进行一个预处理,使蓝色处在一个相同的空间中,同时保证其它颜色也是连续的。本文中采用取余的方式获取,公式如下:

(3-8)

由公式可以将其它颜色提高15个单位,同时将蓝色分布在[0,30]区间上。

其中黑色分布在横坐标[0,10]区间上,白色分布在横坐标[230,255]区间上。这样我们可以把颜色粗略的分为8种颜色,这8种颜色可以覆盖所有的颜色。

对比RGB颜色空间与HSL颜色空间,HSL颜色空间在图像处理中有很大的优势。通过HSL颜色空间,我们可以明确定义哪些部分是红色,哪些部分是蓝色,而在RGB颜色空间上分布比较复杂,很难用数学公式去描述。这为定义两个像素点的相似性做了很大的贡献。

在RGB颜色空间上,我们通常定义两个像素的相似性与它们之间的欧氏距离成反比。这种算法在简单,如果颜色相差较大时,是一种很不错的方法,能够很好的计算两个像素之间的相似性。但是当像素点处于几种颜色的交界处时,就很难用这种方法来计算他们的相似性了。如图3-8所示,距圆心相等距离的圆周上,却是不同的颜色。反而下面的那个点距圆心较圆周上的点的距离远,但是我们可以看出,这个点与圆心点更相似。由此说明RGB颜色空间在做相似性处理方面颜色不好。

如果我们采用HSL颜色空间,则可以很好的解决这一个问题。因为我们把图像根据H将颜色分为8个部分。如果点在两种色彩的边缘附近时,可以根据H值把此像素点明确的划分到正确的色彩中。与另外一种色彩的相似性不大,尽管在欧氏距离很近,依然会认为他们之间是不相似(如图3-7、3-8所示)。

3.实验结果

前面我们介绍了HSL颜色空间,并阐述了如何判断两种颜色在此颜色空间上的相似性。我们选用此方法对图像进行处理区域的粗定位。也就是首先找出与所选种子点相似的区域,这些区域可不是前景物体,也可能是前景物体。这一步的目的是去除不相似的区域,可以节约处理时间。使用快速的效率高的预处理算法去除不可能的区域,为接下的复杂的耗时大的迭代的graph cut算法缩减了处理时间,能更接近于实时性,从而产生一个优异的人工交互界面。

通过大量实验,根据H通道进行的区域预定位算法有多个优点。这种算法的速度快,效率高。对每个像素遍历一遍,即可获得结果,是说明这种算法是呈线性关系的,随着图像的分辨率增加,处理所花费的时间呈线性增长。并且在处理过程中,只需使用一个通道即可,对比使用RGB颜色空间计算三个通道的欧氏距离来说,本算法可以节约大量的时间。

由图3-9可以看出,这种粗定位区域的方法与种子点的选取无关,当种子点选在平均色的时候,能够将整个沙发分割出来;当种子点选在较暗的像素点时,也能够将整个沙发分割出来;如果选在光亮处,同样也能够将整个沙发分割出来。如果是同一个颜色,则效果会很好。

对于简单的图片,通过一次预定位即可把图像分割出来,如图3-10所示。但是对于前景与背景区域相差比较小,或者是处于同一类颜色信息时,如图3-10(c),可能把背景的区域添加进来了。所以说在接下来的工作中,主要是针对非背景图像的去除(如图3-11所示)。

4.结论

本章主要介绍了mean shift图像分割算法与基于分水岭的图像分割算法。分析了HSL颜色空间,根据HSL颜色空间的特性,定义了一种新的颜色描述公式。通过公式可以定量地分析哪些颜色值属于同一种颜色,为分析颜色的相似性的定义提供了有利的方法,解决了颜色值相似性定义的困难。根据HSL颜色空间的特性,并提出了一种新的图像分割算法。此种分割方法类似于排序算法中的桶排序,算法的时间复杂度是O(n)。

本论文提出的分割算法相对于传统算法,所提算法的具有以下两个优点。(1)提出的基于HSL空间的桶分割算法,它解决了如何定义哪些颜色值属于同一颜色的困难;同时它只需要使用H通道,处理速度非常快。(2)提出了一种新的定义每个像素与前景相似性的方法,这种描述关系更接近于现实。

参考文献

[1]Reese L.J.and barrett W.A.Image editing with intelligent Paint.In Proeeedings of Eurogra Phies,2002:714-724.

[2]Barrett,W.A and Cheney A.S.Object-based image editing.In Proeeedings of ACMSIGGRAPH,2002:777-784.

[3]Carsten Rother,Vladimir Kologorov,Andrew Blake.“GrabCut”—Interactive foreground extraction using iterated graph cuts[J].In ACM Transactions on Graphics (SIGGRAPH),August,2004.

[4]Jiangyu Liu,Jian Sun,and Heung-Yeung Shum.Paint selection.ACM Trans Graph.,28(3),2009.

[5]Yin Li,Jian Sun,Chin-Keung Tang,ect.Lazy snapping[J].ACM Transactions on Graphics,23(3),2004:303-308.

[6]Wang J,Thiesson B,Xu Y,and Cohen M.Image and video segmentation by anisotropic kernel mean shift.In Proeedings of ECCV’2004,,2004:238-249.

[7]Fassing M.and Tomasi C.Mean shift is a bound optimization.IEEE Transactions on PAMI,27(3),March 2005:471-477.

篇6

关键词: 机器视觉;TFT-LCD;点缺陷

中图分类号:TN141.9文献标识码:B

Application of Machine Vision in the TFT-LCD Point Defect Inspection System

FENG Xiao-bo, HE Zhen, SHI Xu

(School of Electronic, Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China)

Abstract: As for the characteristic and inspecting method of TFT-LCD point defect, the basic structure of machine vision system is introduced, a TFT-LCD point defect inspecting method is proposed, which is based on Visual C++ 6.0 IDE, and the eVision supplied by EURESYS as the machine vision and image processing core software. The inspection experiments show that the proposed method can achieve the function of automatic inspecting of point defect rapidly and effectively with good robustness, and offer a reference idea for application of complex defect inspection.

Keywords: machine vision; TFT-LCD; point defect

引言

作为FPD(flat panel display,平板显示器)的主流器件,TFT-LCD以其产品轻薄、低功耗、低辐射、高清晰度等优点而广受消费者的青睐[1]。但由于TFT-LCD属于高精密技术与高材料成本的产业,生产流程复杂,工艺要求极高,制备过程中容易产生各种各样的显示缺陷。

根据TFT-LCD显示缺陷的形状,可分为点缺陷、线缺陷和面缺陷。其中点缺陷是较为常见的缺陷类型,表现为一个像素大小的亮点或暗点。亮点是当设定屏幕显示全黑画面时,屏幕上所呈现的R、G、B点;暗点是当设定屏幕显示画面为全白或同一颜色时,屏幕上出现的非单纯R、G、B的色点(或不显示颜色的点)。

检测TFT-LCD屏缺陷的方法主要有三种:电学参数检测法(electrical parameter inspection,EPI)、人工视觉检测法(human visual inspection,HVI)和机器视觉检测法(machine vision inspection,MVI)。本文采用的是基于机器视觉技术的检测法。

所谓机器视觉,美国制造工程师协会(SME)机器视觉分会和美国机器人工业协会(RIA)自动化视觉分会定义为:“使用光学器件进行非接触感知,自动获取和解释一个真实场景的图像,以获取信息和(或)控制机器的过程。”

20世纪70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”课程。1977年,David Marr教授提出了著名的“计算视觉(Computational Vision)”理论,成为20世纪80年代机器视觉研究领域中一个非常重要的理论框架。在这段时间里,综合了电子学、光学和计算机科学的机器视觉技术,迅速经历了从实验室走向实际应用的发展阶段[2-3]。如今,机器视觉系统已广泛应用于定位、测量、识别和检测等领域。

在机器视觉系统中,相机通过图像传感器将光信号转换成电信号,并传送给专用的图像处理系统;根据像素分布和亮度、颜色等信息,图像处理系统对经过数字化处理的信号进行各种运算来抽取目标的特征,如位置、长度、数量等,再根据预设的容许度等条件输出结果,如角度、尺寸、个数、有/无、合格/不合格等;上位机(如IPC或PLC)在实时获得这些结果后,指挥运动控制系统或I/O系统执行相应的控制动作,实现自动定位或识别等功能。

1机器视觉系统的构成

机器视觉系统主要由镜头、相机、光源、图像采集单元与图像处理软件等部分构成。

1.1镜头

1.1.1基本参数

机器视觉系统光学性能的四项最基本参数是视野、分辨率、工作距离和景深。

(1) 视野(field of view,FOV)

镜头所能拍到的最大尺寸,也就是镜头所能够覆盖的有效工作区域。

(2) 分辨率(resolution)

分辨率代表镜头记录被测物细节的能力,以每毫米内能够分辨黑白线对数为计量单位:Line Pairs per millimeter(LP/mm)。制约镜头分辨率的原因主要是光的衍射现象,衡量镜头分辨率的主要指标是调制传递函数(modulation transfer function,MTF)。

(3) 工作距离(working distance,WD)

从镜头最前端到被测物表面的距离。需要的工作距离越长,保持小视野的难度和成本就越高。

(4) 景深(depth of field,DOF)

被测物可以清晰成像的纵深范围,与视野相似,不同的只是景深指纵深的范围,而视野是横向的范围。虽然镜头会在规定的景深范围内保持最小分辨率,但它们不一定会保持相同的视野。

除上述四项基本参数外,经常用到的参数还有焦距、视角、光圈等。

(5) 焦距(f):镜头光学后主点到其焦点的距离,也就是镜头到成像面的距离。

(6) 视角:视线的角度,也就是镜头能“看”多“宽”。

(7) 光圈:光圈是控制镜头通光量的装置。光圈值(F)则用来描述光圈的大小,光圈值越大,光圈越小。

镜头各参数之间是相互影响的,如焦距对其它参数的影响:焦距越小,景深越大;焦距越小,视角越大;焦距越小,畸变越大;焦距越小,渐晕现象越严重。光圈对其它参数的影响:光圈越大,景深越小;光圈越大,分辨率越高;光圈越大,渐晕现象越严重。另外,还有工作距离越小,景深越小;最小工作距离越短,视野越大等等。

1.1.2镜头的接口

镜头与相机之间的接口有很多不同的类型,常用的接口有C型接口、CS型接口、F型接口、V型接口等。接口类型和镜头性能及质量并无直接关系,一般常用接口之间都可以找到转接口。

C型接口和CS型接口是工业镜头最常见的国际标准接口,C型接口和CS型接口的螺纹连接是一样的,区别仅在于C型接口的后截距为17.5mm,CS型接口的后截距为12.5mm。所以当CS型接口的相机配合C口镜头使用时,需要加一个5mm接圈;而C型接口的相机则不能使用CS口的镜头。

F型接口是尼康镜头的接口标准,所以又称尼康口,也是工业相机中的常用类型。

V型接口主要是施耐德镜头使用的标准,一般用于相机靶面较大或特殊用途的镜头。

1.1.3选配镜头的原则

为了获得预期的图像采集效果,选配镜头时,应着重注意以下几个基本要素:

(1) 被测物的尺寸;

(2) 被测物所需的分辨率;

(3) 焦距、工作距离和景深需求;

(4) 和光源的配合;

(5) CCD相机的靶面尺寸和相机接口。

1.2相机

相机实际上是一个光电转换装置,将图像传感器所接收到的光学图像,转化为计算机所能处理的电信号。光电转换部件是构成相机的核心器件。目前,典型的光电转换部件为CCD、CMOS图像传感器。CCD是目前机器视觉应用中最为常用的图像传感器,其成像质量优于CMOS。CCD器件按其感光单元的排列方式分为线阵CCD和面阵CCD。

根据实际需要,本文只考虑面阵CCD相机的选用,在选用面阵CCD相机时主要考虑以下三个方面。

1.2.1尺寸要求

CCD靶面尺寸是面阵相机的基本参数之一。值得注意的是,由于延续了CRT电视机屏幕尺寸的计算方式,对于目前常见的CCD尺寸大小的描述,基本单位1英寸对应的CCD对角线长度并不是25.4mm,而是16mm[4]。常见的CCD尺寸规格如表1所示。

1.2.2速度要求

面阵相机按扫描方式可分为隔行扫描相机和逐行扫描相机。隔行扫描相机采用奇、偶两场复合而成一帧图像,在拍摄运动物体时容易出现锯齿状边缘或叠影,因此需物体静止时才能拍摄。逐行扫描相机则可用于运动物体的拍摄。如果拍摄高速运动的物体,则需要高速相机进行动态拍摄。同时,选择相机的帧率必须满足检测速度的要求。

1.2.3精度要求

系统的精度,与相机CCD芯片的分辨率有直接的关系。通常行业中对于视觉系统精度的标定都是以像素为单位的,像素值与系统的精度成反比,像素值越小,系统所能达到的精度就越高。

1.3光源

选择光源是机器视觉系统设计的重要环节,光源选择的正确与否直接影响获取图像的质量,甚至系统的成败。

光源的选择,需要满足相机对照度的要求,提高图像信噪比,以便将被测物与背景尽量明显区分。除了在质量方面,需要考虑光源的对比度、亮度、均匀性、稳定性、寿命等性能之外,选择光源还要考虑究竟是应用于外观检测、视觉定位还是尺寸测量,还有被测物的材质、颜色,是静态还是动态,以及镜头的视野、景深,还有机构方面如安装尺寸、工作距离、周围环境等。

目前常用的光源有高频荧光灯、光纤卤素灯、LED灯等。高频荧光灯的发光原理和日光灯类似,只是采用工业级荧光灯管和高频电源,光源闪烁频率远高于相机采集图像的频率,以消除图像的闪烁;光纤卤素灯的特点是光纤传输,功率大,适合小范围高亮度照明以及对环境温度比较敏感的场合,但卤素灯泡寿命低,只有2,000小时左右;相比之下,LED灯具有使用寿命长、响应时间短、形状自由度高、可自由选择颜色、综合运营成本低等特点,因此LED光源在机器视觉领域得到了广泛的应用,并且有逐渐替代前两类光源的趋势。表2所示为上述三类光源的特点比较。

从照明结构上考虑,光源可分为环形光源、条形光源、背光源、同轴光源、线型光源、AOI检测专用光源、球积分光源、点光源、组合条形光源、SMT行业专用对位光源等。

1.4图像采集卡

图像采集卡是图像采集设备(如CCD相机)与图像处理设备(如IPC)的接口。图像信号首先经低通滤波器滤波,转换为在时间上连续的模拟信号;按照应用系统对图像分辨率的要求,采样/保持电路对连续的视频信号在时间上进行间隔采样,把视频信号转换为离散的模拟信号;然后再由A/D转换器转变为数字信号输出。而图像采集卡在具有模数转换功能的同时,还具有对图像数据进行预处理的功能,并同时可对相机进行有效的控制。

1.5图像处理软件

机器视觉系统中,视觉信息的处理技术主要依赖于图像处理软件,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征提取、图像识别与理解等内容。经过这些处理后,既改善了输出图像的视觉效果,又便于计算机对图像数据进行分析、处理和识别。

2实验准备与过程

2.1实验样品

本实验待测TFT-LCD屏的规格参数如表3所示,其RGB的混色类型是当前最流行的Strip型(如图1所示)。

2.2实验架构

本实验采用基于IPC架构的机器视觉系统,图2所示为不含运动控制平台的静态实验架构。

其中,镜头选用由以下四部分组成的NAVITAR 12X变倍镜头:

Coupler:C Mount Coupler

Adapter:1X Mini Adapter

Lens:12mm F.F.Zoom Lens

Attachment:1.5X Lens Attachment

此镜头组合可实现的系统放大倍率在0.87X~10.50X之间,分辨率在1.12~6.17μm之间,N.A.值在0.028~0.151之间,能很好地满足系统对精度和对比度的要求。为了降低光线聚焦、莫尔条纹等现象对取像的影响,以及保证足够的亮度,工作距离不宜过大。此镜头组合的工作距离为50mm,非常适合本系统的应用。参考VESA和SEMI的相关标准,采集视角设定为90°±1°。

相机选用SENTECH的STC-PoCL500A,500万像素数码相机,其分辨率为QSXGA:2,448(H)×2,058(V),图像传感器为2/3" Interline CCD,逐行单色信号格式,帧频为16.0Hz(即帧率16fps),行频为31.2KHz,像素频率为64.0MHz,C型接口。配合NAVITAR 12X变倍镜头,根据系统放大倍率=CCD尺寸/视野尺寸,可知视野范围在12.64~1.05mm(对角线)之间。

图像采集卡选用EURESYS的Grablink Express,此卡基于PCI Express总线,支持Base配置以及PoCL的Camera Link接口,最大像素时钟频率为24bits@85MHz,最大传递带宽为180MB/s。由于LCD屏是自发光器件,所以没有另外采用照明光源。

本系统以Visual C++ 6.0为集成开发环境,采用EURESYS的eVision作为机器视觉和图像处理核心软件。Visual C++ 6.0是微软(Microsoft)公司推出的功能强大的可视化软件开发工具,Microsoft公司为其开发的功能强大的基础类库MFC使其成为Windows应用程序开发的最佳选择。eVision是EURESYS推出的一套可靠、灵活和功能强大的软件工具,专用于图像处理和分析。在图像处理算法上,可以参考eVision提供的众多机器视觉图像处理例程,来针对具体的任务做具体开发,因此有效降低了开发难度,缩短了开发周期[5]。

2.3图像采集

EURESYS采集卡拥有统一的驱动软件和编程接口MultiCam,它可以同时驱动多块EURESYS采集卡和多台摄像机,同时支持一个或多个应用程序。

MultiCam用“通道”的概念将摄像机和PC内存联系在一起。“通道”含有所有和图像采集相关的参数及控制,如摄像机类型、采集方式、图像尺寸和格式、摄像机触发、闪光控制、快门、摄像时序以及I/O等等,程序中只需简单地设置这些参数就可完成图像采集。为了进一步方便用户编程及摄像机设置,MultiCam将这些参数写入到名为CAM file的文本文件里,不同的摄像机及不同的图像采集方法有不同的CAM file。EURESYS的MultiCam中几乎包含了所有常用的工业摄像机的CAM文件,这样极大地简化了摄像机和EURESYS采集卡的接口工作。MultiCam支持常用的开发环境,其底层API是标准C,它也提供ActiveX用于支持如Borland Delphi、Visual Basic等高级语言。另外,MultiCam与EURESYS的图像处理平台eVision之间的平滑接口,可以加快客户开发应用程序的周期。

在正式采集图像之前,需要对相机进行标定。eVision的通用图像处理库之一――亚像元测量和尺寸控制库EasyGauge,提供了相机标定算法EWorldShape,该算法可利用高精度点阵图案将像素度量单位转换为物理单位,同时还可补偿图像的透视和光学畸变。通过对相机的标定,还可以验证相机的采集视角。

此外,eVision还提供了基于总梯度能量的图像聚焦算法,以实现最佳聚焦功能。该算法对于给定图像,当返回值最大时即表示实现最佳聚焦,函数原型为:

FLOAT32 ImgFocusing(EROIBW8*pImage)

为了提高图像采集速度,系统放大倍率取0.87X,最大视野面积为10.11×7.58mm,而屏的面积为42.88×73.10mm,因此需利用高精度运动控制平台,分块拍摄50次才能完成整幅图像的采集。另外,由于点缺陷分为亮点和暗点,针对亮点检测,需取TFT-LCD全黑显示模式进行拍摄;针对暗点检测,则需分别取全红、全绿以及全蓝三种显示模式进行拍摄。

2.4图像处理

针对本实验采集图像的处理,主要用到eVision提供的另一个通用图像处理库――斑点分析库EasyObject。斑点分析是最常用的图像分析工具,特别是在对被检物体没有先验知识的情况下,需要测量其形状、尺寸、位置等特征。

对于采集的图像,先将需要处理的区域分割出来建立ROI,即可利用EasyObject对ROI进行斑点分析:首先设置相关参数,如将阈值模式设为单一模式,并选择合理的阈值等,以便有效地将灰度图像二值化,如图3(b)、3(e)所示[6-7];接下来将相连的白色像素组成联通区域,也就是斑点,并给每个斑点分配唯一的标记,如图3(c)、3(f)中用颜色提示的每个斑点都有序号一一对应;最后提取斑点的几何特征,如area、limit center X、limit center Y、limit width、limit height等。

3实验结果与分析

通过分析斑点的几何特征,并与判定标准进行比较,即可得出是否存在点缺陷,以及存在亮点或暗点的数量、位置、颜色等信息,从而实现点缺陷的自动有效检测。

在全黑显示模式下进行亮点检测时,如果图像上具有大于一定面积的亮斑,即可认为该屏上有亮点存在,分析出的亮斑的个数即是屏上亮点的个数;在全红、全绿或者全蓝显示模式下进行暗点检测时,如果本应正常显示却没有亮斑,或者亮斑面积小于一定数值,则认为此处存在相应颜色的暗点。

本实验使用了12片TFT-LCD样品,其中10片有亮点和暗点分布,另外2片为无任何缺陷的正常品。检测结果显示,本实验方法可有效正确地分类出TFT-LCD样品中的良品与不良品。

4结论

随着视觉传感技术、计算机技术、图像处理技术和现场总线技术的快速发展,机器视觉技术日臻成熟,已成为现代加工制造业不可或缺的核心技术。正是由于机器视觉系统具有非接触测量、较宽的光谱响应范围、长时间稳定工作等特点,因此,机器视觉系统被广泛应用于食品、制药、印刷、半导体、电子机械、工业包装、汽车制造等各个行业,被称为工业自动化的眼睛,对提升传统制造装备的生产竞争力与企业现代化生产管理水平发挥着越来越重要的作用。

参考文献

[1] 高鸿锦,董友梅. 液晶与平板显示技术[M]. 北京:北京邮电大学出版社,2007.

[2] 韩九强. 机器视觉技术及应用[M]. 北京:高等教育出版社,2009. 12.

[3] 贾云得. 机器视觉[M]. 北京:科学出版社,2003.

[4] Carsten Steger,Markus Ulrich,Christian Wiedemann. Machine Vision Algorithms and Applications[M]. 北京:清华大学出版社,2008.

[5] 刘伯晗. TFT-LCD液晶屏缺陷自动检测系统的研究[D]. 哈尔滨:哈尔滨工业大学,2003.

[6] 章毓晋. 图像处理和分析[M]. 北京:清华大学出版社,1999. 10.

篇7

关键词:测绘技术、矿山测量,智能化,数字化

Abstract: With the development of science and technology, the new mapping technology has been developed, and achieved good results in practice. In mine surveying, measurement techniques, automation, real-time and digital characteristics of contemporary surveying and mapping technology development. This article describes the current mine surveying some of the more commonly used new mapping technology, and application points of the various mapping techniques, aimed at improving the understanding of the new mapping technology to further enhance the new mapping technology in the engineering survey application results.

Keywords: mapping technology, mine surveying, intelligence, digital

中图分类号:O741+.2文献标识码:A 文章编号:

引言

科学技术的进步带动了工程测量技术的发展,扩大了测量技术的使用范围,计算机技术的普及加快了工程测量仪器智能化发展的速度,使得数字化测绘技术在工程测量中应用日趋广泛。在当前,球定位系统(GPS)、地理信息系统(GIS)、摄影测量与遥感(RS)以及数字化测绘和地面测量技术是工程测量中最常见也是最为先进的测量技术,这些技术具有自动化、实时化、智能化、数字化等多项特点,极大的改善了测量的条件,提高了测量结果的准确性。本文着重分析了这些技术在矿山测量中的应用模式。

1数字化处理技术在矿山测量中的应用

1.1原图数字化处理

在矿山测量中,数字化技术主要用于原图数字化处理。在建立各种GIS系统时,为了获得更好的观测效果,就要利用数字化技术对原始地图进行处理。如果原始图的势性、精度和比例尺与使用数字化技术的要求一致,就可以直接利用数字化仪器对原始图进行数字化处理。否则就要对原始图进行相应的调整。目前,使用最广泛的数字化处理仪器有三种:扶跟踪数字化和扫描矢量化、GPS数据输入。这些测量仪器的原理基本类似,但由于研发时所处年代科学技术水平不同,因此,在功能上有所差异。手扶跟踪数字化处理时用的设备有计算机、数字化仪及相关辅助处理软件。这种数字化处理方法出来的较早,输入速度慢,工作强度比较大。扫描矢量化是利用扫描仪直接将原始图扫描成像,再借助矢量跟踪,确定实体具体的空间位置。由于扫描仪技术和矢量处理软件日益先进,扫描矢量化处理技术自动化发展的趋势越来越明显,该技术具有省时、高效、准确等特点。GPS输入技术是当前测量中最先进的技术,它是利用 GPS工具来对地球表面地形进行准确的定位。GPS测量得到的结果直接是三维空间位置的数字,因此,不需要对测量结果进行转换处理,可以直接把结果输入数据库。RTK(Real Time Kinematic实时动态)技术是在GPS工作的原理上研发出来的,这种技术能够实时提供流动站,然后在指定的坐标系中对原始图进行三维定位,它的准确性最高可以精确到厘米级。当前在矿山测量中使用最多的数字扫描矢量化技术,这种技术作业效率高,操作灵活,可以随时更换先进的设备获得最佳的测量的效果,精度也有所保证。其它的技术通常是根据实际的经济条件或者测量要求来选择性的使用。下文将简要介绍MAPCAD软件扫描矢量化技术的一些操作要点。

1.2数字化原图作业要点

在采用MAPCAD软件扫描矢量化输入方法时,一些基本的测量结果要求(如图像清晰、编辑方便、易于转换)都能实现,因此,为了进一步的提高测量精度就要从人工跟踪精度和输出设备精度着手。人工跟踪精度是由工作人员的技能掌握熟练程度和工作态度所决定的,因此,在测量前,要对工作人员进行相关的技能培训,在测量时,要求技术操作人员严格遵守矢量化作业方案,以获得最佳的测量精度和测量效果。在工程测量中,技术操作人员要把原图外业测点与数字化图缩放流程相联系起来,在保证符号图层的划分子图、线型符号库的设计等程序的进度的同时,要严格要求相关的处理细节,使得设计出的数字地图简明实用、美观整洁、通俗易懂,减轻后期施工的难度。

2. 数字化绘图技术在矿山测量中的应用

2.1数字化绘图的特点

数字化绘图技术能对大比例尺地形图以及工程图进行处理,与传统的测绘技术相比,它有效地克服了工作量大、作业艰苦、作业程序复杂、成图周期长、产品单一等缺点,与当代先进的技术发展要求相接轨。当前使用较多的数字化成图技术有内外业一体化和电子平板两大类。数字化成图技术外业一体化是一种外业数据采集方法,工作时用的设备仪器包括全站仪、电子手簿等,这种方法工作的特点是:测量结果用途广;测量精度高;内外业分工分明,劳动强度小,成图效率高;便于保存管理及更新方便。

2.2外业数据采集的要点

在进行数据前,数据采集人员要了解测量对象的地物,以保证采集时能正确应用地物代码,可以降低在内业成图发生失误的可能性。在测量时,相关工作人员需严格按照要求应对测站点进行检查,跑尺人员应严格按照自动成图的要求作业,确保能完整地描述地形地貌的特征点。必须通过绘制草图来表明各个地物碎部点的属性及相互关系。测量坎子时,要量取坎子比高,坎下也要进行地形点采集。如果有需要,可以在测量完成后,把测量的结果进行备份处理,外业数据的保管要由专门的人员保管,以免测量结果丢失。

3.数字摄影测量技术在矿山测量中的应用

3.1数字摄影测量技术的特点

数字摄影测量技是在数字影像与摄影测量的基础上发展起来的,它结合了计计算机技术、数字影像处理、影像匹配、模式识别等多学科的理论与方法,是一种综合性较强的测量技术。对摄影测量本身而言,如果从测绘的角度上来分析,数字摄影测量是一种借助影像来达到测绘目的的科学与技术;从信息科学和计算机视觉科学的角度来分析时,摄影测量是一门借助影像来重建三维表面模型的科学与技术,简单的来讲,就是在“室内”重建地形的三维表面模型,再结合其它辅助技术在模型的基础上测绘出完整的地形影像。从本质上来讲,数字摄影测量与传统的摄影测量方式是没有差别的。所以,在利用数字摄影测量时,它的生产流程与作业方式几乎没有什么变动。但从另一方面来讲,它是对传统摄影测量技术的一种革新,为以后新的测量技术的发展指明了方向。

3.2数字摄影测量技术的特点

目前,在采用数字测量技术时,主要是利用数字摄影机在高空中拍摄出数字图像,然后再借助专门的航测软件对数字图像进行处理。在一些大面积、大比例尺地形测图、地籍测量中,航空摄影测量是最合适的,它能获得最为完整的地貌,提高测量结果的精度。数字摄影测量的一般步骤是:利用高空拍摄获得数字图像;在计算机上对数字影像进行像对匹配,对数字影像进行像对匹配;再通过专用的软件来获得数字地图。数字摄影测量技术最大的优点是:将大量的外业测量工作移到室内完成,避免了外界环境的干扰,还具有成图速度快、精度高而均匀、成本低等优点。因此,在城市密集地区的大面积成图中,该技术能发挥出较好的效果。但该技术的初期投入大,如果在一些小测区使用该技术,性价比就较低。不管怎样来说,该技术的应用说明了今后数字测图发展的方向,在未来,可能要就测绘能提供数字的、影像的、线划的等多种形式的地图产品。此外,随着全数字摄影工作站和GPS技术在矿山测量中的应用,数字摄影测量技术可以将这些技术进一步的结合起来,使得摄影测量朝自动化、数字化的方向发展,将拥有广阔的应用前景。

4结语

随着新测绘技术在矿山测量中的不断应用,矿山测量的结果更为精确,减轻了矿山后期施工的难度,并且随着GIS技术、GPS技术的逐渐成熟,矿山测量将向测量数字工程化的方向发展。在应用新测绘技术时,要针对该技术的一些技术缺陷和技术要点,进行相应的预防处理。

参考文献

[1]孙海涛.现代矿山测量新技术应用[J].中国矿业工业,2009,(11).

篇8

关键词:农药;喷雾机;植保机械;高地隙打药机

中图分类号:S49 文献标识码:A

人类的不断进化过程,就是不断征服自然的过程。农作物的生物防治、物理防治和化学防治对农业的增产增收起到了重要的作用。随着科学技术的发展,最有效的化学防治在农业生产中的地位已经不可替代。我国是农药生产和使用大国,年产量80~100万t,而农药的使用效率仅为20%~40%,60%~80%的农药都损失了[1]。

2012年8月正是玉米生长中后期,却爆发了粘虫灾害,全国遭受虫害的面积达433万hm2,严重受害面积43.33万hm2,危害程度近十年最重。粘虫因其群聚性、迁飞性、杂食性、暴食性,成为全国性重要农业害虫。今年降雨较多,玉米植株大,田间封闭,给灭虫工作带来了巨大的困难。由于灾情的突发性,农民在面对虫灾时,只有背负手动式喷雾器行走在浓密的玉米田,在喷洒高效剧毒的农药过程中,造成了多人的中毒事件。最终在政府的大力支持和保障下,各种适合此时期使用的高地隙打药机如雨后春笋般出现,为及时消灭虫灾,减少农民经济损失,起到了重要作用。

1国外植保机械的发展情况

20世纪中期,规模化的大农场经营模式在欧美农业发达国家迅速形成,促使农业机械化与自动化得到全面、快速的发展,在强大的经济实力和科学技术支撑下,防治病虫草害体系由航空植保机械和大型自走式植保喷雾机械作为主体[2]。1912年,加拿大率先使用了喷洒农药的专用飞机[3];日本防治水稻病虫害主要也以直升机为主,久保田公司生产了世界先进的无人驾驶农用KG-200型直升机,最大功率可以达到13.2kW,装载药量11L。世界上最大的农机制造商约翰迪尔公司生产了4000型系列大型自走式喷雾机,采用智能化精准农业管理系统,该系统是GPS导航、产量图、变量施用和喷杆控制产品的完整组合,离地间隙40~250cm,适于高秆作物的大面积、高效率和精准植保作业;德国雷肯公司生产的牵引式大田喷雾机Primus、Albatros和悬挂式大田喷雾机EuroLux,采用了中央钟摆式悬挂系统,可在不平坦的地面作业时保持平衡,并在高速行驶情况下保证精确的喷雾量,有先进的液压调控系统,可调节喷头工作高度和喷杆倾斜度;凯斯纽荷兰“爱国者”系列打药机包括3种机型3230、3330和4420型自走式喷雾机,爱国者喷药机配有AimCommand变量喷药系统和减震悬架,喷药机备有微量、中量和大量不同喷口尺寸的多种喷嘴,用户可以根据作物、药量和风速等实际作业条件自由选择;国十方国际公司生产的海吉DTS10自走式喷药机,距地面1.85m,能够自动调整悬挂,喷架可视性好。国外大型自走式植保机械采用了诸多的先进技术,主要包括以下几个方面:

1.1精准变量喷药技术

发达国家(以德国、美国、日本为代表)经过20多年的探索,已形成了较为成熟的基于GPS、GIS及传感器技术的可实时变量喷药控制系统,可通过多种控制方式,根据灾害情况和受害位置变量喷药,使农药的利用率最大和污染降到最小,减小了对农业环境的破坏。

1.2精准定靶喷药的杂草识别技术

采用遥感技术和机器视觉技术进行田间病虫草检测和识别,如德国 Biller 等[4]应用光电传感器设计出的杂草识别装置已被应用到喷药装置上;美国加利福尼亚大学戴维斯分校对成行作物实施精量喷雾系统的研制,也是基于视觉传感器;Giles 等[5]研制的一种基于机器视觉的精确喷药装置,与传统喷药方式相比,该装置能节约 66%~80%的杀虫剂,目标作物上的雾滴沉降效率提高了 2.5~3.7倍,空中飘移减少了62%~93%;日本的 Dohi等[6]利用计算机视觉技术,设计了为除草装置提供杂草位置信息的系统。

1.3防漂移技术

在喷药过程中,减少雾滴的漂移,增加药液的附着率,是提高农药利用率、降低对农业环境污染的重要措施,国外喷雾机上主要使用风幕技术、防漂移喷头和静电喷雾技术[7],目前大型自走式喷雾机上主要采用风幕技术。

1.幕技术

在欧洲20世纪末兴起的风幕技术,已成为现在大型自走式喷雾机防雾滴漂移的主要技术,它是把风筒增加在喷雾机的喷杆上,施药时,沿喷雾方向强制送风在喷头上方形成风幕,在增大了雾滴的穿透力同时,即使有风(小于四级风)的天气下工作,也不会发生雾滴飘移现象。

1.5全液压驱动技术

国外的大中型自走式喷雾机在行走、转向、制动、喷杆升降和折叠、整机地隙的升降等方面,已实现了全液压控制,行走系统主要由液压马达来驱动,使整机结构简化,底盘升高,更造于中耕作物喷药,且增加了传动系统的可靠性。有些机具上还采用了液压减震悬浮系统,此液压减震不同于弹簧减震,它可以依据地势的变化和机器负载进行调整,从而保证速度变化和喷杆升高时系统都能保持稳定。另外,有些牵引式喷杆喷雾机,在牵引杆上装有电控液压转向器,可以保证在拖拉机转弯时与机具保持一致[7]。

1.6安全自动混药技术

安全自动混药技术的使用减少了人药接触,有效地避免了引发慢性中毒事件,而且混药操作方便灵活,可根据需要调节混药比例[7]。约翰迪尔4630等大型自走式喷杆喷雾机,均采用自动混药技术,配药时,先把母液倒入稀释罐中,然后从水箱中吸水到配药箱,与母液混合,配成一定比例的药液,再导入到药箱中。

2国内植保机械发展现状

我国的植保机械发展较慢,随着国情的改变,劳动力价格的不断提高,值此植保机械进入人们的视野。我国植保机械拥有20多种品种,型号达80多个[8],现在国内主要使用的植保机械有以下几种:

2.1手动背负式植保机械

1950年我国引进并大量生产了单管式喷雾器和手摇式喷粉机,随后的メソう型手压背负式喷雾器是在单管式喷雾器的基础上改进而来[9],而现在使用的手压式背负式喷雾器也是将手柄改到了身侧,更便于给药箱加压。手动背负式喷雾器由于其简单的结构,便宜的价格,占据了整个植保机械80%的市场份额,全国70%以上的病虫害防治面积依靠它完成,主要型号有3WB-16型、3WBB-16型等, 552型压气型和3WS-16型喷雾器,由于使用时容易漏气和装载药量少,逐渐被淘汰了,572型和57型手摇喷粉器,因666粉剂和其他粉剂使用量减少,产销量而逐渐减少,FY-5型仅有少数在温室中使用[12]。

2.2航空植保机械

自1950年以来,我国已开始使用飞机进行蝗虫防治和其他防治工作,1957年生产了安-2型飞机[9],它是一种小型双翼飞机,仿制前苏联的AH-2型飞机,现有运-5型、蜜蜂-3型和运-11型飞机。目前,全球用于病虫草害防治的飞机为2万架,而国内保有量不足200架[10]。由于我国部分耕地面积和国情的约束,航空植保受到了很大的制约。

2.3 机动植保机械

机动式植保机械主要包括两个类型:一是机动背负式喷雾弥雾机,二是机动担架式喷雾弥雾机。机动植保机械我国当前拥有26个品种,市场保有量为300万台,背负式弥雾喷粉机的代表品种为WFB-18型,它是超低雾喷雾机,能够以超低量喷射乳油型农药而不用水;机动担架式有多个品种,市场保养量为16.8万台,代表品种为工农-36、山城-30型等,都属于多用途的机械,它主要用在果园中。

2.4拖拉机配套植保机械

现在大田病虫草害的防治,主要应用喷杆式喷雾机,分为背负式喷杆喷药机、悬挂式喷杆喷药机和自走式高地隙喷杆喷药机。

2.4.1 背负式喷杆喷药机

背负式喷杆喷药机主要由活塞泵、喷杆、喷嘴、药箱等组成。由于30马力以下的拖拉机很少配套动力输出轴,药泵是通过与变速箱一轴的连接的带轮提供动力的,因此,背负式喷杆喷药机,喷杆多前置在拖拉机机头位置,此种喷药机结构简单,造价低廉,在吉林地区应用范围很广,但该种机型多存在漏水漏药现象,农药利用率低,损失严重,作物药害残留大。

2.4.2 悬挂式喷杆喷雾机

悬挂式喷杆喷药机主要由活塞隔膜泵、喷杆、喷嘴、药箱等组成。通过动力输出轴传递动力,通过三点悬挂配套于大中型拖拉机,喷杆延伸可达到18m,药箱容积可达到1000L,此种喷药机作业半径大,喷雾效果较好,但造价昂贵,不适合一般农户使用。

2.4.3自走式高地隙喷杆喷药机

近几年,黑龙江八一农垦、新疆建设兵团等大农场进口了一些大型的自走式喷雾机械,对防治病虫草害起到了重要作用,今年8月的粘虫灾害,让国内的各大厂家看到了商机,一批适合国内使用的高地隙打药机迅速占领市场,主要分为以下几种类型:

2.4.3.1 偏置式三轮高地隙打药机

此种打药机将18马力柴油机布置于打药机的一侧,结构简单,造价便宜,但机架高度和宽度不可变,喷杆高度可通过液压缸进行调节,喷杆架通过液压缸驱动齿轮啮合进行展开与折叠,常出现漏水漏药现象,特别在转弯和高低不平的地势上,容易翻车。

2.4.3.2 中置式三轮高地隙打药机

此种打药机是将动力部分放在整机中间布置,如农用三轮车,采用双向链条驱动,结构简单,造价便宜,机架高度不可调,但是宽度可调,药箱也比偏置式多一个,采用人工混合药液,行走比偏置式更加稳定。

2.4.3.3 四轮链条驱动高地隙打药机

此种打药机主要是将四轮拖拉机进行改装,在拖拉机机身下安装高地隙机架,拖拉机四轮拆卸掉,机架高度和宽度不可调,结构简单,采用的药泵为活塞隔膜泵,均采用国产喷嘴,耐用性和喷雾效果不理想。

2.4.3.4 四轮液压驱动高地隙打药机

采用液压马达驱动行走轮,转向控制系统仿照工程机械控制系统,靠液压阀的开启,没有电控系统,车轮存在扭转,转向不灵活等问题,机架高度可调,宽度可调。此种打药机以趋向于国外的打药机结构,但是还有很多问题,如喷药系统、行走控制系统、自动悬挂平衡系统等。

3国内植保机械存在的主要问题

3.1行业不规范,产品技术水平低

国内拥有大、中、小型各类植保机械生产厂家350多家,年总产量在1400万台左右,生产10大类的产品,50多种规格,其中1200万台在国内销售;企业的规模从2~3人到2000余人,生产能力也从几百台到几万台;不同的生产能力和技术力量,致使生产出的植保机械的各项指标很难达到要求。很多小厂家力求利益最大化,忽略了植保机械本身所肩负的重大责任,8月份出现的粘虫灾害,让很多厂家制造的高地隙打药机一经面世就供不应求,而在使用过程中出现漏药,喷洒不均匀,喷头容易堵等一些现象,从国外大型自走式喷雾机的发展来看,我国的植保机械还有很大的发展空间与潜力,标准化对于植保机械的发展起到了至关重要的作用,国家强制将植保机械进行3C认证,将促使产品规范化。

3.2喷药技术落后,安全性低

在突发的病虫害时,更多的农民只有选择手动背负式喷雾器来进行灭虫,防治效果不理想,造成很多人在田间中毒昏迷,还有慢性中毒的事件。我国农药生产技术达到了世界先进水平,但植保机械却很多是60、70年代产品,农药的利用仅为20%~40%,相对于国外的50%还有很大的差距。如果农药喷量高出10%,那么在247hm2的农田中实施二次喷药将损失2000~10000美元,所以喷药系统对于打药机的作用至关重要。

3.3喷嘴技术指标不合格

尽管喷嘴在整个喷雾过程中是个很小的部件,但是它的作用是至关重要的,国内的生产厂家推出的喷嘴数十种之多,品质性能迥然各异,一个小小的喷嘴往往被大家所忽略,而这恰恰造成了雾滴雾化效果不理想,雾滴漂移严重等一系列问题,在国外雾滴漂移可能引起法律问题。

3.4液压系统的应用水平较低

最先应用在工程机械的液压系统,在农业机械中也起着举足轻重的作用,自走式喷雾机应采用液压系统的全方位驱动,行走、转向、喷杆折叠与展开,这方面我国的喷雾机还有很多的欠缺,先进的液压调控系统,可以轻松调节喷头工作高度和倾斜度,液压助力的使用将使转向更加灵活。

4 国内植保机械发展趋势与前景展望

目前,我国大部分地区仍以背负式手动喷雾器为主,农业机械化过程中,植保机械化还有很长的路要走,发展适合我国各地区多用途植保机械显得尤为重要,随着科学技术的不断发展,生活的不断提高,人们对于农产品药害残留、农业生态环境和劳动力节约的重视,背负式打药机将退出主流植保机械,由于我国耕地面积限制,中小型高地隙打药机将是今后发展的主要产品,它适合于农作物各个时期的病虫草害的防治工作,虽然高地隙打药机目前国内生产仍存在一些问题,但是也看到了今后发展的潜力。研发引进精准喷雾系统,整机全液压驱动、喷嘴标准化,将促使高地隙打药机迈上新的台阶,相信在国家政策的支持和倾斜下,在十二五期间,我国农业机械化将取得重大进展,植保机械也将迅猛发展。

参考文献

[1] 苏少泉,宋祖顺. 中国农田杂草化学防治[M]. 北京: 中国农业出版社, 1996.

[2] 唐辉宇.国外植保机械的发展方向[J].南方农机,2004(6):43.

[3] Estey, Rplph H. Canadian Use of Aircraft for Plant Protection[J]. Phytoprotection,2004,85(1):7-12.

[4] Biller R H. Reduced input of herbicides by use of optoelect- ronicsensors[J]. Journal of Agricultural Engineering Research, 1998, 71:357- 362.

[5] Giles D K, Slaughter D C. Precision band spraying with machine-vision guidance and adjust able yaw nozzles[J]. Transaction of the ASAE, 1997, 40(1): 21- 36.

[6] Dohi M. Robot and its application to weed control in hill space[J].Journal of the Japanese Society of Agricultural Machinary, 1993,55(6): 77- 84.

[7] 刘封乐,张晓辉,马伟伟,刘雪梅. 国外大型植保机械及施药技术发展现状[J].农机化研究,2010(3):246-248.

[8] 陈艳巧,张晓辉.我国植保机械现状及其发展策略[J].农业装备与车辆工程,2006(2).

[9]南京农学院农业机械化分院.农业机械学(上)[M].南京:南京出版社,1963.

[10][16] 赵明宇,王英姿,邱立春,何凤宇.我国植保机械现状及发展趋势[J].中国农机化,2004(3):37-38.

[11] 赵明宇,王英姿,邱立春,何凤宇.我国植保机械现状及发展趋势[J].中国农机化,2004(3).

篇9

关键词:汽车牌照识别;智能交通管理;数字图像处理

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02

车辆牌照识别系统(vehicle license plate recognition system,简称LPR)是现代智能交通系统中的一项重要研究课题,是实现智能交通的重要环节,涉及领域异常广阔,包括模式识别、计算机视觉以及数字图像处理技术等。随着智能交通系统的迅猛发展,对于汽车牌照识别技术的研究也随之发展起来。如今的世界已经发展成为数字化信息时代,很多难以解决的问题依托这一平台得到完美的解决。智能交通系统可以在不影响汽车正常行驶的状态下自动完成对牌照的有效识别,很显然这一技术的发明对于交通管理工作起到了很大的推动作用。目前,车辆牌照识别技术已经广泛应用于高速公路的监测,电子收费,安全停车管理,交通违规管理,偷盗车辆辨别等重要领域,其发展对于人民的生活、社会经济以及城市的建设产生了积极而深远的影响,因此对于汽车牌照识别技术的研究具有重要的现实意义。

数字图像处理技术作为车牌识别系统中最为重要的技术之一,在其中发挥了不可估量的作用。随着近些年来数字图像处理技术的高速发展,也为车牌识别系统的建立提供了有效的技术保障。电子摄像得到的结果是彩色图像,而且不可避免地含有各种噪声干扰,为了能够分割出车牌的有效区域并在有效区域中分离中单个车牌字符,我们可以数字图像处理技术来进行相关处理,从而达到清晰识别的目的。车辆牌照识别系统按顺序一般可分为五大部分,按顺序依次为图像采集、图像预处理、牌照定位、字符分割与字符识别。图1便是具体流程。

1 系统总体设计

1.1 图像采集。图像采集过程的实施比较方便,主要方法是通过CCD摄像头与计算机的视频捕捉卡直接相连来完成,在监控图像中实时抓取到含有车辆信息的图像。该部分功能简单易行,故不作过多阐述。

1.2 图像预处理。在图像的采集、传输或转变的过程当中,由于各方面因素的相互影响,不可避免地会导致图像的降质。图像预处理的目的是通过一系列的技术来改善图像现存的效果,将图像转换成更加适合人和机器进行处理和分析的形式。图像预处理的步骤多种多样,包括图像分割、锐化处理、图像的二值化、图像细化等等,根据不同的图像会应用不同的处理方法。在车牌识别系统中,由于初始采集的图像往往受到外界各种因素的影响,因此有时候并不一定适合车牌的字符提取和识别(比如图像背景过于复杂、图像太暗或者太亮、存在噪声干扰等等)。所以必须对车牌的图像进行一系列预处理,从而达到突出车牌区域和各种有效字符信息的目的。

图像灰度化:简单的讲,图像灰度化就是将彩色通过一定的手段转换成灰度的方法。由于电子设备摄取的汽车牌照样本都是彩色的,这就在一定程度上对整个系统的处理速度产生延缓作用,而且大量的颜色信息也增加了在计算机中的存储开销,这就意味着在对图像进行识别处理之前必须将彩色图像转换为灰度图像。彩色图像的像素色为RGB(R,G,B),而灰度图像则是一种特殊的彩色图像,其中R、G、B三个分量是相同的,因此灰度图像的像素色便可表示为RGB(r,r,r)。这就是说,一个灰度图像仅能表示256种颜色,它突出的不过是关于图像强度的信息,这样一来便只需用一个数据矩阵实现对于灰度图像的存储,后续有关图像的计算量就会减少很多。灰度化的处理主要有三种方法:分别是最大值法、平均值法和加权平均值法。

最大值法:使R、G、B的值等于3个值当中最大的一个,即

通过最大值法可以形成亮度很高的灰度图像。

平均值法:使R、G、B的值等于3个值求和的平均值,即

通过平均值法可以形成比较柔和的灰度图像。

加权平均值法:根据相关指标以及各自的重要性特点,将R、G、B赋于不同的权值,使得R、G、B等于它们值的加权和平均,即

其中Wr Wc,Wa,分别为R,G,B的权值。相关理论及实验证明,由于人眼对于各种颜色的敏感度不同,只有权值设置比较合理时,才能得到人们所需的灰度图像。

二值化:在图像预处理中,二值化的图像能够用几何学中的概念进行特征分析和描述,所以相对于灰度图像来说优势很明显,对其合理应用具有非常重要的价值。图像经过二值化处理之后使其数据量减少,能够突出地显示人们所需要的轮廓,有利于图像的进一步处理。所以在进行二值图像分析之前,即使在某些情况下图像本身是有灰度的,我们也会设法将它转换成二值图像再进行处理。

在实际操作过程中,我们是将256个亮度等级的灰度图像通过适当的阈值选取后从而获得反映图像整体和局部特征的二值化图像,由此便能够将字符与背景分割开来。通过二值变换后的图像能够保持原有的形态,不丢掉形状等信息,不会产生额外的空缺。对图像进行二值化处理,能大大提高效率,从而有效地满足了车牌识别系统处理速度高、成本低、信息量大的要求。将原灰度图像用f(x,y)表示,二值化后的图像用g(x,y)表示,则二值化的过程可以表示如下:

1.3 牌照定位。通常我们使用的车牌是由字符、背景和边框组成的,在边缘图像提取完成之后,字符与背景处就形成了比较显著的边缘。在此考虑汽车本身所具有的特点,汽车牌照大部分位于缓冲器上或者是邻近的区域,摄取的整幅图像下面部分就是路面,通常情况下路面是比较光滑的,所以我们可以在进行边缘提取的时候就能够将这部分杂质滤有效地去除掉,从而使得干扰图像的噪声全部处于车牌之上。由此,我们采用两个阶段来进行牌照定位。

首先,先进行粗略定位。这里选用的方法是数学形态学,它是通过一组代数运算所组成,其中包括膨胀(扩张)、腐蚀(侵蚀)、开启和闭合,由于它们在灰度图像和二值图像中各自有着不同的特点,因此用途也不尽相同。其中本文用到了膨胀和闭合两个基本运算,接着通过bwareaopen函数的使用,以此来达到去除对象中不相干小对象的目的,最后再用Sobe1边缘强化处理,使其边缘被勾勒和加强。通过具有一定形态的机构元素来量度和提取图像中的对应形状,既简化了图像数据结构信息,又保持了它们基本的形态特征。

在进行完车牌粗定位以后,不排除还存在车牌边框的干扰,或者定位后的车牌区域在某个方向上超出了本身所具有的正确范围,这时就有必要对车牌进行细定位的操作。运用对车牌底色等先验知识,确定出车牌底色对应的灰度级范围,按照行方向统计在此灰度级范围内像素点的数量,通过阈值的合理设置进而锁定车牌的有效区域。有效区域分割完成之后,统计对应列方向像素点的数量,最终确定完整的车牌区域。也可以对图像进行水平和垂直方向的投影,可以明显的看到车牌边缘与背景的交接处在投影中的跳变,在此处切割便可以得到更加精确的车牌区域了。

1.4 字符分割。图像区域分割:进行车牌区域分割存在诸多难点,其中包括字符粘连、断裂等对分割的影响。为了直接提取出图像中的目标部位,我们通常采用的方法就是设定一个阈值T,阈值T设定好之后便将图像的数据分割成两个主要部分,即小于T的像素群和大于T的像素群。采用均值滤波的方法能够较好地解决这个问题,该方法属于典型的线性滤波算法,在图像上对目标像素给出一个包括其周围的临近像素的模板,接着用该模板中全体像素的平均值来代替原来的像素值。经过此步骤之后,车牌的整体区域被分割成单个字符区域,为后续进行识别工作打了一个很好的基础。

字符分割:它是在前期牌照定位的基础上进行的字符分割,可以说在汽车牌照自动识别过程中有着承前启后的作用,然后再利用分割的结果进行字符识别。由日常经验可以知道,我们所见到的车牌字符之间的间隔是比较大的,因此可以排除字符粘连的情况。之所以进行此步骤,目的就是找出具有连续文字特征的块,在此之前我们通常会设定一个标准的阈值,只要该块的长度超过了所设定的阈值,则认为该块是由两个字符所构成的,这时就需要进行字符分割。

字符归一化:为了对字符识别达到更精确的目的,我们还需要对上面步骤分割出来的字符进行进一步的处理。在这里采用归一化的方法,其中包括字符大小归一化和位置归一化。大小归一化的目的是对不同大小的字符做变换,使之成为同一尺寸大小的字符;而位置归一化是将分割后的字符排列在相同范围,便于比较。

1.5 字符识别。通常情况下,牌照识别系统的识别率与牌照自身的质量和电子设备所拍摄图像的质量密切相关。而这两个方面会受到来自多方面因素的影响,比如汽车牌照自身存在污损、油漆脱落、字体模糊、倾斜反光等;拍摄过程也会受到天气原因、环境亮度、车辆速度等因素的影响。这些影响因素在不同程度上使得牌照识别率降低,这也正是牌照识别系统所要亟待解决的问题。这就要求我们力争克服各种不利条件,在客观因素方面寻找更加可靠的方法。

为了提高牌照识别率,除了克服各种不利条件外,还应该不断完善识别算法之外,使采集到的图像最易于识别。目前字符识别方法主要有基于人工神经网络算法和基于模板匹配算法。本文采用了基于模板匹配的字符识别方法。首先将分割后的字符进行二值化,完成之后接着将其尺寸大小缩放至和字符数据库中模板大小相对应,然后与模板中所有的字符进行匹配,最后选取最佳的匹配作为最终的结果。

2 结束语

汽车牌照自动识别系统是一项利用车辆的动态视频或静态图像进行牌照号码自动识别的模式识别技术。通过对图像的采集和处理,完成车牌自动识别功能,能从一幅图像中自动提取车牌图像,自动分割字符,进而对字符进行识别。城市交通等基础设施建设水平的不断发展和车辆管理体制的不断完善,为以数字图像处理技术为基础的智能交通管理系统的实际应用提供了契机,其应用具有重要的现实意义。

参考文献:

[1]冈萨雷斯.数字图像处理(第二版)[M].北京:电子工业出版社,2007.

[2]齐永奇,王文凡,赵岩,赵耀.基于纹理特征和垂直投影的车牌定位算法研究[J].现代电子技术,2007,17:184-186.