计算机视觉总结范文

时间:2023-12-19 18:07:44

导语:如何才能写好一篇计算机视觉总结,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉总结

篇1

关键词:总量核算法 河道排水 水力计算

在城市排水设计的实际中,经常会遇到城市区域排水为管道系统与河道系统共同完成排水任务的情况,如文中所涉及的"废墙子河改造工程"就是其中一例。废墙子河改造工程被天津市政府列为民心工程之一,它是天津二级河道系统改造的一部分。该河道贯穿和平区和河西区两区,为东西向的排水河,全长约5 km,两侧服务面积约为8 km2,该服务区域南北向最长约1 km,最短处约200 m,呈不规则分布。原河道为梯形明渠,上口宽约16 m,沿途有约8处管道直接排水进入河道系统,排水出路为河道最东头的海河,是典型的管道与河道排水的城市区域。因为涉及到服务区域的排水是否能自流入河,出口泵站水量多大合适以及河道断面尺寸的选取等问题,其水力计算显得特别重要。本文就上述水力计算问题的解决,借助常用成熟的计算方法和"总量核算法",并应用计算机技术提供了解决此类问题的途径和方法,供业内人士参考。

1 总量核算法

通过对实际工程的分析,两侧汇水面积的雨水是通过现状管道排至河道内,其计算采用分步进行是最合适的,即求出各管道在降雨某时刻的入河水量,并进行叠加,进而求出河道总水量。而明渠内流态紊乱,当各出口极限强度水量到达河道时,由于水量的差异,会形成倒流等现象,无法按常规明渠计算设计参数,为了使计算更符合实际,设计采用河道水量状态核算法,即所谓的"总量核算法"。

总量核算法设计计算分为5个步骤,其中第一~第三步为服务区域水量计算,第四、五步为河道内水量计算两部分。具体步骤为:第一步是按极限强度法求各服务区管道出口洪峰流量;第二步是通过极限强度法模拟管道出口流量线(Q~t曲线);第三步是对Q~t曲线进行修正;第四步是对各服务区Q~t曲线求和(W总~t曲线);第五步是按工程情况设计河道几何尺寸和控制参数。其中按极限强度法求各服务区管道出口洪峰流量是按国家规范通常的做法,不作为本文讨论的重点。下面就基本模式中涉及的其它各方面讨论如下。

1.1 通过极限强度法模拟管道出口流量

使用极限强度法是基于暴雨强度公式各地都很容易得到,其使用普及程度高、参数全、计算管道出口流量最接近工程实际,且不降低设计标准。因此,它成为本文实践的首选。但该法计算的结果是管道最大出口流量,而非各时段管道出口流量。但稍加分析就可以发现其计算过程与管道出口各时段的流量关系,即假设计算区域的降雨强度在降雨某历时均相等,其起端和末端地面覆盖程度基本相同,在相同面积下所产生的径流水量相同,则有从首端区域集水并到达管道内某段所计算的水量和时间即为末端相同面积流入河道的水量和时间,截取不同的水量和时间,就能求出高峰流量出口以前的流量线。对于高峰流量出口以后的水量和时间的计算则是采用延长首端地面集水时间,在管径一定的情况下逐一计算到管道出口水量。将计算结果合并后,即为这个服务区域的流量和时间曲线,即Q~t曲线,见图1。计算中应注意起端和末端的面积相差悬殊且地面覆盖程度相差较大时,应进行必要的修正;还应注意整个暴雨计算时间以当地暴雨强度公式所适用的最长时间为准。

1.2 对Q~t曲线进行修正

使用暴雨强度公式求管道出口流量的Q~t曲线中,由于其参量化等因素,致使暴雨强度历时 2/3时间以后的残余强度偏大,这将会给总水量造成较大误差,特别是河道兼有调蓄功能时更加明显。结合天津市暴雨强度公式的使用条件和公式推导的适用条件以及工程实际,折算出一个降雨历时为:当地暴雨强度公式所适用的最长时间加上服务区内管道从首端集水开始到高峰流量从管道中排出的时间,此时令管道出口流量为零。按照上述时间修正的Q~t曲线,对河道总水量的影响小于5%,如图1中的修正段所示。

1.3 对各服务区Q~t曲线求和(W总~t曲线)

从本步骤开始即进入到河道内水量计算阶段,对每个服务区计算的流量进行叠加,以求出排水系统的W总~t曲线。因W总~t曲线是由多条Q~t过程线叠加而成,数学回归公式较难推导,且时常因管材的影响而出现跳跃。因此,本文计算中采用的是单位时间内插中值法进行分步叠加,以更趋理论值,最终求出W总~t曲线。

1.4 按工程情况设计河道几何尺寸和控制参数

考虑设计河道的实际情况,沿途5 km各入流口雨水高峰流量进入河道的时间相差不多,且此时河道内流态紊乱,上下游只表现在水位的升高,加之河道按调蓄设计,故在计算中可忽略水力坡度的影响,以平均水位为基准。因此,W总~t曲线即是表示河道内在某个降雨历时时的最大水量,此时河道内的水量关系为:W总-W排=W蓄。即通过对强排泵站设计流量W排的设定,进而求出河道调蓄能力W蓄的各种工况,见图2。在此基础上,再对不同断面的河道进行设计,直到蓄排满足各种参数为准。

2 结论

采用总量核算法成功地解决了废墙子河改造工程水力计算问题,并为解决此类计算问题进行了理论和方法上的延伸,且具有下列特点:

①是对以往排水计算方法只能计算一个工况点的发展和扩宽,能提供多种供选择的设计工况;

②计算中采用极限强度法计算管道流量,采用总量核算法计算河道参数,工程整体不降低设计标准;

③是直接使用暴雨强度公式,各地极易得到,且充分贴近广泛使用的极限强度法,实用性更强。

另外,使用本方法时也应注意如下问题:

①水量计算时是在"极限强度法"基础上进行的,使用时要对它的假设条件了解清楚,以避免计算偏差过大;

②由于暴雨强度公式统计假设的原因,一般在120 min后曲线变平缓,对入河总水量影响较大,故应进行趋零修正;

篇2

Abstract: This paper puts forward the camera calibration method in computer vision, through analysis of principle of computer vision, and analyzes the application of camera calibration methods in computer vision.

关键词: 计算机;视觉;摄像机;定标

Key words: computer;visual;camera;scaling

中图分类号:TP391.4 文献标识码:A 文章编号:1006-4311(2013)24-0193-02

0 引言

在计算机技术快速发展的今天,人们越来越依赖于计算机,计算机在人们的生活工作中占有重要的地位。计算机中的各种应用层出不穷,广泛应用在各个领域,计算机视觉在摄像中的应用为摄像机定标方法提供了巨大的参考价值。由于人们对摄像机拍摄效果的要求,使得摄像机在不断改革更新,摄像机的定标方法是摄像机研究领域备受关注的话题。计算机视觉中摄像机的定标方法是摄像机研究领域所推崇的,它受到了研究人员的高度重视。计算机视觉中摄像机的定标方法呈现出了高质量的摄像效果,极大地满足了人们对摄像机摄像效果的要求。

1 计算机视觉投影原理

计算机视觉投影原理是利用光的折射现象,把视觉中呈现的影像投射到摄影机的屏幕上,形成了固定的图像。在计算机视觉中摄影机的成像原理就是利用光的感应,通过对摄像机的焦距进行调整,确定拍摄目标在摄像机镜头中的位置,然后利用光的折射形成固定的图像。在进行摄像时调整焦距是非常关键的,焦距就是镜头与目标之间的距离,这两者距离的远近决定了摄像的效果。如果焦距太远的话,目标成像就会非常小甚至是模糊。如果焦距太近的话,目标成像会很大也会导致无法看清图像,所以调整焦距是非常必要的,只有调好了焦距才会形成高质量的图像。

2 计算机视觉中的摄像机定标方法

2.1 三维立体定标法 摄像机的成像往往都是三维立体的,把图形通过每个立体面详细的表现出来,以达到完美的效果。要想达到三维立体的效果在对摄像目标的位置进行确定时,就要找出目标的三维坐标点,以便接下来的摄像工作可以顺利进行。然后在图像投影中找到对应的三维坐标,这一步决定了整个摄像过程的设计方案。最后确定目标在摄影镜头中的实际三维坐标,根据镜头中目标的实际三维坐标形成具体的图像。三维立体定标方法的操作原理就是把目标的三维投影进行分步成像,和实际成像效果相联系,形成镜头中具体的三维图像。在计算机视觉中把三维成像图进行处理,对三维定标的参数进行分析,找出最优的三维成像方法,使摄像机呈现出高质量的摄像效果。

2.2 平面定标法 平面定标法就是利用多个成像平面对目标的位置进行分析,选择合适的成像平面对目标进行位置的确定。每个平面的成像都是不同的,由于每个平面的成像都是在运动的,所以应该在摄像机与目标之间的平面内找到一个点,来分析目标与摄像机之间的成像规律,然后根据这一规律对目标进行定标,使摄像机中运动的目标给人们带来不一样的感受。随着目标的不断运动,摄像机与目标之间平面内的点会越来越多,对物体的定标会受到这些点的影响,物体定标的准确度也越来越高,为摄像机定标提供了可靠的信息支持,会减少摄像机定标的成本,提高了摄像的经济效益。相比三维立体定标法,平面定标的精确度更高,定标所用的时间相对较短,所以平面定标法在摄像研究领域中值得推广。

2.3 双平面定标法 所谓的双平面定标法就是利用镜头与目标之间的两个平面的成像点来进行定标,不需要成像平面上的光线通过平面中心,只要选取两个平面之间任意两点坐标来对定标参数进行计算分析,得出具体的成像图。这种定标方式不受平面中心的影响可以在任意点上成像,减少了定标参数的数量,提高了定标的工作效率。但是由于双平面定标法只是任意选取两平面上的点,对定标的精确度造成了一定的影响,使计算机对参数的运算缺少可靠的数据支持,一定程度上降低了摄像机的成像清晰度,使计算机视觉中摄像机的定标精度存在一定的偏差,呈现出来的具体图像质量相对比较差。

2.4 直线两点定标法 在三维立体和平面定标法的基础上,又进一步研究了直线两点定标法,极大程度上满足了人们对摄像效果的要求。直线两点定标法是利用定标物与摄像机镜头之间的直线上的两点进行定标。然后通过计算机视觉对这两点的坐标参数进行分析,然后摄像机利用这些参数对摄像机的焦距进行调整,确定物体的具置。在三维立体和平面定标的基础上对计算机视觉程序进行改进升级,进一步提高对物体定标的精确度。对原有定标方法进行创新改进得出了直线两点定标法使定标参数的数量大幅度的下降,节省了很多的人工成本,摄像机的清晰度也会大大提高。

2.5 透视变换焦距的定标法 透视变换焦距定标法是通过分析镜头与目标之间的距离,不断调整两者之间的距离使镜头里呈现出来的图形清晰为止,然后就将现在的目标设置为定标物。由于这种定标方法不用去分析具体的定标参数被人们广泛的应用。随着科技的发展现在的摄像机都有自动调整焦距功能,不用人为的去调整焦距,使定标物更快地呈现在镜头中,节省了大量的定标时间,计算机的运算速度也加快了。但是这种定标方法也存在一定的缺陷,在实际操作如果不考虑摄像环境以及摄像镜头的变化,定标的精确度会存在一定的偏差,导致镜头中的定标物成像不清晰。

3 计算机视觉中摄像机定标方法的应用

3.1 在计算机视觉中摄像机的主动定标 计算机视觉中摄像机的定标方法推动了计算机技术在摄像机中的广泛应用。计算机视觉中摄像机的主动定标是计算机技术在摄像机中的显著应用。计算机技术使摄像机在定标过程中主动寻找定标物,使焦距和视角很好地配合,充分发挥计算机视觉在摄像机中的成像原理,把定标方法合理地运用在摄像机主动定标过程中,使摄像机的清晰度得到大幅度地提升。

3.2 分层次进行摄像机的定标 随着计算机技术在摄像机定标中的不断发展更新,摄影者喜欢分层次地进行定标,把自己的观点融入到摄像机定标过程中,用自己的思维对定标参数进行分析,利用计算机视觉成像原理把定标物直观的反映在计算机上,以便更好的对定标物进行分析,以其中一个定标物的成像平面来确定定标物的具体成像图,使摄像机镜头中的定标物图像可以更清晰。这种分层次的定标使计算机技术可以更好的应用在摄像机定标过程中,呈现出高质量的摄像效果。

4 总结

在计算机视觉中摄像机的定标方法都是可行的,但各种方法都存在一定的缺陷,所以在实际应用中还应该根据摄影环境以及摄影机的质量选择最优的定标方法,保证定标参数的准确性,在镜头里呈现出清晰的成像。针对计算机视觉中摄像机定标方法的缺陷,摄像机的研究领域应该要不断更新摄像机定标方法,提高摄像机定标的精确度,不断满足人们对摄像机清晰度的要求,呈现出清晰的摄像效果。

参考文献:

[1]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报,2000(1).

[2]伍雪冬,蒋新华,李建兴,黄靖.计算机视觉中传统摄像机定标方法综述[J].福建工程学院学报,2007(1).

篇3

关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物

中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3

计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。

1 计算机视觉中与摄像机定标解析

计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。

2 传统的摄影机定标方法及应用特点

传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。

2.1 基于3D立体靶标的摄像机定标

这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。

这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。

2.2 基于2D平面靶标的摄像机定标

基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。

这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。

2.3 基于径向约束的摄像机定标

基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。

总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。

3 摄像机自定标方法及其应用特点

摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。

3.1 基于主动视觉的自定标法

目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。

这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。

3.2 基于Kruppa方程的自定标方法

基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。

这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。

3.3 分层逐步定标法

分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。

这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。

3.4 基于二次曲面的自定标方法

基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。

在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。

4 传统摄像机定标方法与自定标方法优缺点分析

从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。

4.1 传统的摄像机定标方法弊端

传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。

总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。

4.2 摄像机自定标方法相关问题

目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。

5 结束语

随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。

参考文献

[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.

[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.

[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.

[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.

[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.

[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.

[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.

[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.

篇4

进行了阐述。

关键词:自动控制技术 农业自动化

由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距, 已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术, 如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展, 从而形成了一系列适合我国农业特点的自动化控制技术。

一、已有的农业机械及装置的部分自动化控制

自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上, 成功研制出6CRK-55型可编程控制加压茶叶揉捻机, 它利用计算机控制电功加压机构, 能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制, 是机电一体化技术在茶叶机械上的首次成功应用。

1.应用于拖拉机

在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。

2.应用于施肥播种机

根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。

3.应用于谷物干燥机

不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时, 自动掐断燃料供给的装置。

二、微灌自动控制技术

我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年, 全国共有节水灌溉工程面积0.133亿m2, 其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段, 高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况, 对灌溉用水进行动态监测预报, 实现灌溉用水管理的自动化和动态管理。在微灌技术领域, 我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备, 总结出了一套基本适合我国国情的微灌设计参数和计算方法, 建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统, 可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。

三、自动控制技术在精准农业中的应用

篇5

【关键词】照相软件 人脸识别技术 计算机

人脸识别作为一项现代化科技技术,具有极大的发展空间。1964年,人脸识别(AFR)这一领域逐渐出现在人们的视野里,至于1991年至1997年,若干具有代表性的人脸识别算法诞生于世,到如今,以支持向量机为代表的统计学习理论被应用到了人脸识别中来。前人的侧重点在于对其算法的延伸探究,但就笔者而言,存在一定程度上专业知识的限制,因而根据自身的知识储备与探究能力,将人脸识别技术这一宽泛概念的探讨缩小至相对更贴近生活,且较为容易理解与研究的一个主题――对于照相机软件中人脸识别技术的探究,并由此展开对计算机人脸识别的部分性探究。

1 对于人脸识别技术的初步了解

科幻性质的故事往往以其并不符合实际的奇幻情节,模糊得描绘了现实世界未来的发展蓝图。这里不得不提及一部具有启发意义的电影――《生化危机》,电影中追踪主角行踪的卫星定位人脸识别技术,是否未来也将存在于我们的现实社会当中?由此,便联想到生活中照相软件的人脸识别是否也是通过相似的原理而执行的。

关于人脸识别,其本质上隶属于生物特征识别的一支。其余包含指纹识别,虹膜识别,DNA识别等技术。当今最为广泛运用的是指纹识别,但随之而来产生的是一定的安全性问题。例如去年热门的高考替考话题,指纹贴的出现使指纹识别的安全性受到质疑。而人脸识别仍处于一个不完全成熟的发展阶段,就目前现状来说,其所具有的不可复制性、自然性、不可察觉性,使其安全性与实用性都处于相对较高的水平。但同样,其技术难度也呈正比例增长。

通过对与计算机信息科技的学习,能够得出这样一个总结性结论:“人脸识别是通过计算机视觉的一些算法所实现的。”

前人对从不断更新的研究中得出,人脸识别的基本算法有四种:

(1)基于人脸特征点的识别算法(Feature-based recognition algorithms)。

(2)基于整幅人脸图像的识别算法(Appearance-based recognition algorithms)。

(3)基于模板的识别算法(Template-based recognition algorithms)。

(4)利用神经网络进行识别的算法(Recognition algorithms using neural network)。

当然,如今也早已存在许多其他的的算法能够支持人脸识别技术的实现。而对于该项技术的应用的范围也在逐渐扩大,门禁考勤系统、住宅安全管理、电子身份等等,都将在很大程度上的得益于其的不断发展。

让我们回到主题:照相机的人脸跟踪究竟是如何实现的呢?围绕这一问题,由浅及深,笔者将本文中的探究内容主要分为以下三个部分:

(1)图像在计算机内部的存储方式。

(2)计算机如何区分出物体与其所在背景。

(3)计算机如何定位人脸并从而实现识别功能。(注:由于照相软件只是作为一个对于人脸识别问题的切入点,单单深究照相软件会带来一定的局限性,因此二、三两点将跳过作为载体的照相软件,直接对于照相机功能背后的原理作进一步探究。)

1.1 图像在计算机内部的储存方式

计算机通过往往通过bitmap的形式来储存图像,也就是像素矩阵。

从结构上讲,计算机中储存的图像一把可以分为两大类,即矢量图和位图。矢量图通过数学公式计算获得,优点在于不会失真,但其最大的缺点是难以表现色彩层次丰富的逼真图像效果。而位图的基本思想,则是把一幅图像按照行列进行分割,所获得的点成为像素。相机所拍摄获得的照片便是以位图的形式储存的。每一幅图像均是由无数像素组成,而每一个像素对应显存中1、8、16或24位二进制数来表示颜色信息。位数决定了图像所含的最大颜色数,位数越多,图像的色彩就越丰富。

1.2 计算机如何区分出物体与其所在背景

大致的过程可以由图1所知,用相对容易理解的话来解释,计算机对于区分物体与其所在背景,首先是通过对要是别的物体提取表面特征,然后再对真实的照片提取表面特征,最终在进行匹配,配合相应的算法,这样,计算机便可以区分出物体与其所在背景。

由此所延伸的科目是计算机视觉。

正如定义所提到:计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。

通过这门科目,我们能够做到使用计算机来处理图像,并区分出目的对象。形象地说,在这门科目的辅助之下,计算机能够成为人类的第二双眼睛,对目标进行识别、跟踪和测量。

“One picture is worth ten thousand words.”图像的处理,将为人类提供巨大的便捷。

大致罗列出其处理所进行的步骤,分别是:图像获取、特征提取、检测分割、高级处理。

1.3 计算机如何定位人脸并从而实现识别功能

关于人脸的定位与识别,在很大一定程度上与区别物体与背景的技术存在着相似之处。但是人脸的定位与识别,又是更高于目标对象的识别的。这正是算法的不停更新与发展所带来的科技发展的结果。

目前比较流行的Cascade Classifier(Opencv中做人脸检测的时候的一个级联分类器)效果还是比较好的,正脸检测到的成功率能达到90%以上。

此外,在人脸局部区域特征提取时,一种叫做CNN(Convolutional Neural Network)卷积神经网络技术的运用――使用提取特征的filter对像素点进行几层处理,也为识别带来一定的便利。CNN运用到了深度学习,因此这里将拓展以下有关deep learning的概念:

deep learning的概念源于人工神经网络的研究。其三大框架为:CNN(Convolutional Neural Network,卷积神经网络),DBN(Deep Belief Network,深度置信网络),AE(AutoEncoder,自动编码机)。而目前在CV(Computer Vision的缩写,指计算机视觉)领域应用最广的是CNN。到近来也有很多人尝试用deep learning的方法来实现人脸识别,其与先前所提到的计算机区分物体和背景的原理也是相似的。

2 结论

回到最初的问题:照相机的人脸跟踪是如何实现的?综上所述,可以获得的结论是:照相机的人脸跟踪是通过计算机视觉的一些算法实现的。但这些算法在技术方面人仍然面临着一些难点,例如,在特征识别时,外界客观因素,有如,光线、着装遮挡、目标对象的姿态、脸型、样本缺乏等等尚未解决的问题。这些都使人脸识别技术尚有巨大的可发展空间。就像前段时间由推出的How Old do I Look线上脸部侦测服务,曾一度掀起热潮,可见,人们对于人脸识别技术的期望也是很高的。

那么,未来的人脸识别技术到底能够发展到何种程度呢?香港中文大学教授汤晓鸥、王晓刚及其研究团队曾在2014年6月宣布,他们研发的DeepID人脸识别技术的准确率超过99%,比肉眼识别更加精准。相信未来,计算机人脸识别技术将与我们共同成长,逐渐成熟与完善。毕业于UC Berkeley的博士贾扬清,创造了Caffe――全称Convolutional Architecture for Fast Feature Embedding,一个清晰而高效的深度学习框架,具有上手快、速度快、模块化、开放性、社区好等优点。如此不断迅捷发展的计算机技术,在这个数字化的时代,正是对未来发展很好的导向。

参考文献

[1]韦凤年.怎样写科技论文[J].河南水利,2006(09).

[2]董琳,赵怀勋.人脸识别技术的研究现状与展望[J].China Academic Journal Electronic Publishing House,2011,10.

作者简介

孙文倩(1998-),上海市人。现在上海市洋泾中学高中在读。

篇6

关键词:数字摄影测量;影像匹配;影像匹配分类;匹配策略

中图分类号: P216 文献标识码: A

1.前言

影像匹配是数字摄影测量的典型问题之一。在航空摄影测量领域,影像匹配是自动获取数字地面模型(DTM)的关键技术,是以影像匹配代替传统的人工观测,来达到自动确定同名点的目的。一般来说,由于影像在不同时间、不同传感器、不同视角获得的成像条件不同,因此即使是对同一物体,在影像中所表现出来的几何特性、光学特性、空间位置都会有很大的不同,如果考虑到噪声、干扰等影响会使影像发生很大差异,影像匹配就是通过这些不同之处找到它们的相同点。在计算机视觉中,通常称为影像配准,而且很多领域中影像匹配都是必不可少的关键环节。目前影像匹配己成为现代信息处理,特别是图像信息处理领域中的一项非常重要的技术,已有很多学者进行这方面的研究而且已经取得了很好的成就。影像匹配研究涉及到了影像采集、影像预处理、影像分割、特征提取等,并且与计算机视觉、多维信号处理和数值计算方法等紧密结合。它也是其它一些影像分析技术,如立体视觉、运动分析、数据融合等的基础。目前,它的应用范围相当广泛,在计算机视觉、虚拟现实场景、航空航天遥感与数字摄影测量、医学影像分析、光学和雷达跟踪、景物制导、地形匹配、指纹与肖像检测等领域都有着重要的应用价值。在数字摄影测量的研究中,几何变换和对应关系是两大关键问题。几何变换问题经过数学和图形图像学的研究已经得到了解决,而对应问题(特别是同名点的对应问题)正是影像匹配的研究目的。影像匹配的良好实现,可以大大促进数字摄影测量自动化量测的发展,并为立体测图、建立立体模型、自动生成DEM、正射影像、等高线,构建三维立体和虚拟现实场景提供技术支撑。

2.影像匹配国内外研究现状与内容

影像匹配技术一直是数字摄影测量、计算机视觉等领域的关键技术难题,但它广阔的应用前景吸引了众多领域的科研人员孜孜不倦地对它进行攻关,成为经久不衰的研究热点。最初的影像匹配是利用相关技术实现的,因此又称为影像相关。从上个世纪五十年代至今,国内外学者提出了许多相应的理论,涌现了大量的匹配算法[1][[2][3][4],如相关函数法、相关系数方法、整体法等。Bellman于上个世纪50年代提出的动态规划法影像匹配,德国 Ackerlnann 教授提出的最小二乘匹配方法[5],Rosenhlm提出的多点最小二乘影像匹配[6],已及Ton Jez-ehing、JainA K提出的确定两影像区域间对应关系的点匹配方法[7],Daniel P Huttenlocher等人提出的Hausdorff距离匹配方法[8]等等;1978年,我国摄影测量学的先驱王之卓院士率先提出了“全数字摄影测量”的概念[9], 利用影像匹配来代替传统的人眼立体观测;张祖勋院士提出了基于跨接法的影像匹配 [10];吕言提出了特征提取的吕言算子和基于特征的影像匹配方法[11];张力、沈未名等也提出了基于空间约束的神经网络影像匹配算法[12]。尽管发展出了多种多样的匹配方法,但这些影像匹配算法按其匹配基元分类,主要可以分为基于像元灰度的影像匹配算法、基于特征的影像匹配算法以及基于影像的理解和解释的匹配算法。

3.影像匹配的基本概念

匹配是图像处理的一个基础问题。简单的说,匹配技术就是找到两幅不同影像之间的空间位置关系实现同一目标的两幅(或两幅以上)影像在空间位置上的对准。 Barbara zitova和 Jan Flusser在其著作中对影像匹配进行了定义[23],称其是针对来自于同一场景、不同时间、不同视角、不同传感器的两幅或多幅图像进行重叠 (Overlapping)的过程,这个重叠就是几何对齐 (Geometrically Align)的过程。可以从中看出两点,其一,影像匹配所研究的影像具有成像机理、自然条件、成像时间等的不同,这些都造成参与匹配的影像对具有很大的差异;其二,影像重叠的目的为了对两幅影像在空间上进行对准,以确定两幅影像之间的平移以及旋转关系。也可以说影像匹配时利用两个信号的相似性评价函数,评价它们的相似性以确定同名点。即首先取出以待定点为中心的小区域中的影像信号,然后取出其在另一影像中相应区域的影像信号,计算两者的相似性评价函数,以相似性评价函数值的大小来确定相应区域中心点位同名点,即以影像信号分布最相似的区域为同名区域,同名区域的中心点为同名点。

4.影像匹配的困难与解决问题思路

影像匹配的方法有很多,但都有不同程度的局限性。对于一些共性的问题,如匹配模糊度问题,匹配组合问题等,目前仍是影像匹配中的难点问题。在实际应用中主要表现在以下几种情况的影像匹配中存在的问题:

1.信息贫乏区域(非重叠覆盖范围)和纹理重复区域(遮蔽区域)的匹配

2.阴影区域的匹配

3.陡坡表面和断裂线地区的匹配

4.影像之间存在大的旋转角度的匹配

5.非漫反射地区的匹配

6.对运动的目标和阴影的匹配

7.存在较大比例尺差异的影像间的匹配

8.不同传感器影像之间的匹配

针对这些问题,一般的对于纹理贫乏和周期性纹理重复区域,自适应的调整窗口大小;对于遮蔽和断裂线区域采用双向匹配的方法;对于陡坡区域采用跨接法影像匹配;对于存在较大旋转角度的影像匹配则采用SIFT算子[28]进行处理。

5.小结

发展至今,影响匹配技术已经取得了很大的成就,多种多样的影像匹配算法基本能够满足实际应用的需求。但影像匹配中仍存在着诸多问题和挑战,这也是数字摄影测量面临的典型问题之一,也是我们今后科研的主攻方向和着力点。另外,目前的影像匹配算法大多是针对特定情况的应用,适应性方面不是太强。因此,寻找一种普适性的影像匹配算法或适应性较强的影响匹配处理系统从而实现数字摄影测量发展的一次飞跃是我们不得不思考的问题。

参考文献:

[1]张祖勋,新的核线相关算法一跨接法[J],武汉测绘科技大学学报,1988,13(4):19-26.

[2]王之卓,摄影测量原理续编[M],北京:测绘出版社,1986.

[3]吕言,用于提取数字图像点特征之有利算子研究[J],测绘学报,1989,18(3):175-182.

[4]张力,沈未名,张祖勋等.基于空间约束的神经网络影像匹配[J].武汉测绘科技大学报,2000,25(1):55-58.

篇7

关键词 机器视觉 农业 具体应用

中图分类号:R471 文献标识码:A

0引言

机器视觉是一门涉及模式识别、神经生物学、计算机科学、人工智能、图像处理、心理物理学等诸多领域的交叉学科。主要是通过计算机对人类某些视觉方面的智能行为的模拟和再现,再处理并理解从客观事物的图像中提取到的信息,最终达到在实际检测和控制中应用的目的。近年来,随着农业的智能化发展,使得机器视觉越来越多的应用于农业之中。

1机器视觉的主要结构

1.1照明

照明是机器视觉系统里的一个非常重要的部分。它直接影响着摄像机采集到的数据的质量,所以,在选择照明设备的事情上,要非常的谨慎。一个好的光源的判别标准是:

(1)能够突出对比被测物体的特征。

(2)保证稳定性和亮度。

(3)物体的位移不会对成像质量有影响。

生活中常见的光源主要有白炽灯、氙灯、荧光灯、LED等几种类型。在照明上,有两种方法可以来增强需要的目标特征:

(1)利用光谱。选取合适的照明光源反射呈现出希望看到的光谱范围。

(2)利用照明的方向性。有两种方法:其中一种是具利用光源本身的照射效果。光进行漫反射时,光的照射强度在每个方向上基本相同。而当光直射时,光源的光会集中在一个狭小的范围内。特定的环境下,光源会发出单向平行光。

(3)可以从被测物、光源、摄像机三个部分的相对位置入手。有正面光、背光、明场照明、暗场照明四种相互独立的方法。

1.2镜头

摄像镜头是一种光学设备。具有把光转换为摄像机内部成像的功能。镜头是机器视觉中举足轻重的部分,对判断图像的质量好坏有着很客观的作用。镜头性能的参数主要有工作距离、角度、视场、景深、分辨率等几个方面。工作距离指的是镜头的前部到被测物体的距离。视场表示摄像头能观察到的最大的范围。景深指的是在物体在摄像机照射到清晰图像的情况下能移动的前后距离范围。

1.3摄像机

摄像机是可是将光线转换成图像的装置。摄像机又分CCD和CMOS传感器摄像机两种。两者主要的区别是读出数据的方式。CCD的成本高,工艺复杂,耗电高,但是效果好。CMOS制造成本低,制造工艺简单,消耗的电力小,但是CMOS的通透性和对色彩的还原能力都比较差。CCD可分为两类,面阵式和线阵式。在速度较高的情况下一般采用线阵式,速度低的情况下采用面阵式。面阵式价格也比较便宜。

1.4 图像采集卡

把摄像机采集到的数据通过图像采集卡转存到电脑中。

2机器视觉在农业中的应用

2.1机器视觉在棉花氮素营养诊断中的应用

农作物生长发育进程和产量形成受肥料影响很大,基于机器视觉的作物生长监测与诊断技术是近地面遥感监测的方法之一,其优质清晰的数字图像既能方便地对作物生长发育的季节性变化进行评估,也能实时高效、快速准确、自动无损地提供作物长势信息和营养状态诊断,在信息化精准农业生产中扮演着极其重要的角色,还可以帮助农户适时采取农艺措施(施肥、灌水、耕作、收割以及病、虫、草、鼠害防治等),从而提高农作物产量与品质。

2.2机器视觉在嫁接苗移栽实时定位中的应用

为了降低嫁接苗培育整个环节的工作强度、提高嫁接苗存活率以及生长质量,嫁接苗的全自动培育是未来发展的趋势。嫁接苗的全自动培育包括精密定向自动播种、自动育苗、自动供苗、自动嫁接、嫁接苗自动移栽以及温室自动管理几个步骤,每个环节都有大量的研究人员深入研究。其中,嫁接苗的自动移栽主要完成从嫁接机上取苗再到穴盘上进行种苗的过程。移栽效果一般取决于穴孔定位的精度、稳定性以及末端执行器的设计。针对移栽过程中基于机器视觉的穴孔位置的定位研究是目前的研究热点。

2.3机器视觉在茶陇识别与采茶机导航中的应用

中国是茶叶的主要原产地,也是世界上茶叶种植、消费、出口最大的国家之一。目前,我国茶叶采摘和用工的矛盾已经成为茶叶产业发展的瓶颈,加快发展茶叶采摘机械化势在必行。采用机械化作业替代人工,不仅可以降低成本,而且能够提高采茶质量和生产效率。机器视觉在茶陇识别与采茶机导航中的应用,给茶产业带来了新的春天。利用计算机视觉系统识别茶树嫩芽并实现定位采摘的方法,不仅可以保证叶片的完整性,还能使整个采摘过程完全自动化,节省大量的人力物力,但机器视觉的识别效率还有待提高。

3总结与展望

机器视觉在农业中的应用为精细农业和农业生产自动化奠定了基础,不仅有助于解放劳动力,还有助于提高农作物产品的品质和产量。

另外,植物生长过程的三维重构是目前国内外的研究热点,机器视觉技术是改过程中不可或缺的重要环节。植物生长周期长,利用三维重构技术可将作物在虚拟空间中结构的发育与生长过程进行仿真,并以三维图像进行展现,不仅能够直观、精确地呈现植物的三维生长过程,还可对植物的生长进行预测,为生物育种、育苗提供高效便捷的实验方法。

参考文献

篇8

关键词:三维点云;配准;迭代最近点

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)31-7568-03

在计算机应用领域,三维点云数据的配准对解决曲线曲面匹配、图像拼接、三维重建、计算机辅助文物复原等问题至关重要。以计算机辅助文物碎片拼接为例,在过去十年间有很多研究项目需要获取文物详细的三维表示,但是通过三维扫描设备获取的多个扫描需要采取一定的技术恢复每个扫描的相对视点,然后将多个扫描融合到一个最终的模型。这一过程就是三维点云数据的配准,它是获取文物准确的三维表示的关键步骤。1992年,Besl和Mckay提出了一种基于几何模型的三维物体配准算法——迭代最近点算法[1]。近年来,伴随着三维扫描技术的不断进步,该算法得到了广泛应用,也吸引了众多研究者的目光。许多研究者对该算法进行了系统的研究,分析了该算法的特点与不足,提出了各种改进算法。国外学者Michael Wild[2]回顾了2002年到2007年ICP算法的发展;介绍了ICP算法的流程并对几种改进算法做了详细的分析和比较;最后介绍了该算法在放射疗法中的应用。近几年,ICP算法的研究改进以及应用仍然是国内外众多学者热衷的一个研究方向,这从发表在IEEE上的论文数量即可看出。本文详细总结了ICP算法的基本原理,然后从数据采样、特征点选取与点对权重、非重叠区域检测、兼容性约束四个方面对几种改进算法进行了系统而详细的分析与研究。总结了这些算法的基本思想和特点,这些工作对后期的研究将会起到重要的作用。

1 ICP算法的基本原理

篇9

【关键词】灰度化 RGB HSI HSV

一、引言

彩色摄像机采集的图像一般是RGB三个颜色通道的模型,即拥有红(700nm)、绿(546.1nm)、蓝(435.8nm)三个分量,这三个分量不同比例的混合,可以得到人类视觉上几乎全部的色彩信息[1]。但由于该信息占据存储空间大小灰度化后的三倍,并且三个通道没办法按照数学方法进行一些必要的处理(比如边缘检测或者二值化),故需将RGB模型处理成为一种新的色彩通道,该模型只有一个色彩通道,可以令R=G=B,这样原本用三个通道的信息,便转化为一个叫做灰度的值,而这个值的范围同样是0~255,并且可以直观地认为,该数字表示图像上色彩的亮度。由于彩色光(RGB混合)同一波长有可能对应不同的混合颜色,所以我们又定义了色调、饱和度、明度的概念。色调用于标识颜色,如果颜色可以用单一色光和白光按照一定比例配合,则这个颜色的色调用此单一色光的波长表示,若非单色光和白光按照比例合成,则这个颜色的色调用此非单色光的补光表示[2]。饱和度用以表示颜色的纯洁程度,明度用于表示颜色的明亮程度。要提取亮度分量,需要用到HSV和HSL模式。HSV由色调、饱和度、纯度表示颜色。HSL则由色调、饱和度、亮度三个通道构成,是目前应用最多的色彩模式之一[3~4]。灰度化一般可以采取RGB分量、HSL分量、HSV分量、HSI分量等方式。

二、 灰度化原理

(一)RGB分量法:将RGB空间中的R分量、G分量或B分量提取出来称为强度信号,变为所要的图形。

(二)HSL分量法:将RGB空间按公式转换为HSL空间,然后分别提取H、S、L分量[5]。

(三)HSV分量法:将RGB空间按公式转换为HSV空间,然后分别提取H、S、L分量。

(四)HSI分量法:人的视觉系统经常采用HSI色彩空间,它比RGB色彩空间更符合人的视觉特性。在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,它们可以分开处理而且是相互独立的。因此,在HSI色彩空间可以大大简化图像分析和处理的工作量。

三、灰度化的实现

四、总结

本文介绍了几种图像灰度化的方法,并用LABVIEW编程实现了,仿真结果表明对于不同的图像应该针对图像本身采用相应的灰度化方法。

参考文献:

[1]郝建青,张仲义,陈滨.基于车辆实时跟踪的编组站综合自动化系统集成方案的研究[J].铁道学报,2000,(2):1-6.

[2]徐杰民,肖云.二维条码技术现状及发展前景[J].计算机与现代化,2004,(12):141-142.

[3]张聪,张慧.复杂背景下维条码图像的提取[J].微计算机信息,2007,23(10):302-304.

[4]霍宏涛,林小竹,何薇.数字图像处理[M].北京:北京理工大学出版社,2003.

[5]刘红霞.图像分割算法的研究与实现[D].上海:华东师范大学,2004.

作者简介:

篇10

(大连东软信息学院电子工程系,辽宁大连116023)

摘要:智能科学与技术概论课程是智能科学与技术专业重要的必修基础课,对整个专业课程体系有概括性的引导作用,对学生深入学习后续课程有很大帮助。文章从智能科学与技术概论课程的教学实际出发,提出该课程的整体课程规划,并根据学生的学习情况验证其适用性。

关键词 :智能科学;专业基础必修课;课程规划

基金项目:2012年辽宁省普通高等学校本科工程人才培养模式改革试点项目(G2201249)。

第一作者简介:林宝尉,男,讲师,研究方向为计算机视觉、模式识别,linbaowei@neusoft.edu.cn。

0 引言

智能科学与技术概论课程是智能科学与技术专业的必修基础课。学生通过学习基础课,能够了解整个专业的知识构成、体系结构以及发展方向,便于将来学习必修专业课,包括模式识别、人工智能、智能机器人等课程。在这个过程中,如何让学生顺利地过渡到更高层次的专业课学习中,如何提高其学习兴趣,如何帮助学生深入了解各门专业课之间的层次关系,都是该专业设置过程中需要考虑的问题。智能科学与技术概论的规划起到了承上启下的作用。虽然专业导引课也从全局对该专业的情况进行了介绍,但其内容以学生职业引导、兴趣培养为主,对专业课程的设置并无过多展开。因此,智能科学与技术概论课程的设置十分必要。

1 课程规划设置

1.1 能力指标

课程将学生的能力体系分为5个部分:技术知识与推理能力、开发式思维与创新、个人职业能力、态度与习惯、时间构思设计实现和社会贡献,与其对应的二级、三级及详细指标见表1。每个能力指标平均对应4个学时,共32个学时。

1.2 讲授方式

(1)精讲多练。通过讲解智能科学的相关内容并结合相关实验,让学生掌握智能科学的基础知识,提高其学习兴趣,为后续课程的学习打下良好基础。

(2)以项目为导向组织教学,通过案例教学,将构思、设计、实施和运行引入教学过程中。

(3)鼓励学生自主学习,加强基本职业能力的训练。教学过程中注意互动和引导,运用讲授教学、练习教学、实验教学、案例教学等多种教学方法完成教学任务。

(4)教学实施过程中,提供丰富的教学资源,如多媒体课件、案例、网络资源、优秀学生作品和外文技术资料等。

(5)对学生进行多方面考核与评价。结合课程实施过程,从知识掌握、能力水平、态度表现等方面,对学生进行全方位的考核。

1.3 讲授内容

该课程讲授内容分为3个单元,具体内容如下。

单元一:智能科学导论,主要涉及智能科学与技术的目标界定、学科分类、涉及范围、学科定位、人类认知以及学科简史等知识点。该单元将在2个学时中完成,并要求学生课外学习2个学时。

单元二:学科基础理论知识,主要涉及机器系统、视觉感知、高级语言编程等知识点。该单元主要介绍支撑学科的相关课程,并在实践课中使用高级语言编写简单系统。该单元共10个课时,其中包括4个实践课时。

单元三:专业课介绍,主要涉及数字图像处理介绍、模式识别介绍、计算机视觉介绍、智能机器人介绍等相关必修专业课的入门介绍,并在每次课程结束后配合实践编程、工具使用、机器人搭建等实践环节提高学生的学习兴趣,使其全面认识后续专业学习。该单元共20个学时,其中包括12个实践课时。

1.4 实验设置

实验课程共16个学时,包括4次实验,详细内容如下。

实验一:数字图像处理实验。使用课程中讲授的Matlab语言,实现数字图像的傅里叶变换、边缘检测功能。该实验共4个课时,配合单元一以及单元二的部分知识点,使学生基本掌握Matlab编程语言,并理解数字图像处理的基本知识。

实验二:模式识别机器学习实验。该实验利用高级程序语言,实现数据的SVM算法以及KMeans算法,让学生理解模式识别以及机器学习等知识。该实验共4个学时。

实验三:计算机视觉实验。使用图像拼接、3D场景重建等相关专业工具,实现二维图片的3D重现。该实验共4个学时。

实验四:机器人实验。学生在机器人实验室,实际动手组装博创模块化机器人,并编程实现机器人运动调试。该实验共4个学时,实验地点为模块化机器人实验室。

1.5 结课考试

在教学的各个环节,教师从出勤情况、日常表现、作业、实验、结课项目及结课报告的完成情况对学生进行全方位的考核,其中结课项目、调查报告及实验作业占最终成绩的90%。结课项目为小组项目,4个学生为一个小组完成系统的设计、编写、调试等步骤,并组织5名教师对每个小组进行答辩考核。

2 问题及改进

学校于2012年申请创办智能科学与技术专业。该专业培养学生掌握计算机基础、电子电路、控制方法、智能信息处理与识别等基本知识,使其具备信息处理、自动控制、人工智能系统开发等基本能力。智能科学与技术概论课程在大二下学期开设,共32学时,其中理论教学16学时,实践教学16学时。通过理论教学和实践教学,学生了解了智能科学的基础理论知识,掌握该专业核心专业课的关系,认识相关后续课程,并能够使用简单的算法和工具,为日后深入学习专业课打下良好基础。

2.1 教材选择

由于本专业办学时间较短,没有足够的针对智能科学与技术概论的教材可供选择。现阶段使用较多的教材为《智能科学与技术导论》以及《智能科学》。《智能科学与技术导论》是钟义信主编、北京邮电大学出版社出版的、适合智能专业大一新生使用的专业教材,对整个专业有详细的介绍,适合作为新生的专业导引课程,安排16个学时较为合适,并不适于我校智能科学与技术概论课程的要求。《智能科学》是史忠植主编、清华大学出版社出版的专业教材,该教材对整个智能专业的重要内容都有涉及,系统地介绍了智能科学的概念和方法,吸收了脑科学、认知科学、人工智能、数理逻辑、社会思维学、系统理论、科学方法论和哲学等方面的研究成果,适合高年级学生使用,安排64个学时较为合适,也不适于我校情况。

鉴于上述原因,我们设计该课程时,前半部分理论知识介绍使用了《智能科学与技术导论》,后半部分专业课程介绍使用自制课件。经过2轮的教学实践以后,我们将根据教材使用情况编写自用的讲义教材。

2.2 内容设计

该课程内容会介绍智能专业的重要专业课,但要在32学时内完成所有专业课程的介绍,并保证该课程内容不与专业导引课以及智能信息处理导引课冲突,难度很大,因此选择最合适的讲授内容,对于该课程的授课效果非常重要。

在授课过程中我们发现,学生对简单的数字图像处理、计算机视觉的流行应用以及动手要求强的机器人课程兴趣较大,但对数学推导要求较高的模式识别、机器学习等课程接受程度较低。该课程的教学目的是让学生了解相关课程的意义、历史、发展等知识,所以,建议加大实验动手课程的课时比例,让学生多使用相关知识、算法和应用,尽量避开复杂的数学推导。

2.3 资源配置

学校的智能科学与技术专业创建于电子工程系,依托电子系的软硬件实验室,培养学生的软硬件知识储备,提高学生的实际动手能力。其中,软件算法将配合嵌入式设备进行硬件集成,并指导学生设计具有智能算法应用的硬件设备。教学过程中将使用校实验室中的模式识别嵌入式开发板、博创模块化机器人平台以及Turtlebot智能机器人平台。该课程在实际讲授时,理论课以及算法相关实验在大班进行,硬件实践课程在小班进行,能取得较好的授课效果。

3 实施效果

在该课程设计内容的指导下,智能科学与技术概论已经完成了2轮的课程教学,并在课程结束后组织学生填写调查问卷。题目分两类,第一类包括课程目标是否清晰、该课程能否提起学生对该专业课的学习兴趣、该课程的实验设计能否有效提高学生的动手能力,以及该课程的内容相关设计是否优秀。统计结果如图1所示。除极个别学生外,大多数学生都选择了符合以及完全符合,说明该课程设计可以满足教学要求。第二类问题总结学生在课程中获取的知识能力,包括编程调试、理论知识应用、信息获取、技术文档写作、自主学习、分析问题、解决问题等,为多选题。从图2可以看出,学生对各项能力的认可率均超过50%,其中信息获取、分析问题等能力的认可率接近80%,说明该课程设计基本满足教学目标。

4 结语

智能科学与技术概论对智能专业学生的深入学习起到了重要的引导作用。我们根据自身的实际情况出发,设计出适合该专业学生的课程设计安排。经过两轮的实施效果证明,该课程的设计方式比较适合学生。随着课程的持续,我们将不断解决存在的问题,并编写适合我校学生使用的教材。

参考文献:

[1]钟义信,智能科学技术导论[M].北京:北京邮电大学出版社,2007.

[2] Edward FC,Johan M,Soren O.重新认识工程教育:国际CDIO培养模式与方法[M].顾佩华,沈民奋,陆小华,译.北京:高等教育出版社,2009.