计算机视觉的应用方向范文

时间:2023-12-18 17:59:12

导语:如何才能写好一篇计算机视觉的应用方向,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉的应用方向

篇1

关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物

中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3

计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。

1 计算机视觉中与摄像机定标解析

计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。

2 传统的摄影机定标方法及应用特点

传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。

2.1 基于3D立体靶标的摄像机定标

这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。

这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。

2.2 基于2D平面靶标的摄像机定标

基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。

这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。

2.3 基于径向约束的摄像机定标

基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。

总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。

3 摄像机自定标方法及其应用特点

摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。

3.1 基于主动视觉的自定标法

目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。

这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。

3.2 基于Kruppa方程的自定标方法

基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。

这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。

3.3 分层逐步定标法

分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。

这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。

3.4 基于二次曲面的自定标方法

基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。

在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。

4 传统摄像机定标方法与自定标方法优缺点分析

从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。

4.1 传统的摄像机定标方法弊端

传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。

总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。

4.2 摄像机自定标方法相关问题

目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。

5 结束语

随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。

参考文献

[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.

[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.

[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.

[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.

[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.

[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.

[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.

[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.

篇2

1.1计算机在和艺术融合时

有效结合图像、文本、声音、动画等因素,在丰富艺术语言表现形式时,也使作品更具有感染力。当计算机视觉艺术与数字媒体结合在一起时,使人们在观看画面时,不仅是欣赏画面,也能够感受到声、色等。数字媒体通过计算机视觉艺术利用高度仿真的视觉、触觉和听觉,使大众在观看电影或玩游戏时,能够真实感受到虚拟世界,同时还可以通过肢体语言、动作以及视线的转移,与计算机进行有效交流。比如在2010年开展的上海世博会上,德国馆所开展的动力之源”金属球表演1.3吨重、装有40万根LED发光二极管的互动金属球。在互动开始时,观众被分成两批跟着解说员的指令呼喊,金属球自动找到声音最响亮的那个方向。然后,哪边的呼喊声大,互动球向那一边的摇摆也更为剧烈,同时,球体表面上,亦不断展现出一幅幅城市的美好愿景。使大众不仅是单独欣赏电影,而是可以参与到视觉艺术表演中。数字媒体通过计算机视觉艺术,在最大程度上满足艺术创作对感受的表现。

1.2计算机视觉艺术在数字媒体中的应用

丰富了艺术的表达形式。交互技术的发展与成熟,使计算机视觉艺术的领域得到很好的拓展,并在各种数字媒体艺术中得到广泛应用。比如在网页、游戏等内容。交互技术的应用,使人们不再是被动的欣赏,而是参与到视觉艺术中,让大众去参与、选择和判断,而且可以通过不同的选择将过程和结局进行不同的呈现,调动观众的兴趣,提高大众的参与度。

1.3计算机视觉艺术在电子游戏中的应用

首先是大型电子游戏应用的计算机视觉艺术。比如日本科乐美公司在推出警匪枪战射击《警察官2》游戏时,就受到许多玩家的欢迎。在游戏中,玩家不再只是使用鼠标和键盘来进行游戏,而是玩家可以通过身体行动,比如“蹲、闪及侧身等行为以此进行移动。机器通过摄像机部捕捉到玩家的身体动作,玩家可以有效操作与机器相连的手枪,将屏幕中的对象进行射中。其次是手机上的小型电子游戏,比如在《神庙逃亡》,玩家只需要用手指向左、向右滑动屏幕,可以人物向左或向右转向;而向上、向下滑动则可以让人物跳跃或下滑过各种障碍。另外在需要游戏人物在左侧或右侧奔跑时,只需要侧一下手机就可以,并且游戏画面有着充足的声光效果,可进行互动,有着极高的震撼力,对提高大众的参与度有着积极的促进作用。

1.4计算机视觉艺术在数字媒体中的应用

使数字媒体技术将艺术进行有效表现,并在纯艺术和实用艺术中应用到数字媒体,而数字媒体技术可以将单纯的个人视觉进行有效的创造,并将艺术转化为社会性视觉产品,并可以获得经济效益。而大众可以利用拷贝、剪切等方式将数字媒体中的视觉艺术进行获取,然后将艺术资源进行转化,为个人视觉艺术的创作奠定了坚实的基础。随着大众对独特性以及个性化的艺术要求越来越高,在追求独特的视觉艺术时,追求刺激的视觉艺术时,也提高了对视觉艺术作品的评价标准。计算机视觉艺术在数字媒体中的应用,给大众带来美的享受,使大众在观看视觉艺术时可以怀着愉悦、舒适的感觉进行欣赏,也可以获得相应的审美评价,在潜移默化中改变着人的精神追求。计算机视觉艺术在数字媒体中应用时,没有掺杂其他因素,使计算机视觉因素只是追求视觉形式和视觉美感,能够在最大程度上体现艺术的本质。并且数字媒体本身就具有美的品格,与计算机视觉艺术相结合,使数字媒体艺术在具备了美时,也可以体现真。因此,计算机视觉艺术在数字媒体中的应用,提高了审美价值,大众通过感受、体悟数字媒体所体现出的视觉艺术,领悟到视觉艺术中的美,能够在很大程度上满足大众对美的追求。

2总结

篇3

关键词: 危险气体罐车; 液位检测; 计算机视觉; 报警系统

中图分类号: TN948.64?34; TP216 文献标识码: A 文章编号: 1004?373X(2016)22?0067?0

0 引 言

随着自动化测试技术的发展,采用智能测试和计算机视觉方法进行液位检测和监控,借助的物理场有超声波、微波雷达、射线及激光等,能实现高低位报警功能,在工业控制场合中,固定位置处的液位监控是保障工业控制安全的重要技术,特别是在危险光车的运输过程中,需要对危险气体罐车的液位进行实时监控和识别,通过感应元件实现对液位的准确检测,通过检测发射和接收的时延来确定液位的高度。随着计算机视觉处理技术的发展,以及图像处理技术的应用,采用计算机视觉部监控方法进行危险气体罐车的液位监控识别成为未来实现液位准确监测和定位的重要发展方向,研究基于计算机视觉的危险罐车的液位检测监控报警系统,在保障危险罐车运输安全方面具有重要意义,相关的系统设计方法受到人们的重视[1?3]。

目前,对液位的检测方法按照测量液位的感应元件与被测液体是否接触,其可分为接触型和非接触型两大类。通过人工检尺法[4?6],加装浮子测量装置进行液位检测,微波雷达、射线及激光主要是应用在检测罐体为危险物质,将微波发射器和接收器安装在罐顶,利用超声技术并结合数字信号处理算法进行液位检测[7?9]。但是,上述设计方案因无法找到超声信号为零的位置,所以考虑使用灵敏度相同的另一液位检测传感器作为参考通道进行自适应噪声抵消,参考液位检测传感器应放置在对目标反射信号较小,更多的反映液位反射的超声信号的位置,但是对电磁波、光波等超声无法穿过的介质,液位检测的精度不高[10],难以实现有效的监控识别和报警。针对上述问题,本文进行危险气体罐车液位监控识别报警系统的改进设计,首先进行了液位检测原理分析,构建系统装置的总体结构模型,然后进行了危险气体罐车液位计算机视觉监控识别报警系统的硬件模块化设计和软件设计,最后通过实验分析验证了本文设计的液位监控识别报警系统的优越性能,得出有效性结论。

1 液位计算机视觉监控识别报警系统的总体设计

根据上述液位检测弊端分析,进行危险气体罐车液位计算机视觉监控识别报警系统设计,首先分析系统设计的总体架构模型,系统设计包括了系统的硬件设计和软件设计部分。硬件设计中,主要是在计算机视觉环境下完成液位视觉特征的获取,并对接收到的视觉特征进行相应的处理。本系统的硬件部分主要是数据采集和数字信号处理。接收探头采集的视觉特征通过信号采集电路进行高分辨率的A/D采样,液位视觉的差异性可以通过对分辨率和采样率的大小来判断。在对液位检测的超声信号检测的基础上,设计自适应滤波器进行信号滤波,通过自适应均衡方法得到基于视觉传感器的液位检测特征,为系统设计提供了准确的数据基础。因此,采集电路的设计必须采用高分辨率,硬件电路设计中,包括确定DSP处理器型号、Visual DSP++集成开发环境、器件以及连接关系。根据I/O设备的数据采集量确定液位监控识别系统的分辨率和基线恢复性能,采用ADI公司的ADSP21160处理器系统作为计算机视觉监控识别的主控芯片,数字信号处理器主要完成对整个硬件系统的电路控制,根据设计的功能指标得到本文设计的监控系统的计算机视觉的像素值的系统最低采样率为1 024 MHz, 则DSP的最低速度应大于[25×20=500 MHz]。

在进行罐体液位监控中,研究的罐体的厚度分别为5 mm平面罐体,20 mm平面罐体。由于本文构建的系统是一个高采样率的数据采集系统,在进行液位监控识别报警中,需要利用C8051F处理器发射频率为120 kHz左右的脉冲序列,作为原始声信号数据存入计算机系统,以此进行监控识别,根据上述描述,得到系统设计的模块构架如图1所示。

2 系统的设计与实现

2.1 硬件电路设计的指标分析

在上述进行了危险气体罐车液位计算机视觉监控识别报警系统的液位检测原理分析和系统设计总体构建描述的基础上,进行系统的硬件设计,系统的硬件模块主要包括了超声信号A/D采样电路、时钟电路、滤波电路、程序加载电路和电源电路等。系统的设计指标描述如下:

(1) 危险气体罐车液位计算机视觉监控识别报警系统的输出信号幅度

(2) 监控系统的整体功耗

(3) 计算机视觉监控接收机采样率不低于12 MHz;

(4) CAN总线对无液状态采集数据采样分辨率不低于8位;

(5) 有液状态采集数据中具有高压控制功能;

(6) 具有基线恢复功能。

根据上述设计的指标,进行硬件模块化设计。

2.2 系统硬件模块化设计与电路实现

首先设计图像信号A/D采样电路,A/D采样电路是实现罐车液位计算机视觉监控识别报警系统设计的基础,通过A/D采样电路上传图谱数据,使用AD公司一款高性能A/D芯片AD9225对上一个缓冲区数据进行峰值检测,利用A/D芯片内的采样保持器和参考电压进行计算机视觉特征监测和液位脉冲数据采样,结合视觉特征在危险气体罐车中传播可以进行信号转换,通过A/D采样电路转化为计算机视觉监控系统能识别的数字信号,A/D芯片通过时钟把脉冲信息输入到罐体液位监测系统的中央处理单元,数字输出包括12位数字输出和一个溢出指示位,采用多样化的数据捕捉和传送模式,罐车液位计算机视觉监控识别报警系统的PPI的所有操作与A/D、D/A转换器、视频编码/解码器进行并行串口通信,由此实现控制信号的无帧同步、内部触发。根据上述设计,得到罐车液位计算机视觉监控识别报警系统A/D采样的时序逻辑如图2所示。

罐车液位计算机视觉监控识别报警系统的输入超声信号采用的是单端输入,耦合方式可以是交流耦合,通过上述逻辑结构,构建A/D采样电路如图3所示。

图4中,WDO引脚产生的超声波将发生反射纵波(或横波),利用多层介质中超声波的传播规律进行计算机视觉监控识别,实现对罐体液位状态的检测。

2.3 软件算法的设计

由于是单峰液位突变特征,因此,可结合角点检测的特点,利用Harris角点检测方法能够实现丙烯聚合过程中非正常液位的检测和识别。角点能够描述液位图像中两个边缘的相交点,Harris角点检测方法主要通过液位图像中的特征点形状进行非正常液位的检测和识别,即使液位的颜色发生变化仍能进行有效的检测。

设置液位图像[I(x,y)],对其进行平移[(Δx,Δy)]后图像具有自相似性,这种自相似性能够用自相关函数进行评价,其公式如下:

[c(x,y;Δx,Δy)=(u,v)∈W(x,y)ω(u,v)[I(u,v)-I(u+Δx,v+Δy)]2] (1)

式中:[W(x,y)]为以[(x,y)]为中心模板的窗口;[ω(u,v)]为加权函数,可以将其设置为常数或者高斯函数。对泰勒公式进行展开,能够得到:

[I(u+Δx,v+Δy)≈I(u,v)+Ix(u,v)Δx+Iy(u,v)Δy =I(u,v)+[Ix(u,v)Iy(u,v)]ΔxΔy] (2)

则:

[c(x,y;Δx,Δy)=ω(u,v)[I(u,v)-I(u+Δx,v+Δy)]2 ≈[Ix(u,v)Iy(u,v)]ΔxΔy2ω(u,v) =[Δx,Δy]M(x,y)ΔxΔyω(u,v)](3)式中:

[M(x,y)=Ix(u,v)2Ix(u,v)Iy(u,v)Ix(u,v)Iy(u,v)Iy(u,v)2=ACCB] (4)

因此,对液位图像进行平移后得到的自相关函数能够近似于下述二次项函数:

[c(x,y;Δx,Δy)≈[Δx,Δy]M(x,y)ΔxΔy] (5)

进而能够得到丙烯聚合过程中液位的视觉方程:

[Δx,ΔyM(x,y)ΔxΔy=1] (6)

图像中液位图像的尺寸是由[M]矩阵的特征值决定的,特征值能描述液位图像中灰度变化的速度和方向。Harris角点法无需对[M]的特征值进行计算,只要计算出一个角点的响应即可,其计算公式如下:

[R=detM-α(traceM)2] (7)

式中,[α]为经验参数,通常取值为0.04~0.06。利用上述方法取得的全部Harris角点,计算全部的角点纵坐标的均值进行计算即可得到实际的液位高度,从而实现丙烯聚合过程中非正常液位的准确检测与识别。

3 系统软件开发仿真环境描述和系统调试结果分析

危险气体罐车液位计算机视觉监控识别报警系统的软件开发建立在嵌入式Linux开发系统基础上,系统软件需要实现的功能包括危险气体罐车液位超声采集、能谱测量、计算机视觉图像控制、CAN通信以及A/D采样E2PROM烧写。SPI E2PROM AT25HP512用于DSP的程序加载,正确配置DSP的SPI寄存器,采用DIP封装实现程序加载,根据上述软件开发环境,发送WREN指令直接通过烧写器烧写,进行危险气体罐车液位计算机视觉监控识别报警系统的仿真测试。首先采用层次聚类方法在计算机视觉环境下进行液位状态数据采集,然后进行信号转换,得到有液状态和无液状态下的采集结果如图5所示。

对上述原始数据进行信号处理,采用自适应滤波电路进行有用信息提取,得到提取结果如图6所示。

监控识别,由图6可见,采用本文设计的系统进行危险气体罐车的液位检测,在计算机视觉下能实时准确检测液位值,实现准确的监控识别和报警,性能可靠稳定。

4 结 语

本文进行了危险气体罐车液位计算机视觉监控识别报警系统优化设计,利用不同液位状态下声波在不同罐体环境中的传播特征的差异性,进行声波在不同罐体环境中的传播的差异性特征提取,判定液位状态。进行系统的硬件设计和软件设计,包括A/D采样电路、时钟电路、滤波电路、程序加载电路和电源电路等。通过危险气体罐车液位检测系统输入的参考信号对有液和无液的状态进行区别检测,采用计算机视觉监测方法,进行危险气体罐车液位内部状态特征的视觉监测。研究表明,该系统具有较好的液位检测性能,实现危险气体罐车液位的有效监控识别报警,具有较好的应用价值。

参考文献

[1] 刘茂旭,何怡刚,邓芳明,等.融合RFID的无线湿度传感器节点设计研究[J].电子测量与仪器学报,2015,29(8):1171?1178.

[2] 吕富勇,周瑞卿,阮世阳,等.高频磁场检测中采样保持器的设计及其性能分析[J].电子测量技术,2015,38(8):13?16.

[3] 郭静波,谭博,蔡雄.基于反相双峰指数模型的微弱瞬态极低频信号的估计与检测[J].仪器仪表学报,2015,36(8):1682?1691.

[4] JAFAR S A. Interference alignment: A new look at signal dimensions in a communication network [J]. Foundations and trends in communications and information theory, 2011, 7(1): 129?134.

[5] GOMA/DAM K, CA/DAMBE V R, JAFAR S A. A distributed numerical approach to interference alignment and applications to wireless interference networks [J]. IEEE transactions on information theory, 2011, 57(6): 3309?3322.

[6] PATCHARAMANEEPAKRON P, ARMOUR S, DOUFEXI A. Coordinated beamforming schemes based on modified signal?to? leakage?plus?noise ratio precoding designs [J]. IET communications, 2015, 9(4): 558?567.

[7] KALEVA J, TOLLI A, JUNTTI M. Weighted sum rate maximization for interfering broadcast channel via successive convex approximation [C]// Proceedings of IEEE Global Communications Conference. Anaheim, USA: IEEE, 2012: 3838?3843.

[8] LIU H, DING Z G, FAN P Z, et al. Precoding design for interference suppression in multi?cell multi?user networks [J]. IET communications, 2014, 8(9): 1534?1540.

[9] RATHEESH M, DAVID M J. System?level performance of interference alignment [J]. IEEE transactions on wireless communications, 2015, 14(2): 1060?1070.

篇4

关键词:自动控制技术农业自动化

中图分类号: DF413.1文献标识码: A

由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距, 已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术, 如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展, 从而形成了一系列适合我国农业特点的自动化控制技术。

一、已有的农业机械及装置的部分自动化控制

自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上, 成功研制出6CRK-55型可编程控制加压茶叶揉捻机, 它利用计算机控制电功加压机构, 能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制, 是机电一体化技术在茶叶机械上的首次成功应用。

1.应用于拖拉机

在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。

2.应用于施肥播种机

根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。

3.应用于谷物干燥机

不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时, 自动掐断燃料供给的装置。

二、微灌自动控制技术

我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年, 全国共有节水灌溉工程面积0.133亿m2, 其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段, 高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况, 对灌溉用水进行动态监测预报, 实现灌溉用水管理的自动化和动态管理。在微灌技术领域, 我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备, 总结出了一套基本适合我国国情的微灌设计参数和计算方法, 建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统, 可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。

三、自动控制技术在精准农业中的应用

精准农业是在传统农业与农业机装备技术上, 运用高新技术进行农业生产管理。精准农业较传统农业其先进之处主要是应用全球定位系统(GPS)、地理信息技术、计算机控制技术、专家与决策知识系统, 实现农业生产的定位、定量、定时, 做到精耕细作和由于农业水土管理区管理点较为分散, 用传统方法进行数据采集和信息传输精度差、速度慢。把电子技术、微电子技术和通信技术紧密结合起来, 采用现代方法进行自动化监控和管理非常必要, 如在渠系、灌水、泵站等方面实现自动化监控与管理。农业自动化向智能化方向发展, 进一步发展精准农业重点发展节水、节肥精准农业技术体系的自动化控制, 实施精准灌溉、精准施肥, 提高水资源和化肥资源的利用率。精细设施农业主要发展以温室为主的自动控制系统智能化研究, 从而现降低成本、提高作物产量、提高农产品品质。这有助于我国农业资源的高效利用和农业环境保护, 是发展持续农业的重要途径。将计算机视觉技术应用于农业自动化领域计算机视觉技术是一个相当新且发展十分迅速的研究领域, 日本、美国等发达国家已在农业计算机视觉方面进行了广泛而深入的研究, 如农业种质资源管理、获取作物生长状态信息、农产品自动收获、农产品品质鉴定等。英国开发研制的采摘蘑菇机器人, 在定位蘑菇采摘点和测量时, 已经利用了计算机视觉和图像处理技术。计算机视觉技术在我国农业生产和农业现代化方面已开始应用, 但在设施农业、虚拟农业中的应用尚处于起步阶段, 应进一步加强、加快该领域的研究与应用。

我国农业自动化已在设施农业中的温室自动化控制、排灌机械自动化、部分农业机械装置自动化等方面得到一定的发展, 尤其精准农业的发展越来越得到重视。电子技术和计算机技术的迅速发展推动了农业机器向自动化方向发展。随着智能化技术的发展, 人工智能将是世纪农业工程发展的重点。各种农业机器人或智能化系统将在农业自动化控制中不断涌现, 继续推动和实现农业自动化是农业机械化工程技术工作者所面临的长远课题和挑战, 并进一步促进农业自动化控制技术向智能化技术发展。

四、自动控制技术在精准农业中的应用

精准农业是在传统农业与农业机装备技术上, 运用高新技术进行农业生产管理。精准农业较传统农业其先进之处主要是应用全球定位系统(GPS)、地理信息技术、计算机控制技术、专家与决策知识系统, 实现农业生产的定位、定量、定时, 做到精耕细作和由于农业水土管理区管理点较为分散, 用传统方法进行数据采集和信息传输精度差、速度慢。把电子技术、微电子技术和通信技术紧密结合起来, 采用现代方法进行自动化监控和管理非常必要, 如在渠系、灌水、泵站等方面实现自动化监控与管理。农业自动化向智能化方向发展, 进一步发展精准农业重点发展节水、节肥精准农业技术体系的自动化控制, 实施精准灌溉、精准施肥, 提高水资源和化肥资源的利用率。精细设施农业主要发展以温室为主的自动控制系统智能化研究, 从而现降低成本、提高作物产量、提高农产品品质。这有助于我国农业资源的高效利用和农业环境保护, 是发展持续农业的重要途径。将计算机视觉技术应用于农业自动化领域计算机视觉技术是一个相当新且发展十分迅速的研究领域, 日本、美国等发达国家已在农业计算机视觉方面进行了广泛而深入的研究, 如农业种质资源管理、获取作物生长状态信息、农产品自动收获、农产品品质鉴定等。英国开发研制的采摘蘑菇机器人, 在定位蘑菇采摘点和测量时, 已经利用了计算机视觉和图像处理技术。计算机视觉技术在我国农业生产和农业现代化方面已开始应用, 但在设施农业、虚拟农业中的应用尚处于起步阶段, 应进一步加强、加快该领域的研究与应用。

我国农业自动化已在设施农业中的温室自动化控制、排灌机械自动化、部分农业机械装置自动化等方面得到一定的发展, 尤其精准农业的发展越来越得到重视。电子技术和计算机技术的迅速发展推动了农业机器向自动化方向发展。随着智能化技术的发展, 人工智能将是世纪农业工程发展的重点。各种农业机器人或智能化系统将在农业自动化控制中不断涌现, 继续推动和实现农业自动化是农业机械化工程技术工作者所面临的长远课题和挑战, 并进一步促进农业自动化控制技术向智能化技术发展。

【参考文献】

[1]马玉敏等.工业以太网的最新发展.自动化系统工程,2006(2):2.

篇5

国内人工智能产业链解构

基础技术、人工智能技术和人工智能应用构成了人工智能产业链的三个核心环节,我们将主要从这三个方面对国内人工智能产业进行梳理,并对其中的人工智能应用进行重点解构。

人工智能的基础技术主要依赖于大数据管理和云计算技术,经过近几年的发展,国内大数据管理和云计算技术已从一个崭新的领域逐步转变为大众化服务的基础平台。而依据服务性质的不同,这些平台主要集中于三个服务层面,即基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。基础技术提供平台为人工智能技术的实现和人工智能应用的落地提供基础的后台保障,也是一切人工智能技术和应用实现的前提。

对于许多中小型企业来说,SaaS 是采用先进技术的最好途径,它消除了企业购买、构建和维护基础设施和应用程序的需要;而 IaaS通过三种不同形态服务的提供(公有云、私有云和混合云)可以更快地开发应用程序和服务,缩短开发和测试周期;作为 SaaS 和 IaaS 中间服务的 PaaS 则为二者的实现提供了云环境中的应用基础设施服务。

人工智能技术平台

与基础技术提供平台不同,人工智能技术平台主要专注于机器学习、模式识别和人机交互三项与人工智能应用密切相关的技术,所涉及的领域包括机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜索、定理证明、博弈、自动程序设计、智能控制、机器人学习、语言和图像理解和遗传编程等。

机器学习:通俗的说就是让机器自己去学习,然后通过学习到的知识来指导进一步的判断。我们用大量的标签样本数据来让计算机进行运算并设计惩罚函数,通过不断的迭代,机器就学会了怎样进行分类,使得惩罚最小。这些学到的分类规则可以进行预测等活动,具体应用覆盖了从通用人工智能应用到专用人工智能应用的大多数领域,如:计算机视觉、自然语言处理、生物特征识别、证券市场分析和DNA 测序等。

模式识别:模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读,它偏重于对信号、图像、语音、文字、指纹等非直观数据方面的处理,如语音识别,人脸识别等,通过提取出相关的特征来实现一定的目标。文字识别、语音识别、指纹识别和图像识别等都属于模式识别的场景应用。

人机交互:人机交互是一门研究系统与用户之间交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。在应用层面,它既包括人与系统的语音交互,也包含了人与机器人实体的物理交互。

而在国内,人工智能技术平台在应用层面主要聚焦于计算机视觉、语音识别和语言技术处理领域,其中的代表企业包括科大讯飞、格灵深瞳、捷通华声(灵云)、地平线、SenseTime、永洪科技、旷视科技、云知声等。

人工智能应用

人工智能应用涉及到专用应用和通用应用两个方面,这也是机器学习、模式识别和人机交互这三项人工智能技术的落地实现形式。其中,专用领域的应用涵盖了目前国内人工智能应用的大多数应用,包括各领域的人脸和语音识别以及服务型机器人等方面;而通用型则侧重于金融、医疗、智能家居等领域的通用解决方案,目前国内人工智能应用正处于由专业应用向通用应用过度的发展阶段。

(1)计算机视觉在国内计算机视觉领域,动静态图像识别和人脸识别是主要研究方向

图像识别:是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。

人脸识别:是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。

目前,由于动态检测与识别的技术门槛限制,静态图像识别与人脸识别的研究暂时处于领先位置,其中既有腾讯、蚂蚁金服、百度和搜狗这样基于社交、搜索大数据整合的互联网公司,也有三星中国技术研究院、微软亚洲研究院、Intel中国研究院这类的传统硬件与技术服务商;同时,类似于 Face++ 和FaceID 这类的新兴技术公司也在各自专业技术和识别准确率上取得了不错的突破。

而在难度最大的动态视觉检测领域,格灵深瞳、东方网力和 Video++ 等企业的着力点主要在企业和家庭安防,在一些常见的应用场景也与人脸识别技术联动使用。

(2)语音/语义识别

语音识别的关键基于大量样本数据的识别处理,因此,国内大多数语音识别技术商都在平台化的方向上发力,希望通过不同平台以及软硬件方面的数据和技术积累不断提高识别准确率。

在通用识别率上,各企业的成绩基本维持在 95% 左右,真正的差异化在于对垂直领域的定制化开发。类似百度、科大讯飞这样的上市公司凭借着深厚的技术、数据积累占据在市场前列的位置,并且通过软硬件服务的开发不断进化着自身的服务能力;此外,在科大讯飞之后国内第二家语音识别公有云的云知声在各项通用语音服务技术的提供上也占据着不小的市场空间。值得注意的是,不少机器人和通用硬件制造商在语音、语义的识别上也取得了不错的进展,例如智臻智能推出的小 i 机器人的语义识别、图灵机器人的个性化语音助手机器人和服务、被 Google 投资的出门问问的软硬件服务。

(3)智能机器人

由于工业发展和智能化生活的需要,目前国内智能机器人行业的研发主要集中于家庭机器人、工业企业服务和智能助手三个方面其中,工业及企业服务类的机器人研发企业依托政策背景和市场需要处于较为发达的发展阶段,代表性企业包括依托中科院沈阳自动化研究所的新松机器人、聚焦智能医疗领域的博实股份,以及大疆、优爱宝机器人、Slamtec 这类专注工业生产和企业服务的智能机器人公司。在以上三个分类中,从事家庭机器人和智能助手的企业占据着绝大多数比例,涉及到的国内企业近 300 家。

(4)智能家居

与家庭机器人不同,智能家居和物联企业的主要着力点在于智能设备和智能中控两个方面。在这其中,以海尔和美的为代表的传统家电企业依托自身渠道、技术和配套产品优势建立起了实体化智能家居产品生态. 而以阿里、腾讯、京东、小米和乐视等互联网企业为代表的公司则通过各自平台内的数据和终端资源提供不同的软硬件服务。

值得关注的是,科沃斯、broadlink、感居物联、风向标科技、欧瑞博、物联传感和华为等技术解决方案商在通用硬件和技术、系统级解决方案上已成为诸多智能家居和物联企业的合作伙伴。综合来看,智能家居和物联企业由于市场分类、技术种类和数据积累的不同各自提供着差异化的解决方案。在既定市场中,没有绝对意义上的排斥竞争,各企业之间的合作融合度较强。

(5)智能医疗

目前国内智能医疗领域的研究主要集中于医疗机器人、医疗解决方案和生命科学领域。由于起步较晚和技术门槛的限制,目前国内医用机器人的研发水平和普及率相较于国际一线水平仍存在一定的差距,从事企业主要集中与手术机器人和康复机器人两大领域,以新松机器人、博实股份、妙手机器人、和技创等企业为代表。

在医疗解决方案方面,以腾讯、阿里巴巴、百度和科大讯飞为代表的公司通过和政府、医疗机构的合作,为脑科学、疾病防治与医疗信息数据等领域提供智能解决方案。而在生命科学领域,研究的着眼点在以基因和细胞检测为代表的前沿研究领域。

综合来看,国内人工智能产业链的基础技术链条已经构建成熟,人工智能技术和应用则集中在人脸和图像识别、语音助手、智能生活等专用领域的场景化解决方案上。就趋势来看,未来国内人工智能领域的差异化竞争和突破将主要集中在人工智能相关技术的突破和应用场景升级两个层面。

未来国内人工智能行业发展的五大趋势

(1)机器学习与场景应用将迎来下一轮爆发

根据 Venture Scanner 的统计,截至 2015 年 9 月,全球人工智能领域获得投资的公司中,按照平均融资额度排名的五大业务依次是:机器学习(应用类)、智能机器人、计算机视觉(研发类)、机器学习(研发类)和视频内容识别等。

自 2009 年以来,人工智能已经吸引了超过 170 亿美元的投资。过去四年间,人工智能领域的民间投资以平均每年 62% 的增长速率增加,这一速率预计还会持续下去。而在 2015 年,全球人工智能领域的投资占到了年度总投资的 5%,尽管高于 2013 年的2% ,但相比其他竞争领域仍处于落后位置。

目前中国地区人工智能领域获得投资最多的五大细分领域是计算机视觉(研发类)、自然语言处理、私人虚拟助理、智能机器人和语音识别。从投资领域和趋势来看,未来国内人工智能行业的资本将主要涌向机器学习与场景应用两大方向。

(2)专用领域的智能化仍是发展核心

基于 GPU(图形处理器)计算速度(每半年性能增加一倍)和基础技术平台的飞速发展,企业对于人工智能神经网络的构建取得了前所未有的突破。但是,由于人工智能各领域技术和算法的复杂性,未来 20 年内人工智能的应用仍将集中于人脸和图像识别、语音助手和智能家居等专用领域。

通过上述产业链环节构成和投资分类可以看出,优势企业的核心竞争力主要集中于特定领域的专用技术研发;其中,计算机视觉和语音识别领域的研发和应用已处于国际一流水平,专业应用机器人的研发也有望近 10 年内迎来突破性发展。可以预见的是,在由专业领域向通用领域过渡的过程中,自然语言处理与计算机视觉两个方向将会成为人工智能通用应用最大的两个突破口。

(3)产业分工日渐明晰,企业合作大于竞争

随着专用领域应用开发的成熟和差异化技术门槛的存在,国内人工智能产业将逐渐分化为底层基础构建、通用场景应用和专用应用研发三个方向。

在底层基础构建方面,腾讯、阿里巴巴、百度、华为等企业依托自身数据、算法、技术和服务器优势为行业链条的各公司提供基础资源支持的同时,也会将自身优势转化为通用和专业应用领域的研究,从而形成自身生态内的人工智能产业链闭环。

在通用场景应用方面,以科大讯飞、格灵深瞳和旷视科技为代表的企业将主要以计算机视觉和语音识别为方向,为安防、教育和金融等领域提供通用解决方案。而在专用应用研发方面则集中了大部分硬件和创业企业,这其中既包括以小米和 broadlink 为代表的智能家居解决方案商,也包含了出门问问、linkface 和优必选这类的差异化应用提供商。

总的来说,由通用领域向专业领域的进化离不开产业链条各核心环节企业的相互配合,专用领域的竞争尽管存在,但各分工层级间的协作互通已成为多数企业的共识。

(4)系统级开源将成为常态

任何一个人工智能研究分支都涉及到异常庞大的代码计算,加上漏洞排查与跨领域交叉,任何一家企业都无法做到在封闭环境内取得阶段性突破的可能。可以看到的趋势是,Google、微软、Facebook 和雅虎等视人工智能为未来核心竞争力的顶级企业都先后开放了自身的人工智能系统。

需要明确的一点是,开源并不代表核心技术和算法的完全出让,底层系统的开源将会让更多企业从不同维度参与到人工智能相关领域的研发,这为行业层面新产品的快速迭代和共同试错提供了一个良性且规范化的共生平台。于开放企业而言,这也确保了它们与行业最新前沿技术的同步。

(5)算法突破将拉开竞争差距

作为人工智能实现的核心,算法将成为未来国内人工智能行业最大的竞争门槛。以 Google 为例,Google 旗下的搜索算法实验室每天都要进行超过 200 次的改进,以完成由关键字匹配到知识图谱、语义搜索的算法创新。

在未来竞争的重点机器学习领域,监督学习、非监督学习和增强学习三个方面算法的竞争将进入白热化阶段。而正是算法层面的突破造就了腾讯优图、科大讯飞和格灵深瞳等企业在图像识别和计算机视觉领域取得了突破性进展和国际一线的技术水平。

但就目前国内人工智能算法的总体发展而言,工程学算法虽已取得阶段性突破,但基于认知层面的算法水平还亟待提高,这也是未来竞争的核心领域。

总的来看,虽然基础技术的成熟带来了存储容量和机器学习等人工智能技术的提升,但由于现阶段运算能力以及大规模 CPU 和GPU 并行解决方案的局限,目前国内人工智能的发展主要集中于计算机视觉、语音识别、智能生活等方向上。

虽然专用化领域的场景应用仍是目前研发和投资的核心,但随着技术、数据的积累演化以及超算平台的应用,由专用化领域的场景应用向语音、视觉等领域的通用化解决方案应该在未来 20 年内成为发展的主流。

篇6

关键词:计算机视觉;地图匹配;SLAM;机器人导航;路径规划

1概述

计算机视觉在人工智能学科占据重要地位,为自主移动机器人视觉导航做了深厚的理论铺垫。目前,机器人导航技术有很多种,传感器导航技术如里程计、激光雷达、超声波、红外线、微波雷达、陀螺仪、指南针、速度、加速度计或触觉等得到了普遍应用,与上述非计算机视觉导航技术相比较,计算机视觉导航技术如人眼般具有灵敏度高且可捕获的信息量大以及成本低等优点。由于室内相对室外空间比较狭小且内部环境复杂,所以普通移动机器人在作业过程中,完成躲避眼前障碍物、自主导航以及为自身找出一条可行路径等一系列操作会相对比较困难。计算机视觉导航技术可利用本身的摄像头获得室内周围的环境信息,实时对其周身的场景进行快速反馈,对视野前方障碍物进行快速识别和检测,从而确定一条高效的可行的安全路径。本文对计算机视觉导航技术进行分类研究,主要分为3类:第一类是环境地图事先已知,提前对外界环境特征进行提取和处理,建立全局地图,并将地图信息存储在机器人内存数据库中,在导航的时候实时进行地图匹配;第二类是同时定位与地图构建,移动机器人在自身位置不确定的情况下根据自身的摄像头获取周围未知环境信息,在作业时逐步构建周围的环境地图,根据构建的增量式地图自主实时定位和导航;第三类是不依赖环境地图,自主移动机器人不需要依赖任何的环境地图,其在作业活动时的可行区域主要取决于摄像头实时识别和检测的环境相对信息。

2环境地图的表示方法

目前,计算机视觉导航技术多采用栅格地图、几何地图、拓扑地图和混合地图构建环境地图信息。

2.1栅格地图

栅格地图,将栅格图像考虑为一矩形,均分为一系列栅格单元,将每个栅格单元赋予一个平均概率值,并利用传感信息估计每个单元内部内存障碍物的概率。构建栅格地图的优点是其地图表达形式直观,创建和维护比较容易;但当划分的栅格单元数量不断增多时,实时性就会慢慢变差;当划分的栅格单元越大时,环境地图的分辨率越低。

2.2几何地图

几何地图利用几何特征如点、直线、平面等来构成环境主要框架,需要知道这些特征在环境中信息的具置,所以几何地图通常使用其对应的三维空间坐标来表示。几何地图构建过程相对简单,保留了室内环境的各种重要信息,是基于计算机视觉的定位与地图构建算法中最常用的一种表示方式。但是为了完成环境的建模需要标记大量的特征,从而计算量也非常的大,降低了实时性,其重建的地图也容易出现与全局不一致的情况。

2.3拓扑地图

拓扑地图用许多节点和连接这些节点的曲线来表示环境信息。其中,每个节点相对应真实环境中的特征点(如门角、窗户、椅子、桌子角及拐角等),而节点之间的曲线表示两个节点对应的地点是相联通的。拓扑地图把环境信息表上在一线图上,不需要精确表示不同节点间的地理位置关系,图像较为抽象,表示起来方便且简单。机器人首先识别这些节点进而根据识别的节点选择节点与节点间的曲线作为可作业的路径。

2.4混合地图

混合地图主要包括3种形式:栅格一几何地图、几何一拓扑地图以及栅格一拓扑地图。混合地图采用多种地图表示,可结合多种地图的优势,与单一的地图表示相比更具有灵活性、准确性和鲁棒性,但其不同类别的地图结合起来管理会比较复杂,难以协调,增加了地图构建的难度。文献针对室内环境所建立的模型分为全局拓扑和局部几何表述部分,整体环境通过拓扑节点串连起来,维护了整体环境表述的全局一致性;而以每个拓扑节点为核心所采用的几何表述则可确保局部精确定位的实现,这样建立的几何一拓扑混合环境模型可将二者的优势都表现出来,使得移动机器人定位和地图构建同时进行,实现容易。

3基于计算机视觉的室内导航

基于计算机视觉的室内导航技术可利用摄像头捕获机器人周围环境的全部信息,对其周身的场景进行反馈,对障碍物进行快速识别和检测,从而确定一条高效的可行的安全路径。本文将计算机视觉室内导航技术主要分为3类:第一类是环境地图事先已知;第二类是定位与地图构建同时进行;第三类是不依赖环境地图。

3.1环境地图事先已知

提前对外界环境特征进行提取和处理,建立全局地图,并将地图信息存储在机器人内存数据库中,在导航的时候实时进行地图匹配,即预存环境地图。在环境地图事先已知的导航中,路标信息保存在计算机内存的数据库中,视觉系统中心利用图像特征直接或间接向移动机器人提供一系列路标信息,一旦路标被确定后,通过匹配观察到的图像和所期望图像,机器人借助地图实现自身精确定位和导航。该导航技术过程可分为以下步骤:

a)图像获取:摄像头获取其周围的视频图像;

b)路标识别及检测:利用相关图像处理算法对图像进行一系列预处理如进行边缘检测和提取、平滑、滤波、区域分割;

c)路标匹配标志:在观察到的图像和所期望图像之间进行匹配,搜索现有的路标数据库进行标志路标;

d)位置计算:当有特征点进行匹配时,视觉系统会根据数据库中的路标位置进行自身精确定位和导航。

在基于计算机视觉的地图匹配定位过程中,主要有2种地图匹配较为典型。

①已知起点,已知地图。这种条件下的定位称为局部定位,采用的是一种相对定位的方法,如图1所示为其位姿估计过程,这种情况目前导航技术研究得最多。

②不知起点,已知地图。这种条件下的定位称为全局定位。当机器人需要重置时,通常使用这种定位方法来检索机器人的当前位置(即姿态初始化)。常用的辅助方法是在环境中添加一些人造信标,如无线收发器,几何信标,条码技术,红外或超声波接收系统进行位置识别,利用视觉系统识别自然标志,自主定位。

3.2定位与地图构建同时进行

不知起点,不知地图。SLAM技术最早由Smith等人于1986年提出,移动机器人在自身位置不确定的情况下根据自身的摄像头获取周围未知环境信息,在作业时逐步构建周围的环境地图,根据构建的增量式地图自主实时定位和导航。在日后的导航研究中,混合地图中的几何一拓扑混合环境模型被得到广泛应用,主要用来解决SLAM问题。

2003年,在解决SLAM技术难题上,Arras等人采用基于Kalman滤波器和最邻近(nearest neighbor)匹配策略的随机地图创建方法。下面是该算法步骤:

a)数据采集:首先初始化系统,从摄像头传感器采集距离数据;

b)状态预测:视觉系统预测机器人运动状态,实时返回新位姿信息和协方差矩阵,预测地图;

c)观测:从原始捕获的信息中提取主要特征信息并将此信息返回给局部地图;

d)测量预测:预测机器人当前位姿的全局地图;

e)位置匹配:应用最邻近滤波器匹配局部地图中的观测点和预测点;

f)估计:使用扩展Kalman滤波器更新地图;

g)创建:将非相关的观测点加入地图,对机器人返回增量式地图;

h)输出地图。

制约机器人视觉系统性能的重要因素是信息实时处理的计算复杂度和处理效率,SLAM算法需要在地图密度与计算效率之间取得权衡。

3.3无环境地图

在这类系统中,机器人不需要依赖任何的环境地图信息,机器人的活动取决于其当时识别和提取出来的环境信息,这些环境信息可能是桌子、椅子和门等,不需要知道这些环境元素的绝对位置。无环境地图的导航技术典型的技术有3大类:基于光流的导航技术、基于外观信息的导航技术、基于目标识别的导航技术和基于目标跟踪的导航技术。

3.3.1基于光流的导航技术

光流是三维空间运动物体在观测成像面上的像素运动的瞬时速度,也是图像亮度的运动信息描述。光流法计算最初是由Horn和Schunck于1981年提出的,其利用二维速度场与灰度,引入光流约束方程,得到光流计算的基本算法。光流计算基于物体移动的光学特性提出了2个假设:①运动物体的灰度在很短的间隔时间内保持不变;②给定邻域内的速度向量场变化是缓慢的。如Santos-Victor等人研发了一种基于光流的robee视觉系统,该系统模拟了蜜蜂的视觉行为。在robee视觉系统中,使用单独的双目视觉方法来模拟蜜蜂的中心反射(Centering Reflex):当机器人移动到走廊两侧的墙壁中心时,左眼捕获场景的瞬时速度与右眼捕获场景的瞬时速度是相同的,几乎没有差别,那么机器人就可以知道他们在走廊的中心。如果眼睛两侧的眼睛的瞬时变化速度不同,则机器人移动到较慢的速度。在自动机器人导航的实现中,基于这个想法是测量摄像机捕获图像场景瞬时速度差异。这种导航技术只能用于室内单通道直走道导航,不能引导机器人改变方向,具有一定的局限性。

3.3.2基于外观信息的导航技术

基于外观的机器人导航方法,不需要构建真实的地图导航,机器人通过自身所携带的摄像头和传感器感知周围目标的外观信息进行自主定位和导航。其中,所述的外观信息多为目标信息的颜色、亮度、形状、空间大小和物理纹路等。机器人在导航时存储连续视频帧的环境图像信息,并将连续视频帧与控制指令相关联,从而再执行指令规划有效路径到达目的地。

3.3.3基于目标识别导航技术

为了达到目标点或是识别目标,机器人很多时候只能获取少量的图像信息。Kim等人提出了一种用符号代替导航各个位置的赋值方法。该赋值方法中,机器人执行命令如“去窗边”“去你后面的椅子旁”等。这样,通过相关的符号命令,机器人自动识别并建立路标,通过符号指令到达目标点。例如“去你后面的椅子旁”,这样的命令就是告诉机器人路标是椅子、路径向后。该导航技术的难点在于目标是否可以准确实时识别路标。第一,识别大量不同类别的物体,室内环境有许多不同类别的物体,需要将它们组织到一个在给定的容易搜索图像数据结构中去,起到容易识别是用什么度量来区分物体;第二,识别大量不同背景下的物体,一个合适的物体表达式有助于将图像组织成片断,而这些片断来自于物体的种类且与物体无关的;第三,在抽象层次上识别物体,机器人可以不需要在看到一个具体的杯子之前便能知道它是一个杯子,相关程序能够类似的物体进行识别和区分。

3.3.4基于目标跟踪的导航技术

基于目标跟踪的导航技术,为机器人构造一个虚拟地图,机器人通过摄像头获取连续的视频序定一个跟踪的目标,为了达到对目标的精确定位和实时跟踪,可以利用粒子滤波算法对需要跟踪的目标进行建模。基于粒子滤波的目标跟踪主要包含四个阶段,分别是初始化目标区域,概率转移,目标区域权重计算,目标区域重采样。在机器人导航之前,通过视频序列的当前几帧标注机器人所需要跟踪的目标,在导航时,机器人通过连续的视频帧感知周围的待跟踪目标,同时对所需要跟踪的目标散播粒子,当获取的视频帧对目标区域重采样后足以让机器人确定所需要跟踪的目标时,机器人通过确定的目标为自己规划最有效的路径到达目的地。获取视频序列目标跟踪是算机视觉领域中的重要分支,它在工业生产、交通导航、国防建设、航空导航等各个领域有着广泛的应用。

篇7

关键词:数字图像技术;应用;发展趋势

中图分类号:TP391.41

计算机的特点在于能够处理各种数据,数字图像能够经过增强、复原、分割等处理,随着计算机技术的不断发展和进步,现在的数字图像技术具有图像处理多样性、精度高、图像的再现性好、处理量大的优点,本文主要研究数字图像处理技术的发展现状和发展趋势。

1 数字图像处理技术研究现状

所谓图像处理是指利用计算机来处理图像的过程,主要是实现改善图像的视觉效果,研究的内容主要包括图像数字化、图像增强、图像还原以及图像分割等。数字图像处理最早来源于20世纪20年代的报纸业,到20世纪50年代,随着计算机的发展,数字图像处理技术得到人们的普遍关注,数字图像处理技术随着太空计划得到很大的发展,最具有典型的例子,是对月球照片的处理。

进入到20世纪70年代后,数字图像处理技术随着计算机断层扫面(CT)的出现得到发展,在以后的时间里,数字图像处理技术不断有新的研究成果,1975年EWI公司研究的CT装置获得诺贝尔奖,目前数字图像技术已广泛应用在各行各业中。

2 数字图像处理技术的应用

数字图像处理技术目前在各行各业中都得到了很大的进展。在遥感航空航天方面,不少国家都派出了侦查飞机对目标地区进行空中摄影,进而通过图像处理技术来分析照片,节省了人力、物理,也能够从图片中得到其他的有用信息。在20世纪60年代以来,美国以及其他的一些国家发射了资源遥感卫星,由于成像条件非常差,因此图像本身的质量也不高,需要采取数字图像处理技术处理,如采用多波段扫描器进行扫描成像,图像分辨率为30m,这些图像转变为数字信号传送下来,再经过处理。数字图像处理技术在各国的应用中已非常广泛,如用在森林调查、灾害监测、资源勘查以及城市规划中。

数字图像处理技术最早来源于医药方面,因此在生物医学工程方面,数字图像处理技术也发挥出了巨大作用,除了上文所讲述的CT之外,还有一些显微图像处理技术,主要是识别红细胞、白细胞以及染色体分析等,在医学诊治方面X光肺图像增强、心电图分析以及超声波图像处理技术等发挥出了重要作用。

在通信工程方面,目前通信主要的发展趋势为综合性的多媒体通信,也就是将电视、计算机以及电话联合在一起在数字通信网上传输,在传输的过程中最为复杂和困难的地方集中在图像的处理中,比如说,彩色电视信号速率为100Mbit/s以上,想要传输出去就需要压缩信息的比特量,因此技术成败的关键就在于编码压缩。目前国家正在大力研发的新的编码方法,如小波变换图像压缩编码以及自适应图像网络编码等。

在工业和工程方面,主要的应用集中在自动装置配线中检测零件的质量、弹性力学照片的应力分析以及邮政信件的自动分检等,另外在智能机器人中也有应用。在军事、公安方面,数字图像处理技术的应用主要集中在导弹的精确制导、侦查照片以及图像的传输和显示方面,在公安方面,主要应用在鉴别人脸、识别指纹以及图片复原方面。数字图像处理技术除了以上所讲述的应用领域之外,在电视图像的编辑、服装设计、发型设计以及文物资料复原等方面也有广泛的使用。

3 数字图像处理技术的发展趋势

目前数字图像技术随着科技的进步得到了很大的发展,随着低成本硬件相关技术的发展可以想象数字图像技术将会得到更加广泛的应用,目前国内的研究成果主要集中在一些诊断、图像压缩编码以及目标识别等方面,但是还没有广泛应用在实际生活中。数字图像处理技术将会向着高分辨率、立体化、超高速以及智能化等方面发展,下面具体讲述数字图像处理技术的发展趋势。

随着计算机、人工智能以及思维科学研究的不断发展,数字图像处理技术在计算机视觉方面将会进一步的发展,智能机器人的重要感觉器官是视觉,目前研究的开放话题集中在理解和识别三维应力,将会应用在军事勘察、危险环境作业以及家庭服务等方面,目前人们对于自身的视觉了解的还非常少,因此在计算机视觉方面还需要进一步的探索。

数字图像处理技术还会向着虚拟现实发展,所谓虚拟现实就是使用计算机构成一个虚拟的三维空间,这项技术的发展是在计算机硬件技术的提高方面提出的,人们应用机器人身上的摄像机能够真实的感受到所在的环境,进而操纵机器人的行为,另外网上虚拟现实也是未来的一个发展方向。人们在完成社会生产中往往习惯使用自身的认识和工具,将这些掌握在自身手中,因此目前时代的发展趋势就是将原来二维的东西向着三维发展,如三维重建技术在地图方面的使用,在军事方面能够使用电子沙盘实现任意角度的转化和计算,也能够真实的直观的反应两点之间的障碍物等,还能够实现模拟飞行路线,为作战指挥带来极大的便利。在计算机中进行三维重建目前的热点和难点问题主要是计算机视觉研究领域。在图像压缩、识别以及分割方面,目前已取得很大的研究进展,目前图像处理面临的新的问题主要是图像专业压缩算法、图像识别算法等。

4 结束语

综上所述,本文先分析了数字图像处理技术研究现状和主要的应用领域,进而研究数字图像技术的发展趋势。目前数字图像处理技术已广泛的应用在生活中,如在网络、手机等中的应用,数字图像处理技术的发展与人们的生活息息相关,随着技术的不断发展,数字图像处理技术还会不断得到进步,这些还需要更多的人努力去研究。

参考文献:

[1]孔大力,崔洋.数字图像处理技术的研究现状与发展方向[J].山东水利职业学院院刊,2012(04):11-14.

[2]陈炳权,刘宏立,孟凡斌.数字图像处理技术的现状及其发展方向[J].吉首大学学报(自然科学版),2009(01):63-70.

[3]吕戈静.浅谈数字图像处理技术的现状及发展[J].电脑知识与技术,2012(33):8035-8036.

[4]丁可.数字图像处理技术研究与发展方向[J].经济研究导刊,2013(18):246+270.

篇8

【关键词】视频跟踪 手部识别

1 引言

计算机从诞生至今,其输入设备从最初的机电开关,逐渐发展为打孔纸带、磁带,再到今天的键盘、鼠标和游戏手柄,向计算机输入数据的效率越来越高,但方法的本质并未改变,都要将自然信息通过机械式方式输入计算机。这些方式都是基于2D的图形界面,将用户的操作限制于特定的外部设备上,无法实现自然而随意的人机交互。长时间使用,会使用户感到疲惫,导致用户体验下降。

对于用户来说,人的语音、手势等可以说是最为自然、最为方便的交流手段,同时手势在3D环境中意义明确、方向精确,是极好的人机交互手段。许多大型互联网公司与游戏公司早就对此进行了探索。微软,索尼,任天堂等公司有着自己研发的外部设备,如游戏手套和传感器等,以此来捕捉并记录手部的运动轨迹,实现特定的操作乃至体感游戏。但这类外部设备的缺陷也是很明显的:这类设备一般为机械传感器式或光纤传感器式,带有传感器、机械部件甚至用来与主机连接的电缆等,沉重、累赘、不灵活;且通常价格昂贵、极易损坏,用户体验不佳;更重要的是限制于特定平台,不具备通用性,普及度不高。

若能实现基于计算机视觉技术的手势识别及操作系统,不仅可以将我们的双手从特定外部设备上解放出来,使操作更加轻松、随意,还能获得更好的人机交互体验,推动“虚拟现实”的研究。目前已经有了大量的跟踪算法和相关设别,如微软的Kinect摄像头及最新的Hololens头盔已经能达到很好的效果,但都较为复杂。因此本文研究一种简单通用的基于计算机视觉的手部跟踪算法。

2 手部区域提取

2.1 样本采集

为了保证研究的顺利进行,首先需要采集手部样本图片。为保证实验结果的准确性,样本图片数量最好在100张以上,并记录不同姿态,其中男性样本和女性样本的数量保持相等。

2.2 肤色信息分析

肤色信息近似为皮肤的颜色信息,物体表面的颜色即表面色是因光照而呈现的颜色[6]。我们采用RGB颜色模型对手部表面肤色进行分析,发现肤色处于某个范围之内。方法如下:手动提取样本图像中的手部,对其进行RGB颜色分量统计,得到各分量直方图。由于各分量直方图上手部体现为一个近似波峰,所以可取波峰的半峰全宽(Full Width at Half Maxium)作为手部的肤色阈值。

根据肤色阈值提取手部,设HandSkin表示肤色阈值范围,RGB(m, n)表示点(m, n)处的颜色信息,而bw(m, n)代表该点是否是手部,则:

2.3 模式识别

通过肤色信息初步提取手部后,可能会有孤立的局部点集出现。为此,统计所有互相连接的点集,提取点集对应的几何特征,建立规则来选取符合手部的点集。

几何特征一般包括面积、周长、重心等。而手部可以分为手掌和手指部分,手掌形状近似于椭圆,手指为细长的柱体,因此整个手部的周长面积比会与其他物体有所区分,所以根据周长面积比将手部从背景中提取出来:

面积:指物体区域包含的像素数,用符号s表示。

周长:物体轮廓线上像素间距离之和,用符号c表示。在进行周长计算时,需根据像素间的连接方式,分别计算距离。像素间距离可分为并列连接像素与倾斜连接像素。并列有上下左右四个方向,像素间距离为1;倾斜方向有左上、左下、右上、右下,其像素间距离等于单位正方体的对角线长度。本文中先获取二值图像的边缘信息,再使用8向链码求周长。

周长面积比:用r表示,r = c/s。

求得所有样本的面积周长比后,通过统计建立规则,并排除异常数据。设h表示点集,hand表示手部,handrule表示手部点集所必需满足的规则,noise表示噪声,s.t.表示满足,则最终的手部点集为:

3 手部跟踪

基于计算机视觉的手部跟踪算法具体步骤:

步骤1:第一帧图像预处理。根据上文所述方法进行第一帧的初始化。通过肤色信息和面积周长比特征提取出第一帧图像中的手。为了方便描述手的运动轨迹,用几何图形来近似表示手部区域,本文选用包围手部区域的最小椭圆来表示手部,该椭圆的中心O1表示手部中心点。

步骤2:依次扫描视频的每一帧。对于第n帧,由于相邻帧的时间相隔较短,手部不会有太大位移。根据上一帧手部区域的位置,设置该帧的扫描范围。通过第2章方法,得出当前帧手部的中心点On。不断重复算法直至视频结束。

步骤3:描绘运动轨迹。从视频最后一帧的中心点On开始,逆序依次连接On与On-1,直至视频第一帧的中心点O1,得到完整的手部运动轨迹。

4 结论

本文所提出的以手部肤色信息为基础的手部跟踪算法,工程实现上较为简答,算法效率高,经试验测试,能够较为准确地再现手部运动轨迹。同时,该种方法也具有缺点,在手部快速移动或做复杂运动时,算法所描绘的运动轨迹可能会出现断裂,且该算法对光照敏感,在过强或过弱光照条件下,算法的准确性都会受到影响。今后的工作将继续完善本算法,将尝试以HSI颜色模型进行分析,考虑引入手部纹理与边缘信息,减弱算法的光照敏感性,采用专家系统、智能优化、神经网络、特征降维等高级技术。

参考文献

[1]俞烈彬,孟凡文.武器装备系统中的人机交互新技术[J].电子世界,2013(12): 164-165.

[2]孟艳丽,郭建.二语演讲中手势功能的实证分析[J].河南科技大学学报(社会科学版),2014,32(3):62-67.

[3]刘晋钢,刘卫斌,刘晋霞.Kinect与Unity3D数据整合技术在体感游戏中的应用研究[J].电脑开发与应用,2014, 27(11):7-14.

[4]张蓬,王晓冲,陈建义.多自由度机械臂的虚拟现实仿真实现[J].机械设计与制造,2015(01):128-134.

[5]闫庆森,李临生,徐晓峰,等.视频跟踪算法研究综述[J].计算机科学,2013, 40(6A):204-209.

[6]奚吉,赵晓铃,张煜东.改进的沃尔什滤波的图像插值算法[J].计算机工程, 2010,36(22):211-213.

[7]张煜东,吴乐南,王水花.专家系统发展综述[J].计算机工程与应用,2010, 46(19):43-47.

[8]王水花,张煜东,吉根林.群智能算法的理论及应用综述[J].南京师范大学学报(工程技术版),2014,14(4):31-38.

[9]张煜东,吴乐南,韦耿.神经网络泛化增强技术研究[J].科学技术与工程,2009(17):4997-5002.

[10]张煜东,霍元铠,吴乐南,等.降维技术与方法综述[J].四川兵工学报,2010, 31(10):1-7.

作者简介

罗伟,男,江西省景德镇市人。现供职于南京师范大学计算机科学与技术学院。研究方向为手势跟踪。

通讯作者

张煜东,男,江苏省南京市人。博士学位。现为南京师范大学计算机科学与技术学院教授。研究方向为图像处理。

作者单位

篇9

在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。

人机交互:从呆板到员活

人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?

于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。

计算机怎样识别手势?

从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。

手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。

了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。

计算机识别手势的手段主要有两种:

1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。

2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。

目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。

更好地为人服务

日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。

Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。

手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。

篇10

【关键词】图像识别 边缘检测 小波算法

小波算法在图形识别、压缩等方面有着较为广泛的应用,且具有较高的应用效率。在图形识别与压缩中实现小波算法的应用,能够更加有效地实现应用数据的识别与压缩。当前,在图像识别与边缘检测领域中依旧存在着计算方法相对单一的情况,这种局限性对图像识别与边缘检测的进一步发展造成了严重的阻碍作用。因此,要实现小波算法在图像识别与边缘检测中的广泛应用,促进其进一步发展。

1 小波算法概述

法国地球物理学家J・Morlet在1984年首次提出了小波的概念,随后Hardy空间分子解说研究为小波算法的诞生奠定了理论基础。当前,小波算法在图像处理中有着非常广泛的应用,并且其应用效果非常良好。小波算法主要是对非平稳的信号进行分析,在小波算法压缩、平移等处理功能的支持之下,能够从多个尺度对函数或者信号进行分析,实现空间域与频率域的具备变换,从而能够更加有效地对信息进行检索。因此,小波算法属于新兴的信号处理技术。

在传统的信号表示中,正交基有着非常广泛的应用。基函数具有正交性,这使得基函数相应的表示函数能够通过内积进行计算。小波算法实现了局部化思想的发展,属于信号的“时间――频率”分析方法,其主要的特点为多分辨率分析,同时在时间域与频率域中都能够对信号的具备特征进行表示。

2 图像识别中小波算法的应用分析

图像识别指的是通过计算机实现对图像的处理、分析与理解。通过图像识别工作能够实现不同模式目标、对象的计算机识别工作。一般情况下,图像识别的有效支持包括两个方面,一方面是进入到系统中的信息,另一方面是系统中原本保存的信息,通过对这两种信息的对比之后实现对图像的有效识别。不同的图像具有不同的特征,计算机在进行图像识别的过程中通常会将视线集中在图像较为突出的特征方面,从一个突出的特征向下一个突出的特征进行依次扫描。因此,在图像识别的过程中,知觉机制的工作原理为排除多余信息、识别关键信息,因此小波算法有着非常关键的作用。一般情况下,在图像识别中实现小波算法的应用,能够有效地整理按照阶段获得的信息,以此为基础形成完成的知觉映像。此外,在图像识别中实现小波算法的应用还能够有效地处理与计算信息的细节,促进图像识别效率的提高。

利用冗余小波对图像进行J个尺度的二维小波变换,得到3・J+1幅子图像,其公式为

[Cj・{dj1,dj2,dj3},j=1,2,3,……,J] (1)

其中,Cj代表原图像尺度aj上的二维小波变换得到的低频子带图像;djk代表原图像在尺度2j与方向k上的二维小波变换得到的高频细节自带图像,其中k=1,2,3,分别对应高频子带图像的水平部分,垂直部分与对角线部分。

3 边缘检测中小波算法的应用分析

在计算机视觉中,边缘检测是非常重要的核心问题之一。一般情况下,边缘检测的主要目的就是对数字图像中具有明显亮度变化的点进行标识。在边缘检测的过程中,图像属性中一些较为显著的变化能够对重要事件、变化等进行反映。例如,如果在图像的属性方面出现了表面方向不连续的情况,这就说明在这一地方存在着比较重要的事件、变化等。此外,边缘检测在图像处理与计算机视觉中还发挥着特征提取的关键作用。实现了小波算法在边缘检测中的应用,能够在很大程度上实现相应数据计算量的降低,同时还能够将计算机视觉中一些不相干的冗杂信息进行有效的剔除,同时能够合理地对结构属性进行辨识与保留。小波算法在边缘检测中的应用包括两种类型,第一种类型为查找计算,第二种类型为穿越计算。在边缘检测的查找计算中,工作人员通过以查找方法为基础的小波算法对计算机图像中的一阶导数最大值与最小值进行寻找,从而实现边缘检测工作。在边缘小波基选取的过程中,遵循的原则包括:第一,边缘检测小波应该选择高通滤波器,滤波器的脉冲回应函数包括奇对称与偶对策两个部分,

f(x)=f1(x)+f2(x),其中f1(-x)=-f1(x),f2(-x)=f2(x)

除此之外,小波算法在边缘检测的应用过程中,其主要的应用效果还包括在数据压缩方面取得了较好的效果。小波算法首先对边缘检测中的线性频率进行分析,之后实现相关信息与数据的压缩与处理,通过小波算法实现压缩与处理之后,其图像的分辨率普遍较高,出现这种情况的主要原因是在边缘检测中实现小波算法的应用能够使边缘检测中存在的高频信号进行消除,在高频信号消除的基础上对信息与数据进行压缩工作,从而取得较好的效果。然而,在利用小波算法实现边缘检测中的数据与信息压缩时,工作人员还应该关注到边缘检测中存在的非线性不稳定信号,在对这些信号进行处理的过程中,小波算法的应用效果并不明显。因此,在边缘检测中实现小波算法的应用,应该注重小波算法形态的有效选择,从而实现边缘检测水平整体上的提升。

4 总结

随着计算机视觉处理技术的快速发展,图像处理与边缘检测中已经实现了小波算法的广泛应用,且已经取得了非常良好的应用效果。因此,工作人员在图像识别与边缘检测的过程中,对小波算法的应用已经有了非常明确的了解,通过小波算法的有效应用能够促进图像识别与边缘检测水平的不断提高。

参考文献

[1]乔闹生,邹北骥,邓磊,曾友兵,邹剑臣.一种基于图像融合的含噪图像边缘检测方法[J].光电子.激光,2012,11(65):2215-2220.

[2]马丽亚木・阿布来孜,艾力米努.阿卜杜如苏力.一种基于边缘图像融合的图像边缘检测方法[J].计算机系统应用,2012,12(41):182-185.

[3]王娅囡,谷方,杨厚俊,范延滨,贾冬雪.基于PET医学图像边缘检测算法的研究[J].现代生物医学进展,2014,05(42):965-968.

[4]王晓丹,吴崇明.基于MATLAB的系统分析与设计--图像处理[M].陕西:西安电子科技大学出版社,2014,02(44):96-98.