计算机视觉范畴范文
时间:2023-12-18 18:00:16
导语:如何才能写好一篇计算机视觉范畴,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:计算机;视觉技术;交通工程
中图分类号:TP391 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01
一、引言
随着科技的发展,计算机替代人的视觉与思维已经成为现实,这也是计算机视觉的突出显现。那么在物体图像中识别物体并作进一步处理,是客观世界的主观反应。在数字化图像中,我们可以探寻出较为固定的数字联系,在物体特征搜集并处理时做到二次实现。这既是对物体特征的外在显现与描绘,更是对其定量信息的标定。从交通工程领域的角度来看,该种技术一般应用在交管及安全方面。监控交通流、识别车况及高速收费都是属于交通管理的范畴;而对交通重大事件的勘察及甄别则是交通安全所属。在这个基础上,笔者对计算机视觉系统的组成及原理进行了分析,并形成视觉处理相关技术研究。
二、设计计算机视觉系统构成
计算机视觉处理技术的应用是建立在视觉系统的建立基础上的。其内部主要的构成是计算机光源、光电转换相关器件及图像采集卡等元件。
(一)照明条件的设计。在测量物体的表征时,环境的创设是图像分析处理的前提,其主要通过光线反射将影像投射到光电传感器上。故而要想获得清晰图像离不开照明条件的选择。在设计照明条件时,我们通常会视具体而不同处理,不过总的目标是一定的,那就是要利于处理图像及对其进行提取分析。在照明条件的设定中,主动视觉系统结构光是较为典型的范例。
(二)数据采集的处理。如今电耦合器件(CCD)中,摄像机及光电传感器较为常见。它们输出形成的影像均为模拟化的电子信号。在此基础上,A模式与D模式的相互对接更能够让信号进入计算机并达到数字处理标准,最后再量化入计算机系统处理范围。客观物体色彩的不同,也就造就了色彩带给人信息的差异。一般地黑白图像是单色摄像机输入的结果;彩色图像则需要彩色相机来实现。其过程为:彩色模拟信号解码为RGB单独信号,并单独A/D转换,输出后借助色彩查找表来显示相应色彩。每幅图像一旦经过数字处理就会形成点阵,并将n个信息浓缩于每点中。彩色获得的图像在16比特,而黑白所获黑白灰图像则仅有8比特。故而从信息采集量上来看,彩色的图像采集分析更为繁复些。不过黑白跟灰度图像也基本适应于基础信息的特征分析。相机数量及研究技法的角度,则有三个分类:“单目视觉”、“双目”及“三目”立体视觉。
三、研究与应用计算机视觉处理技术
从对图像进行编辑的过程可以看出,计算机视觉处理技术在物体成像及计算后会在灰度阵列中参杂无效信息群,使得信息存在遗失风险。成像的噪声在一定程度上也对获取有效信息造成了干扰。故而,处理图像必须要有前提地预设分析,还原图像本相,从而消去噪音。边缘增强在特定的图像变化程度中,其起到的是对特征方法的削减。基于二值化,分割图像才能够进一步开展。对于物体的检测多借助某个范围来达到目的。识别和测算物体一般总是靠对特征的甄别来完成的。
四、分析处理三维物体技术
物体外轮扩线及表面对应位置的限定下,物体性质的外在表现则是其形状。三维物体从内含性质上来看也有体现,如通过其内含性质所变现出来的表层构造及边界划定等等。故而在确定图像特征方面,物体的三维形态是最常用的处理技术。检测三维物体形状及分析距离从计算机视觉技术角度来看,渠道很多,其原理主要是借助光源特性在图像输入时的显现来实现的。其类别有主动与被动两类。借助自然光照来对图像获取并挖掘深入信息的技术叫做被动测距;主动测距的光源条件则是利用人为设置的,其信息也是图像在经过测算分析时得到的。被动测距的主要用途体现在军工业保密及限制环境中,而普通建筑行业则主要利用主动测距。特别是较小尺寸物体的测算,以及拥有抗干扰及其他非接触测距环境。
(一)主动测距技术。主动测距,主要是指光源条件是在人为创设环境中满足的,且从景物外像得到相关点化信息,可以适当显示图像大概并进行初步分析处理,以对计算适应功率及信息测算程度形成水平提高。从技术种类上说,主动测距技术可分为雷达取像、几何光学聚焦、图像干扰及衍射等。除了结构光法外的测量方法均为基于物理成像,并搜集所成图像,并得到特殊物理特征图像。从不同的研究环境到条件所涉,以结构光法测量作为主要技术的工程需求较为普遍,其原理为:首先在光源的设计上由人为来进行环境考虑测算,再从其中获取较为全面的离散点化信息。在离散处理后,此类图像已经形成了较多的物体真是特征表象。在此基础上,信息需要不断简化与甄别、压缩。如果分析整个物体特征信息链,则后期主要体现在对于数据的简化分析。如今人们已经把研究的目光转向了结构光测量方法的应用,体现在物体形状检测等方面。
(二)被动测距技术。被动测距,对光照条件的选择具有局限性,其主要通过对于自然光的覆盖得以实现。它在图像原始信息处理及分析匹配方面技术指向较为突出。也通过此三维物体之形状及周围环境深度均被显露。在图像原始信息基础上的应用计算,其与结构光等相比繁杂程度较高。分析物体三维特性,着重从立体视觉内涵入手,适应物体自身特点而存在。不过相对来说获得图像特征才是其适应匹配的条件保障。点、线、区域及结构纹理等是物象特征的主体形式。其中物特较为基础与原始的特征是前两个特征,同时它们也是其他相关表征的前提。计算机系统技术测量基本原理为对摄像机进行构建分析,并对其图像表征进行特征匹配,以得到图像不同区间的视觉差异。
五、结束语
通过对计算机视觉技术的研究,悉知其主要的应用领域及技术组成。在系统使用的基础上深入设计,对系统主要构成环节进行分析。从而将三维复杂形态原理、算法及测量理论上升到实际应用。随着社会对于计算机的倚赖程度增加,相信该技术在建筑或者其他领域会有更加深入的研究及应用。
参考文献:
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2012(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2011(04).
篇2
【关键词】精密播种机;监控系统
近些年来,电子工业迅速发展,机电结合的各种排种器监控系统也趋于成熟。农业生产中的最基础环节是播种,也是丰产丰收的重要保证。精密播种机随着播种技术的发展己经被广泛应用于现代农业播种。机械式播种机是现今我国最长使用的精密播种机,在播种作业过程中存在不同程度的漏播重播的问题造成农作物大量减产现象,其原因是在播种过程中全封闭特点,对精密播种机监测系统进行设计与研究将会提高精密播种的质量,这对实现现代化智能农业具有极其深远的意义。
1.国内外田间播种监控系统的研究成果
1.1国外监控系统研究成果
在播种监控这个方面,国外对其的研究比较优先, 发达国家加快了农业装备电子信息应用技术在农业机械的播种与镇压的电子监视播深控制等方面的研究。在20世纪70年代中期他们便开始对如何加快农业装备电子信息应用技术的问题进行研究,机械式报替器、机电信号式报替器和电子仪器是国外精播机上采用的监测和报警装里的3种类型, 这些监测系统实现播种故障的报警是通过对不同种类的排种器工作状况进行监控,与此同时,法国、美国、前苏联也为此都相继做了大量的实验。随着高科技的发展,一些先进技术已经进入监控系统的研究范畴之内,比如将GPS技术应用于监控系统。另外一些先进的监控系统还具备对各种播种参数进行运算显示的功能。
1.2国内监控系统研究成果
随着对国外不同类型精密播种机的不断引进吸收和我国对精密播种机监测系统研究投入的不断加大,我国精密播种机的研制工作在精密播种机监测系统方面的研究方面取得了极大的突破,由我国独立生产的新式播种机及新式播种机的监测系统不断涌现。国培光在1983年便开始对播种机的电子监视和报警装置进行研究,并研制成可以实现故障的声光报警和每行播种速度播种数量及播种面积等播种参数的数码显示功能的装置,其原理是传感器信号转化电路。我国近年来根据单片机技术,传感器技术信息技术和虚拟仪器技术的发展,经过进一步研究,从而在精密播种机监测系统的智能自动化上取得了巨大进步。我国河北农业大学的刘淑霞教授,经过不断研究实现,利用MCS-51单片机对重播、漏播分别进行不同方式的声光报警以实现精密播种机排种性能的监测,并可定时计算重播率、漏播率,并通过显示器显示需要的参数并打印下来。我国吉林工业大学的马旭通过对计算机图像处理技术的研究而建立了精密排种器性能检测系统。该系统采用图像增强、平滑、锐化及分割等预处理方法,来对种子动态图像进行详细分析,从而到达有效提高图像质量的作用,并为了明确检测精密排种器重播、漏播及合格指数的方法,从而提出了根据种子面积和种子间距来检测排种器性能的特征提取方式,满足了我国精密排种器性能检测的要求。
2.监控系统的工作原理
2.1早期人工测量方法
我国在20世纪60年代时播种机试验台设备较少,有的仅是利用黄油作为粘胶剂来固定下落种子且为仿制前苏联的新帆布带式排种器试验台。吸嘴装置被安在帆布带转弯处以便于吸取种子,这种设计的目的是为了减少粘胶消耗和简化清种工作。这种在粘胶带上采用人工测量播种性能的方法虽然检测比较直观,有可以在一定程度上反映种子的性能优点,但存在由于种子污染严重而无法回收重复利用,且工作条件较差,测量取样极其不方便的缺点。随着新技术的不断涌现,人工测量的方法已经别其他方法淘汰。
2.2传感器检测法
现代的光电传感器工作在播种检测上应用较广泛。通常在播种机的排种口装有光电传感器,光电传感器便在播种机排出一粒种子后便产生一个信号,然后经过放大整形送给单片机,单片机通过该信号可以知道有没有排出种子。在检测到该信号后,为保证每穴一粒的播种的质量,单片机便停止振动,若单片机未检测到有种子的排出就会继续振动,直到排出一粒种子。窝眼轮式、离心式和电磁振动式都是基于这种原理形成的。传感器检测最适用于检测漏播,但其缺点在于重播的检测准确性极差。
2.3利用计算机处理图像技术
计算机图像处理是利用摄像头每间隔一定的时间采集一幅图像后,通过采集卡把图像传送给计算机,再通过计算机对图像进行识别处理的原理,达到根据图像中的种子特征来判断是否出现漏播。从而在发生漏播时,计算机会进行报警和相关处理。分为中国农业机械化科学研究院的王红永研究的图像处理与机器人相结合的技术和通过对CCD摄像机的拍摄区域进行图像分割,提取种子特征,从而用计算机视觉技术来处理运动的物体两种方法。利用计算机视觉技术来处理运动的物体的原理是对图像进行滤波、增强、锐化、分割处理,从而确定根据种子边缘、面积及种子之间的距离来检测排种器的性能。计算机图像处理系统虽然有装置检测效果好的优点,但是存在结构复杂的缺点。
3.监控系统的发展趋势
根据目前国内外使用精密播种机的趋势可知,现有的精密播种机的性能还不够完事,不能完全满足农业上的要求,所以监测技术的研究仍要继续。监控系统发展的重要的一环和精播机监控系统发展的第一走向是提高监控系统灵敏度。现在很多研究是以微型单片机为基础来进行控制监控装置。单片机应该在程序设置的时间上实现对监视传感器、转换线路和报警系统的监控来提高报警灵敏度。应该研发在监控系统检测到有故障造成不能正常播种是报警系统可以瞬时启动,同时启动补偿系统代替出故障的部件,从而继续播种的系统。这样就可以避免漏种现象的发生。因此若想要减少漏种造成的损失,提高播种机的工作质量,以达到进一步地提高自动化、智能化水平的目的,可以从研制自动补偿式监控系统入手。
结语
随着精密播种技术的迅速发展,监控装置也在完善。监控系统性能的好坏对播种的质量有特别大的影响,研究精播机监控系统发展的重要方法是提高监控系统的灵敏度和研究自动补偿式监控系统。其中,提高监控系统灵敏度是精播机监控系统的发展方向。采用自动补式监控系统来加快自动补偿式监控系统的研制,不仅可节约社会劳动力,减轻劳动强度,还可以大大减少漏种造成的损失,以达到极大提高播种机的工作质量,进一步提高系统的自动化和智能化的目的。
参考文献
篇3
【关键词】 计算机技术 应用状况 改革策略 知识更新
前言:计算机在我国社会不同产业领域中的应用指导地位非凡,包括人们日常生活、学习活动等,几乎无法全然脱离计算机技术而独自运行。我国想要在日后激烈的国际竞争范畴内拔得头筹,就必须想方设法革新调整各项技术项目独特的计算机指导单元。由此看来,进行我国计算机技术改革应用方案调整,绝对是迎合时展步伐的最佳途径,理当引起相关管制主体的高度关注。
一、计算机技术在我国人工智能领域中的改革应用
这里深入强调的人工智能技术,主张生动化模拟并延伸既有人工智能项目结构,确保内部工序得到有机规整和紧密衔接,可以说是计算机技术体系单元中的一类分支,其核心动机在于开创一类全新样式的智能机械设备,能够顺势发挥语言、图像精确化识别和灵活回应功能。可以说此类科学挑战性极高,从事此类工作的人员必须熟练掌握计算机、哲学知识内容,能够针对计算机视觉效应分析并预测相应结果。归结来讲,就是利用机器完成人类智能操控范畴之下的一切复杂类事务,但是此类科学规范指标,会随着时代推移自然地朝着更加富有挑战性地方向过渡延展,这一切结果与计算机科学技术进步成果可以说有着深度关联。因此,人工智能在计算机操作环境中得到更加深度的关注,尤其是在机器人、经济政治决策等仿真系统应用环节中,发挥的辅功效一时之间将难以被轻易替代。
二、计算机操作程序在我国电子商务交接工序中的交织渗透
所谓电子商务,就是说在国际范围内的商业贸易活动之中,因为计算机网络技术的特殊支持引导作用,使得买卖人员可以不用亲自会面就可轻松地完成交易任务,至此过后消费者网上自由购物等相关综合服务体验的参与诉求,会得到更加充足的迎合满足。如今电子商务被顺势划分出广义和狭义两个类型。其中,广义形式的电子商务,希望利用不同功能的电子仪器处理商务内容,包括电话、电视、计算机网络等现代化系统。而狭义角度下的电子商务,比较倾向于实物商品合法性消费等行为流程。尤其是在我国技术、经济全面发达的文化背景影响下,能够快速掌握最新信息技术和商务规则的人员,便能够完成以商品交换为中心的低成本、高效率改造任务。基于此,电子商务内部的计算机应用改革成果也受到了更加严格的规范限定,开始透过系统观点角度,进行环境、人员、工具等要素自由衔接,希望借此令此类商务模式的生产力水准得到尽情的舒展发挥。
三、计算机技术在办公自动化空间中的全面革新与适用性调整
计算机内部办公程序辅助功效异常深刻,使得相关事业领域人员全面摆脱以往笔墨书写行为弊端,形成自动形式的文件制备、传递以及储备管理机制,对于企业行政效率提升作出突出的辅助贡献。网络时代的飞速发展,对于机关工作人员办公软件操作技能自然提出更加严格的规范掌控要求,这样才能确保办公自动化体系建设步伐的骤然提升结果。有关此类结构的改革调整策略内容具体表现为:
首先,信息来源上转变,广泛博览。机关人员一定要跟上网络发展的步伐,积极融入网络发展之中,从只注重本地信息的小圈子里解脱出来,充分利用先进的信息技术将分散于各种网络的社会信息及时收集起来,整合成为有机的、完整的信息系统,不断拓展服务空间,有计划、有步骤、高效率、高质量地服务于各级领导。
其次,资料搜集上转变,实现优质高效。办公自动化的普及,机关人员在资料收集利用上有了更方便的条件、更广阔的天地、更高效的手段。为适应这一变化,机关人员一是要变单一为多元,二是变粘贴为储存,三是变保存为整理。
结语:按照上述内容陈述,如今电信行业在我国居民群众生活领域中的核心引领地位日渐清晰,并且同步引领着数据库理论、系统软件技术等方面的进步潮流,其间赢取的社会、经济效益自然不胜枚举。需要额外加以强调的是,信息保护始终是数据通信处理过程中的核心支撑媒介,相关工作人员在今后计算机技术多元化改良设计环节中,应该适当针对此类细节加以关注和改造力度,避免日后当中不安隐患扩张,对我国社会主义多元化发展前景造成不必要的限制危机。
参 考 文 献
[1]陈香生.计算机应用技术对企业信息化的影响分析[J].中国商贸,2011,26(09):66-78.
篇4
关键词:人脸识别;图像处理;模式识别;实时视频;肤色分割
中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)14-3410-02
Research on Face Recognition Based on Real-time Video
JIN Xin
(Department of Computer Technology and Application, Wuhan Institute of Technology, Wuhan 430074, China)
Abstract: Face recognition is a research focus in the fields of machine vision and pattern recognition, and it has broad application prospects. a novel method face recognition based on Real-time Video isproposed in this paper, This paper focuses on similarity calculation, Image binary-conversionand face recognition. The results indicate that the recognition performance of this system is good.
Key words: face recognition; Image Processing; pattern recognition; real-time video; complexion segmentation
建立一个准确、稳定、快速的人脸识别系统,是模式识别和计算机视觉领域比较困难的问题,存在多方面的挑战。首先,人脸在形状、大小、颜色、质地等方面都有很大差异,具有模式可变性;其次,人脸在不同的方向、角度、尺度展现出不同表像;再次,环境和设备造成的图像质量不稳定,也增加了人脸识别的难度。今天,人脸识别的应用背景已经超出了单纯的人脸识别系统的范畴,在数字视频处理、视觉监控等反面都有着重要的应用价值。同时,人脸识别研究已经涉及到了模式识别、数字图像处理、计算机视觉、人体科学等多方面的内容,具有重要的学术价值。
1 人脸识别系统设计
本系统研究的主要是针对简单背景下的正面人脸识别,采用的是基于肤色的人脸识别方法。由于人脸的肤色与背景颜色具有很大的区别,在色彩空间的分布与背景色彩有差异而呈现出一定的色彩聚类性。本系统利用这一特点,利用肤色分割的方法把人脸区域与非人脸区域分割出来,最后定位出人脸。肤色分割的方法识别人脸的优点是速度快而且对姿态不敏感,其缺点是难以区分类似肤色的非人脸区域,使用于特定的环境。
1.1 系统构架
下面介绍系统的具体实现过程。系统的整个过程可以看作由图像的输入和预处理、肤色分割、人脸定位四个功能模块组成。 图1为系统结构图。
1.2 系统算法流程
图2为系统算法流程图。
2 系统实现
系统是在VC++6.0的环境下编程实现的。系统用到的关键技术包括图像的读取、色彩空间转换、图像建模、相似度的计算、图像二值化、直方图以及人脸区域的定位。下面介绍相似度计算,图像二值化,以及人脸定位的编程实现过程。
2.1 相似度计算
相似度计算是本系统关键的技术之一。将输入的图像从RGB空间转换到YCbCr空间得到色度值(Cb,Cr) ,通过公式(1)计算像素点属于肤色的概率。
(1)
得到每一个像素点的肤色概率值后,找到概率最大的点,每一像素点的概率除以最大像素点的概率,重新得到一个灰度值,以灰度值的大小来表征这个点属于皮肤的概率,从而得到一个肤色相似度图。相似度值大小表明该像素点属于肤色区域概率大小,相似度值越大,则属于肤色区域的可能性越大。主要有以下几部分来实现:1)构造函数;2)相似度数组的初始化;3)相似度的计算;4)找到最大的相似度值;5)已经得到每个像素的相似度值除以最大的相似度值,得到新的相似度值。
2.2二值化
二值化是在相似度计算完成后才能进行。图像的二值化是为了能够更好的分割出肤色区域,对于简单背景的单人正面人脸图像,在得到其肤色相似度图后再进行二值化,就能基本确定出人脸区域。将图像二值化,需要确定一个阈值 作为分割的依据。以这个阈值 作为分类标准的典型的区域分类器为:
(2)
N(i,j)是经过转换后的图中任意一点像素点的肤色概率值,通过与阈值T得比较后,划分成了服色与非肤色点M(i,j),构成二值图像。其实现功能主要有:1)根据Fisher准则确定动态阈值的大小;2)相似度值与动态阈值的比较,如大于阈值,则在二值化数组中该点的值为1,小于阈值的像素点在二值化数组中为0。流程图如图3。
2.3 标记人脸区域
图像分割是一种重要的图像分析技术。在对图像的研究和应用中,人们往往只对图像的某些部分感兴趣。这些部分被称为目标或前景区域,其它部分称为背景。要对目标区域进行辨别和分析,首先就要把它从背景中提取出来,在此基础上才能进一步对目标进行分析。在人脸识别中,图像分割就是把人脸与背景区域分割出来,减少目标的搜索区域。标记人脸区域是通过扫描二值化数组来实现的。先在水平方向不变的情况下扫描纵轴,统计出1最多时的纵坐标的值,并以其纵坐标为中心,先往左扫描纵轴上为1的点,满足某一条件认为找到左边框,跳出循环,接着往右扫描纵轴上的为1的点,满足某一条件,找到右边框,跳出循环。然后在竖直方向不变的情况下扫描左右边框范围内横轴为1点,满足条件,找到上边框值,跳出循环。
3 实验分析
通过对采集的50幅图片的进行实验,表1为本系统的实验数据。
实验发现系统对光线均匀的图片和背景简单的图片具有很高的识别成功率,而对有些光线较暗、光线太强和背景复杂的图片不能进行有效的识别,会产生误检或是漏检的情况。造成这些结果的原因有:
1) 阈值大小的选取
在光线较暗的图像中,如果阈值选取的过大,二值化后的图像中属于人脸的
域就会变小,识别时人脸光线较暗的部分就难以识别出来,造成只能识别出一部分的人脸。而在光线太强的图像中,如果阈值取得太小,就会造成识别出来的人脸区域过大,把部分背景区域也识别为人脸区域。这一缺点可以通过光纤的补偿来减少光线强弱对其的影响。
2) 背景的复杂性
在复杂背景图像中,如果背景色彩与肤色很相近,就会导致二值化后的图像中属于人脸的区域变大,识别出来的人脸就会包括背景区域。更严重的是,图像中不存在人脸,而识别出的结果却仍然标出了一块与人脸色彩相近的区域,这就造成了误检。通过人脸模板匹配可以剔除误检区域,也可以剔除非人脸肤色区域。
3) 人脸的装饰
人脸上的装饰也是导致识别系统出错的一个原因。人脸上的眼镜、胡须、化妆等到会导致人脸肤色发生一定的变化,从而影响二值化图像,导致识别成功率下降。
4 结束语
作为21世纪的一个朝阳产业,人脸识别技术已经开始进入到人们生活的各个方面,本文介绍了基于实时视频的人脸识别技术,提出了一种解决方案,着重叙述了人脸识别和识别算法分析及应用程序开发等,最后,结合具体图像进行了测试,结果表明效果良好。
参考文献:
[1] 方旭.基于BP神经网络人脸识别方法的研究与改进[J].电脑知识与技术,2011(4).
[2] 俞燕.基于特征的弹性图匹配人脸识别算法改进[J].计算机工程,2011(5).
[3] 张彩甜.人脸识别技术研究[J].电脑知识与技术,2009(20).
[4] 杨颖娴.基于PCA算法和小波包变换的人脸识别技术[J].微电子学与计算机,2011(1).
篇5
人 工 智 能 作 业
拥抱人工智能
学院:
年级:
专业:
学号:
姓名:
拥抱人工智能
摘 要:介绍了人工智能的含义以及模式识别的领域。
关键词 人工智能;模式识别;AlphaGo
1 人工智能
1.1人工智能的含义
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。AlphaGo的胜利,无人驾驶的成功,模式识别的突破性进展,人工智能的的飞速发展一次又一次地挑动着我们的神经。作为人工智能的核心,机器学习也在人工智能的大步发展中备受瞩目,光辉无限。
我所理解的人工智能,就是如下五个定义。定义一:AI就是让人觉得不可思议的计算机程序。定义二:AI就是与人类思考方式相似的计算机程序。定义三:AI就是与人类行为相似的计算机程序。定义四:AI就是会学习的计算机程序。定义五:AI就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程。如今人工智能的时代到来,给予了我们很大的便利。如智能图像理解软件Google照片、智能美图软件美图秀秀、只能搜索排序软件Google、智能出行自动驾驶软件滴滴优步司机、智能机器翻译软件有道翻译官等。
1.2 人工智能的发展历史
迄今为之,人工智能诞生已有62年。1956年,John McCarthy创造人工只能一次。1962年,IBM的阿瑟··萨缪尔开发的西洋跳棋程序就战胜过一位盲人跳棋高手。1987年到1993年现代PC的出现,让人工智能的寒冬再次降临。1997年IBM计算机“深蓝“成功击败世界顶级国际象棋高手之后,国际商用机器公司(IBM)又尝试一轮新的人机博弈。2016年AlphaGo在围棋人机大战中击败韩国职业九段棋手李世石。
1.3 人工智能的复兴
人工智能的复兴可分为以下两次。第一次AI热潮由图灵测试掀起。艾伦.图灵是人工智能的开拓者,他所提出的图灵测试,直到今天仍然是我们判定一部机器是否具有人类智慧的重要手段。假如有一台宣称自己会"思考"的计算机,人们该如何辨别计算机是否真的会思考呢?一个好方法是让测试者和计算机通过键盘和屏幕进行对话,测试者并不知道与之对话的到底是一台计算机还是一个人。如果测试者分不清幕后的对话者是人还是机器,即,如果计算机能在测试中表现出与人等价,或至少无法区分的智能,那么,我们就说这台计算机通过了测试并具备人工智能。第二次AI热潮则由语音识别掀起。20世纪80年代到90年代的第二次AI热潮中,语音识别是当时最具代表性的几项突破性进展之一。今天我们拿出手机,使用苹果手机内置的语音输入法,或者使用中文世界流行的科大讯飞语音输入法,我们就可以直接对着手机说话以录入文字信息。技术上,科大讯飞的语音输入法可以达到每分钟录入400个汉字的输入效率,甚至还支持十几种方言输入。
1.4人工智能所带来的警示
AlphaGo带来的警示是:如果计算机可以在两年内实现大多数人预测要花20年或更长时间才能完成的进步,那么,还有哪些突破会以远超常人预期的速度来临?这些突破会不会超出我们对人工智能的想象,颠覆人类预想中的未来?我们已为这些即将到来的技术突破做好准备了吗?AI真的会让人类大量失业吗?哪种工作最容易被AI取代?这一系列的问题,都引起我们的思考。
1.5 分析人工智能
人工智能的应用场景有:自动驾驶、智慧生活、智慧医疗、艺术创作、智慧金融、和人类同场竞技等。今天的人工智能还不能做什么?情感、审美、自我意识、跨领域的推理、抽象能力、常识等。人工智能时代,程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能,几乎一定可以由机器来完成;反之,那些最能体现人的综合素质的技能,例如,人对于复杂系统的综合分析、决策能力,对于艺术和文化的审美能力和创造性思维,由生活经验及文化熏陶产生的直觉、常识,基于人自身的情感(爱、恨、热情、冷漠等)与他人互动的能力,这些是人工智能时代最有价值,最值得培养、学习的技能。
2 识别模式
如今,机器学习的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中模式识别就是计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。当我们人眼看到一幅画时,我们能够很清晰的知道其中哪里是动物,哪里是山,水,人等等,但是人眼又是如何识别和分辨的呢,其实很简单,人类也是在先验知识和对以往多个此类事物的具体实例进行观察的基础上得到的对此类事物整体性质和特点的认识的,并不是人类原本就有对这类事物的记忆,就好比婴孩时期的我们,并不知道什么是狗,什么是帅哥,什么是美女,但是随着我们的慢慢长大,我们观察的多了,见的多了,再加上过来人的经验指导,我们就知道的多了。 其实,每一种外界的事物都是一种模式,人类平均每天都在进行着很多很多的各种各样的模式识别,人们对外界事物的识别,很大部分是把事物进行分类来完成的。而我们对事物进行辨别,就是模式识别。
2.1 识别模式的主要方法
解决模式识别的方法主要有:模板匹配法,ANN法,基于知识的方法和基于数据的方法。基于知识的方法就是专家系统,句法识别就属于基于知识的,但是句法识别不常用。基于数据的方法也就是基于统计的方法,即依据统计原理来构造分类器,来对未知样本进行预测,这种学习过程是机器学习中研究最多的一个方向,也是模式识别采用的最主要方法。顾名思义,ANN也就是大名鼎鼎的神经网络。模式识别的研究范畴,存在两个极端,要么分类和特征之间的关系完全确定,要么完全随机。
2.2 监督与无监督
简单来说,类别已定的就叫做有监督分类,反之就是无监督分类;前者因为我们有已知划分类别的训练样本来作为学习过程的“导师”,所以很多时候,有监督和无监督,又叫做有导师学习和无导师学习;
后者,在不知道要划分的是什么类别时,我们要做的工作是聚类(clustering),根据样本特征将样本聚成多少类,使属于同一类的样本在一定意义上是相似的,不同类之间的样本则有较大差异,通过聚类得到的类别也称作为聚类,但是通常在聚类中存在一个尺度问题,当设置的尺度不一样,得到的聚类也不一样。所以在很多无监督识别问题中,分类结果并不一定是唯一的,因此在没有特别指定的目的情况下,很难说哪种分类方案更合理。另外,用一种方法在一个样本集上完成了聚类分析,得到了若干个聚类,这种聚类结果只是数学上的一种划分,对应用的实际问题是否有意义,还需要结合更多更专业的知识来进行解释。
2.3 识别模式应用
主要有:语音识别,说话人识别,OCR,复杂图像定目标的识别,根据地震勘探数据对地下储层性质的识别,利用基因表达数据进行癌症的分类等等。
2.4 模式识别系统的构成
一个模式识别系统通常包括典型的四个部分(如下图):对原始数据的获取和预处理,特征提取与特征选择,分来或聚类,后处理;以上四个部分,无论是监督的还是无监督的都共有的,可以说是整个系统的核心所在,也是模式识别学科的主要研究内容。
3 总结与期望
AI来了,有思想的人生并不会因此而黯然失色,因为我们全部的尊严就在于思想。机器带给人类的不是失业,而是更大的自由与更加个性化的人生体验。未来也将是一个人类和机器共存、协作完成各类工作的全新时代。正如谭铁牛院士在中科院第十九次院士大会上的报告《人工智能:天使还是魔鬼?》所说的那样,高科技本身没有天使和魔鬼之分,人工智能也是如此,这一把双刃剑,是天使还是魔鬼取决于人类自身。人工智能在天使手里是天使,在魔鬼手里就是魔鬼。因此我们有必要未雨绸缪形成合力,确保人工智能正面效应,确保人工智能造福于人类。
参考文献
[1]张学工,模式识别[M].北京:清华大学出版社,2000.1
篇6
关键词:交叉学科;跨学科;计算神经科学;人工智能;研究生培养
文章编号:1672-5913(2013)18-0001-05
中图分类号:G642
1 背景
科学史上,许多重大的科学发现都产生在不同学科的碰撞和融合中。在自然科学领域,许多伟大的科学家都有着复杂的学科背景,20世纪1/3的诺贝尔获奖项目出现在交叉科学领域。计算机学科里很多大科学家也都有着交叉学科的背景,如计算机之父冯·诺伊曼其实是个数学家,在经济、量子力学及几乎所有数学领域都作出过重大贡献,他提出的计算机二进制表达正是得益于其敏锐的数学洞察力。清华大学计算机科学与技术系张钹院士多次在公开讲座中提到,经他统计,自1966年美国计算机协会(ACM)设立图灵奖以来一直到2012年,60个获奖者中2/3的人都有数学、物理、化学等理科专业背景,甚至还有政治等人文科学背景;相反,纯粹是计算机专业或相近专业如电子学、无线电学等背景出身的人并不多。由此可见,熟练掌握其他学科的知识对于在计算机领域作出重要贡献大有裨益。
高校培养交叉学科人才,一是要引导学生学习不同学科的课程,二是开设一些本身就是多学科交叉的课程。国内高校已经做了大量尝试,也收到了不错的效果。2013年,《计算机教育》杂志专门策划了跨学科教学专题,对国内跨学科教学的实践情况进行报道。很多高校的一线教学人员都报告了他们在交叉学科教育方面的构想或实践经验。
计算神经科学是一门新兴学科,对于促进脑科学、信息科学尤其是人工智能等领域的发展具有重要意义。2010年3月23-25日,中国科学院、浙江大学、上海交通大学的知名学者齐聚北京,举行第367次香山科学会议,主题为“神经信息学与计算神经科学的前沿问题”。与会专家探讨了计算神经科学的国内外发展情况,指出该学科在国内外都还发展不成熟,我们应抓住机遇建立一流的计算神经科学。要达到这个目标,除了加大科研资助和鼓励科研创新外,优质的课程教学必不可少。鉴于计算神经科学的多学科交叉特点,许多专业都可以尝试进行这方面的教学,包括医学、生物学、心理学、数学、物理、化学、计算机、电子,自动化等,笔者将论述计算神经科学与计算机科学的关系以及开设该课程所面临的机遇与挑战。
2 计算神经科学的特点及其与计算机科学的关系
借助飞速发展的现代科技,人类已经能够上天入地,但是对于脑的认识却十分有限。诺贝尔奖得主克里克(Crick)说过:“对我们人来说,在科学研究中没有比研究自己的脑更重要的了。我们对整个世界的认识都有赖于它。”认识人脑的工作机理有两方面的意义,一是促进神经疾病诊疗技术的发展,二是提高人工智能的水平。
诚如艾萨克·阿西莫夫(Issac Asimov)所言,“人脑是我们所知道的最复杂的组织”。它有大约1011个神经元,而平均每个神经元要与103~104个神经元相连。虽然这些数字现在看来并非很大(能存储1T=1012Byte的硬盘在市场上已经很普遍),但问题是计算机硬件是我们事先按一定规则构建的系统,我们对于它每一部分的结构与功能都非常清楚,而人脑却是一个黑箱。想象一下让一台计算机穿越回唐朝,让那个时代的人们了解这台计算机的工作原理是一件多么不可想象的事情。
幸运的是随着科学技术的发展,实验手段正发生着翻天覆地的变革,我们面对的黑箱正在慢慢变灰。通过这些实验手段,我们可以观察到“箱子”的部分内部。然而,只看到大脑内部的一些的结构和它们之间的关系远远不够。唐朝人打开计算机主机盖,能看到主板、CPU、内存条甚至一些精细的电子元件,但这对于他们完全理解计算机的工作原理还差很远。他们需要综合各种技术手段得到计算机内部情况,从硬件问的相互连接关系推断出冯·诺伊曼设计的体系结构及发展变化,从软件的功能推断出算法逻辑,从二进制代码推断出可读代码。要得到这些结果,只有实验数据是不够的,还必须对数据进行整理分析,从蛛丝马迹中发现数据背后的规律和原则。人脑就好比一台唐朝人眼中的计算机。计算神经科学就是一门试图通过理论分析和建模计算的方式理解脑工作原理的学科。
计算神经科学领域的形成始于1988年,Seinowski、Koch和Churchland在Science杂志上发表了计算神经科学领域的“宣言”。从广义上讲,只要是通过建模、仿真等手段对神经科学的实验数据和实验现象进行定量分析的,都属于计算神经科学的范畴。近年来,由于实验技术的革新和脑科学研究的蓬勃发展,这方面的研究早已不局限于生物、医学、心理学等学科,很多其他学科的研究人员以各种方式参与到脑科学的研究中,包括数学、物理、计算机、电子、材料等,他们将该学科中的一些定量计算理论引入神经科学并据此研究脑科学的实验数据和现象。
国外许多著名高校都设有计算神经科学的研究中心或相应专业,包括MIT:CSAIL-ArtificialIntelligence Group;Stanford University:Center forMind,Brain and Compution;Harvard University:Mind/Brain/Behavior Program;CMU/University ofPittsburg:Center for the Neural Basis Of Cognition:University College London:Gatsby ComputationalNeuroscience Unit;Columbia University:BionetGroup。这其中大多数都有信息科学类院系的参与,如MIT的Artificial Intelligence Group就是在计算机与人工智能实验室下的一个组,而Stanford University 的Center for Mind,Brain andComputation由计算机系、电子系、语言系、神经生物系、心理系以及神经科学研究所的教授组成。计算机领域的一些杰出学者也参与了计算神经科学的研究,包括MIT的David Marr和Tomaso Poggio,CMU的Tom Mitchell,Caltech的Pietro Perona,Stanford Universit),的Fei-Fei Li等。这里还不包括大量的以计算机科学、电子工程等为教育背景但主要活跃在神经生理学、认知心理学等传统神经科学领域的学者。
一方面,计算机科学及其相近领域的研究人员对神经科学和认知心理学的贡献越来越大,已经成为脑科学研究中一支不可忽视的力量;另一方面,神经科学和认知心理学的研究进展对计算机科学的某些方面起到很大的推动作用。例如,近年来在机器学习领域非常热门的深度学习(Deep Learning),在很大程度上受到大脑感觉系统层次化结构的启发,见图1。其中,图1(a)为大脑视觉皮层各区域的位置及信息处理通道,图1(b)为深度学习的框架。
3 面向计算机专业研究生开设计算神经科学课程的机遇和挑战
相对于医学、生物学、心理学等专业,面向计算机专业的研究生开设计算神经科学课程相对容易。这是因为通过本科阶段的培养,计算机专业研究生在理论证明、逻辑推断、数据分析等方面的基础更扎实,他们接受医学、生物、心理学等学科的知识相对容易;但反过来,让那些习惯了生理和心理实验的学生接受一些计算理论方面的知识则相对困难。而相对于数学、物理、化学等理科专业,计算机专业的研究生在模型实现方面有优势。这是因为现在很多计算神经科学的模型都涉及大规模计算,扎实的编程基础使得他们在处理这类问题上更加得心应手。这些是面向计算机专业研究生开设计算神经科学课程的机遇。然而我们面临的挑战更大,主要包括两个方面,论述如下。
3.1 课程定位的挑战
通过调查一些国外著名大学开设的计算神经科学课程,我们可以发现大多数课程的立足点都是“理解脑”,以揭开大脑的秘密为目的,而且无论该课程是神经科学、心理学或相关院系开设的(如Baylor College ofMedicine神经科学系的课程Theoretical Neuroscience-Learning,Perception,Cognition,MIT脑与认知科学系的课程Inlroduction to Computational Neuroscience),还是交叉学科中心开设的(如UniversityCollege London Gatsby ComputationalNeuroscience Unit的课程ComputationalPerception and Scene Analysis),甚至是一些计算机类院系开设的(如CMU计算机系的课程Computational Perception),都是这样。
如果在国内高校面向计算机专业开设计算神经科学课程,将课程目标定位于“理解脑”,会存在一定的现实困难。国外著名高校非常注重基础研究和交叉学科研究,经过多年的发展,他们培养的研究生已经形成了学习其他学科知识的习惯,但国内研究生在选修课程方面则显得更加功利一些,只选修那些目前对自己有用的课程。对计算机专业的学生而言,修一门有关理解大脑工作机理的课程显得比较怪异,这与他们将来从事的IT工作似乎风马牛不相及;为此,我们一方面需要从课程体制、培养计划等方面引导学生重视基础学科和交叉学科的课程,另一方面还需要考虑在现阶段如何通过课程定位吸引计算机专业学生选修相关课程。
3.2 师资力量的挑战
交叉学科课程的讲授对授课教师的专业素养提出了更高的要求,授课教师需要具有交叉学科的研究背景,这样才能把学科前沿看得更清楚,把问题讲得更透彻,但这通常不是一件容易的事,对于计算神经科学这一学科跨度非常大的交叉学科而言更是这样。国内这一学科目前还处于萌芽阶段,从事相关研究的学者相对较少,零散地分布在各自院校的不同院系,而且无论是在哪个院系,他们都是少数派。师资力量的不足已经成为制约计算神经科学在国内高校和科研院所发展的主要因素之一。
4 应对挑战的措施
4.1 准确进行课程定位
为了使学生更容易接受计算神经科学这一课程,我们首先需要给这一学科下一个恰当的定义。从狭义上讲,我们建议将计算神经科学定义为神经科学、认知心理学和人工智能的交叉学科,三者之间的关系如图2所示。人工智能是计算机学科的一个专业方向(这里的人工智能包含机器学习、数据挖掘等各种智能计算的理论与方法),是计算机科学与神经科学和认知心理学产生交叉的主要领域。相对于计算神经科学的广义定义,这一定义拉近了其与计算机专业学生的心理距离。
针对计算机专业的学生,该课程定位不能只是“理解脑”,还要强调“利用脑”,教师需要向学生强调:一方面人工智能为神经科学和认知心理学提供研究的工具,另一方面后两者的发展又反过来促进人工智能等信息领域的技术革新。学生理解了这一点,选修这一课程的积极性才会提高。计算神经科学在计算机专业内并不是一门孤立的课程,它其实要用到很多概率论、线性代数、机器学习、模式识别等领域的知识,与人工神经网络、人工智能、计算机视觉等学科有着紧密的联系。计算神经科学与清华大学计算机科学与技术系一些专业课程之间的关系如图3所示,其中箭头表示课程间的支持关系。
4.2 有效提高师资力量
一方面,我们要鼓励教师进行计算神经科学这一交叉学科领域的研究,培养该领域的杰出学者或从国外全职引进一批这样的学者,这是解决师资力量不足的根本之道。如果在全职引进人才方面有困难,可以通过国家的各种引智计划引进一批短期工作的学者,让他们开设计算神经科学方面相关课程,以便有志于此方面教学科研的本地教师参与学习,最终实现课程的本土移植。
另一方面,我们也可尝试让多个专业的教师同时讲授这门课程。教师一起确定教学大纲,分工合作,各自讲授涉及自己专业的那一部分内容并适当向神经科学靠拢。这样做的优点是较容易找到合适的教师并且每名教师不用花太多精力学习其他领域的知识,缺点是内容会比较散,难以形成一个有机整体,更麻烦的是教师如果不专门从事计算神经科学的研究,那么对于某些知识点则难以讲透;因此这项措施只是权宜之计,一旦条件成熟,我们还是建议由从事计算神经科学研究的教师授课。
5 教学内容的选择
由于计算神经科学是一门交叉学科,涉及的知识点较多并且分布在很多学科里,因此要求学生将这些学科的课程全部学完后再学这门课程,显然不现实也不必要。另外,将所有计算神经科学的知识点都在课堂上讲解一遍也不现实,这就涉及教学内容的选择问题。
5.1 教学内容精而新
“精”强调对教学内容的筛选,有两个原则:一是重要的基础知识必须讲到,这些基础知识包括神经科学、数学、信息论、机器学习等领域的与计算神经科学密切相关的基础知识,这样培养出的学生才能举一反三;二是挑选有代表性的专题,如神经元模型、有监督学习、无监督学习等,把每个专题讲深入了,才能让学生体会到这一学科的常规研究思路和方法,培养学生将来从事相关研究工作的能力。
“新”强调教学内容的时效性。一个尴尬的事实是现在真正称得上计算神经科学的教材很少,笔者认为最经典的教材要数Peter Dayan和LarryAbbott主编的Theoretical Neuroscience,该教材由MIT出版社于2001年出版。这本教材内容很丰富,基本覆盖计算神经科学领域内所有的大方向,缺点是内容比较陈旧。计算神经科学近年来发展迅速,大量的经典工作都没有包含在该教材中。该教材若作为研究生课程教材显然不合适,因此教师必须总结近年来该领域的一些重要进展,如在顶级期刊(如Nature、Science等)上挑选一些重要研究成果并将这些内容归纳到自己的讲义中。
5.2 教学内容向计算机科学倾斜
教师在教学过程中不仅要强调揭开脑的奥秘,还要强调这些奥秘对于计算机科学的意义和作用。一方面挑选一些能让计算机科学发挥重要作用和计算机专业学生体现优势的内容,如神经信号处理和人机接口,因为这些需要用到较多的模式识别技术;另一方面强调为我所用,挑选一些对计算机科学有用的内容,如稀疏编码、深度学习等在机器学习和模式识别领域受到广泛关注的话题。
6 结语
计算神经科学是一门新兴的交叉学科,为了响应在国内建立一流计算神经科学的号召,对于科研和教学我们都不能忽视。目前国内有能力开设计算神经科学课程的学校还不多,即使有也只集中在医学、心理学等院系,其定位一般侧重于“理解脑”。长此以往,国内对于脑科学的研究将面临跛脚走路的尴尬境地,因为脑科学研究的另一任务——提高人工智能的水平将被忽略,因此在工科院系尤其是信息科学相关院系开设计算神经科学方面的课程非常有必要。研究型高校应抓住机遇,从政策上鼓励工科院系开设相关课程,这对于国内学术界从容应对脑科学革命这一挑战具有重要意义。
参考文献:
[1]孙群,张剑湖,李俊民,数学专业设置交叉学科课程的研究[J],高等理科教育,2007(2):29-31
[2]郑利平,安宁,路强,等,跨学科教学实践与构想[J],计算机教育,2013(1):3-5
[3]陶飞,程颖,杨金键,等,交叉学科研究模式的组织建设研究[J],计算机教育,2013(1):6-10
[4]罗嘉庆,周世杰,跨学科课程教学研究与案例[J],计算机教育,2013(1):11-13
篇7
【关键词】MATLAB;数字图像处理;人脸识别
1.引言
人脸识别是当前计算机模式识别领域中的一个非常活跃的研究课题,在安全检测、身份验证、军事、商业等领域具有广泛的应用前景。基于人脸识别的自动身份认证具有重要的理论意义和应用价值。但是通过人脸图像来进行识别仍然面临巨大的挑战,要使这一技术成为完全成熟的技术还有许多工作需要做。
2.人脸识别的研究内容
人脸识别(Face Recognition)是指基于己知的人脸样本库,利用图像处理和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。从广义上讲,其研究内容包括以下五个方面:
(1)人脸检测(Face Detection):即从动态的场景或复杂的背景中检测出人脸的存在并且确定其位置,然后分离出来。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响。
(2)人脸表征(Face Representation):也称为人脸特征提取,即采用某种表示方法来描述检测出的人脸与数据库中已知人脸。通常的表示方法包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵特征矢量)、固定特征模板、特征脸、云纹图等。
(3)人脸识别(Face Identification):即将待识别的人脸与数据库中已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表征方法与匹配策略。
(4)表情分析(Facial Expression Analysis):即对待识别人脸的表情进行分析,并对其加以归类。
(5)生理分类(Physical Classificat-ion):即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子的脸部图像、基于年龄增长的人脸图像估算等。
相对来说,人脸的表情分析、生理分类是两个非常难的研究方向,不过它在计算机图形学,尤其是计算机动画等领域有很广泛的应用前景,因此在最近几年得到了国内外很多从事计算机视觉(Computer Vision)的研究人员的注意。本论文主要介绍狭义的静态人脸图像识别方法,研究的重点是人脸特征提取与识别的关键技术,不涉及表情识别和生理分类方面。
人脸识别系统通常主要由人脸检测与定位,人脸特征提取与识别两部分组成,在这两部分的基础上还包括图像预处理等步骤。其主要实现步骤如下:
(1)图像预处理
由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊,且对比度低、区域灰度不平衡。为了提高图像的质量,保证提取特征的有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作,以改善图像质量,保证提取特征的有效性。
(2)人脸的检测与定位
从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来,输出为分割好的人脸局部图像。
(3)图像归一化
图像归一化属于图像预处理的范畴。在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度的克服光照变化的影响而提高识别率[3,4]。
(4)特征提取与识别
对于归一化了的人脸图像进行面部的各特征提取,将原始人脸图像中的数据映射到特征空间,对人脸进行特征建模,建立的特征模型主要用于区分各人脸之间的差异性,为人脸识别分类打下基础。由于原始的人脸图像数据量是相当大的,为了有效的实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征,如何提取稳定和有效的特征是识别系统成败的关键。人脸识别验证是整个自动人脸识别系统的最后一个步骤,根据面部特征的提取结果,将待检测人脸与人脸库中人脸数据进行比较,判断出待检验人脸的身份信息。
一个完整的人脸自动识别系统如图1所示。
对以上人脸识别系统进行分析可以看出,人脸识别研究需要考虑以下几个主要方面:如何准确快速的检测并分割出人脸部分;在非约束环境下,如何采用一些必要的处理方法来提高系统的鲁棒性,寻找一种受人脸姿态变化和光照条件等因素影响较小的特征提取方法;如何有效的变化补偿、特征描述和准确的分类等等,以上方面均直接影响人脸识别的速度与准确度。
3.人脸识别的具体过程
在实验编程中,我们利用的是MATLAB
7.0平台。MATLAB是由MathWorks公司推出的一套高性能的数值计算和可视化的数学软件。MATLAB编程运算与人进行科学计算的思路和表达方式完全一致。不像学习其他高级语言如Basic、C那样难于掌握。MATLAB的基本元素是矩阵,所以其非常适合用来进行图像处理。MATLAB具有强大的数值计算和图示能力。具有非常丰富的工具箱(ToolBox)。在国内外高等院校中,已成为高等数学、数值分析、数字信号处理、自动控制理论以及工程应用等课程的基本教学工具。
3.1 将训练样本图像输入程序
采用的训练样本图像为包含4个人的图像样本集,以验证本程序的通用性。图2为本实验要输入到识别程序中的部分人脸样本图像。
3.2 程序对输入的图像进行预处理
本程序对输入的图像进行的预处理包括有彩色图像到灰度图像的转换、图像的噪声消减、图像的尺寸归一化等。人脸识别需要将人脸图像样本尺寸归一化,即缩放变换到固定的尺寸。在本程序中,为方便图像矩阵的计算,提升计算速度,将图像统一缩放到120×120大小。图3为经过预处理后得到的灰度图像。
3.3 人脸图像训练阶段
利用基于PCA+LDA算法的人脸识别算法进行人脸识别,该环节包括训练和识别两个环节,对人脸样本图像进行训练则会产生平均脸和特征脸。图5-4为训练样本集中各人脸图像的特征脸,图4为训练样本集的平均脸。
3.4 人脸图像识别阶段
将测试图像输入程序。若经过程序判断待测试图像为人脸图像库中的人脸图像,则显示识别结果。图5为测试例子和识别结果。
4.人脸识别实验结果及分析
由于受实验条件所限,未能利用该人脸识别系统采集大量不同的人脸实验样本,只是由简单人脸图像数据库来充分验证系统的性能。实验中,人脸库中有4个各自4幅图片,从中每人各随机选择3幅人脸图像作为训练样本,共同作为训练样本集。其余每人所剩下的1幅人脸图像作为测试样本集。所有照片比较充分的反映了同一个人的不同人脸图像因光照变化、面部细节变化等因素而产生的差异。摄像头获取的照片拍摄于不同的时间,且同样允许在一定范围内的光照、表情及面部角度的变化。该人脸识别系统采用基于PCA+LDA算法的人脸识别方法,具体实现步骤如前文所述。按照上述训练及测试样本的选取,在不同的人脸样本的情况下,利用该系统进行人脸识别,均获得了80%以上的识别率。
从实验结果可以看出,即使所采用的训练及测试样本集中的图像样本均为具有一定姿态变化,在不同光照条件下获取的图像,但该人脸识别系统仍具有很好的识别效果。另外,该人脸识别系统采用优秀的人脸识别算法,降低了系统的运算量,因此具有较高的识别速度。这充分说明了运用PCA+LDA方法进行人脸识别的可行性。
本文所设计的人脸识别系统实现了人脸识别主要模块的功能,但距离一个具有实时性的快速自动人脸识别系统还相差较远,在系统的构建方面还有许多工作要做。针对该系统现状,在今后的工作中,还要对其作进一步的完善。
参考文献
[1]王蕴红,朱勇,谭铁牛.基于虹膜识别的身份鉴别[J].自动化学报,2002,28(11):l-10.
[2]梁路宏.人脸检测与跟踪研究[D].清华大学博士论文,2001.
[3]程云鹏.矩阵论[M].西安:西北工业大学出版社,2003,2.
作者简介:
篇8
关键词:ROS;机器人;Ubuntu
20世纪以来随着电子技术的不断发展及人类对于自身的不断了解,机器人的研究也在不断深入。现阶段虽能做出外表、走路等接近人类的机器人,但这些都属于前沿领域,研究门槛高,实际的商业用途不是很广,所以大多还停留在样品阶段,走进市场的很少。借助互联网和智能手机的大潮,嵌入式处理器正在完成以前台式处理器做不到的事情,于是现阶段机器人又被重新定义。在目前的消费领域,某些配备智能处理器和具有互联网功能的产品也被认为是机器人,如图1所示的两款国内厂家生产的机器人产品。图1所示的机器人属于生活工具类,一般放置在家中,无法自行移动,采用嵌入式处理器,带有摄像头、无线网络模块、显示模块,可以连接手机,通过手机App对机器人进行相关设置,同时机器人摄像头采集到的图像也能实时传给手机,和手机进行语音对讲。机器人还带有语音识别模块,若向它询问“明天天气如何”,他会从网络获取天气信息然后作出回答。这些放置在家中的机器人也可以实现安全监测的功能,通过手机实时查看家中的监控影像或通过适配各种传感器以实时洞悉,比如贴在门窗后面的加速度传感器,当门窗被动作时传感器给机器人发出信号,机器人随即通过设定的方式进行报警。
图2所示为两款国外生产的机器人,其最主要的特点是可以运动,属于智能玩具的范畴。这些机器人可以连接智能手机,通过手机对机器人进行设置,然后把手机当做机器人的操作杆,操作其做出各种运动,达到娱乐的目的。同时,机器上装有摄像头,可以在手机上同步看到机器人摄像头拍摄到的视频画面。但也有一些创新,如左边的机器人在星战电影里有原形,用手机摄像头对准该机器人,通过手机端的AR技术,在手机屏幕里可以给机器人加上各种效果,增加娱乐性。
还有一些具有特殊用途的机器人,如扫地机器人,其根据内部的路径算法清洁地面,同时能自动避开障碍物,并于电量即将耗尽时自动返回充电桩充电。
今后服务机器人的趋势会是以上列举的这些机器人的集大成者,即在软件智能和C械运动方面不断发展。软件智能通过高性能的嵌入式处理器实现视频处理、网络连接和语音识别等技术。机械运动则先搭配单片机和步进电机,通过轮子的滚动实现移动,通过增加机械零件和改进算法来逐步实现动物甚至人体的肢体行走。图3所示框图列出了实现具有该功能机器人需要采用的技术。
高性能嵌入式处理器上运行着机器人的核心系统。摄像头采集视频图像,并对图像中的事物进行一些简单判别,如识别人脸,对静态事物的图像采集也能让机器人辨别障碍物,或计算出静态事物的大致几何图形甚至尺寸。对动态事物的图像采集,机器人可以计算出动态事物的运动轨迹甚至速度。4G和WiFi&BT模块属于无线通信模块,有了无线通信机器人才能得到自身之外的更多信号,并将自身的信息传达给别人。语音识别模块能让机器人识别声音,显示&触摸屏只是机器人与外界交互的一种方式,GPS模块能让机器人知道自己的位置信息,存储模块除了存储机器人的系统和各类软件外,也能让机器人具有记忆功能。摄像头采集视频图像并计算,计算结果可以存储在存储模块中,当遇到类似的计算时就可以判别事物,通过网络模块将这类信息传递出去分享给更多的机器人。单片机管理着机器人各类基础模块,步进电机控制机器人的运动,各类传感器让机器人有了感知外界环境的能力。红外模块可以实现对一些外部电器的操控,电池和电池管理模块为整个机器人的运转提供能量。
硬件结构是实现服务机器人运算和控制的基础,在高性能嵌入式处理器上运行的操作系统进行服务机器人具体的运算和控制,相当于机器人的灵魂。目前主流的三大机器人操作系统有Ubuntu,Android和ROS。Android软件平台使用较广泛,ROS为专用的机器人软件平台。要实现对服务机器人的运算和控制,软件平台需要解决以下问题:
(1)分布式计算现代机器人系统往往需要多个计算机同时运行多个进程,当多个机器人需要协同完成一个任务时,需要互相通信来支撑任务完成;用户通过台式机、笔记本或者移动设备发送指令控制机器人,而人机交互接口可以认为是机器人软件的一部分。
(2)软件复用随着机器人研究的快速推进,诞生了一批应对导航、路径规划、建图等通用任务的算法。当然,任何一个算法实用的前提是其能够应用于新的领域,且不必重复实现。
(3)快速测试为机器人开发软件比其他软件开发更具有挑战性,主要是因为调试准备时间长,且调试过程复杂。何况受硬件维修、经费有限等条件限制,未必随时有机器人可供使用。
ROS作为机器人专用的软件平台,可在ARM搭配Ubuntu的环境下运行,对服务机器人的运算和控制进行了诸多优化,大大增强了其实用性。
(1)点对点设计
一个使用ROS的系统包括一系列进程,这些进程存在于多个不同的主机并且在运行过程中通过端对端的拓扑结构进行联系。虽然基于中心服务器的那些软件框架也可以实现多进程和多主机的优势,但在这些框架中,当各电脑通过不同的网络进行连接时,中心数据服务器就会出现问题。
ROS的点对点设计以及服务和节点管理器等机制可以分散由计算机视觉和语音识别等功能带来的实时计算压力,适应多机器人遇到的挑战。点对点设计示意如图4所示。
(2)多语言支持
在写代码时,许多编程者会比较偏向某一些编程语言。这些偏好是个人在每种语言的编程时间、调试效果、语法、执行效率以及各种技术和文化的原因导致的。为解决这些问题,我们将ROS设计成语言中立性框架结构。ROS现在支持许多种不同的语言,如C++、Python、Octave和LISP,同时还包含其他语言的多种接口实现。
(3)精简与集成
大多数已经存在的机器人软件工程包含了可以在工程外重复使用的驱动和算法,不幸的是,由于多方面的原因,大部分代码的中间层都过于混乱,以至于很难提取出它的功能,也很难把它们从原型中提取出来应用到其他方面。
为了应对这种趋势,我们鼓励将所有的驱动和算法逐渐发展成为和ROS没有依赖性单独的库。ROS建立的系统具有模块化的特点,各模块中的代码可以单独编译,而且编译使用的CMake工具使它很容易的就实现精简的理念。ROS将复杂的代码封装在库里,只创建一些小的应用程序为ROS显示库的功能,允许对简单代码超越原型进行移植和重新使用。作为一种新加入的优势,当代码在库中分散后单元测试也变得非常容易,一个单独的测试程序可以测试库中很多的特点。
(4)工具包丰富
为了管理复杂的ROS软件框架,利用大量小工具来编译和运行多种多样的ROS组建,从而设计成了内核,而非构建一个庞大的开发和运行环境,示意图如图5所示。
(5)免费并且开源
篇9
关键词: 在线学习; 目标检测; 随机蕨分类器; 半自主学习
中图分类号: TN919?34; TP391 文献标识码: A 文章编号: 1004?373X(2016)09?0121?05
Abstract: Since the object attitude has great variation in different monitoring scenes and different imaging conditions, an object detection system with semi?autonomous learning ability is proposed. The system can improve the detection performance by means of fast semi?autonomous learning while executing the detection task. The system is composed of object detection module and online learning module. To satisfy the requirement of system online learning, the online learning method of random fern classifier is proposed. It can sustainably self?renewal the object detection module, and improve the detection performance. The whole learning process by needn′t prepare the initial training samples semi?autonomous learning framework, and only select a detected object to perform the adaptive learning, so the detection performance is improved gradually. The experimental results show that the method has strong adaptive capability and high detection rate.
Keywords: online learning; object detection; random fern classifier; semi?autonomous learning
0 引 言
在线学习属于增量学习的研究范畴,在这一类方法中分类器对每个样本只学一次,而不是重复的学习,这样在线学习算法运行过程中不需要大量的存储空间存储训练样本。分类器每获得一个样本,即对其进行在线学习,使分类器能根据新样本自我更新和改进,进一步提高分类效果。早期的在线学习算法有Winnow算法[1]、统一线性预测算法[2]及增量有监督人工神经网络[3]等。2001年学者Oza将这些算法与boosting算法[4]进行结合,提出了在线boosting算法[5]。在Oza的方法中,强分类器是一定数量的弱分类器的加权和,这些弱分类器都是从弱分类器集合中挑选出来的。在线学习时,每个训练样本逐一更新弱分类器集合中的每个弱分类器,包括调整正负样本的分类阈值以及该分类器的权重,使分类准确率高的弱分类器权重越来越高,而准确率低的弱分类器权重越来越低,从而每次在线学习一个样本就可以挑选出一个当前权重最高的弱分类器加入强分类器中使最终训练出来的分类器有较强的分类能力。冯国瑜等人将在线学习用于增量支持向量机算法[6],也取得了不错的效果。侯杰等人提出了基于指数损失和0?1损失的在线boosting算法[7],该方法严格证明了在线学习过程并未损失分类准确性。但是,在线boosting算法的弱分类器集合中每个弱分类器都要对新样本进行在线学习,当弱分类器个数较多时,在线学习速度必然会变慢。Grabner对在线boosting算法进行了改进,使其也像Adaboost算法一样可以进行特征选择,并且这种特征选择是在线进行的,称为在线Adaboost[8],从而使在线学习能够用于计算机视觉领域的目标检测。该算法初始化[N]组弱分类器集合,其中每个集合包含[M]个弱分类器。在线学习过程即为通过对新样本的学习更新[M×N]个弱分类器权重及分类阈值的过程,同时在线学习新样本权重也随之更新。可见弱分类器个数越多,在线学习的分类器性能越好,但是,需在线更新的弱分类器越多,其学习速度越慢。此外,文献[9?11]提出了一些改进方法,但在线学习速度和分类器性能的矛盾一直没有解决。
Ozuysal提出随机蕨分类器算法[12],该算法随机初始化多个随机蕨,每个随机蕨均包含[K]个特征。将每个特征二值化,相应的[K]个特征构成的随机蕨为一个[K]位的二进制码。统计正负训练样本在该随机蕨的二进制数值即得到该随机蕨的后验概率分布。对于待测样本则由多个随机蕨的后验概率共同估计其类别。可见,该分类器将多个特征融合为一个随机蕨,不再需要训练弱分类器,提高了分类器训练速度。因此,本文在其基础上提出在线随机蕨算法,通过更新每个随机蕨的后验概率分布实现在线学习,从而摆脱了对样本权重及各个弱分类器权重、阈值的更新,因此分类器在线学习速度快。此外,随机蕨分类器分类性能的好坏由每个随机蕨包含的特征数及总随机蕨个数决定,特征越多,随机蕨总数越大,则分类效果越好。而随机蕨分类器的在线学习是通过更新其后验概率分布实现,因此提高随机蕨个数,增加每个随机蕨包含的特征数对在线学习速度影响不大,较好的平衡了分类器性能和在线学习速度的矛盾。
此外,本文提出半自主在线学习框架,可在随机蕨分类器进行视频目标检测的同时通过少量的人工干预,逐渐提高该分类器的视频目标检测性能。同时,该框架也验证了随机蕨分类器及其在线学习算法对视频目标检测的效果。通过实验可知,初始的随机蕨分类器通过在线学习算法可有效提高其视频目标检测精度。
1 随机蕨分类器
1.1 随机蕨分类器
对比式(4)可见,随机蕨分类器随机提取多个特征构成随机蕨,从而可联合多个随机蕨进行近似计算。从这个角度看,该算法是近似精确度和计算速度的平衡,通过对每个随机蕨包含特征数及随机蕨个数的选择可保证在分类器训练速度较快的情况下实现较好的分类精度。这一点对分类器的在线学习非常重要。
1.2 随机蕨分类器的使用
由1.1节可知,随机蕨后验概率[P(FlCk)]的计算方法是随机蕨分类器的关键。
通常训练随机蕨分类器采用二进制特征,如LBP,2 b模式等。假设在一个样本中随机提取5个特征值构成一个随机蕨[F,]则该样本的一个随机蕨数值即为5位二进制码对应的十进制数。由于该数值通过5位二进制码获得,因此有25种可能的数值,针对大量训练样本,可很方便地计算该随机蕨的后验概率。如图1所示,由相同位置的5个特征可获得每个样本的随机蕨数值,统计该数值分布即可获得车辆样本在该随机蕨的后验概率[P(FCk)]。
显然一个随机蕨对样本的分类精度不高,可以通过式(4)联合多个随机蕨的分类结果,其中每个随机蕨包含的特征数及使用的随机蕨个数决定了分类精确度及训练随机蕨分类器消耗的时间。
2 半自主在线学习
为了使基于随机蕨分类器的视频目标检测系统能够在少量人工干预的帮助下逐渐提高检测性能,本文提出半自主在线学习系统,下面首先介绍在线随机蕨算法,并在此基础上构建半自主学习系统。
2.1 在线随机蕨分类器
由上节可知,随机蕨分类器的训练不需更新弱分类器权重及样本权重,只需统计每类训练样本在不同随机蕨的后验概率分布即可,如图2所示,因此该分类器的训练速度较快。并且,对于随机蕨分类器的在线学习也很容易通过更新后验概率分布实现。
本文主要探讨在视频中检测某类目标的问题,与图1,图2的多类目标分类问题不同,需准备正负样本训练初始随机蕨分类器,统计正负样本在随机蕨不同数值上的分布。例如,针对随机蕨[F,]其对应的特征值为00101的正负样本个数分别为[N]和[M,]相应地,该随机蕨数值为00101时,为待检测目标的可能性是[NN+M,]该随机蕨有5个特征,相应有25种取值,统计每种取值的正负样本个数,计算其为待测目标的可能性,即为随机蕨[F]的后验概率分布,如图4所示。初始正负样本通过随机框选一个待检测目标进行仿射变换得到。
在线学习时,每个随机蕨的后验概率分布根据增加的正负样本数更新。设在线学习的样本为[fnew,Ck,]其中[fnew]为其多维特征向量,[Ck]为其样本类别,设为正样本。下面以随机蕨[F1]为例说明随机蕨分类器的在线学习过程:
(1) 计算该样本在随机蕨[F1]的数值,设为00101,即十进制数5;
(2) 将随机蕨[F1]的数值也为5的正样本数[N]加1,负样本数[M]不变;
(3) 更新随机蕨[F1]的后验概率分布,其中数值5的后验概率变为[(N+1)(N+M+1);]
(4) 归一化随机蕨[F1]的后验概率分布。
可见,随机蕨分类器的在线学习过程即为各个随机蕨数值对应的样本数统计过程,由样本数变化更新后验概率分布。因此其在线学习速度远高于其他在线学习算法。
2.2 半自主在线学习框架
本文提出半自主在线学习框架可在检测系统运行过程中手工框选部分错误的目标检测结果作为在线学习样本,用于随机蕨分类器的在线学习,从而逐渐提高该分类器的视频目标检测性能。通过实验可知,初始的随机蕨分类器通过在线学习算法可有效提高视频目标检测精度。
半自主在线学习框架如图5所示,首先在第一帧视频图像中框选一个待检测目标, 利用该框选目标进行仿射变换得到初始正样本集,同时在该视频帧的非目标区域提取少量初始负样本集。由初始正负样本集根据1.2节提出的训练方法训练初始随机蕨分类器,将该分类器用于后续帧的同类目标检测。由人工对部分检测结果进行判断,对于检测到的虚警则标注为在线学习负样本,对于漏检目标则框选出来作为在线学习的正样本,采用2.1节提到的方法对随机蕨分类器进行在线学习,更新其后验概率分布。由于整个过程是人工指定在线学习样本,因此这种方法称为半自主在线学习。
半自主学习框架可在某一监控场景视频中在线训练有针对性的分类器,这和传统的离线学习方法有很大区别。离线学习中样本准备过程及分类器的训练过程均需耗费大量时间,非常不方便。采用半自主学习可直接从视频帧中框选一个待检测的目标启动分类器的在线训练过程,虽然刚开始检测性能不佳,但是随着在线学习的样本增多,检测性能逐渐提高。此外,半自主学习中,手工选取的在线学习样本主要针对检测过程多次出现的虚警及漏检目标,从而提高分类器训练的针对性,加快检测性能提高速度,获得针对某一监控场景的检测系统。一旦监控场景变化或检测目标类别变化,只需重新框选目标启动新的半自主学习过程即可,从而为不同的监控场景训练其专用的分类器检测系统。
2.3 半自主在线学习流程
由2.2节可知,半自主在线学习框架主要用于验证随机蕨分类器在线学习的有效性,其流程如图6所示。
3 实验效果及分析
在车辆目标检测的实验中,选取了一段交通视频,从视频文件中读入视频帧中的车辆信息。首先在第一帧视频图像中框选出一个车辆目标,对其进行仿射变换,得到200个正样本,再从监控视频四周非目标区域提取300个负样本训练初始随机蕨分类器。其中随机蕨分类器的随机蕨个数为15,每个随机蕨包含的特征数为5个。将该分类器用于对后续视频帧车辆目标的检测,并手工选取漏检目标作为在线学习正样本,同时手工选取虚警作为在线学习负样本,对分类器进行在线学习。实验过程中,系统在线学习了不到500帧图像,共2 875个正负样本就获得了不错的检测结果。如图7~图9所示。
在视频目标检测的初始阶段,在线学习的样本较少,视频帧中的目标较难被检测出来,这时候表现出来的是虚警少漏检多,如图7所示。随着视频中在线学习样本量的增多,虚警越来越多,漏检越来越少,如图8所示。正样本的在线学习使得视频帧中能够检测到的目标增多,负样本的在线学习使漏检减少,相应地,虚警的数量就会变少。当分类器在线训练的正负样本越来越多时,分类型的性能就逐渐提高,视频帧中的每个目标基本能够被检测出来,虚警也越来越少,如图9所示。
通过观察并且记录了每个阶段视频帧中某部分虚警的数量和漏检的数量,形成了一个表格,比较直观地发现它们的变化规律,如表1所示。
为了说明本文在线随机蕨分类器能够在不同的环境中对目标进行检测,具有较强的自适应性。将训练好的车辆目标分类器在第二种检测环境下进行半自主学习,只训练了200帧左右,共862个正负样本,就获得了较好的检测效果,如图10,图11所示,而在第三种检测环境下,只半自主学习了不到100帧,共253个正负样本,其检测结果如图12,图13所示。
4 结 论
本文将随机蕨算法和在线学习理论结合起来应用到目标检测系统中,组成了在线随机蕨的目标检测方法。通过半自主学习框架使检测模型在执行目标检测任务的同时逐步提高自身的检测性能。多组实验结果表明,本系统可以适应成像目标以及成像背景的变化,并保持不错的检测效果。
未来将进一步提高在线学习随机蕨分类器的分类能力,并结合在线学习样本自主获取、标注方法,将系统扩展为全自主在线学习系统,拓宽其应用范围。
参考文献
[1] LITTLESTONE N. Learning quickly when irrelevant attributes abound: a new linear threshold algorithm [J]. Machine learning, 1988, 2(4): 285?318.
[2] LITTLESTONE N, WARMUTH M K. The weighted majority algorithm [J]. Information and computation, 1994, 108(2): 212?261.
[3] POLIKAR R, UPDA L, UPDA S S, et al. Learn++: an incremental learning algorithm for supervised neural networks [J]. IEEE transactions on systems, man, and cybernetics, part C (applications and reviews), 2001, 31(4): 497?508.
[4] VIOLA P, JONES M J. Fast and robust classification using asymmetric AdaBoost and a detector cascade [J]. Advances in neural information processing system, 2002, 2(3): 1311?1318.
[5] OZA N, RUSSELL S. Online bagging and boosting [C]// Proceedings of the Eighth International Workshop on Artificial Intelligence and Statistics. Florida: [s.n.], 2001: 105?112.
[6] 冯国瑜,肖怀铁,付强,等.一种适于在线学习的增量支持向量数据描述方法[J].信号处理,2012,28(2):186?192.
[8] GRABNER H, BISCHOF H. On?line boosting and vision [C]// Proceedings of 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2006: 260?267.
[9] ZEISL B, LEISTNER C, SAFFARI A, et al. On?line semi?supervised multiple?instance boostin [C]// Proceedings of 2013 IEEE Conference on Computer Vision and Pattern Recognition. San Francisco: IEEE, 2010: 1879?1887.
[10] CHEN S T, LIN H T, LU C J. Boosting with online binary learners for the multiclass bandit problem [C]// Proceedings of the 31st International Conference on Machine Learning. [S.l.: s.n.], 2014: 342?350.
[11] QI Zhiquan, XU Yitian, WANG Laisheng. Online multiple instance boosting for object detection [J]. Neurocomputing, 2011, 74(10): 1769?1775.
[12] OZUYSAL M, CALONDER M, LEPETIT V, et al. Fast keypoint recognition using random ferns [J]. IEEE transactions on pattern analysis and machine intelligence, 2010, 32(3): 448?461.
- 上一篇:幼儿心理健康的重要性
- 下一篇:出口贸易概念