计算机视觉的发展范文
时间:2023-12-20 17:57:02
导语:如何才能写好一篇计算机视觉的发展,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:航空运输;协同决策;多航站楼;实时指派;混合集合规划;航班波
中图分类号:U8
文献标志码:A
文章编号:1005-2615(2015)01-0071-06
随着民航运输的飞速发展,运输量的快速增长,多航站楼多区域管理已经成为民航发展的一种趋势,然而这将使得机场运行保障变的更加复杂。机位是机场的核心资源,机位分配是机场日常运行保障中的一个非常重要的工作。高效合理的机位分配方案不仅会给民航运输带来巨大的经济效益,并且在一定程度上可以提高民航运输的安全性。在机场停机位实时指派的问题上,国内外学者已经进行了很多模型与算法的相关研究。从已有研究来看,在机位实时指派算法中,仍需综合考虑多航站楼模式、航班波、协同决策、时隙交换公平性以及这4个因素的影响。
由于运输量增长,许多大型机场都通过扩容的方式来满足需求。其中.航站楼的改扩建使得一个机场多个航站楼的运行模式应运而生。在多航站楼运行中,有很多公共的资源需要共享,如机位、跑道等外场资源;旅客由于转机等原因需要在多个航站楼之间活动;飞机也可能因为调配原因而从一个航站楼转移到另外一个航站楼。因此,机场的运行调度算法必须能够满足以上种种运行上的需求。在多航站楼运行模式下进行资源分配时,必须充分考虑各种资源之间的联动关系才能做到协调运行。此时.值得注意的是应当将航站楼作为资源分配的一个基本判断依据。首先判断航班机位是否在不同航站楼之间调整,然后根据预先设定的各种规则再进行其他资源的变更,这样才能使系统的处理逻辑相对清晰和简单。
为满足日益增长的航空运输需求,航空公司纷纷考虑以航班波的方式进行排班。相应地,枢纽机场针对航班波进行各项航班保障工作,其中就包括停机位的指派。航班波是指,为实现航班有效衔接,在一个时段安排进港航班,在紧接着的另一个时段安排出港航班。当航班波不受延误影响时,机场资源可以得到高效利用,旅客的中转等待时间大大缩短。但是,如果航班波受到延误航班的影响.旅客的中转时间会大幅度上升。要使航班不受或尽量少受延误航班的影响,则需要实现机场、航空公司和空管的协同决策。然而,目前机场、空管和航空公司大多单独完成各自任务,没有达到协同决策的要求。
在实现航空公司与机场的协同决策时,需要考虑到时隙分配和机位指派的先后关系以及相互影响。当航班延误之后,航班所获得的时隙将会改变.但在航空公司不知道后续机位指派方案的前提下.无法判断延误航班获得的时隙方案所对应的最佳机位指派方案是否为所有可能的机位指派方案(时隙交换后)中延误成本最小的。因此,航空公司需要与机场进行协同决策。首先由航空公司给出不同时隙方案,机场给出不同时隙方案下机位指派的延误成本,根据最小延误成本确定最佳时隙交换方案,再将该方案告知航空公司。然而,在总的延误成本最小时还需考虑航空公司间的利益均衡,所以在进行时隙交换时,还要考虑航空公司问的利益均衡性.进行公平的时隙交换。
本文在协同决策的基础上综合多航站楼资源共享性、航班波延误最小化、时隙交换公平性等因素,建立机场停机位实时指派模型,并在混合集合规划中实现模型的求解。
l 机位实时分配模型
1.1 模型符号
2 求解方法
混合集介规划( Mixed set programming,MSP)源自逻辑规划与约束规划,是以一阶逻辑与集合推理为算法框架的逻辑求解系统。MSP能够将集合运算、量词、布尔逻辑、逻辑函数、日期/时间推理、数值约束等集成于一个系统,实现从实数、整数等数值类型扩充到布尔值、日期/时间集合类型的混合域上的全局推理,以及约束满足问题的建模与求解。此处,集合规划的概念并非指在问题求解中对集合运算符号、集合变量及集合约束的简单使用,而是系统地将集合推理与运筹学算法相结合,以集合变量为主进行问题建模,以基于集合推理的算法为核心进行模型求解。本文采用MSP方法求解下列算法。
2.2 停机位实时分配
步骤1 读取航班的机位预分配结果,航班对应的机位预分配信息,得到每个机位的可利用时间段。从时隙分配方案中得剑航班的时隙分配结果,包括带有航班波衔接的延误航班和没仃航班波衔接的延误航班。
步骤2对于没有航班波衔接的延误航班,根据航站楼{ at1,…,atn}分n次循环。将没有航班波衔接的延误航班根据最小延误费用原则和航站楼资源共享原则进行停机位分配。
步骤3 对于有航班波衔接的航班,考虑时隙公平交换的原则,根据不同的航站楼{ at1,…,atn}分n次循环.得到每个航站楼的延误航班时隙交换集合。根据有航班波衔接的航班和有时隙交换的延误航班.得到没有时隙交换的延误航班集合。根据最小延误费用原则和航站楼资源共享原则进行停机位分配。
步骤4 将步骤2.3的结果根据不同的航站楼进行综合,得到最终的各个航站楼的停机位分配。
在求解策略的设计中,将精确算法和启发式规则有机地结合在一起,既确保解的可行性,又灵活、个性化地控制搜索过程。启发式规则为:
(1)假设延误航班计划所属航班波为ωp,则其分配时隙所属的航班波必须大于等于ωp。
(2)航空公司进行时隙互换时,延误航班所处的航班波的数值应尽量相同。
(3)航班的停机位在不同航站楼之间调整要满足以下条件:
①不能是有航班波衔接的航班;
②调整后该航班产生的油耗费用不能大于该航班所属机型的平均油耗;
③调整后该航班的到达停机位时间不能大于该航班所属机型的平均滑行时间;
④调整后各航空公司的时隙交换满足公平性原则。
将上述两个算法的求解规则,结合不同的α,β值和约束条件.同时植入深度优先搜索算法中,一体化搜索确定延误航班的时隙分配集合与停机位指派集合.从而优化延误航班的时隙分配并最终确定满足多目标的停机位指派方案。
3 实例分析
3.1 实验数据
大型机场的航站楼比较庞大,分区也较为复杂.因此本文选取两个航站楼内4个区域9:00~11:00内到达的航班及机位分配情况进行优化,其中区域1和2属于一个航站楼,区域3和4属于另一航站楼:小、中、大机型分别用l,2,3表示;国航、东航、南航、海航分别用C.E.S,D表示。最小安全时问间隔T=5 min;旅客中转等待成本:1元/ min;飞机的油耗成本:7元/kg。飞机油耗:大型飞机46 kg/min,中型28 kg,/min.小型12 kg/min。航班信息见表1,各个区域的机位信息见表
2,延误信息见表3。
3.2 实验结果及分析
执行本文算法,根据时隙交换的优先级高于滑行油耗的原则,进行多次运算后,得到α=0.55,β=0.45。在满足时隙交换公平性的条件下,得到时隙交换结果如表4所示。
在不同的限定条件下,得到机位实时指派方案如表5所示,其中,初始方案表示航班尚未延误的机位初始分配方案;优化1方案表示航班延误后,进行合理的时隙交换但航站楼之间与航站楼符各区域之间的机位资源不共享时产生的机位指派方案;优化2方案表示航班延误后,进行合理的时隙交换且航站楼之间与航站楼各区域之间的机位资源可其享时产生的机位指派方案;优化3方案表示航班延误后,不进行时隙交换但航站楼之间与航站楼各区域之间的机位资源可共享时产生的机位指派方案。
初始方案中,滑行油耗为7 324 kg,旅客中转等待时间为369 600 min,因此,总成本为420 868元。优化1方案中,滑行油耗为7 342 kg,旅客中转等待时间为414 400 min,因此总成本为465 794元。优化2方案中,滑行油耗为6 736 kg,旅客中转等待时间为414 400 min,因此总成本为461 552元。优化3方案中,滑行油耗为6 844 kg,旅客中转等待时间为478 000 min,因此总成本为525 908元。各部分成本变化情况如图1所示。
对比优化方案1与优化方案2 可知,当资源共享时,飞机的滑油成本可以大幅度减小,从而降低最终的总成本。对比优化方案2和优化方案3可知,当时隙可交换时,旅客的中转等待时间可以大幅度减小,从而控制最终总成本。结果显示,本文提出的算法在实现了资源共享的同时也实现了时隙的有效交换,达到了控制延误成本的目标。
篇2
关键词:计算机;视觉技术;应用;分析
中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)03-0242-02
计算机人工智能技术中的一项重要技术就是计算机视觉技术,这种技术主要是让计算机利用图像来实现认知环境信息的目的,这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展,计算机视觉技术也得到了较快发展,并且在实际生产与生活中的应用也越来越广泛。
1 计算机视觉技术概述
1.1 基本概念
计算机视觉技术主要研究计算机认知能力的一门技术,其具体主要是通过用摄像机代替人的眼睛,用电脑代替人的大脑,最终使计算机具备类似于人类的识别、判断以及记忆目标的功能,代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术,通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说,计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上,利用计算机来分析、处理视觉信息的技术,它是现代社会新兴起的一门高新技术。
1.2 工作原理
在亮度满足要求的情况下,首先使用摄像机对具体事物的图像信息进行采集,利用网络把采集到的图像信息向计算机内部输送,然后在计算机系统内部处理加工图像信息会把事物的原始图像得到,随后利用图像处理技术进一步处理原始图像,获得优化质量效果之后的图像,分类与整理图像中有特征价值的信息,通过智能识别技术识别与描述提取到的图像信息特征,最后把得到的高层次的抽象信息存储起来,在进行识别事务时分析对比这些储存信息就可以实现事物的识别,这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示:
1.3理论框架
人类研究视觉技术虽然起步比较早,但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了,视觉技术是一项特别复杂的信息处理过程,要想对视觉的本质准确完整的理解,必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为:计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术,我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。
所以,可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程,其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次,可大致把计算机视觉技术划分为:低层视觉处理、中层视觉处理、高层视觉处理三个层次。
2 计算机视觉技术在自动化中的应用
2.1 农业自动化中计算机视觉技术的应用
在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况,便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量,例如可以应用计算机监测技术来监测大多数蔬菜的质量,传统的人工检测蔬菜质量的方法,不仅费时费力,而且检测结果的准确性也不能很好的保证,在实际人工检测过程中还容易伤害蔬菜,可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小,然后和质量达标蔬菜的光线能量大小进行对比,根据这些对比结果可以把蔬菜质量的好坏准确判断出来,在蔬菜质量检测过程中应用计算机视觉技术,把传统的蔬菜检测方法完全颠覆了,极大的方便了农产品的质量检测,由此可见,计算机视觉技术在农业生产中有很高的使用与推广价值。
2.2 在工业自动化中计算机视觉技术的应用
计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸,其测量与被测对象的原理如图2所示。
光学系统、计算机处理系统以及CCD摄像头,是计算机检测系统的主要组成,被测物体由光源发出的平行光束进行照射,利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上,然后再通过计算机处理这些图像,进而把被测部位的轮廓位置信息获取下来,若被测对象是出现位移时,可通过两次重复测量,利用两次测量的位置差就可以得出,被测物体的位移量。
此外计算机视觉技术还可以应用于逆向工程中,应用3D数字化测量仪可以快速准确的测出现有工件轮廓的坐标值,同时还能构建曲面,保存成CAD或CAM图像,把这些图像送入CNC制作中心加工,便可制作出产品,这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现,最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸,获得各部位数据,进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现,器具体轮廓结构示意图如下图3所示。
这种测量方法的工作原理为:利用激光穿越平行、等距的振幅光栅组件,或直接采用干涉仪发出的干涉条纹,形成平面条纹结构光,再向物体表面投射,由于物体各表面的深度与曲率的不同,条纹会自动出现变化,然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中,把图像信号转化为模拟信号,再转化为数字信号,然后经过传送再还原信号到图形处理系统,就得到三维轮廓图像。
在工业自动化中计算机视觉技术的深入广泛应用,不但使工业产品的生产质量得到了保障,而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量,封口质量以及印刷质量等等,如我国重点指定的印刷造币机器的南京造币厂,由于货币制造印刷是由印刷造币机器来实现的,所以要严格要求其生产工艺,一丝一毫的生产差错都不允许存在,为了保障印刷制造出来的造币机器质量完全达标,必须严格精确检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术,随着计算机视觉技术的不断进步,计算机视觉技术已经对印刷造币机器的需求完全满足了,实际的应用效果也非常理想,印刷造币机器在实际生产的过程中,南京造币厂把计算机视觉技术应用在了每个应刷造币机器最后的生产工序上,硬币受到重力下落的瞬间,计算机视觉技术可以瞬间采集图像的信息,准确拍摄硬币在下落过程中的图像,通过高速光纤传感器可以把硬币图像向计算机系统快速传输,利用计算机系统处理信息与识别信息的超强能力,可以及时识别硬币质量,经大量实践研究得出,在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生,由此可知,在工业自动化中计算机视觉技术的应用不但可行,而且发展空间还很大。
2.3 在医学自动化中计算机视觉技术的应用
在医学领域计算机视觉技术也得到了广泛应用,如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术,这些技术的广泛应用很大程度上方便了医生准确判断病人病情,另外,在生产药品的过程中,应用计算机视觉技术可以高效检测药品包装的合格与否,其基本流程是:传送装置先准确运输药品到指定位置,传送装置自身又可分为检测与分离两个区域,在传送药品的过程中药品的图像信息会被特定的摄像机采集,采集完成后向计算机系统传递采集信息,然后计算机系统会分析与处理这些信息,把没有包装好的药品自动识别出来,并且向分离区传递识别信息,分离区的自动装置会依据传输的分离信息,隔离开没有包装好的药品,这样就可以有效分类包装好的药品与没有包装好的药品,在药品包装检测方面应用计算机视觉技术代替传统人工检测,不但可以实现药品准确无误的检测,而且还可以大大提高检测药品包装质量的效率,完善了药品生产的自动化,由此可见,在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。
3 结束语
总之,计算机视觉技术是一门研究计算机识别能力的高新技术,它涵盖了很多其他技术,具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用,我们必须在明白其基本概念、工作原理以及理论框架的基础上,结合实际生产情况,不断进行深入研究,只有这样才能使计算机视觉技术得到更好地推广与应用,才能使这项现代化的高新技术更好的服务于社会,服务于人类。
参考文献:
[1] 龚超,罗毅,涂光瑜.计算机视觉技术及其在电力系统自动化中的应用[J].电力系统自动化,2003(1).
[2] 李永奎,刘冬.计算机视觉技术在农业生产中的应用[J].农业科技与装备,2011(6).
篇3
在我国市场经济不断发展的盛况下,我国科技发展水平也紧随其后,成为世界上的科技强国之一。在计算机水平的不断提高下,计算机视觉技术应运而生。其中,计算机视觉技术被应用与各个领域,并在各个领域都得到广泛有效的应用,比如军事领域、医疗领域、工业领域等。本文针对计算机视觉技术在交通领域中的应用进行分析。
【关键词】计算机视觉 交通领域 探究
近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。
1 计算机视觉的概述及基本体系结构
1.1 计算机视觉概述
通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。
计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。
计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。
1.2 计算机视觉领域基本体系结构
提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。
2 计算机视觉在交通领域的应用
2.1 牌照识别
车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。
2.2 车辆检测
目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。
2.3 统计公交乘客人数
城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。
2.4 对车道偏离程度和驾驶员工作状态判断
交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。
2.5 路面破损检测
最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。
3 结论
本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。
参考文献
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).
[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).
[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).
[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.
[6]王大勇.关于计算机视觉在交通领域中的应用分析[J].科技与企业,2013(01):115.
作者简介
夏栋(1988-),男,湖北省孝感市人。现为同济大学软件学院在读硕士。研究方向为计算机视觉。
篇4
[关键词] 物流企业; 自动化; 算法
[中图分类号] F252; TP39 [文献标识码] A [文章编号] 1673 - 0194(2013)06- 0058- 03
0 引 言
随着物流业被列入我国十大行业振兴计划,物流业已经成为我国经济发展的不可缺少的重要组成部分。物流业是我国经济运行的基础,是推动国民经济发展的重要支柱性产业之一。随着国家持续加强和改善宏观调控政策,物流业发展环境和条件不断改善,物流业保持了较快的增长速度。但由于中国物流业起步较晚,存在物流成本较高、管理落后等问题,离一体化、信息化的物流业还有一定差距。中国物流业只有应用现代物流的理念,采用先进的信息技术与运作方式,才能应对拥有技术、资金和管理优势的外国企业的竞争。实现传统物流业向现代物流业的转变,也是物流业自身结构调整和产业升级的需要,是整个国民经济发展的必然要求。我国经济要集约式发展,必然需要推进现代物流。现代物流的根本宗旨是降低物流成本、提高物流效率、满足客户需求,其中信息化是现代物流的核心。随着信息技术的不断更新和物流企业自身的发展,使得新兴的信息业务与传统物流业务之间相互介入,模糊了新兴信息技术及业务与传统物流业务的界限,从而模糊了物流业的产业属性和产业界限, 即发生了产业融合现象。产业融合是由于技术进步和放松管制的原因,发生在产业边界和交叉处的技术融合,在经过不同产业或行业之间的业务、组织、管理和市场的资源整合后,改变了原有产业产品和市场需求的特征,导致产业的企业之间竞争合作关系发生改变,从而最终造成产业界限的模糊化甚至重划产业界限。
产业融合促进了传统产业创新, 进而推进产业结构优化与产业发展,即产生创新性优化效应。物流信息化的重要性已经引起国内很多学者的重视,并纷纷提出相应的观点和建议。马健(2005)认为物流企业将在建立呼叫中心、应用系统领域和网络计算机领域出现信息化融合的趋势,并提出物流企业应采取的战略。邓小瑜(2011)等从技术融合、产品融合、业务融合、产业衍生4个层面阐述了物流业如何进行信息化建设。物流业与信息业的融合包含通过融合信息技术提高来增强企业竞争力和将信息业务增加到物流服务中形成新的业务2个方面。
视频摄像头在日常生活中非常普遍,但是利用率较低,大部分监控系统都是提供视频数据的线性存储,成为事后证据查找的有效手段。近年来,随着计算机视觉的发展,很多学者开始研究视频理解,尤其是针对视频信息检测与识别技术,建立有效的算法,实现底层图像处理技术与高层视频内容分析之间的关联,从而推动了计算机视觉在物流领域的应用,提高物流企业的竞争力。
1 计算机视觉的相关知识
1.1 计算机视觉的概念
20世纪80年代初,Marr从信息处理的角度,提出了第一个比较完善的计算机系统视觉框架。计算机视觉是指利用计算机模拟人眼的视觉功能,对图片或视频进行采集、加工、处理和识别,从中提取三维景物的形态和运动信息,解决物流、工业、商业等领域产品图像自动检测识别问题,提高检测识别效率和自动化程度。计算机视觉自动识别技术作为一门交叉学科,近年来受到各相关行业的高度重视。计算机视觉的处理流程为:摄像机图像采集图像处理计算机帧存储、图像识别控制逻辑显示器显示。
1.2 亮度要求
基于计算机视觉的硬件环境中,亮度是非常重要的因素。在计算机视觉中亮度的作用是突出物体的重要特征或使物体本身可见,而弱化物体其他不需要的特征或物体所处的背景。如果物体太亮或太暗,都会影响对物体的处理。
彩色物体反射光谱的某些部分,吸收其他部分。因此开发人员可以利用这个特点来提高某些物体的可视度。开发人员可以利用颜色之间的对比增强某种颜色或抑制其相反的颜色。例如,如果一个红色的物体在一个绿色背景中则应该加强红色,这时可使用红色照明。这样红色的物体会显得明亮,同时会变暗绿色的对象。
LED是目前用于计算机视觉的主要照明技术,相比白炽灯、日光灯等使用时间短、亮度逐渐减弱的特点,LED灯的寿命超过100万小时,而且耗电小,产生热量少。
1.3 计算机和摄像机的接口
常用的计算机和摄像机接口包括IEEE 1394、Ethernet、USB2.0 and Gigabit Ethernet等。
1.4 RGB介绍
RGB 颜色空间是实际应用最多的一个颜色空间,在使用计算机进行图像处理时,数字图像一般用RGB 空间存储和表示,分3个通道:红(Red)、绿(Green)和蓝(Blue),分别反映了颜色在某个通道的亮度值。3种原色光不同比例混合即使得人得到不同颜色的感知,这就是RGB颜色空间的由来。RGB 空间中每种颜色都能用三维空间中的一个点来表示。
2 计算机视觉在物流领域的优势
随着物流业的迅速发展,计算机视觉在条形码识别、运动物流跟踪方面逐渐得到应用。与传统方法相比,计算机视觉应用在物流领域的优势为以下方面。
2.1 灵活、低成本
物流系统中一般采用传感器来收集相关信息,但是传感器的位置是固定的,如果需要多方位的信息,必须同时需要多个传感器才能完成。利用计算机视觉摄像机和计算机来完成,只需要通过程序的设置和一台摄像机就可实现多方位信息的收集。
2.2 高效、准确
在一些人眼难以满足要求的场合,或不适于人工工作的环境下,用计算机视觉来代替人工视觉可以提高生产效率、信息的准确率。
3 计算机视觉在流水线中多方位跟踪计数的算法
物流企业在流水线产品的计数方法目前主要采用传感器,而利用摄像机所提供的视频信息可以实现多方位的跟踪。计算机视觉是一个集成系统,图像分析的时间有限,算法必须简单有效。本文采用的物流流水线视频图像如图1所示。图中红色矩形表示流水线中传输的物品,绿色区域为流水线中的物品处理区域。
系统会在视频图像中设计①、②、③、④四个计数区域,在物品进行相关处理前进行计数。计数方法为将每帧图像变为黑白图,图像中的红色变为白色,其余都变为黑色。当每幅图像中的红线部分中的白色像素超过一定阈值时,认为物体撞线,如图2所示,这时确定有需要计数的物品通过,可以开始计数。
3.1 主要算法
3.2 算法的运行结果
OpenCV是Intel公司开发的开源计算机视觉库。它提供了几百个C/C++函数,实现了计算机视觉领域中大部分最常用的算法。利用Intel开发的开源视觉库Intel OpenCV和VC6.0将上述算法转换为对应的源代码,可实现4个区域的物品计数。
3.3 算法的评价
该算法利用计算机视觉技术实现了物流流水线上的多方位计数,提高物流企业的信息化水平,节约了资金。算法简单,运行速度快,完全可以满足物流企业的实际需求。
4 结论与建议
本文所提出的算法实现了计算机视觉技术在物流企业的应用,为信息产业和物流业的融合提供了新的思路。但信息产业与物流产业的融合并不意味着引入信息技术后物流业的竞争力一定能提高。Berry(1995)指出了企业可以从6个方面来利用技术手段来提高竞争力,根据Berry的建议和我国物流业的实际情况,本文认为从以下几个方面来考虑如何通过与信息技术的融合提高物流企业的竞争力。
4.1 要有一个战略性的全局行动纲领
技术只是一种手段,使用技术的目的是为了企业发展服务,应符合全局发展的需要。因此物流企业高层管理者应该参与技术战略的制定,保证技术战略与全局战略一致,并有CIO(首席信息官)监控具体执行情况。而不应该盲目使用一些新技术或进行信息改革,造成企业不必要的损失。
4.2 解决主要问题
物流业作为服务行业其最终目的是为客户服务,使用信息技术的有效性应建立在为客户解决实际问题的基础上。因此信息产业与物流业的融合应体现在为客户提供更多的便利,或提供增值服务的基础上。
4.3 使用物流公共信息平台和建立物流信息系统,保证系统有效运转
通过现代物流公共信息平台的建设,企业可以及时获得需求信息,政府可获得物流业相关的调控和管理的宏观信息,实现互联互通。通过企业流程再造,利用含有CRM(客户关系管理)等模块的ERP系统,采用EDI(电子数据交换系统)、GPS、条形码、无线射频技术等先进技术,建立真正适应企业发展的符合现有服务模式的管理信息系统。
4.4 创新型物流人才的引进和培养
物流企业在自身提高业务流程和信息化水平的同时,还应注重创新型人才的引进和培养,特别是有国际大型物流企业管理和技术经验的复合型人才。
主要参考文献
[1] L Leonard,Berry. On Great Service:A Framework for Action[M]. New York NY:The Free Press,1995.
篇5
关键词 疲劳驾驶 人眼、人脸 嘴巴 专利
中图分号:C18 文献标识码:A
0引言
造成交通事故的原因25%-30%产生于疲劳驾驶,因此疲劳驾驶已成为诱发交通事故的重要因素。国内外专家和学者针对疲劳驾驶的检测开展了大量的研究工作,目前研究的重心主要集中在基于计算机视觉的疲劳驾驶检测,因此对基于计算机视觉的疲劳驾驶检测的相关专利进行分析尤为必要。
1基于计算机视觉的疲劳驾驶检测专利申请数据分析
1.1全球专利申请量趋势
从图1可以看出,基于计算机视觉的疲劳驾驶检测专利申请量从1990-2001年间处于技术研发初期,专利申请量相对较少。从2002年开始该领域的专利申请量逐渐呈现持续增长趋势,并在2014年达到最大值153件。由此可知,随着疲劳驾驶的增多,人们对疲劳驾驶的检测也越来越重视,相应的研究也正不断增加。基于此,在今后的一段时间内,相关的专利申请量有望继续保持。
1.2专利申请产出地区分布
目前各领域的专利申请量主要集中在中国、美国、韩国、日本和欧洲,通过对该领域在中国、美国、韩国、日本和欧洲的专利申请量进行统计分析发现,中国的申请量以48%的占比雄居第一,其他几个地区的申请量相差不大,具体如图2所示。
1.3在华专利申请量变化趋势
图3为1990年至2014年基于计算机视觉的疲劳驾驶检测在华的申请量变化趋势图,由该图可以看出,1990-2002年是技术的萌芽期,在2003年以后申请量才呈现逐年增长的趋势,并且在2012年-2014年将均维持在较高的申请量。因此,该领域国内虽然起步较晚,但是最近几年申请量相对其他地区却具有压制性的优势。
1.4在华主要申请人分析
图4展示了在华主要申请人的申请量份额,主要以科研院所和大型汽车企业为主,其中吉利汽车公司以领先优势排名第一。
2主要技术分支的专利申请分析
基于计算机视觉的疲劳驾驶检测的主要技术分支有:基于人眼的驾驶疲劳检测、基于人脸的驾驶疲劳检测、基于嘴巴的疲劳检测。下面从三个技术分支的发展概况、三个技术分支的主要工作原理及重点专利等方面进行分析。
2.1全球专利申请主要技术分支的申请量趋势图
由图6可知,近年来基于人眼和人脸的驾驶疲劳检测的申请量呈现较快增长,申请量也较基于嘴巴的疲劳检测的申请量大,体现了该领域近年来的发展趋势,并体现出基于人眼和人脸的驾驶疲劳检测的技术分支发展已较为成熟。三个技术分支在2006年之前,申请量的差别不大且数量均较小,显示出在2006年以前三个分支的区别并不明显,发展也较为缓慢,这说明基于计算机视觉的疲劳驾驶检测也是近10年才兴起的一项技术,它依赖于图像处理技术的发展水平。
2.2在华专利申请主要技术分支的申请量趋势图
由图7可知,三个技术分支在2006年以前均只有零星的申请量,这与该领域在全球的发展情况相符合,基于人眼的疲劳驾驶检测在华申请量自2006年以来呈现稳步增长,且近年来申请量最大。基于人脸的疲劳驾驶检测申请量虽小于基于人眼的疲劳驾驶检测,但近年来的申请量也呈现出稳步增长的势头。然而,基于嘴巴的疲劳驾驶检测虽有增长趋势,但申请量一直都较小。由此可知,在国内疲劳驾驶的检测主要是采用人眼检测和人脸检测,这两个分支是国内的研究的热门,也是今后国内在该领域的发展趋势。
3结语
通过对基于计算机视觉的疲劳驾驶检测专利的申请量的总体分析,以及基于人眼、基于人脸、基于嘴巴三个技术分支的申请量趋势分析可知,基于计算机视觉的疲劳驾驶检测在近10年取得了较快发展,这与计算机图像处理技术的发展密不可分;同时,科研院所作为该领域研究的主体,应加强与中小企业的合作。国内疲劳驾驶的检测研究主要集中在人眼检测和人脸检测,这两个分支是国内的研究的热门,同时,基于人眼的疲劳检测其发展方向明确,后续发展将集中在眼睛定位算法的研究上,并且定位精度将越来越高,越来越满足实际的要求。
参考文献
[1] 朱淑亮.基于视频图像分析与信息融合的驾驶员疲劳检测技术研究[J].济南:山东大学,2011.
[2] 刘学.基于人脸图像分析的疲劳驾驶检测方法研究[J].南京:南京航空航天大学,2012.
[3] 张灵聪,王正国,朱佩芳,等.汽车驾驶疲劳研究综述[J].人类工效学,2003.
篇6
关键词:农业机械;新技术;发展
1.农业机械新技术的应用和发展的重要性
我国是一个农业大国,农业是我国国民经济的基础,农业机械新技术的应用和发展具有重要的意义。
第一,提高机械的运作效率。目前在农业机械的使用方面,有的机械在使用过程中不能清晰地识别农作物的位置,比如,在收割小麦的过程中,有的小麦受到大风影响产生倒伏,对这些倒伏区域,机械在收割过程中很容易漏掉。所以在农业机械中使用新技术有利于弥补农业机械的漏洞,提高机械的运作效率。
第二,解放劳动力,促进经济发展。农业是一个需要大量年轻劳动力的行业,农业机械新技术的应用有利于实现农业种植、收割的自动化,解放劳动力。这些年轻的劳动力投入到其他的领域,有利于促进我国经济的发展。
2.农业机械新技术的应用
21世纪是个科技迅速翻新的时代,目前农业机械领域的新技术也层出不穷,下面介绍几种最新出现的农业机械新技术。
(1)计算机视觉技术。计算机视觉技术出现于20世纪70年代末,主要利用计算机视觉技术进行农产品品质和农产品等级的检查。计算机视觉是一种以图像处理为基础而兴起的学科,主要对视觉信息处理的计算理论、表达与计算方法进行研究。[1]随着计算机视觉技术应用领域的不断扩展,目前在农业机械生产方面,计算机视觉技术不仅能够用于检查农产品品质和分级,还可以用于播种和收割。但是由于计算机视觉技术在农业机械方面的使用时间比较短,一些技术难题还没有得到解决,所以计算机视觉技术在农业机械方面的应用还需要继续研究。
(2)人工智能技术。随着智能化的发展,智能技术在农业机械方面的应用也得以实现。美国运用人工智能技术发明了激光拖拉机,不仅可以控制拖拉机的行进方向,还能够对拖拉机进行具体的定位。[2]通过人工智能技术,人们建立了一个庞大的数据库,通过这个数据库可以对土地的具体情况进行掌握,以设计出具体的农业生产所需的化肥、种子、农药、水等原料的用量。
(3)机器人技术。比智能化更进步的就是机器人技术,机器人技术在农业机械中的应用,这是计算机信息网络和计算机视觉技术以及自动化控制等技术的结合的产物。目前研发出了除草机器人、播种机器人、浇水机器人、施肥机器人等,利用机器人进行农业生产活动,可以节省人工费用,解放劳动力,避免有些农业生产活动,对人体产生危害。
(4)自动控制技术。在农业机械中运用自动控制技术,可以帮助操作者降低操作难度,同时可以根据地势的高低和秸秆的长短来调节高度,保证机械使用过程中的安全性,提高农业机械使用的可靠性,提高农业生产效率。
3.农业机械新技术的发展
农业机械新技术的应用和发展都是为了提高农业的生产率服务的,所以农业机械新技术的发展主要表现为以下几点:
第一,加速新技术的使用和推广。科学技术是第一生产力,加速计算机视觉技术、自动控制技术、智能化技术等新技术在农业机械中的使用,同时引进国外先进的机械新技术,对推动我国农业的发展,提高农业的生产效率具有重大的意义。
第二,政府补贴。新型机械的购买都是生产个体自行组织的,资金压力大,使得机械新技术难以推广,所以对于农业机械新技术的推广使用,政府要在物质上予以补贴,拓展新机械的使用范围。
第三,提高农业资源利用效率。机械使用的目的就是为了提高农业的生产效率,提高农业资源的利用率。例如,在传统的农业生产过程中,对农作物秸秆的处理方式,绝大多数情况就是焚烧,不仅浪费资源,而且污染空气。但是农业机械新技术的使用通过将农作物的秸秆进行粉碎处理,将农作物秸秆转化为肥料,不仅提高了农作物资源的使用效率,也减小了空气的污染程度。
4.结语
随着科技的发展,计算机视觉技术、自动控制技术、智能化技术等新技术在农业机械方面的应用越来越广,农业机械新技术的应用和推广将大大提高我国农业的生产效率,提高农业资源的利用率,促进国民经济的发展。
参考文献:
[1]田 静.探讨农业机械新技术的应用与发展[J].中国农资,2013(36): 74.
篇7
关键词:计算机;视觉技术;交通工程
中图分类号:TP391 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01
一、引言
随着科技的发展,计算机替代人的视觉与思维已经成为现实,这也是计算机视觉的突出显现。那么在物体图像中识别物体并作进一步处理,是客观世界的主观反应。在数字化图像中,我们可以探寻出较为固定的数字联系,在物体特征搜集并处理时做到二次实现。这既是对物体特征的外在显现与描绘,更是对其定量信息的标定。从交通工程领域的角度来看,该种技术一般应用在交管及安全方面。监控交通流、识别车况及高速收费都是属于交通管理的范畴;而对交通重大事件的勘察及甄别则是交通安全所属。在这个基础上,笔者对计算机视觉系统的组成及原理进行了分析,并形成视觉处理相关技术研究。
二、设计计算机视觉系统构成
计算机视觉处理技术的应用是建立在视觉系统的建立基础上的。其内部主要的构成是计算机光源、光电转换相关器件及图像采集卡等元件。
(一)照明条件的设计。在测量物体的表征时,环境的创设是图像分析处理的前提,其主要通过光线反射将影像投射到光电传感器上。故而要想获得清晰图像离不开照明条件的选择。在设计照明条件时,我们通常会视具体而不同处理,不过总的目标是一定的,那就是要利于处理图像及对其进行提取分析。在照明条件的设定中,主动视觉系统结构光是较为典型的范例。
(二)数据采集的处理。如今电耦合器件(CCD)中,摄像机及光电传感器较为常见。它们输出形成的影像均为模拟化的电子信号。在此基础上,A模式与D模式的相互对接更能够让信号进入计算机并达到数字处理标准,最后再量化入计算机系统处理范围。客观物体色彩的不同,也就造就了色彩带给人信息的差异。一般地黑白图像是单色摄像机输入的结果;彩色图像则需要彩色相机来实现。其过程为:彩色模拟信号解码为RGB单独信号,并单独A/D转换,输出后借助色彩查找表来显示相应色彩。每幅图像一旦经过数字处理就会形成点阵,并将n个信息浓缩于每点中。彩色获得的图像在16比特,而黑白所获黑白灰图像则仅有8比特。故而从信息采集量上来看,彩色的图像采集分析更为繁复些。不过黑白跟灰度图像也基本适应于基础信息的特征分析。相机数量及研究技法的角度,则有三个分类:“单目视觉”、“双目”及“三目”立体视觉。
三、研究与应用计算机视觉处理技术
从对图像进行编辑的过程可以看出,计算机视觉处理技术在物体成像及计算后会在灰度阵列中参杂无效信息群,使得信息存在遗失风险。成像的噪声在一定程度上也对获取有效信息造成了干扰。故而,处理图像必须要有前提地预设分析,还原图像本相,从而消去噪音。边缘增强在特定的图像变化程度中,其起到的是对特征方法的削减。基于二值化,分割图像才能够进一步开展。对于物体的检测多借助某个范围来达到目的。识别和测算物体一般总是靠对特征的甄别来完成的。
四、分析处理三维物体技术
物体外轮扩线及表面对应位置的限定下,物体性质的外在表现则是其形状。三维物体从内含性质上来看也有体现,如通过其内含性质所变现出来的表层构造及边界划定等等。故而在确定图像特征方面,物体的三维形态是最常用的处理技术。检测三维物体形状及分析距离从计算机视觉技术角度来看,渠道很多,其原理主要是借助光源特性在图像输入时的显现来实现的。其类别有主动与被动两类。借助自然光照来对图像获取并挖掘深入信息的技术叫做被动测距;主动测距的光源条件则是利用人为设置的,其信息也是图像在经过测算分析时得到的。被动测距的主要用途体现在军工业保密及限制环境中,而普通建筑行业则主要利用主动测距。特别是较小尺寸物体的测算,以及拥有抗干扰及其他非接触测距环境。
(一)主动测距技术。主动测距,主要是指光源条件是在人为创设环境中满足的,且从景物外像得到相关点化信息,可以适当显示图像大概并进行初步分析处理,以对计算适应功率及信息测算程度形成水平提高。从技术种类上说,主动测距技术可分为雷达取像、几何光学聚焦、图像干扰及衍射等。除了结构光法外的测量方法均为基于物理成像,并搜集所成图像,并得到特殊物理特征图像。从不同的研究环境到条件所涉,以结构光法测量作为主要技术的工程需求较为普遍,其原理为:首先在光源的设计上由人为来进行环境考虑测算,再从其中获取较为全面的离散点化信息。在离散处理后,此类图像已经形成了较多的物体真是特征表象。在此基础上,信息需要不断简化与甄别、压缩。如果分析整个物体特征信息链,则后期主要体现在对于数据的简化分析。如今人们已经把研究的目光转向了结构光测量方法的应用,体现在物体形状检测等方面。
(二)被动测距技术。被动测距,对光照条件的选择具有局限性,其主要通过对于自然光的覆盖得以实现。它在图像原始信息处理及分析匹配方面技术指向较为突出。也通过此三维物体之形状及周围环境深度均被显露。在图像原始信息基础上的应用计算,其与结构光等相比繁杂程度较高。分析物体三维特性,着重从立体视觉内涵入手,适应物体自身特点而存在。不过相对来说获得图像特征才是其适应匹配的条件保障。点、线、区域及结构纹理等是物象特征的主体形式。其中物特较为基础与原始的特征是前两个特征,同时它们也是其他相关表征的前提。计算机系统技术测量基本原理为对摄像机进行构建分析,并对其图像表征进行特征匹配,以得到图像不同区间的视觉差异。
五、结束语
通过对计算机视觉技术的研究,悉知其主要的应用领域及技术组成。在系统使用的基础上深入设计,对系统主要构成环节进行分析。从而将三维复杂形态原理、算法及测量理论上升到实际应用。随着社会对于计算机的倚赖程度增加,相信该技术在建筑或者其他领域会有更加深入的研究及应用。
参考文献:
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2012(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2011(04).
篇8
关键词:三目摄像机;标定;立体视觉;外部参数
一、绪论
1.1研究的背景及意义
计算机视觉是当今极为重要的学科之一,它在具有很强的挑战性的同时又拥有广泛的应用前景和实用价值。计算机视觉以视觉理论为中心,以图像处理、模式识别、计算机技术和生理学、心理学为基础,研究内容主要有两个方面:一是开发从输入图像数据自动构造场景描述的图像处理系统;二是理解人类视觉机理,用机器代替人去做人类难以达到或根本无法达到的工作[1]。
计算机视觉应用的广泛性体现在其不仅用于文字、指纹、面部、商标以及图像数据库、检测集成电路芯片、多媒体技术这些图像方面,还应用到机器人导航、工业检测和产品的自动装配、CT图像器官重建和遥感照片解释等空间物体的定位、识别以及重建上。现如今,计算机视觉已经应用到机器人、地理、医学、物理、化学、天文等各大的研究领域。
作为多个学科交叉与融合中心的计算机视觉,摄像机是其研究的重要工具,而摄像机标定又是计算机视觉研究的一个关键问题,故摄像机的标定越来越受到广泛的重视。摄像机标定是通过物体空间上的点与图像中的对应点的几何关系,来确定摄像机的内外参数的过程。标定结果是否准确影响着三维测量的精度和三维重建的结果,而且实时的标定更能满足自动导航机器视觉的需要[2]。
伴随着应用的发展,摄像机广泛地被应用于三维立体的测量、视觉检测、运动检测等领域。由此,对摄像机标定的精度要求也日益增加。摄像机标定结果的优劣影响了计算机视觉在各领域的应用。摄像机标定的准确与否,对能否提高计算机视觉在各领域测量的准确度有重要影响[3]。因此,研究摄像机标定方法具有重要的理论研究意义和实际应用价值。
1.2摄像机标定技术研究的发展及现状
摄像机有一个图像平面和提供三维空间到图像平面转换的镜头。由于镜头会产生畸变,不能把这个转化过程简单描述为投射变换。所以它表示的是畸变的模型,这些模型近似于真实数据,而其精确性则依靠于建立的模型及模型参数的准确性。
首先进行摄像机标定工作的是加拿大的Deville,他于1910年建立实验室,使用多个瞄准仪对他的“测量摄像机”(surveying camera)进行标定[4]。上个世纪三十年代后期,美国标准局发明了一种精确镜头,用来检测摄像机,同时将它用在摄像机标定上。四十年代后期,该项工作得到进一步加深,有了更多对高精度的需求和对易操作设备的需求。1955年,Carman出版了 《棋盘平面度的干涉测量和控制》,该书引起了社会各界对摄像机标定的关注。二战时期,随着飞机的大规模使用,航空摄影与制图兴起,为得到更加精确的测量结果,对摄像机镜头的校正要求也变得更高。五十到七十年代也是镜头校正技术发展最为迅速的时间段。在这期间,各种镜头像差的表达式逐步被提出并且得到普遍认同与采用,建立了很多的镜头像差的模型,D.C.Brown等人作出了比较大的贡献,他们导出了近焦距情况下给定位置处径向畸变表达式并证明了近焦距情况下测量出镜头两个位置的径向畸变就可以求出任何位置的径向畸变[5]。这些径向与切向像差表达式成为后来各摄像机的标定非线性模型的基础。这段时间里,研究的重点是如何校正镜头与用何种方法补偿镜头像差,这些研究对促进各性能镜头组的研制起到了重要作用。在1999年,张正友提出了一种简便的摄像机标定方法,该方法介于传统标定和自标定之间,操作方便灵活,能够得到不错的精度,满足了众多拥有桌面视觉系统的用户在摄像机标定方面的需求。
1.3本文的主要研究内容
本文的主要研究多个摄像机的标定问题。标定主要是对摄像机内外参的测量计算,利用这些参数对多个摄像机识别的物体尺寸进行衡量并建立起多摄像机系统的数字环境。
论文的内容包括:
第一章为绪论,介绍摄像机标定相关的研究背景、国内外研究现状。
第二章为摄像机标定理论基础:主要介绍标定的坐标系与待标定的参数。
第三章提出本文的多摄像机标定方法与实验过程。
第四章进行全文的总结。
二、摄像机标定方法研究
2.1摄像机标定原理
摄像机通过透镜将三维物体投影到--维图像平面上,这个成像变换的过程称为摄像机成像模型。摄像机成像模型有多种,最常用的为小孔成像模型。由于实际的摄像机镜头会发生一定的畸变,使得空间点所成的像不在线性模型描述的位置而会发生一定的偏移,为了能准确的标定摄像机参数,标定的过程中要考虑非线性畸变因子。
一般来说,得到标定结果后要对其精度进行评估,然而很难得到准确的摄像机标定参数真值作为参考,其中基于图像坐标和世界坐标的绝对和相对误差的评价方法应用广泛,本文将对这些方法的原理进行探讨。
2.2摄像机标定坐标系建立
首先定义了四个坐标系,如图1所示,图像坐标系的坐标原点为O0,列与行由坐标轴u和v表示;成像平面坐标系的原点是摄像机光轴与图像坐标系的交点0l,x、y 轴分别与u、v 轴平行;在摄像机坐标系中,坐标原点0c即为在摄像机的光心,Xc、Yc轴与x、y 轴平行,与图像平面垂直是摄像机光轴作为Zc轴,0c0l为摄像机焦距f;世界坐标系是假想的参考坐标系,可固定于场景中某物体上,用于描述摄像机的位置,由Xw,Yw,Zw轴组成。
图(1)
2.3摄像机外部参数构成
主动视觉传感器从在笛卡尔直角坐标系中的运动表现为相应的旋转矩阵和平移矩阵,故摄像机外部参数表现为旋转矩阵R和平移矩阵T,则摄像机坐标系与世界坐标系的转化关系可以表示成:
上式中(Xc,Yc,Zc)表示空间点在摄像机坐标系下的坐标,(Xw,Yw,Zw)表示空间点在世界坐标系下的坐标。根据靶标点在像空间坐标系和物方空间坐标系中的坐标,通过分解旋转矩阵线性计算像空间坐标系与物方空间坐标之间的转换参数,即外方位元素(摄站参数)[6]。
2.4各摄像机相对位置确定
三目摄像机拥有三个视觉传感器,而三个传感器之间的相对位置可通过已获得的外部参数进行确定。将三个摄像机坐标系设置为,Oci xci yci zci(i=1,2,3),由2.3中所介绍的内容可知,这三个摄像机坐标系与世界坐标系的关系为:
i=(1,2,3)
由此我们可以得到任意两个摄像机i,j的坐标系转换关系:
其中: = = i,j=1,2,3
三、摄像机标定实验过程及结果
3.1实验系统介绍
实验中被用来标定的是一个多摄像机系统,摄像机标定有关的基本参数、系统组成和开发环境如下:
(1)硬件环境
标定板、三目摄像机和图像采集卡等。
(2)软件环境
OpenCV开源视觉库,它仅由一系列C函数和少量C++类构成,为Python、MATLAB等语言提供了接口,在图像处理和计算机视觉方面实现了很多通用算法。
3.2实验过程
本系统以棋盘格模板作为标定模板。采用激光打印机打印棋盘格黑白方块间隔纸,方块边长为3cm,共6行9列,将打印纸固定在一块平板上,作为标定模板,如图(2)。安装三目摄像机系统,调节固定好个摄像机位置,如图(3)。手持标定板在三目摄像机前方各个位置拍摄5组共15张各姿态的照片,利用Canny算子进行像点灰度中心提取、同名像点匹配并解算出三个摄像机在标定板坐标系中的外部参数值。
3.3标定结果
摄像机1:
R= T=
摄像机2:
R= T=
摄像机3:
R= T=
四、总结
随着计算机技术的高速发展,计算机视觉成为当今热门的研究课题,受到了广泛关注。本文就如何在机器视觉的理论基础上对三目视觉系统进行标定进行了研究,讨论了计算机视觉理论知识,分析摄像机标定原理以及标定坐标系的建立。同时通过计算机视觉知识的分析讨论了基于三目视觉系统的摄像机标定技术,完成了三目视觉系统的外部参数标定实验。三目摄像机测量系统外部参数的标定能够解决测量作业现场、测量控制场建立难的问题,为快速地建立简单实用的控制场提供了方案,有一定的实用价值。
参考文献
[1] 荆丽秋.双目视觉系统标定与匹配的研究与实现[D].哈尔滨工程大学,2009.DOI:10.7666/d.y1489086.
[2] 马颂德.计算机视觉―计算理论与算法基础[M].北京:科学出版社,1998.
[3] 王荣一.摄像机标定及关键技术研究[D].哈尔滨理工大学,2011.DOI:10.7666/d.y2012483.
[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66
[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.
[6] 范亚兵,黄桂平,高宝华等.三目立体工业摄影测量系统外部参数的快速标定[J].测绘工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013
篇9
生活中,每个人都问过别人“这件衣服是从哪买的?”“这双鞋是什么牌子的?”这一问题很快会被AI技术解决,只需要拿出手机对着物品拍照,就会得到商品的各种信息,并且能一键买买买。这就是美国著名图片社交网站Pinterest(拼趣)即将推出的应用图片识别购买业务。
Pinterest总裁Tim Kendall表示,“Pinterest可以即刻在存储750多亿张图片的巨大网络空间内进行搜索,从而为用户找到与所拍摄照片相似的配对图片,以及查找到哪些地方能够买到他们所需的商品。”
目前,Pinterest的估值已经达到了110亿美元,该公司的专注点正在向营收增长和创收方面转变。相比Facebook、Twiter等社交网站,Pinterest已经率先找到了一条清晰的创收道路。
从兴趣到产品
亚里士多德曾经说过,古往今来人们开始探索,都应起源于对自然万物的惊异。科技的进步也是如此,就像微软研发主管和项目负责人Mitch Goldberg所说:“我们想通过该应用向人们展示识别技术的无限魅力。”
今年2月,微软旗下的Garage实验室了一款名为“Fetch!”的应用,它可通过机器学习系统识别照片中宠物狗的品种并用文字对该品种进行简单的介绍。
随着计算机视觉领域开始利用深层神经网络这种模仿人类大脑生物过程的系统来从事机器学习,识别的精确度实现了巨大飞跃。也就是说通过机器学习技术,Fetch!识别的准确度会越来越高,随着大量图片的涌入,Fetch! 可以自我修复错误,从而更加精确地识别每一只狗的样貌、形态、动作。除了测试狗类品种以外,你还可以把朋友的照片上传至平台,看看他们能够对应出哪种宠物。
微软的这款产品基于目前最为热门的一种图像识别技术――“深度神经网络”,同样基于这种技术,微软还有另一款有趣的产品:。去年5月,有超过5.75亿图片被提交到,超过8500万来自世界各地的使用者访问了这个网站,只为寻找一个简单问题的答案――颜龄机器人认为我看起来像几岁?如果是合照,并且颜龄机器人识别出的自己比周围人年龄小,则更能引发用户的兴趣,这种“损人利己”的识别应用着实在社交媒体上火了一把。
另一让计算机视觉研究技术人员特别感兴趣的领域是生物识别,当下最为火爆的莫过于人脸识别技术了。早期的人脸识别技术多为安防领域,如海关识别走私犯、商店识别小偷等。近年来,深度学习的研究与应用使得人脸识别和人工智能的核心技术得到了极大的提升,摄像头等图像硬件的发展为人脸识别提供了很好的图像基础,如今人脸识别技术应用更加广泛,比如公司可以使用刷脸打卡来杜绝代人打卡签到现象。
其实早在2012年,谷歌就开发出了安卓系统的“刷脸解锁”技术,但因安全问题未解决,该技术一直未能得到普及。
而今年3月,电商巨头亚马逊提交了一项针购物付费的专利技术,即消费者在亚马逊网站购物时可以通过自拍或者视频来进行付费,无须再输入账号密码。在消费时系统会提示用户表现出特定的行为、情绪或手势来证明消费者就是本人,而不是拿着照片的冒名顶替者。
亚马逊表示,这项技术能使消费者更加安全地进行网上购物,因为很多用户为了省事会把所有账户都用同一个密码,或者把密码记在手机里,一旦遭遇“撞库”或者手机被盗,后果不堪设想,而刷脸技术则没有这个风险。
除了识别人脸,在识别其他生物方面也有了突破性进展,比如识别寄生虫。疟疾,是一种由疟原虫造成的全球性急性寄生虫传染病,据统计,2015年有大约有2.14亿人受疟疾的影响。
一直以来,医疗工作者是通过肉眼观察采样玻片来确定采样对象是否被疟原虫感染,这不但是对医疗工作者经验的考验,而且工作效率也十分低下,而贫困地区一直都缺乏有经验的医疗工作者。
今年2月,根据MIT Technology Review报道,Intellectual Ventures Laboratory(智能事业实验室)开发出了能够检测和评估疟疾感染的便携式显微镜。这种显微镜采用的是一个名为“Autoscope”的系统,通过计算机视觉和深度神经网络技术,采用深度学习算法来鉴别疟原虫。这款便携式显微镜今年在泰国实地测试,成功鉴别出了 170块玻片中的疟原虫如果这项技术得到普及之后,只要诊所有一台Autoscope显微镜和一些载玻片,就可解决疟疾的诊断问题,这将使疟疾诊断不再依赖于有限的专业医疗人员。
技术转化为产品
新技术的出现,让计算机不但“看见”这个世界,更能“看懂”这个世界,可以代替人眼甚至超越人眼。
人的视野是有限的,并且会受到周边条件的影响,驾驶员在开车时会有视野盲区,还会受到光线的影响,并且大雾、暴雨等极端天气也会严重影响驾驶员的视线。而计算机视觉技术就不一样了,视野会更开阔,受限制更小。根据汽车媒体《Leftlane》报道,福特公司最新的无人驾驶汽车研究计划是由激光感应(LiDAR)和雷达、摄像头形成一张周围环境的高清3D地图,不但让无人驾驶汽车看到摄像头视野范围之外的物体,而且并不受光线限制。在夜间试驾后,福特工程师Wayne Williams说:“坐在汽车里,我能感到它在走,但是我往车外看,只能看到一片漆黑。结果令人惊喜,车辆准确地沿着蜿蜒的道路行驶。”
识别场景这一领域技术的发展,使得计算机不但能当机器的眼睛,还能变成人类的眼睛。
对于双目失明的人来说,能亲自感知这个世界是梦寐以求的事,而微软2016 Build开发者大会上Seeing AI项目正是要帮助盲人实现这一愿望。
Seeing AI项目是通过计算机视觉和自然语言去形容一个人的周围环境、朗读文本、回答问题以及识别人的面部表情,可以在手机上使用,也可以在Pivothead的智能眼镜上使用。如果投入使用,将有助于为视障人士营造更公平的环境,是一款能够真正改变人们生活的产品,就像此项目的高级项目经理Anne Taylor所说的,这是“为真正重要的场景寻求解决方案”。也许不久微软能开发出一种仿生眼,直接发送视觉信号到大脑,让盲人真正看到这个世界。
篇10
【关键字】行人检测 目标检测 图像处理
一、引言
在计算机视觉领域中,行人检测是目标检测的一个重要研究热点,其主要利用各种传感器获取行人的数据信息,通过图像处理及模式识别等算法从图像数据中检测出行人。其中传感器包括激光、雷达等。行人检测并不是孤立存在的,它与行人跟踪、行为分析、姿态估计、场景分割等问题息息相关,因此具有极高的科研价值和商业价值。
二、行人检测技术发展趋势
如图1所示,早在2007年开始就已经出现了行人检测技术的研究。2007至2010年期间,专利申请量虽然呈逐步增长趋势,然而增长速率较平稳,每年的申请量没有太大的变动;2011年相比较于2010年增长率达到两倍以上,此后2012年和2013年相较前一年都有较大的增长量,然而在2014年专利申请量与其前一年2013年相比,呈现减少的趋势,这可能与发明专利未提前公开有关,但该年的总量在除2013年以外的其它各年中仍占有绝对性的优势,预计2014年申请量不会低于2013年。
三、行人检测技术解析
常见的行人检测方法可分为基于简单的图像处理的行人检测方法和基于计算机视觉的行人检测方法。
3.1基于简单图像处理的行人检测技术
该类技术主要分为:帧间差分法、光流法和背景差分法等。其与基于计算机视觉的技术相比算法较为简单,不需要事先准备大量的训练样本或模板,处理速度也较快,因此在国内也占据一定的申请量。如上海交通大学的专利CN201210586125采用高斯混合模型对背景建模从而检测行人,宁波大学的专利CN201210017307采用图割方法进行行人检测,奇瑞汽车股份有限公司的专利CN201310382009通过获取候选区域的至少两个特征图进行候选区域是否包含行人的判断。
3.2基于计算机视觉的行人检测方法
基于统计学习的方法与其他方法相比占绝对性的优势,是最近几年高校和科研院所所研究的重点,同时也是公司企业发展的方向。如北京中星微电子的专利CN200710179786采用积分图像和平方积分图像提高分类器的检测速度,江苏大学的CN201110447411对特征向量进行稀疏表示并组合成稀疏化的混合特征向量作为分类器的特征进行行人检测。
特征和分类器是统计学习的两大关键技术。对特征的改进占56%,如中国科学技术大学的专利CN200810101705利用种群优化寻找行人检测最优特征进行行人检测,北京博康智能信息技术有限公司的专利CN201210082846利用梯度特征和线性边缘特征进行行人检测;
分类器的改进分别占42%,如杭州海康威视数字技术股份有限公司的专利CN201210169536利用多尺度的Adaboost作为分类器进行行人检测,无锡慧眼电子科技有限公司的专利CN201310076413首先基于Adaboost得到级联分类器。