计算机视觉的核心范文

时间:2023-12-28 17:40:31

导语:如何才能写好一篇计算机视觉的核心,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

计算机视觉的核心

篇1

关键词:行政事业单位 预算 收支管理 问题 对策

中图分类号:F812

文献标识码:A

文章编号:1004-4914(2015)10-140-02

财务管理是一项十分复杂且重要的工作,管理工作中涉及许多账务问题,而预算及其收支管理作为整个财务管理系统中最重要的管理部分,其管理水平和质量将直接影响着整个财务部分的质量。由于行政事业单位自身的属性是以服务为目的,在市场经济不断发展和进步的同时,事业单位的成本预算及收支结算已发生了变化。因此,探讨、分析财务管理工作中存在的问题具有重要的作用和意义。只有从这些问题中具体分析,根据其原因,并积极制定行政事业单位财务管理方面的具体对策,才能解决工作中存在的问题,为全面提高行政事业单位的预算及收支管理提供重要的途径。

一、行政事业单位预算及收支管理中存在的核心问题分析

从目前现状分析,在我国事业单位工作体系中,在财务管理方面有了明显的改善,其资金预结算水平,财务资源的整合以及资金的使用效率等方面有了改善,这些对于廉政建设有着积极的作用。为了促使行政事业单位进一步提高财务管理方面的工作水平和质量,本文主要针对在具体工作中存在的问题进行研究,根据客观工作分析,在预算和收支管理方面存在的问题主要从两个方面进行研究,具体表现在:

1.预算管理中存在的问题。行政事业单位中,财务管理方面,其预算工作存在的问题主要表现在:

(1)预算意识尚不明确。目前在我国行政事业单位中,由于受到以前年度预算意识以及办公习惯等影响,基本上是将其具体措施进行延续,在单位财务管理事项中,预算管理仅仅作为一种工作思维方式进行延续,并没有在管理中发挥更大的作用。各个办公部门在具体工作中的参与意识以及积极性不高,这就导致预算管理体系受到一定的局限性,另外,在编制预算的过程中,主要的目的是为了获取预算结果,这就忽视了在预算过程中的一些论证和核实,并且在一定程度上导致预算管理部门的功能失去了自身的效益,并没有发挥办公效益。

(2)预算编制缺乏科学性和合理性。在具体办公过程中对预算编制投入的时间比较短,这就难以保证预算结果。大部分行政事业单位将预算编制工作归纳到财务管理中,其大量的工作数量,在较短时间内难以完成,严重影响了相关部门的积极性和工作态度。从而导致预算编制的不科学以及不合理,预算编制的质量难以保证。

(3)缺乏预算执行力度。在当前行政事业单位的预算执行考核意识不足,相关单位在完成工作之后,没有对其进行预算分析、控制以及考核评价等,影响了预算功能,促使预算结果得不到有效的保障。

(4)预算监督部门工作弱化。由于预算监督是一项系统性工程,需要相关部门联合运行,然而在当前预算工作中由于对系统和深度检查不到位,缺乏一定的连续性,这就导致预算监管受到一定的影响。另外,在办公过程中相关部门没有积极地配合,也影响了财务预算的效果。

2.收支管理中存在的核心问题。在一些行政事业单位财务管理方面,其收支管理工作存在的问题主要表现在:

(1)收支计量与会计核算方面存在的问题。在当前,一些行政事业单位在办公过程中,在会计核算中出现了不规范现象。这就造成财务申报失效,相关的票据以及报表等内容没有真实性效果。同时由于在行政事业单位中,财务管理包含的内容比较多,当发生了物资采购环节与付款相脱节之后,就会造成账面与实际出现差异,在经济上不具有真实效力。

(2)制度问题。针对当前我国国库管理实行的是分级分散收付制度。但是由于这些制度是建立在预算范围具有多重性的基础上实施的,因此在具体应用过程中就造成预算单位的账户管理比较混乱。另外,目前行政事业单位在具体财政支出环节,由于监管与实践存在一定脱节现象,因此这就导致了财政资金的浪费或者流失现象比较严重,造成具体的收支管理出现问题。

(3)收支管理控制方面存在的问题。收支管理主要延续以前工作状况,这就造成现在的收支管理工作没有真正做到收支两条线,共同监管。另外,在支出环节中使得原始财务不具有真实的核实效果,出现了先支出后申报的现象,造成财务收支管理出现漏洞。

二、行政事业单位预算及收支管理的对策分析

目前在行政事业单位办公过程中,其财务管理中仍然存在很多问题,这些问题严重制约着财务管理工作水平的提升。笔者通过上述分析和研究,结合自身多年的经验,总结并归纳出一些解决财务管理中存在问题的建议和措施,具体有以下几点:

1.提升预算的意识,鼓动全体员工参与。由于行政事业单位在预算工作中包含的内容比较多,因此在具体工作中需要全体员工提高预算意识,积极参与,从各个细节中做起,做小、做细、做实,才能增强预算的科学性和有效性。可以设立相关的奖惩机制,针对在工作中遇到的问题具体分析,切实保证管理的实效性和高效性。

2.合理安排预算编制的时间和方法。在具体工作中要编制一个严谨的预算编制系统,在时间和方法上要科学合理。应该给予足够的预算时间进行调查预测和论证分析。在具体方法上要采用“摒弃上年基数,本年调整”的措施,深入贯彻收支分离政策,提高工作效率。

3.建立健全预算考核制度,加强执行力度。为了增强预算考核结果,这就要有效地执行预算和收支管理,以良好的考核制度作为保障。在考核评价中要分为全面评价和动态评价两种方式,从整体和部分具体实施,提高工作效率。

4.强化预算监管力度,保证支出管理的科学性。在具体工作中要细化财务管理机构的职能,为预算和支出提供组织保障,在预算编制、执行以及协调和审核等方面要针对具体的问题及时制定对策,强化监管力度。在强化预算监管力度和保证支出合理中要做到公开、透明、科学化,适当引入社会公众以及媒体等机制,促使财务管理工作具有公开性和公正性。

三、总结

综上所述,行政事业单位在财务管理工作中,针对预算和收支管理问题具有一定的系统性和高效性,因此本文针对在具体工作中存在的问题进行探究,并提出了相关对策,其主要的目的是增强预算收支管理的科学性、合理性和高效性,提高国家资源的利用率,进一步加强廉政建设,整合国库资源,促使行政事业单位在财务管理工作中不断进步,这些对于提升国家建设以及社会发展具有深远的意义。

参考文献:

[1] 刘华强,龚丽丽,刘艳波,薛辉.预算绩效管理改革与行政事业单位财务管理模式探讨[J].首都经济贸易大学学报,2013(16)

[2] 盛建英,朱江,张雪,徐克.新财政体制下行政单位财务管理研究:问题及对策[J].财政科学研究,2014(17)

[3] 张增连,陈丽琴,于洪军,明哲.企业化管理的事业单位资金短缺及财务管理[J].财政科学研究,2014(24)

[4] 潘云霞,王祥楠,吴永霞,高洁.税务事业单位财务管理问题分析对策研究[J].首都经济贸易大学学报,2014(33)

[5] 韩洪玲,陈建华,曹艳杰.基于部门预算绩效考评的绩效改革研究[J].行政预算,2015(37)

(作者单位:山西平阳重工机械有限责任公司 山西侯马 043000)

篇2

关键词 计算机;视觉技术;应用研究

中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2013)16-0114-01

计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。

1 计算机视觉技术

计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。

2 计算机视觉技术在各领域的应用分析

随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。

2.1 在工业领域中的应用

工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。

2.2 在农业生产领域中的应用

该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。

2.3 在林业生产中的应用

该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。

2.4 在农产品检测中的应用

农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。

2.5 在电力系统自动化中的应用

计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。

2.6 在图书馆工作中的应用

随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。

3 结束语

通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。

参考文献

篇3

关键词:计算机;视觉检测技术;原理;应用

中图分类号:TP391.41

受到CIMS的推动和影响,诸多企业的发展趋势逐步趋向于个性化以及自动化,这种大的发展趋势间接的对我国的计算机辅助技术提出了更高的要求,计算机相关技术的发展面临着更加严峻的挑战。就现阶段分析来看,计算机辅助检测技术在现代诸多企业中得到了广泛的应用。随着柔性制造系统的不断进步与发展,驱动图像处理软件、现场总线技术的日趋成熟,检测系统的灵敏性、智能化特点愈发受到人们的关注,在这种大的发展趋势之下,计算机视觉检测技术得到了较快的发展。基于计算机视觉系统现已经广泛应用于现场监控、工况监视等诸多环境之中。

1 关于对视觉技术的相关研究

1.1 基于计算机的视觉检测技术的原理分析和探究

图像技术主要指的就是通过各种途径所实现的对图像的获取以及进一步的深入加工和处理技术。根据视觉检测技术的抽象程度以及对图像处理方式的不同,可以大致将图像的处理和加工技术划分为三个最主要的层次,这三个层次分别是图像的加工处理、图像的分析以及对于图像的理解。将这三个层次进行进一步的结合,便是图像工程。计算机视觉检测技术是一门新兴的计算机检测技术,该技术建立在对计算机视觉研究的基础之上,吸收和借鉴相关的研究成果,借助于传感器来实施三维测量,进而有效获得被测物体的空间具置信息,故而可以很好的满足当代制造业的发展需求。区别于一般的图像处理系统,计算机视觉检测技术所获取的相关数据信息更为精准和迅速,其环境适应性更强。

基于计算机的视觉检测技术注重计算理论的辅导作用,以应用为目标进行视觉技术分析。自上世纪七十年代以来,我国关于对计算机视觉检测技术的研究又取得了显著的进步,并且逐步迈入更为实质性的研究阶段,在该阶段中,逐步开始从通过从多个角度(诸如光学角度、生理学角度以及投影射影角度等等)对其成像问题加以分析。以Marr为代表的专家更是建立了一些一般性的视觉性处理模型来辅助该技术的研究。

1.2 视觉检测技术中传感器的作用

在计算机的控制下配有相关的视觉检测系统,在该视觉检测系统中,主要有三个主要方面的主要作用:第一,对于视觉传感器模型的分析以及确定;第二,进行图像数据分散与整理的相关工作;第三,CAD模型的建立。传感器的主要作用就是对测量棒材的多个截面进行分析,将所收集得到的数据经由图像采集卡采集后,传到相关的图像处理系统中,进而进一步辅助准确的模型的建立。

2 基于计算机的视觉检测技术的应用研究分析

2.1 基于计算机的视觉检测技术的发展状况研究

在研究的初步阶段,相关技术人员借助于数字化的图像处理技术,主要就是为了进一步提高所获得的数字照片的清晰度和质量要求,进而更为精准、科学、规范的对照片所提供的信息加以辨别,为航空卫星图片的读取、识别和分类做准备。在这一系列的视觉工作中,其中最为主要和常见的工作主要是包括分类、识别判读以及三维结构的构建。

基于计算机的视觉检测技术借助于对计算机视觉技术,将所获得的被观察物品的相关信息加以信号转换,并传递给图像处理系统,图像处理系统通过甄别和判断不同照片像素的分布和亮度等讯息,将其进一步转换成为数字化信号,接下来由计算机的图像系统抽出符合目标特征的信号加以运算,对下一步的设备动作加以决定和执行。

就现阶段而言,我国的计算机视觉检测技术系统在诸多领域均有所应用,最为典型的领域诸如医学的辅助诊断、机器人的感应系统、智能化的人机接口等均是建立在该技术的基础之上。借助于计算机视觉技术这一手段,可以有效提高对产品检测的效率,提高精准度,这种新型的视觉检测技术相比较于传统的人眼在流水线上的跟进,其具有显著的优越性,其获取测量结构迅速、检测结果可以直接被观察、可以进行自动识别以及定位准确和实时性的特点,这就很好的避免了由于人的一些主观性因素所导致的误差出现。

二十世纪以来,基于生物特性的计算机视觉检测技术得到了空前的发展,具体表现在人脸识别、生硬识别、指纹识别以及虹膜的识别中,形式日趋灵活和复杂多变。借助于计算机的视觉检测技术,可以有效对用户的身份进行鉴定和识别、判定用户的特殊信息等。除此之外,还可以将基于计算机的视觉识别技术逐步推广到其他领域,如海关的安全检查以及出口、入口的安全控制等领域。

2.2 基于计算机的视觉检测技术的相关应用分析

2.2.1 数码相机中所采用的图像采集技术

视觉检测技术的一个显著特点就是有效提高了生产的柔性和自动化程度,本世纪以来,数码相机凭借其高分辨率,快速成像、显像,功能丰富多变以及性价比较高的特定风靡全球,逐步取代了传统的照相机,传统的照相机主要采用的是CCD 摄像头,其主要的核心及时采集卡,显然这种采集系统已经逐步落后于时展的脚步,现已逐步被淘汰。

2.2.2 微文字识别系统的相关研发和设计

随着科学技术的不断进步与发展,大规模集成电路得到了较快的进步,基于计算机的视觉检测系统的成本得到了极大的降低,基于计算机视觉检测技术的微文字识别系统的研发也被提到了日程中来。微文字识别系统的处理芯片大多是借助于数字信号处理芯片来实现图像的识别,进而借助先进的语音合成技术将朗读变为可能。此外,为了便于使用,该系统的体积被尽可能的缩小,并且可根据美观度和实用性等设计为各种形状。

2.2.3 特殊用纸水印在线检测系统

基于计算机的视觉检测技术可以在某一特定领域代替人的主观判断,诸如水印质量的自动检测方面。区别于普通的工作人员,计算机可以实现长时间工作,对于误差范围的控制可以通过设置等实现,而且在计算机执行任务期间,所受到的客观和主观因素相对较少,这就极大程度上避免了由于人的因素所导致的失误性操作,进而有效提高了工作效率以及检测的精准度。这一优点,在水印质量标准的认定中具有十分重要的意义和作用,通过研发一定的程序和软件,可以制定出一套操作性强、权威性较高的水印清晰度量化标准。

3 基于计算机的视觉检测技术的发展展望

综合分析来看,计算机视觉检测技术现已有大约四十年的历史,作为一种新兴的检测技术,该技术的显著优越性不言而喻,该检测技术以其高精度、反应灵敏迅速、智能化、自动化等特点被广泛应用于诸多领域和行业之中,并取得了显著的成,可以说,该技术具有十分广阔的发展前景。但是,不可否认,基于计算机的视觉检测技术并不是十分的成熟,在其设计和研发过程中仍然存在着诸多不足,而且视觉检测技术是一项设计到心理、生理等多方面知识的复杂性技术,涉及领域众多,更强大功能的实现需要人类知识的不断拓展和延伸,因此,必须意识到该检测技术发展道路上的困难和挑战。

4 结束语

随着科学技术的不断进步与发展,经济的发展对于新技术的研发提出了更高的挑战,再者由于广大人民群众生活质量的不断提高,对于生活水平也有了进一步的认识和了解。基于计算机的视觉检测技术的研发和进步,无疑更好推动了高速发展的经济,不断满足了人民群众日益提高生活需求。由此来看,深入对视觉检测技术的研究和探究无疑具有十分重要的作用,笔者衷心希望,以上关于对我国基于计算机的视觉检测技术的相关探究能够被相关负责人合理的吸收和采纳,进而更好的推动科学技术的创新和进步,推动经济的不断进步与发展。

参考文献:

[1]李旭港.计算机视觉及其发展与应用[J].中国科技纵横,2010(06):42.

[2]张江明,张娟.浅谈制造业中计算机视觉检测技术的应用与发展[J].科技创新导报,2011(24):1.

篇4

近日,国内创业公司商汤科技宣布获得4.1亿美元B轮融资,这是截至目前为止全球范围内人工智能领域单轮最高融资。至此,这家成立仅三年的公司累计融资额达4.5亿美元,估值超过15亿美元,成为全球融资额最高的人工智能独角兽企业。当前,人工智能发展势头良好,技术和产品研发能力大幅提升,市场空间逐步拓展,社会关注与投资力度持续加大,技术创新驱动的人工智能企业正成为资本青睐的热点。

一、商汤融资背景分析

人工智能迎来估值猛涨期。自2014年起,人工智能领域一直都是全球投资热点。近年来,技术与产品的迅速成长带动国内创业热情高q,也引发了资本的高度关注。据统计,截至2017年5月31日,我国人工智能类创业公司已超过650家,产业规模较2016年同期增长达到51.2%,投融资事件超过430起,融资总额达340亿元。科技巨头加大在人工智能领域的布局,投资案例不断涌现。同时,社会资本竞相追逐人工智能领域的优质项目,整体行业获投率偏高,超过一半的人工智能公司成立时间在两年之内,可见资本市场对人工智能产业发展的信心。

计算机视觉领域成为热点聚焦。在大数据、深度学习等新技术推动下,以计算机视觉和语音识别为代表的感知智能正呈现出高速演进态势。目前我国计算机视觉技术水平已达到全球领先水平,并在安防、汽车、金融等领域取得了显著的应用成效。在安防领域,智能技术如人脸识别、图形识别应用场景众多,如车牌识别、车辆视觉特征识别、被动人像卡口、身份证比对等应用。在汽车领域,围绕智能驾驶汽车人工智能在环境感知、路径规划与决策等关键环节均有所应用和体现,在该领域百度、乐视等企业已开展卓有成效的实践。广泛的商业化渠道和技术基础推动计算机视觉成为创投热门领域,据数据显示,中国人工智能创业公司所属领域分布中,计算机视觉领域拥有最多创业公司。2016年,人脸识别服务开发商旷视科技完成至少1亿美元融资,估值超过20亿美元,专注图像识别的图普科技获得千万美元A轮融资。

商汤科技技术实力领先,发展潜力巨大。商汤科技主攻人脸识别、视频监控识别算法、增强现实、文字识别、自动驾驶识别算法和医疗影像识别算法等技术,基础研究实力强大,高质量专利数量、专业学术数量均保持全国领先水平。在2015年ImageNet大规模视觉识别竞赛中,商汤科技获得视频识别冠军,次年在该竞赛中,商汤科技凭借原创深度神经网络平台,获得3个项目的冠军。商汤科技主要业务范围是将计算机视觉技术赋能给安防、金融、机器人、政府大数据分析以及虚拟增强现实等行业。

二、由商汤融资带来的两点思考

篇5

关键词 陶瓷设计,计算机视觉、触觉设计

1前 言

历经数十年发展,CAD/CAM技术已取得了巨大成功,并迎来了数字化设计、数字化制造的时代。NURBS曲线曲面(非均匀有理B样条)以其强大的形状表示能力和配套的计算、编辑算法,已成为事实上的产品表示标准。细分曲面、隐式曲面是近年曲面造型研究的热点,它们突破了NURBS在拓扑结构上的局限性,更容易表达某些复杂的形状。

在陶瓷设计领域,经常需要设计人体、动物等自然雕塑形体,现有的CAD系统可采用NURBS曲面、细分曲面、隐式曲面等来描述这些复杂对象[1],但如何能快速、精确地设计出来,目前尚无有效的数字化工具。人们认识、改变外在事物时,主要利用视觉与触觉的感官功能,通过手眼协调来设计出新的事物,设计师在设计新的对象时,也可如此操作。

近些年出现了一些价格较为便宜的触觉式设计系统,如FreeForm系统,它抽取了大型虚拟现实系统的单一触觉功能,可提供真实感的数字雕塑工具。但一般设计人员使用后的效果并不理想,虽可以在局部修修补补,但缺乏对整体形态的把握[2]。

本文提出了一套视觉与触觉相结合的数字设计系统,以数码相机和力感触觉系统为工具,快速实现复杂形体的数字建模。首先利用数码相机拍照,摄取参考对象的图像,通过一个专门设计的摄影测量与计算机视觉集成系统重构出参考对象的三维数字模型;然后将此模型输入到触觉设计系统,经局部的修正,得到新的设计模型。以下详述系统组成及原理,并给出设计实例予以验证。

2造型设计系统的组成

本文所提出的系统主要分为两个模块:视觉子系统与触觉子系统。其中触觉子系统是购置的,视觉子系统是独立开发的[3]。相机采用奥林巴斯CL5050,拍摄的照片经视觉反求系统处理后,得到VRML格式的三维模型,然后输入FreeForm触觉设计系统,进行再设计,最终输出改型设计后的数字模型。图1所示是视觉系统实物,图2是触觉系统的实物照片。

2.1 视觉系统[4]

本文提出的系统中,视觉系统为自主开发的,先讲述相关的主要原理。

本文采用的视觉系统结合了摄影测量法的高精度与计算机视觉法的灵活性。近年来由图片生成3D模型是一个热门的计算机视觉研究领域,并相应提出了诸多的研究方法,其核心问题包括:相机标定、对应点匹配及3D重构等;针对每个问题均有大量的研究算法,特别是相机标定技术几乎成为一个关键环节。

类似于测量系统控制网的概念,我们设计了一套控制特征点,相机直接根据控制特征点进行标定,可得到精度较高的相机内外参数。图3所示是控制点分布的实物图。

我们对控制点分布采取了特殊设计,使任意角度下拍照,均有10个(通常要求至少6个)以上特征点被摄取。对特征点,采用了高精度的专业摄影测量系统Aicon加以标定,其空间坐标保存于一个数据文件中,以备相机标定时采用。

有了高精度的相机参数,就可以利用成熟的计算机视觉方法重构3D模型。我们采用了遮挡轮廓法[1]及空间剥离法[2]这两种对环境要求较低、算法较为稳定的方法,处理标定过的图像,得到三维模型主要形态,可作为触觉设计的基础。

2.2 触觉系统

触觉子系统采用FreeForm触觉式虚拟设计系统,通常也亦称为3D Touch系统,采用了力回馈技术,手握触觉笔在空间旋转移动,屏幕里相应的雕刻刀便随之移动;当雕刻刀接触到模型时,会有力回馈到握笔的手上,让使用者感受到接触时的力量。在雕刻时可设定模型的软硬度,进而调整雕刻所需的力。常规的实物雕刻操作,在系统内均有对应的虚拟工具,无论是雕刻效果,还是虚拟雕刻过程中的感受,与实际雕刻几乎一样,提供了十分逼真的雕刻环境。

3陶瓷狗的造型设计

在陶瓷设计中,经常需要参考某种实物样品。本实验以图1中的玩具狗作为参考对象,借助视觉、触觉集成系统进行了两次造型、建模试验。视觉系统从不同角度摄取了10幅图片,由这10幅图片生成一个三维模型(见图4)。整个建模过程仅需十几分钟,方便快捷。输出的模型包含了参考对象的主要形态,稍加修整,即可得到新的改型设计。

以视觉系统的输出为骨架,在FreeForm系统中进行细部的修整与再设计,并可添加修饰色彩,得到新的设计结果,见图5。

在试验中,如果仅依靠触觉设计系统,即使熟练的操作人员,要设计出比例协调、结构合理的模型,也需要花费一天或数天时间。视觉系统的输入极大地简化了主体形态的构造,使不太熟练的设计人员也能利用触觉系统,很快设计出新的作品。

4总 结

本文提出了视觉、触觉相结合的方法,利用计算机视觉系统帮助设计人员观察、感知设计对象,并把结果以数字形式保存起来;触觉系统直接利用已有的观察结果,通过手眼协调完成最终设计。这种混合系统弥补了非专业人员所缺乏的空间形体洞察力及操纵力,使他们不用经过长期的专业训练,也可快速地设计出新的作品。本文给出的实例已验证了这一观点。

本文揭示了虚拟雕刻过程所忽略的视觉思维环节,并设计出计算机视觉系统来加以弥补,取得了良好的结果,这套视、触觉结合的设计系统可用于陶瓷产品的设计制造,可大幅度提高设计效率和设计质量。

参考文献

1 Potemesil M.Generating octree model of 3D objects from their silhouetttes in a sequence of

images[J].Computer Vision&Graphics Image Processing,1987,40(1):1~29

2 K.Kutulakos and S.Seitz. A theory of shape by space carving[J]. International Journal of Computer

Vision,2000, 38(3):199~218

篇6

关键词: 边缘检测;SUSAN算子;角点检测;亚像素;标定

中图分类号:TB96 文献标识码:A

The Test Method of Wheel Alignment Parameters Based on Improved SUSAN Operator

LI Yu-yu1, HE Liang-liang2

(1. Automotive industry school in Anhui Province, Hefei Anhui 230041, China; 2. HeFei University of Technology, Hefei Anhui 230011, China)

Abstract: In view of the current four-wheel sensors' shortcomings, such as large amount, low accuracy, complex operation, and high maintenance costs, etc. we put forward a new method of detection which uses three-dimensional visual to detect parameters of four-wheel location. This paper expounds the improved SUSAN operator which is based on the proposed method. Through the collection of sequence image of the target disk format board which moves together with the wheels, we calculate three-dimensional cosine of the rotation axis of the wheels, then get four-wheel location geometric parameters. Compared with the traditional methods, this new method has many advantages, such as non-contact, real-time, simple operation, high precision and so on.

Keywords: edge detection; SUSAN operator; corner detection; subpixel; calibration

引 言

随着汽车行驶里程的增加、使用时间的延续,其技术状况必然发生改变。汽车行驶中的操作稳定性与行驶安全性、轮胎的异常磨损以及燃油消耗的增加等均与汽车车轮定位不准有关[1,2]。目前,国内广泛使用了基于机器视觉的测量技术进行汽车四轮定位,计算机视觉是通过对三维世界所感知的二维图像来研究和提取出三维景物的物理结构[3]。计算机视觉测量技术作为一种新兴的、先进的高精度的测量技术,而摄像机标定是实现影像高精度测量的关键技术之一。本文根据空间向量原理与计算机视觉理论,提出一种四轮定位参数测量[4]的模板标定新方法,主要研究了针对棋盘格平面模板的亚像素级角点坐标的提取,为后续的摄像机的精确标定提供依据,并通过实车实验进行了验证。

1 四轮定位的主要参数

四轮定位的主要参数[5,6]包括:前束角θToe(车轮中心线与车辆几何中心线之间的夹角)、外倾角θCamber(车轮旋转平面与车辆纵向垂直面的夹角)、主销内倾角(kingpin inclination)θKI(在汽车横向平面内转向节主销轴线与铅垂线的夹角)及主销后倾角θCaster(在汽车纵向垂直平面内转向节主销轴线与铅垂线的夹角)等。

X、Y、Z分别为车体的横向、铅垂方向和纵向的坐标轴,根据立体几何知识,四轮定位参数数学模型如式(1)所示,单位为度。

1.1 数学模型求解

根据四轮定位参数的数学模型,我们可以通过摄像机采集随车轮运动的棋盘格式目标盘的序列图像,对其进行角点检测[7],而后计算棋盘格角点的图像坐标与世界坐标之间的单应性矩阵H[8],结合摄像机标定所得到的摄像机内参矩阵,便可求出棋盘格角点的旋转矩阵,即车轮运动的旋转矩阵,进而计算出车轮旋转轴线的方向余弦,从而得到车轮的四轮定位参数,其具体的数学模型求解,流程如图1所示。

2 改进SUSAN算子[9]的棋盘格角点检测

棋盘格图像是进行摄像机标定时最常用的图像,由黑白相间的正方形组成,并以角点作为特征点。

从图2可以看出,如果用原来的SUSAN算子进行角点检测,由于边缘和角点处的核值相似区都为模板区域的一半,故很难区分边缘与角点,必须对SUSAN算子改进后才能用于角点检测。所以我们采用如下的步骤对棋盘格进行角点检测,首先用LoG算子进行边缘检测,然后在边缘像素处用改进后的SUSAN算子进行角点检测,最后利用灰度平方重心法进行亚像素角点定位。

2.1 棋盘格的边缘检测

在线摄像机标定过程中,因为利用SUSAN算子对整幅图像进行角点检测时,其检测速度会比较慢,不能满足在线标定对速度的要求。由于角点一定包含在图像边缘中,所以先利用LoG算子对图像进行边缘检测,记下边缘像素的坐标,再只对边缘处的像素进行SUSAN角点检测即可,这样可以大大减少整个角点检测的运算量。如图3所示,是对棋盘格图像进行边缘检测的效果图。

2.2 棋盘格的角点检测

从图4可以看出,对于理想的边缘,如a所示,其灰度不具有中心对称性,而角点b、c、d、e均具有一定的中心对称度。且对于理想的棋盘格角点e则具有完全的中心对称性,而对于b、c、d 三种角点,其角点越尖锐,其对称性越好。

选用37像素的圆形模板进行SUSAN角点检测,选用相似比较函数[10]作相似比较,如式(2)所示。

式中t为相似度阈值,由于模板图像灰度对比度很好,所以可适当取大一点,选用t=25作为相似度阈值,根据式(3)计算出核值相似区:

最后确定几何阈值g,得到初始角点响应:

因为棋盘格角点的特殊性,其理想的几何阈值g应为,对于实际的图像,由于有噪声的干扰以及摄像机的畸变,不可能是精确的直角角点,所以其几何阈值最好选取~之间的值。从前面的论述可知,棋盘格角点具有完全的中心对称性,而37像素的SUSAN圆形模板可方便地计算出其对称度,所以就此提出了灰度中心对称度的概念。

首先对SUSAN模板像素的一半依次搜索,找到其关于核心点的像素,求出二者的灰度差ΔI如式(5)所示。

ΔI=I(x,y)-I(x',y')(5)

其中I(x,y)与 是关于核心点中心对称的像素灰度值。灰度差ΔI与阈值d的比较得到点(x,y)的灰度对称度D(x,y)为:

D(x,y)=1 ΔI<d0 ΔI≥d(6)

阈值d是用来区分两像素是否具有灰度相似性的关键,灰度区域的差值即为阈值d的取值。

将模板区域一半像素的灰度对称度求和可得到整个模板的灰度对称度S(x0,y0)为:

其中M表示整个模板区域,对于37像素的模板,其理想的最大灰度对称度Smax=18。由于图像角点模糊以及摄像机畸变等因素,棋盘格图像的灰度对称度S达不到Smax,所以在进行角点检测时设定的灰度对称度阈值可适当减小,文中取S=12。通过上述改进后可获取出棋盘格的角点位置。

2.3 亚像素的角点检测

通过上述方法检测到的棋盘格角点并不是单像素角点,但是在进行摄像机的精确标定时,必须将角点定位到亚像素级。对棋盘格角点图像进行分析可知,棋盘格角点图像属于灰度对称分布的目标,而且图像的灰度对比强烈,所以选取灰度平方重心法进行亚像素角点定位。设角点的灰度重心(x0,y0)为式(8):

其中W(i,j)为权值,取W(i,j)=I2(i,j),M是利用改进后的SUSAN算子检测到的角点邻域。该方法原理简单,可以有效地实现亚像素角点定位。

3 四轮定位参数计算及实验结果分析

图像平面上的点m与平面模板的点M之间可通过单应性矩阵H来联系,获得匹配点的坐标就可以求图像坐标与世界坐标之间的单应性矩阵H。用夹具将目标盘以一定角度安装在车轮上,当车辆前后移动时,车轮及目标盘一起前后转动,通过对目标盘上的进行运动前后的拍摄,得到旋转前后的图像,如图5所示。然后进行图像处理和分析提取出目标盘上的特征点,再根据特征点位置的空间坐标变化计算出车轮空间旋转量,进而由该向量与空间坐标系各坐标轴夹角关系得出定位参数。

4 实验结果及分析

应用车轮定位参数检测实验系统对奥迪A6L车轮定位参数进行了检测,共测了3次,取其平均值作为最终结果,结果如表1所示。A列为改进算法前的四轮定位数据,B为改进算法后的实验数据。从实验结果来看,在通过本方法对特征点提取的算法做了改进后,实验结果较之前精准,证明了本方法的正确性和有效性。

5 结 论

应用计算机视觉理论,建立了汽车四轮定位参数测量的数学模型,重点阐明了的改进SUSAN算子的亚像素角点检测,避免了传统SUSAN算子混淆角点和边缘的缺点,可有效地检测出正确的角点。由于只在棋盘格边缘点附近进行角点检测,其运算速度大大提高。灰度平方重心法的亚像素定位方法简单高效,所以该方法非常适合于运用棋盘格对摄像机进行在线标定的场合。这是一种有别于传统检测法的新方法,以便提高汽车四轮定位的检测精度。

参考文献

[1] 罗进益,周. 轿车凹轮定位检测与调整[M]. 北京:人民交通出版社,2002,3.

[2] 张遥远,刘美生,罗发贵,王蛟茹. 四轮定位仪的性能评价与检测[J]. 中国测试技术,2004,30(4):3-6.

[3] 高 文,陈熙霖. 计算机视觉[M]. 北京:清华大学出版社,1999.

[4] 胡修泰. 3D激光车轮定位仪[J]. 汽车维护与修理,2003(07):22-25.

[5] 王德超,涂亚庆,张铁楠. 基于计算机视觉的汽车四轮定位参数检测数学模型及方法[J]. 汽车工程,2008,30(03):223-228.

[6] 张铁楠,涂亚庆,王德超. 基于计算机视觉的汽车车轮定位技术研究[J]. 电子测量技术, 2008,31(04):52-56.

[7] 郝颍明,朱 枫. 摄像机标定中的棋盘格自动检测[J]. 计算机工程,2007,33(17):213-215.

[8] 刘永强,刘军民. 基于视觉测量的汽车车轮定位技术的研究[J]. 大连理工大学网络学刊. 2008.

篇7

关键词:太阳跟踪; ARM微控制器; 计算机视觉; CMOS图像传感器

中图分类号:TN91934; TP36文献标识码:A文章编号:1004373X(2012)04007104

Sun-tracking system based on ARM embedded image processing platform

CHEN Lijuan, ZHOU Xin

(Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)

Abstract: Based on computer vision principle, the realtime tracking of sun was realized by taking ARM microcontroller as the core to construct the embedded image processing platform. The system collects images of sun through CMOS imaging sensor, and computes the sun angles relative to the tracking platform by a microcontroller. With the computed sun angles information, the system controls the turntable through a serial port to make the solar panel perpendicular to the sun radiations. Meanwhile, another tracking mode based on sun trajectory is integrated in the tracking strategy to insure the system reliability. The teat result indicates that the system can reduce the system energy consumption and effectively track sun.

Keywords: suntracking; ARM microcontroller; computer vision; CMOS image sensor

收稿日期:20110813

基金项目:国家自然科学基金资助项目(61102138);南京航空航天大学基本科研业务费专项科研资助项目(V1090031)0引言

随着社会的发展和进步,环保节能已经成为人类可持续发展的必要条件。目前,再生能源的开发和利用越来越受到人们的关注。太阳能由于其普遍、无害、无限、长久等特点,成为最绿色、最理想、最可靠的替代能源[1]。但太阳能同时存在分散,不稳定,效率低等特点,太阳能光伏系统为解决这一问题提供了条件[23]。

就目前的太阳能光伏系统而言,如何最大限度提高太阳能的转换率,仍是国内外的研究热点。有研究表明,和始终朝南的固定表面相比,与太阳辐射方向始终保持垂直的表面对太阳能的利用率提高约33%[4]。太阳跟踪装置可以保证太阳辐射方向始终垂直于太阳能电池板平面,使接收到的太阳辐射大大增加,提高了太阳能的接受率与利用率,因而得到广泛的应用。

太阳跟踪装置的分类方法有很多,按照跟踪方法,主要可分为视日运动跟踪和光电跟踪,视日运动跟踪又可分为单轴跟踪和双轴跟踪[5]。光电跟踪装置有较高灵敏度,结构简单,能通过反馈消除累积误差,具有较大优势,但受环境影响很大。其关键部件是光电传感器,常用的是光敏电阻。由于光敏电阻安装位置不连续和环境光散射等因素的影响,系统不能连续跟踪太阳,精度有限[6]。视日运动跟踪能够全天候实时跟踪,但是存在累积误差。其中,单轴跟踪装置结构简单,但跟踪误差大;双轴跟踪装置算法复杂,跟踪难度较大,但跟踪精度较高[78]。

本文用基于32位ARM嵌入式微控制器S3C2440来构建太阳跟踪系统,采用CMOS图像传感器来感知太阳方位,并通过微控制器计算获取太阳跟踪误差,实现对太阳的高精度跟踪。加入视日运动规律,在跟踪目标丢失时,对系统进行重新定位。同时,该系统的结构简单轻便,功耗低,环境适应能力强,能应用于各种太阳能设备。

1硬件设计

1.1系统硬件结构

系统以ARM微控制器作为主控制器,采用CMOS图像传感器采集图像,并利用双轴转台来支撑太阳能电池板。其中双轴转台集成了电机驱动与控制部分,通过串口与主控制器进行通信。

如图1所示是太阳跟踪系统的硬件结构图。在图1中,CMOS图像传感器与太阳能电池板处在同一平面,并固连在双轴转台上;ARM处理器与双轴转台的电机驱动部分采用串口通信方式;系统的供电均由蓄电池支持(包括ARM控制板和转台),因而形成了一个独立系统。系统的基本工作原理是:根据视日运动规律或CMOS图像传感器采集的天空图像,利用ARM处理器求取系统跟踪控制参数,并通过串口来控制双轴转台的转动。

图1太阳跟踪系统的硬件结构图1.2硬件介绍

(1) ARM微控制器。从实用角度考虑,太阳跟踪系统的低功耗设计显得尤为重要,ARM微处理器在保证高性能的前提下能够尽量降低功耗[9]。相对于PC机,ARM微处理器占用空间较小,质量轻,可靠性强,硬件资源丰富,在简化系统结构的同时为系统功能扩展提供了可能。系统选用32位ARM嵌入式微控制器S3C2440来构建控制平台。运用ARM微控制器构建的嵌入式图像处理平台大大提高了图像的处理速度,同时有效降低了系统成本。图像处理系统还具有拆装方便,配置灵活等优点,安全性得到大大提高[10]。

(2) 双轴转台。系统采用集成式双轴转台,其结构如图2所示,工作电压为24 V,可利用蓄电池供电。在图2中,x向为水平方向,y向为垂直方向。x向转角对应太阳方位角,y向转角对应太阳高度角。该双轴转台x向转动范围为-157°~+157°,y向转动范围为0°~90°,集成了电机控制模块,并提供串行接口,控制器可以利用串口通信来控制并驱动转台在x向和y向上的转动。

(3) CMOS图像传感器。图像传感器产品主要有CCD,CMOS,CIS三种。其中CMOS图像传感器集成度高,价格低廉,而且可以实现数字化输出,软件可编程控制,提高了系统设计的灵活性,同时也具有较高的抗干扰性和稳定性[11]。系统采用的图像传感器为OmniVision公司的OV 9650型COMS摄像头,其功耗为30 μW,阵列大小为1 300×1 028 pixels,焦距为4.85 mm,像素大小为3.18 μm×3.18 μm,支持软件可编程控制,输出图像格式包括YUV,RGB等。

图2双轴转台的结构图2软件设计

2.1跟踪控制策略

图3所示是太阳跟踪系统工作过程流程图,系统采用的跟踪控制策略如下:

(1) 系统可设置2种工作模式,早晨6:00唤醒跟踪控制系统,系统启动跟踪控制,进入跟踪模式;下午18:00休眠系统,系统关闭跟踪控制,进入待机模式。同时系统采用粗跟踪和精跟踪2种方式,粗跟踪采用视日运动跟踪方法,精跟踪采用基于计算机视觉的跟踪方法。粗跟踪为精跟踪提供初始工作条件,精跟踪保证系统的跟踪精度。

图3太阳跟踪系统工作过程流程图(2) 唤醒跟踪控制系统时,采用视日运动开环计算方法进行粗跟踪。粗跟踪的基本过程是:根据太阳运行的天文规律计算,利用系统时间和给定的当地经纬度计算太阳高度角和太阳方位角,并根据计算结果来驱动并控制步进电机,从而调整太阳能电池板的角位置。粗跟踪的目的是为了让太阳进入图像传感器的视野范围,主要用于首次定位和目标丢失后的重新定位。

(3) 系统工作在跟踪模式时,周期性采集图像,采用基于计算机视觉的闭环校正方法进行精跟踪。精跟踪的基本过程是:通过对采集图像进行处理,获取太阳角度偏差量。由太阳角度偏差量可得到转台应转过的角度,从而使太阳能电池板能正对太阳。精跟踪的目的是为了保证系统跟踪精度。

(4) 系统工作在跟踪模式时,由于阴天、雨天或其他原因,太阳光线很弱或基本看不见,导致CMOS图像传感器无法捕捉到太阳。此时,太阳能电池板的工作效率很低,为了减小跟踪系统能耗,不进行电机动作并保持当前状态。同时设置累计标志S,它表示图像传感器在连续S个采样周期内没有捕捉到太阳。当S累计到设定值N时,采用视日运动开环计算方法重新粗定位,并重置累计标志S。这样在降低系统能耗的同时可以提高系统可靠性。

2.2基于计算机视觉的跟踪方法

基于计算机视觉的跟踪方法,其基本过程如下:通过对采集图像进行处理,得到太阳位置偏差量。如果偏差在预设阈值范围内,则保持当前状态;如果偏差超出预设阈值F1的范围,则根据偏差的方向和大小调整转台,使得通过图像处理得到的偏差在预设阈值F2的范围内。其中阈值F1的范围比阈值F2的范围大,这样可以减小电机动作次数,降低能耗。

(1) 图像处理方法。图像传感器得到图像后,首先进行图像的灰度化。使用屏蔽字和移位操作来得到R,G,B分量,再进行比例转换,得到灰度图像。设置阈值,将图像二值化,得到的图像中的光斑即为太阳。找到太阳位置,计算光斑中心与图像中心的偏差值,将该偏差值换算为太阳方位角和高度角的实际偏差值。

(2) 偏差角计算与转台控制。记CMOS图像传感器的焦距为f,像素大小为kx×ky。假设采集图像上太阳位置偏离图像中心的偏差为px×py,则可以计算太阳偏差角如下:

太阳方位偏差角:Δα=arctan(px×kx/f) ;

太阳高度偏差角:Δβ=arctan(py×ky/f) 。

根据太阳方位偏差角和高度偏差角,通过串口控制转台转动,使太阳能电池板正对太阳。其中转台x轴应转过的角度为太阳方位偏差角,转台y轴应转过的角度为太阳高度偏差角。

2.3嵌入式处理平台的实现

系统采用S3C2440作为主控制器。利用Linux内核代码,针对本处理器和本系统特点,对内核进行相应的配置和裁剪,编译生成嵌入式内核,并选用yaffs作为根文件系统,将内核映像文件和根文件系统烧写到微控制器中,并编写相应驱动程序。

程序在主机上设计完成后,需进行交叉编译,然后下载到处理器运行。

首先在主机Linux系统下搭建交叉编译环境,这里采用armlinuxgcc4.3.2 with EABI版本的交叉编译器,并配置主机和目标板的NFS和FTP网络,以实现主机到目标板的文件下载和主机对微控制器的控制。程序编写完成后,进行交叉编译,生成可执行文件,下载到处理器运行即可。

3实验结果

3.1基于计算机视觉方法的跟踪实验

如图4所示是某次精跟踪过程的实验结果,其中(a)为CMOS图像传感器捕捉到的原始图像;(b)为经过灰度化、二值化后的结果,可以看出图像中的太阳已经被提取出来;(c)为精跟踪一段时间后图像传感器得到的图像,可以看出太阳处在图像中心位置,此时太阳光线垂直照射太阳能电池板。

图4视觉跟踪试验结果3.2系统技术指标

对本文提出的太阳跟踪系统进行了性能测试,通过分析测试结果,该系统的技术指标如表1所示。

表1太阳跟踪系统的技术指标

方位角范围-157°~+157°高度角范围0°~90°跟踪精度0.05°系统自重 /kg11工作温度范围 /℃-10~60噪音范围 /dB≤70系统平均耗电量 /W≤5

4结语

本文中设计的太阳跟踪系统采用视日运动跟踪方法和基于计算机视觉的跟踪方法相结合的方式,一方面采用视日运动跟踪方法进行初始粗定位和系统丢失目标时的重新粗定位;另一方面采用基于计算机视觉的跟踪方法进行精确跟踪。基于计算机视觉的跟踪方法采用CMOS图像传感器采集太阳光斑,利用ARM微控制器处理采集到的图像,实现对太阳的实时跟踪。实验结果表明,该系统可以连续跟踪太阳的角度变化,能够达到较高的跟踪精度;当跟踪目标丢失时,能够利用视日运动跟踪方法对系统重新定位,具有较好的环境适应能力。该系统具有较低的日均功耗、较高的跟踪精度和可靠性,结构简单轻便,可应用于各种太阳能光伏系统。

参考文献

[1],杨景常,郑宇.向日葵型跟踪太阳智能发电装置的研制[J].西华大学学报:自然科学版,2007,26(6):1820.

[2]苑玮琦,金晶晶.基于图像传感器的太阳方位检测系统研究[J].微计算机信息,2007,23(12):141143.

[3]HELWA N H.,BAHGAT A B G.,SHAFEEA M R E, et al. Maximum collectable solar energy by different solar tracking systems \[J\]. Energy Sources, 2000, 22 (1): 2334.

[4]GAY C F, YERKES J W, WILSON J H. Performance advantages of twoaxis tracking for large flatplate photovoltaic energy system \[C\]// Proceedings of 16th IEEE Photovoltaic Specialists Conference. \[S.l.\]: IEEE, 1982: 13681371.

[5]郑小年,黄巧燕.太阳跟踪方法[J].能源技术,2003,24(4):149151.

[6]杜伟巍,邹丽新,尤金正,等.基于CMOS图像传感器的太阳自动跟踪控制器设计与实现[J].现代电子技术,2009,32(11):150154.

[7]郑小年,黄巧燕,张晓黎,等.太阳集热器跟踪台的设计与控制[J].中国机械工程,2003,14(12):10071009.

[8]KALOGIROU S A. Design and construction of a oneaxis suntracking system \[J\]. So1ar Energy, 1996, 57 (6): 465469.

[9]周立功.ARM微控制器基础与实践[M].北京:北京航空航天大学出版社,2003.

[10]马俊青,宋爱国,甘英俊.一种基于ARM的图像处理系统的设计[J].电气电子教学学报,2009,31(4):6669.

[11]何小明.用CMOS芯片取代CCD[N].中国电子报,2000915(5).

[12]孙梦宇,赵敏,吴毅杰,等.基于ARM的电子负载网络监控系统\[J\].电子科技,2010(3):4649.

篇8

AlphaGo的出现加速了人们对人工智能(Artificial Intelligence以下简称AI)的理解,但AI极客们的野心远非19行的棋盘可以局囿,他们拥有酷炫的技术和非凡自信,并想以此来改变世界。

美国畅销书作者、发明家雷.库兹韦尔(Ray.Kurzweil)在《奇点临近》一书中为人工智能的出现设定了三个条件:强大的计算能力、海量的知识储备,最后还需要教会计算机拥有认知能力,通过机器学习技术让计算机不断的自行进化。

前两者已经实现。第三点,如何让机器拥有认知能力是AI极客们关注的重点。

机器学习是人工智能的核心。机器学习将教会计算机认识现实世界,知道自然界的日升日落、阴晴圆缺,并能理解人类的行为和语言。机器学习的常用领域包括数据挖掘、视觉理解、语音识别和自然语言处理等方面。我们采访了数位科技公司高层、新锐创业者,他们有一个共同的身份―国内从事机器学习的应用和研发的专家。他们讲述了中国人工智能发展的现状,而一旦科技出现新突破,也预示着新一轮的商业变革。 先知

坐在记者对面,脸庞消瘦的陈运文笑得有些腼腆,言语却充满自信,“很多事情都是可以预测的”。

陈运文是国内大数据方面的专家,曾任百度核心技术研发工程师和盛大文学首席数据官。现在他是个创业者,达观数据创始人兼CEO。他为公司新入职的同事下发了一套题――如何预测泰坦尼克号上的幸存者。整套题通过获取泰坦尼克号上所有乘客的真实信息,包括性别、年龄、职业、票价、舱位等,然后编写程序来预测这2000余名乘员中哪些人最终得以生还。

在陈运文眼里,将所有信息加以综合挖掘,就能够推演出最终的答案―“705名生还者都可以准确预测。”

预测这样的事件只是数据挖掘的一个案例,对于极客而言,只要给他们足够的信息,这个世界就没有意外和偶然。

现在,陈运文用自己的技术帮助企业进行商业决策。虽然只成立不到半年,但这个隐藏在张江天之骄子公寓里的创业公司已经获得真格基金和盛大网络创始人陈大年的投资。

陈运文将第一批客户瞄准为自媒体人,通过数据分析,为自媒体提供可以引发热议的话题,并告诉这些作者,什么人喜爱看他们的文章、会关注什么话题。

让机器自己学会分析信息早就在商业行为中广泛存在。在百度工作期间,陈运文负责搜索引擎的核心算法研究,主要“为用户提供最有价值的信息”。 工作的难点不在于搜索信息,而在于让机器认知用户的搜索意图。

用户经常会在搜索框中输入“口语词汇或者模糊的语句”,服务器要从人们的搜索语句中判断真正的需求。陈运文就需要设计算法让搜索引擎理解用户的语义,从数百亿的网页中迅速找到对用户最有价值的结果。这种“算法”就属于人工智能。百度每天的搜索有数十亿次,每当陈运文改进了算法都能看到用户点击的满意度在上升。

今天这种依靠数据挖掘技术来提高企业运作效率的方法变得更常见,业内将其称为“商业智能”(Business Intelligence)技术。陈运文计划将这种技术在云端运用,另一些同类公司则将这种技术直接运用在软件上。2010年在美国纳斯达克上市的Qlik公司就是商业智能软件的代表企业。他们的QlikView软件为用户提供“可视化”的大数据服务。

“我们的软件可以理解数据,挖掘数据并将其用更直观的方式展现给客户,以帮助管理层做出决策。” Qlik亚太区制造业和高科技市场开发总监Jeremy Sim对《财经天下》周刊表述。

这些带有“预测”功能的软件已经在服务并改变人们的生活,比如根据顾客的购买信息QlikView会提示便利店店长,售货架上的麦片不应该和面包摆在一起,虽然它们都是早餐食品,但如果将麦片和酸奶摆在一起,销售数字会更好看。此类预测还进一步提醒物流部门,尽量地在头天晚上补足麦片和酸奶货源。这类商业智能的应用渗入所有人的生活,以这家公司为例,他们已经在全球100多个国家招徕了3.8万企业客户,间接服务人群上千万。

未来这些带有“智力”的系统将会更多的出现在电商、医疗、教育、金融等领域。“比如随着智能手环的增加,会有更多的健康数据被采集,那么我们会提供健康预警、治疗方案推荐等服务。”陈运文说。现在只是大数据挖掘的初级阶段,人工智能时代也才刚刚开启。 视觉理解,打造机器之目

2014年6月,比尔・盖茨访华,除了见政商要员外,他还专门造访了一家刚成立一年的创业公司―格灵深瞳。对于这家初创公司,比尔盖茨留下了两句后来被广泛引用的评语“This is very cool”和“IT界的下一个大事件是计算机视觉(computer vision)与深度学习(deep learning) 的结合”。

格灵深瞳就是这样一个结合了计算机视觉和深度学习为一身的酷公司。创始人赵勇是致力于视觉理解的知名极客,虽然他本人并不喜欢这个称谓。

“极客(Geek)在英文里形容书呆子,只会做技术不通世事,但我觉得我是一个懂技术的正常人。”他对《财经天下》周刊说。

赵勇专攻计算机视觉和运算影像学,2009年入职谷歌总部研究院任资深研究员,是谷歌眼镜项目的骨干。“我们团队负责谷歌眼镜的场景识别技术,利用谷歌街景来判断使用者所处的位置。”简单地说就是将谷歌眼镜捕获的图像和谷歌街景做比对,然后快速地定位用户所处位置和周边信息。谷歌眼镜可以在500毫米之内将用户的位置精确到米级别。赵勇说谷歌眼镜并不是“进化的产品,而是从无到有的突破”。

2013年初,赵勇回国创业成立格灵深瞳,并在三个月后拿到真格基金和联创策源的联合天使投资,同年6月格灵深瞳又拿到红杉资本 A 轮高达数千万美元的投资。

业内传播着投资人争论其未来估值的段子,据说某次饭局上真格基金的徐小平、红杉资本的沈南鹏和联创策源的冯波讨论格灵深瞳的未来估值,徐小平认为起码5000亿美元,而沈南鹏认为1000亿美元,最后冯波折中地认为3000亿美元。而现在中国电商巨头阿里巴巴的市值还不到1900亿美元。

受到比尔・盖茨和投资人如此追捧的原因在于赵勇的研究方向―计算机视觉,这是机器学习中极为复杂的领域。

将赵勇和陈运一个对比就可以看出他们研究方向的不同。赵勇认为数据挖掘是让计算机理解“结构化信息”,结构化指那些人工制作的成型的信息数据,例如一句话一段文字或者一份表格。但计算机视觉需要让机器理解飘过镜头的一片树叶,或者悄悄走过的一只猫。

陈运文对此也做了比较,他认为数据挖掘更多的是处理文本信息,而文字是具象的表达,机器看到汉字“猫”或者英文“cat”就可以理解这是一种动物,但图片是抽象信息,给计算机看一张猫的图片,让它去理解猫的概念非常困难。

所以当2012年6月谷歌X实验室宣布他们研发的“谷歌大脑”通过百万张图片的学习后可以识别“猫”的时候,全世界都为之震惊。这意味着谷歌培养的这个“孩子”具备视觉理解的能力可以“看图说话”了。而参与“谷歌大脑”研发的吴恩达博士(Andrew Ng)也因为这个项目被誉为“谷歌大脑之父”,成为机器学习领域最权威的学者。

为了建造“谷歌大脑”,吴恩达使用了神经网络系统,他们连接了1.6万片处理器创造了一个拥有10亿多条连接的神经网络,并逐步地培训这个系统,直到它拥有识图的能力。

现在,赵勇做的事情与此类似。

他通过影像设备捕捉实时画面,让计算机识别这个真实世界,更为直接的说法或许是―赵勇正在研制“机器人之眼”。

像谷歌一样,想让计算机能识别图像,赵勇也需要制作一个“深度神经网络”系统。

在人脑中有大约1000亿个神经元,神经元通过神经突出连接在一起就变成了一个神经网络,人们思考问题的时候这些神经网络相互激发,最终产生决策。现在极客们用计算机来模拟这个过程,用计算程序建立起庞大的计算元素,这些程序运算的结果通过网络互为交换互相影响,最终产生结果,这就是初级的人工神经网络。人工神经网络层级越多规模越大,其“聪明程度”就越高,学习的能力就越强。

要培养这样一个会“识图的孩子”,赵勇除了要建立这样一套庞大的神经网络之外,还需要不停训练这个网络。

“可以将神经网络当成一个黑盒子,我在里面设定了一些基本参数,随后不停的往里面输入数据、图片来训练它,通过这种大量的训练,黑盒子里面参数的连接会越来越紧密,整个网络也会越来越聪明,最终变成一个可以识别图片的智能系统。”

严格地说,人工智能不是人类设计出来的,而是人类训练出来的。即便是赵勇这样的创建者也无法知道这些神经网络到底如何相互作用相互影响,并最终形成自己的智能系统。他能做的只是“选择输入数据,控制训练方向”。

依旧以老师教育孩子做比喻,虽然赵勇这个老师不知道孩子是怎么理解图片,识别这个世界的,但他可以控制教学的内容,让这个孩子朝某个方面学习。

赵勇花费了两年时间才为格灵深瞳培养出自己的“孩子”,并将这些有“识图能力”的人工智能设备应用到安防监控和汽车识别方面。

去年格灵深瞳推出了名为“目”的行为分析仪,这是一个包含软硬件于一体的智能监控产品。“目”会实时监控场景内的情况,发觉异常就立刻报警或者提醒工作人员注意。而在另一个名为“威目”的产品中,格灵深瞳做到了车辆识别,他们训练系统辨识超过5000种车辆,这几乎涵盖了地球上所有的汽车类型。这种能力为警方办案提供了帮助,警方可以用“以图搜图”的方式让“威目”提供他们需要的视频资料。“警方提供一张汽车照片,威目在识别照片之后可以从交通录像中找出该车的行动轨迹。”除此之外,该系统还可以搜索“结构化信息”,例如在系统中输入2004年生产车牌中含有5这个数字的红色奥迪A4汽车,“威目”就会在资料中截取相关的图像或者视频,而此前这些工作都需要人工完成。

如果计算机视觉技术以这样的速度继续,或许用不了几年,当我们站在摄像头前时,计算机会在屏幕上敲出那句让人激动的言语―“I see you .” 造物者

“谷歌大脑之父”吴恩达在完成了“认猫”创举两年后离开了谷歌,加盟了百度,任职百度首席科学家并负责“百度大脑”的研发。

说服吴恩达做此决定的是他的好友,现任地平线机器人技术CEO的余凯。

余凯是国际知名的机器学习专家,他牵头成立的百度深度学习研究院是国内第一个研究深度神经网络的研究机构,加盟百度时被李彦宏称为“镇院之宝”。

“深度网络学概起始于2006年,当时主要有5个机构从事这方面的研究,分别是多伦多大学、纽约大学、美国的NEC实验室、斯坦福大学和蒙特利尔大学,而我当时在NEC实验室工作。”余凯说。有段时间他还在斯坦福大学执教《人工智能概论》。他领导的团队在深度学习、图像识别、文本挖掘、多媒体检索、视频监控,人机交互等机器学习领域都有建树。

去年余凯离开百度,在中关村的创富大厦租赁办公室成立地平线机器人技术。成立仅4个月,这家公司就迎来了首轮投资,投资方包括晨兴资本、高瓴资本、红杉资本、金沙江创投等多家机构。

比起商业上的追求,余凯更想用技术改变世界―为万物装上人工智能的大脑,让它们变成拥有智能思维的机器人。

在余凯看来,他在百度的工作主要是在“云端”搭建人工智能深度神经网络,其服务主要体现在“为用户提供更智能的互联网服务”,他希望通过人工智能技术应用到物理世界中,让人们的生活变得更方便和简单。“现在很多电器都采用软件结合互联网操控,我希望未来都可以实现本地人工智能操控。”

他准备让汽车、空调、冰箱、微波炉等上千种产品或设备都具有从感知到决策的能力。比如用户进入房间时空调就可以感知人的位置和体温自动开机送风,并追随人的移动而改变送风方向;冰箱则会读取存储食物的信息,及时提醒用户食用或补充。

余凯利用深度神经网络算法来搭建他的人工智能框架。他将这种人工智能系统描述成“类似于安卓的智能硬件的大脑平台”,这个系统可以安装在不同的产品中。

他“改造万物”的计划先从家居产品和汽车两个方面着手。地平线机器人技术研发了针对这两个行业的人工智能操作系统。家居方面的基于深度神经网络的操作系统名为“安徒生”,汽车的则称为“雨果”。

现在 “安徒生”已经入驻家电产品,在刚刚过去的上海家博会展上,地平线机器人和某国内知名家电厂商合作的两款智能产品面世参展。“现在业界最大的智能家居厂商都是我们的客户,我们向他们提供算法操作系统,并告诉他们如何配置硬件设备,就像安卓向手机厂商提供参考设计一样。”

下一步余凯准备让“雨果”进入汽车自动驾驶领域,在安装了传感器、处理器和雨果大脑平台后,汽车可以成为提供无人驾驶或智能驾驶的新型交通工具。

“定义万物智能的大脑,这还要花很长时间,但是我觉得一步一步往那边靠近。” 余凯知道地平线机器人的征程漫漫,但对于AlphaGo对战李世石这样的人机大战新闻他却无比笃定。“赛前几乎所有专家都说这次机器赢不了,但我在接受网易采访的时候就公开预测机器会赢,因为我了解AlphaGo的算法。”

陈运文也表达了相同的猜测。3月9日下午,陈运文就兴奋地预测AlphaGo能够获胜,那时首尔的李世石刚在棋盘上落下自己的第一枚黑子。

3个小时后,对弈到186手时李世石投子推枰宣告认输。

篇9

1、相机系统的定义:即图像信号处理器,用于处理图像信号传感器输出的图像信号。在相机系统中占有核心主导的地位,是构成相机的重要设备。

2、相机系统的基本内容:相机系统是对于计算机视觉最常见的系统,由各种不同相机、光源、存储设备的系统共同组成。

3、相机系统的构建方式:根据应用的不同,可以选择不同的阵列构建方式,如双相机、8相机平行阵列、32相机环形阵列、64相机球形阵列等多种平台。

(来源:文章屋网 )

篇10

关键词:智能科学与技术专业;课程体系;教材建设

继2004年北京大学率先在国内建立“智能科学与技术”本科专业之后,2005年,北京邮电大学、南开大学和西安电子科技大学;2006年,首都师范大学、北京信息科技大学、武汉工程大学和西安邮电学院;2007年,北京科技大学、厦门大学和湖南大学;2008年,河北工业大学和桂林电子科技大学;2009年,重庆邮电大学和大连海事大学;2010年,中南大学和上海理工大学先后经教育部批准先后设立了“智能科学与技术”本科专业[1-2]。在中国人工智能学会教育工作委员会的指导下,自2002年起,各相关专业教师定期召开智能科学与技术教育学术研讨会,并出版教育论文专辑,大力推进了我国智能科学与技术教育的健康、快速发展,并对我国智能科学技术的人才培养和学科建设起到了极大的带动作用。

作为一个发展中的新兴专业,目前各高校仍主要结合自身基础和特点建设该专业。如南开大学以智能技术与智能工程为核心专业课程[3];北京科技大学从社会需求角度出发,以提高学生软件实践能力为切入点[4];河北工业大学根据相关专业的就业现状,以提高学生硬件实践能力为着力点[5]。为了解决南开大学、北京科技大学和河北工业大学3所高校共同面临的课程体系和教材建设等问题,三校教师分别于2010年6月16日和8月2日在南开大学、河北工业大学进行了两次研讨,现将研讨成果汇总于此。

1研讨背景

“智能科学与技术”专业自开办以来,不可避免地要回答如下3个方面的问题:

1) 来自用人单位的问题:“智能科学与技术”专业是做什么的?与其他专业相比优势何在?

2) 来自学生及家长的问题:“智能科学与技术”专业是学什么的?与其他专业相比优势何在?

3) 来自教师自身的问题:“智能科学与技术”专业应该教什么?与其他专业相比优势何在?

无论是做什么、学什么还是教什么,归根到底是课程体系和教材内容。无论是研究生课程下移(带来学生接受知识的困难),还是在其他专业教学体系基础上做简单的增、删、改(带来学生知识结构的凌乱),都是不行的,长此以往的后果将是没有优势,只有劣势。

南开大学、北京科技大学和河北工业大学3所高校的“智能科学与技术”专业建设都源于自动化专业基础,而且都具有典型的工科特色;同时3所高校分别是教育部直属“985”高校、教育部直属国家“优势学科创新平台”建设项目试点高校和河北省属“211”高校,3所高校的“智能科学与技术”专业分别于2006、2007和2008年招生。3所高校在“智能科学与技术”专业建设上的异同特点以及地域便利的条件,为优势互补、交流融合提供了机遇。

2课程体系

根据研究任务的不同,智能科学技术涵盖的内容可以划分为智能科学、智能技术、智能工程三个层次[6]。

1) 智能科学:主要任务是研究人的智慧,建立人机结合系统理论,并用其模拟人的智慧。

2) 智能技术:在智能科学的框架内创建人机结合智能系统所需要的方法、工具和技术。

3) 智能工程:利用智能科学的理念和思想,充分运用智能技术工具创建各种应用系统。它是当前新技术、新产品、新产业的重要发展方向、开发策略和显著标志。

根据上述智能科学技术的划分,智能科学与技术专业的课程体系同样划分为理论、技术与工程应用3个层次,具体框架如图1所示。

需要说明的是,由于课时、学时等因素的限制,有些课程需要包含未列入课程的部分内容。如智能科学与技术概论课程内含系统论的简要介绍;智能控制系统包含可编程序控制器、智能传感器、智能执行器等内容;智能工程包含若干典型智能系统实例。

3教材建设

经南开大学、北京科技大学和河北工业大学3所高校的讨论,一致认为工科专业应以技术和工程应用两个层次为核心,并将人工智能导论和智能信息处理两门课程的教材合并为智能技术。同时,根据南开大学侧重理论、北京科技大学侧重软件、河北工业大学侧重硬件的原则进行分工,编写对应课程的教学大纲和教材内容。

3.1智能技术

本课程包括智能计算和计算机视觉两部分,分别介绍以对人脑的物理结构进行模拟为主要特征的联接主义智能技术和以模拟人类视觉处理为主要特征的计算机视觉两部分。它是智能技术的主干内容;也是实现智能技术、组成智能系统的重要工具,属于本专业本科生的专业基础课。通过智能技术的学习,学生应能够掌握智能技术的基本原理和方法。通过课堂讲解、,并配合一定的作业练习、上机实验等环节,学生应初步具备运用智能技术和方法分析和解决问题的能力。本课程拟定90学时,其中授课54学时,实验36学时。

教材内容包括智能计算和计算机视觉两部分,智能计算部分包括神经网络、模糊理论和遗传算法/蚁群算法,计算机视觉包括计算机视觉导论、计算机视觉理论基础、图像预处理、图像分割、物体识别、图像理解、双目立体视觉、三维视觉技术、主动视觉。

神经网络讲授单个神经元(感知器)的动作原理,与实际生物神经元的对应关系;讲授BP神经网络的组成,网络的特性和对非线性函数的模拟功能;介绍BP算法的优、缺点;讲授H网络的组成结构,H网络在解决优化问题的优越性。模糊理论讲授模糊集合的概念,建立隶属度函数的概念;介绍模糊规则的建立原则,模糊规则与模糊系统收入输出量之间的关系;介绍模糊化以及模糊量精确化的几种常用方法。遗传算法和蚁群算法只作简要介绍,重点介绍这两种算法的特点和成功的应用实例,使学习者有一个感性认识,明确这种类型算法的“迭代”特点以及总体最优目标与个体行为之间的联系。

计算机视觉理论基础主要介绍Marr的视觉计算理论、图像的相关知识、傅立叶变换基础;图像预处理主要介绍像素亮度变换、几何变换、直方图修正、局部预处理、图像复原;图像分割主要介绍阈值处理方法、基于边界的分割方法、基于区域的分割方法;形状表示与描述主要介绍链码、使用片断序列描述边界、尺度空间方法、基于区域的形状表示与描述;物体识别主要介绍知识的表示、统计模式识别、神经元网络、遗传算法、模拟退火、模糊系统;图像理解主要介绍并行和串行处理控制、分层控制、非分层控制;双目立体视觉主要介绍双目立体视觉原理、精度分析、系统结构、立体成像、立体匹配、系统标定;三维视觉技术主要介绍结构光三维视觉原理、光模式投射系统、标定方法、光度立体视觉、由纹理恢复形状、激光测距法;主动视觉主要介绍从阴影恢复形状、从运动恢复结构、主动跟踪。

3.2智能控制理论与技术

本课程是“智能科学与技术”专业的一门重要专业课程,目的是使学生了解智能科学与控制理论结合所产生之智能控制理论的基本概念和应用价值;使学生熟知当前主流智能控制技术的种类,并掌握模糊控制、神经网络控制以及进化计算、群体智能的基础知识,了解智能技术与传统控制方法的结合点;加强MATLAB仿真实验的训练,以使学生更好地理解基础知识,培养学生使用高级智能控制方法解决实际控制问题的能力。本课程的学习将使学生加深对控制理论的理解,明晰智能技术在控制中的应用技巧,也为本科生继续深造打下基础。本课程拟定64学时,其中授课54学时,实验10学时。

教材内容包括智能控制概论,介绍智能控制的发展历程和应用领域,简介几种重要的智能控制方法;专家控制,简介专家系统的基本结构,讲授专家PID控制器的原理与设计方法;模糊控制,讲授模糊数学基础知识、传统的模糊控制原理和控制器设计与实现方法、模糊PID控制的两种形式,特别是PID控制参数的模糊整定技术;神经网络控制,讲授前馈神经网络和递归神经网络中几种典型的网络模型以及学习算法、基于神经网络的线性系统辨识技术、神经网络逆模控制等;进化计算与控制,讲授进化计算的概念、遗传算法的原理及其与其他智能方法的结合,介绍遗传机器人学;群体智能与控制,讲授蚁群算法的基本原理及其在控制问题中的应用,介绍群体机器人学。

3.3单片机原理与应用

本课程是“智能科学与技术”专业的一门专业课程,目的是使学生了解单片机的组成原理及常用控制算法的实现;掌握51系列单片机指令系统和一般汇编程序设计编写方法;熟悉常用的单片机硬件扩展技术;在此基础上,熟练掌握控制算法的单片机程序编写与调试。本课程拟定54学时,其中授课38学时,实验16学时。

教材内容包括单片机系统概述,介绍单片机定义、单片机发展过程及单片机硬件结构;单片机指令系统及程序设计,介绍指令系统和汇编语言程序设计;硬件资源及接口技术,介绍硬件资源和接口技术;单片机使用技术,介绍抗干扰技术、C语言应用程序设计;依次介绍PID控制器、状态反馈控制器、模糊控制器、系统辨识、卡尔曼滤波、滑模控制器、最优控制器、鲁棒控制器、自适应控制器、神经网络控制器的历史沿革、基本原理、常用形式和单片机具体实现方法。

3.4嵌入式系统

本课程以当前主流的嵌入式系统技术为背景,以嵌入式系统原理为基础,以嵌入式系统开发体系为骨架,以嵌入式控制系统开发为目标,较为全面地介绍嵌入式系统的基本概念、软硬件的基本体系结构、软硬件开发方法、相关开发工具、应用领域、热门领域的开发实例以及当前的一些前沿动态,为学生展示较为完整的嵌入式控制系统领域概况。本课程拟定64学时,其中授课48学时,实验16学时。

教材依据嵌入式控制系统的特征,将控制算法、嵌入式系统硬件、操作系统、应用程序设计及组态软件作为统一的技术平台介绍,突出嵌入式技术在控制系统中应用的特点,重点介绍嵌入式控制系统软硬件、电路、操作系统、实时性、可靠性等特性,从软件体系结构及开发的角度出发,强调实时调度、Bootloader、BSP、嵌入式实时多任务系统设计、交叉开发与仿真开发等关键技术,并特别引入了工业控制中需要的电磁兼容性设计和大量的典型嵌入式控制系统实例设计。通过本课程的学习,学生不但可以学会使用工具开发嵌入式软硬件,而且可以从总体角度选择适当的技术和方法,全面规划和设计嵌入式系统。

3.5智能工程

本课程是“智能科学与技术”专业的一门核心专业课程。面向智能技术的实际应用,着眼于解决工程应用中的技术问题,从典型系统设计案例分析出发,通过大量实验提高学生的工程实践能力。本课程拟定36学时,全部为授课学时。

教材内容包括智能工程概论,介绍智能工程现状、工程设计原则和工程实际流程;常用传感器原理,介绍传感器一般特性、光电式传感器和视觉传感器;典型智能系统设计案例,包括智能移动机器人、智能电梯群控电梯等系统。

3.6智能机器人

课程通过对一个具有代表性的仿人机器人的拆解,将知识点拆解成6个主要教学模块:1)机器人控制模块,介绍各类控制模块的原理与组成;2)机器人运动系统,介绍电机与舵机的原理与控制方法;3)机器人动作系统,介绍机器人各部件的协调控制;4)机器人视觉系统,介绍典型的超声波、影像传感器的原理与识别算法;5)机器人表现系统原理,介绍人与机器人的交互原理;6)机器人通信系统原理,介绍机器人之间的数据与信息传递方法。学生学习时,能够与基础知识相联系,并能掌握机器人这门技术,为从事机器人产品研发工作打下坚实的基础。本课程拟定54学时,其中授课44学时,实验10学时。

教材面向“智能科学与技术”专业,同时兼顾信息类专业学生编写,根据这类专业学生的知识结构和特点组织内容。从具体的机器人控制需求出发,将自动控制的基本理论和机器人控制特点相结合,讲授机器人控制系统的组成、规律、特点和设计方法。理论上反映当前的最新进展,内容上考虑初学者的需求,侧重普及性、实用性和新颖性,结构体系符合信息类和控制类专业学生的特点,力求简洁、清楚,对技术的叙述遵循目标、问题、理论依据、实现方法、实际情况、发展方向的方式。做到重点突出,符合实际,满足需要,指导性强。

3.7智能控制系统

本课程是“智能科学与技术”专业的一门专业课程,使学生了解智能控制系统的基础知识;掌握智能控制系统中最新的智能传感技术、智能控制器、智能执行能执行器及智能网络与接口技术;掌握智能控制系统中多个关键硬件装置的识别及其使用。通过学习多个智能控制系统的开发实例,学生应掌握智能控制系统的设计方法与技术,坚实地掌握最新智能控制系统知识,提高理论联系实际的能力,并为学习其他课程的打下坚实基础。本课程拟定64学时,其中授课48学时,实验16学时。

教材内容包括概述,介绍智能控制系统的基本概念、基本内容和机构及其发展趋势;智能传感系统,讲授智能数据采集技术、传感器智能化的数据处理方法、多传感器信息融合的方法、智能传感器实现方法与典型实例;智能控制器设计,讲授基于单片机的智能控制器设计及其应用、基于高性能嵌入式ARM的智能控制器设计及其应用、基于PLC的智能控制器设计及其应用;智能电动执行器,讲授智能电动执行器的硬件实现技术,软件设计技术以及典型的智能电动执行器实例及其应用;智能网络与接口技术,讲授无线传感器智能网络,工业现场总线网络以及智能传感器、智能控制器和智能执行器的网络接口实现技术;智能控制系统设计实例,综合利用前面的知识设计网络化智能压力传感器的系统设计、基于声音定位的智能机器人系统设计、基于微机电惯性传感器的汽车多路况智能防撞系统的设计、大型设备的PLC智能控制系统设计。

4结语

通过南开大学、北京科技大学和河北工业大学3所高校的研讨,我们凝练出较完整的“智能科学与技术”专业课程体系,体现出本专业的特色;提出可供3所高校共同使用的教学大纲和教材内容,体现出学生培养的工程实践导向。这些研究成果可以为开办“智能科学与技术”专业的兄弟院校进一步研讨提供蓝本,也可以为筹建该专业的高校所参考。

注:本文受到北京科技大学教学研究会第六批教学研究课题、北京科技大学教育教学研究基金青年教师教育教学研究立项项目、河北工业大学教改项目(2010-12)支持。

参考文献:

[1] 王万森,钟义信,韩力群,等. 我国智能科学技术教育的现状与思考[J]. 计算机教育,2009(11):10-14.

[2] 教育部关于公布2009年度高等学校专业设置备案或审批结果的通知[S]. 教高〔2010〕2号,2010.

[3] 方勇纯,刘景泰. 南开大学“智能科学与技术”专业教学体系与实验环境建设[J]. 计算机教育,2009(11):21-25.

[4] 石志国,刘冀伟,王志良.“智能科学与技术”本科专业软件实践类课程建设探讨[J]. 计算机教育,2009(11):93-97.

[5] 刘作军,张磊,杨鹏,等. 谈我校增设“智能科学与技术”专业的设想与措施[J]. 计算机教育,2009(11):53-56.

[6] 卢桂章. 无处不在的智能技术[J]. 计算机教育,2009(11):68-72.

A Study on the Course System and Textbook Construction for the Discipline of

Intelligence Science and Technology

YANG Peng1, ZHANG Jian-xun2, LIU Ji-wei3, ZHANG Lei1

(1. Hebei University of Technology, Tianjin 300130, China; 2.Nankai University, Tianjin 300071, China;

3. University of Science and Technology Beijing, Beijing 100083, China)