计算机视觉方法范文
时间:2023-12-26 18:01:06
导语:如何才能写好一篇计算机视觉方法,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
doi:10.11772/j.issn.10019081.2013.07.2018
摘 要:
电池在生产过程中常常因为设备故障造成其表面产生各种伤痕,传统的人工检测在及时性和耐久性上存在很大缺陷,而现在国内外又缺乏一种针对普通电池表面缺陷的有效自动检测手段。针对电池表面缺陷的分布位置及形态特点,提出一种新的基于计算机视觉的光学自动检测方法。所提方法基于电池负极表面形态特征,利用Canny算子和原创的自由离子碰撞法配合最小值搜索确定待检测区域;针对伤痕比较尖利这一形状特征,用修正的Harris角点作为标记点标记缺陷位置,利用标记点的聚集度信息滤除伪标记点,最后提取出缺陷处图像。实验结果证明所提方法在自然光照环境下的检测成功率达到90%以上且比小波分析法具有更好的检测效果。研究成果为电池生产提供了一种产品质量自动检测的参考方法。
关键词:缺陷;自动检测;电池;Harris角点
中图分类号:TP391.413
文献标志码:A
英文标题
New engineering method for defect detection of batteries based on computer vision
英文作者名
XU Jianyuan*, YU Hongyang
英文地址(
Research Institute of Electronic Science and Technology, University of Electronic Science and Technology of China, Chengdu Sichuan 611731, China英文摘要)
Abstract:
篇2
关键词:摄像机标定 视觉 单目 双目 计算机应用 测量
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2014)02-0053-03
Abstract:Between the actual shape of the object and it’s camera image formed a certain function,for the purpose of obtaining the function parameters,in this paper using Matlab to camera calibration for vision measurement system.The method uses the Matlab toolbox and VC + +6.0 compiler software,designed calibration methods and software programs, conveniently and accurately complete the calibration of single camera and the dual camera,and obtained internal and external parameters of the camera,simplify the calibration procedure,improves the calibration rate,and has good portability,suitable for other vision measurement system.
Key Words:Camera calibration Computer vision Monocular camera Binocular camera Computer application Measurement
在机器视觉应用中,我们选择的摄像机都会有图像畸变。我们看到的物体在摄像机上所成的像与物体实际的形状是有一定的函数关系的。这些函数的参数都是未知或不准确的,我们需要通过实验与计算来得到这些参数,求解这些函数的参数的过程就称为摄像机标定。这一过程精确与否,会直接影响立体视觉系统的测量精度。Matlab是一款专业的数学矩阵处理软件,在现阶段是非常流行,深得人们的信任与喜爱。我们选择Matlab用来标定也是看重了它在数学与图形图像处理方面的超强处理能力。而事实证明,它计算出的结果精确度高、可信度强,正是我们机器视觉项目所需要的。
Matlab提供了很多应用工具箱,其中就有标定工具箱toolbox_ calib供我们使用,其图形交互式的处理方式直观简单、结果快速精确,是标定这一重要步骤非常合适的工具。
1 单个摄像机分别标定
本文采用的是平面棋盘格,棋盘规格为27.5mm。用双目摄像头获得不同位置下的棋盘图片,理论上采集越多的图像,所求出的结果越精确。根据实验所需,一般采集20组左右,并记录标定板的位置信息。
在双目立体视觉系统中,由于其它标定方法的不稳定性和局限性,我们最终决定用Bouguet算法的Matlab标定工具箱分别对左右两个摄像头进行标定,Matlab标定工具箱对单个摄像机标定步骤如下:
首先在F:\Program Files中安装MATLAB R2012a主程序。下载Matlab标定工具箱,把Matlab工具箱的文件夹toolbox_calib复制到安装目录F:\Program Files\MATLAB R2012a\toolbox下,再把我们前面已经拍摄的标定棋盘图复制到F:\Program Files\MATLAB R2012a\toolbox\toolbox_calib下。启动Matlab程序,在Command Window内输入:
>>addpath('F:\Program Files\MATLAB R2012a\ toolbox\toolbox_calib')
>>cd('F:\Program Files\MATLAB R2012a\ toolbox\toolbox_calib')
上述语句的意思是将Matlab工作空间设置在安装文件夹F:\Program Files\MATLAB R2012a\toolbox\toolbox_calib下。为了验证工作空间已经设置成功并且标定的棋盘图能正确识别,继续在Command Window内输入:
>> which right1.jpg
如果窗口内显示:
F:\Program Files\MATLAB R2012a\toolbox\ toolbox_calib\right1.jpg
则证明能在工作目录下找到标定所用图像right1.jpg。
准备工作完毕,运行calilb_gui进行摄像机标定。选择Standard,出现如图1-1所示窗口。
先标定右摄像机,点击Image names,在Matlab命令行窗口会提示你输入图片的basename(基础名称),实验的图片文件名是right1,right2,…,right12,basename就是right。我们输入rignt,按回车,接下来是让你输入图片的格式,实验中保存的是jpg格式,就输入jpg,按回车。Matlab工具箱自动读入实验中棋盘格图片,Matlab完成12幅右摄像头的棋盘图的读入。
回到calilb_gui,选择Extract grid corners,进行这12张棋盘图角点的提取。实验中是找最外面一圈的角点,回到Matlab的Command Window,命令行会出现如下提示:Extraction of the grid corners on the images
Number(s)of image(s)to process([]=all images) =
Window size for corner finder(wintx and winty):
它的意思是输入棋盘角点搜索窗口wintx、winty的长和宽,我们选77大小即可。
角点提取界面会在选择完毕后自动弹出,我们按一定顺序分别提取棋盘的最边上的角点,工具箱会自动找到所有内部对应的角点,如图1-2,点击4个最外边的角点即可。
然后回到Matlab的Command Window,输入棋盘格方格大小。这步定义了空间的尺度,在后面的物体测距、物体大小描述等信息方面起着重要作用。
开始下一幅图的角点提取。完成后回车即可自动读入下一幅图,同理完成12幅图的提取。回到calilb_gui界面,点击Calibration,开始摄像头标定。等待30秒左右,Matlab计算得到了摄像头的本征参数和畸变参数,如下所示:
Focal Length:fc=[984.22621 988.55599] ? [14.18888 14.22740]
Principal point:cc=[356.08748 201.80653] ? [12.12838 10.94669]
Skew:alpha_c=[0.00000] ? [0.00000]=>angle of pixel axes=90.00000 ? 0.00000 degrees
Distortion:kc=[0.04377 0.06571 -0.01079 0.00196 0.00000] ? [0.05325 0.45593 0.00469 0.00398 0.00000]
Pixel error:err=[0.11090 0.10129]
回到calilb_gui面板点击Show Extrinsic查看标定3D效果,如图1-3所示。通过已经记录的实际标定板与摄像机的相对位置,验证标定结果是否符合要求。
验证标定结果无误之后,点击面板上的Save按钮,程序会把标定结果放在F:\Program Files\MATLAB R2012a\%drive_F%文件夹下一个叫Calib_Results.mat的文件中,为了后面立体标定识别的方便性,把这个文件名改为Calib_Results_right.mat,复制到Matlab工作目录下方便后续使用,不复制的话程序会找不到相应文件。
同理对左摄像头进行标定,又生成了新的Calib_Results.mat,将其文件名改为Calib_Results_left.mat并复制到Matlab工作目录下。
2 立体标定
用相同的方法对左右摄像头都进行标定之后,开始立体标定。退出calib_gui面板,回到Matlab的Command Window,在该行有>>的情况下输入stereo_gui按回车键,出现图2-1所示界面,开始立体标定。
点击Load left and right calibration files并在命令行中按两次回车键选择默认的文件名(Calib_Results_left.mat和Calib_Results_right.mat),回到stereo_gui面板点击Run stereo calibration开始立体标定,等待10s左右,左右摄像头的参数都计算出来了,也求出了两个摄像头之间的旋转和平移关系向量(om和T)。
Intrinsic parameters of left camera:
Focal Length:fc_left=[981.10666 982.53816] ? [9.19436 9.02776]
Princi palpoint:cc_left=[276.37936 281.21468] ? [14.55475 8.38110]
Skew:alpha_c_left=[0.00000] ? [0.00000]=>angle of pixel axes=90.00000 ? 0.00000 degrees
Distortion:kc_left=[-0.14594 1.22238 0.00740 -0.01087 0.00000] ? [0.07311 1.03011 0.00193 0.00421 0.00000]
Intrinsic parameters of right camera:
Focal Length:fc_right=[979.65348 984.02580] ? [9.04324 9.18283]
Principal point:cc_right=[361.22778 212.64918] ? [11.95349 9.48257]
Skew:alpha_c_right=[0.00000] ? [0.00000]=>angle of pixel axes=90.00000 ? 0.00000 degrees
Distortion:kc_right=[0.03619 0.08136-0.00818 0.00289 0.00000] ? [0.05344 0.48159 0.00376 0.00391 0.00000]
Extrinsic parameters (position of right camera wrt left camera):
Rotation vector:om=[-0.06188 -0.04645 -0.00279] ? [0.01033 0.01794 0.00067]
Translation vector:T=[-112.45166 0.84707 -2.84633] ? [0.17761 0.19990 2.27834]
回到stereo_gui界面点击Show Extrinsics of stereo rig,弹出双目摄像机标定三维环境状态图,结果如图2-2所示,两个摄像头基本是前向平行并在一条直线上,摄像头之间的距离为112mm,计算得十分准确,标定板和摄像头的相对距离也非常精准,标定板自身放置姿态也基本符合。
3 保存标定结果
由立体标定得到了立体标定参数之后,就可以把参数放入xml文件,xml文件为以后的程序调用作准备。
平移矩阵T得到的结果是基于右摄像头为向量起点的,在后面的cvStereoRectify( )函数得到视差图,再用cvReprojectImageTo3D( )函数得到深度图,其中都是以左摄像头为基准的,所以T向量都要反转才能再使用。
要注意的是Matlab标定结果中的om向量,它代表的意义是右摄像头相对左摄像头的旋转角度。这个向量是旋转矩阵通过Rodrigues变换之后得出的结果,如果要在cvStereoRectify中使用的话,需要将这个向量用cvRodrigues转换成旋转矩阵。
4 结语
借助棋盘格标定板,应用Matlab工具箱及VC++6.0,准确的实现了单目摄像机及双目摄像机的标定工作。并对实验过程环境状态进行3D显示,可以清楚看出计算结果与实际位置十分吻合,本方法简单易行,可以应用与视觉测量系统中单、双摄像机的标定。
参考文献
[1]马颂德,张正友.计算机视觉-计算理论与算法基础[M].北京:科学出版社,1998:52-59.
[2]Tsa i R Y.A versatile camera calibration technique for high accuracy 3D machine vision metro logy using of the-shelf TV cam eras and lenses[J].IEEE Journa l of Robotics and Automation,1987,3(4):323-344.
篇3
摘要:云计算是分布式计算技术的一种,通过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。本文简要探讨在云计算时代存在的信息安全问题及解决这些问题的方法。
关键词:云计算;安全风险
Security Risks&Solutions in Cloud Computing Era
Chen Xin
(Jiangsu Highway Management Centre,Nanjing211300,China)
Abstract:Cloud computing is a distributed computing technology, network computing will be a huge program automatically split into numerous small subroutine,and then handed over to multiple servers through an extensive system search,calculation and analysis after the treatment results back to the user.In this paper,Security Risks&Solutions in Cloud
Computing Era was Investigated.
Keywords:Cloud computing;Security risk
一、云计算的定义与现状
云计算是并行计算、分布式计算和网格计算的发展实现。目前云计算的产业分三层:云软件、云平台、云设备。上层分级:云软件提供各式各样的软件服务。参与者:世界各地的软件开发者;中层分级:云平台程序开发平台与操作系统平台。参与者:Google、微软、苹果;下层分级:云设备集成基础设备。参与者:IBM、戴尔、惠普、亚马逊。
二、云计算的重要特点
(一)超大规模。“云计算管理系统”具有相当的规模,Google的云计算已经拥有100多万台服务器,Amazon、IBM、微软、Yahoo等的“云”均拥有几十万台服务器。“云”能赋予用户前所未有的计算能力。
(二)虚拟化。云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具置。
(三)高可靠性。“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。
(四)通用性。云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。
(五)高可扩展性。“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。
(六)廉价。由于“云”的特殊容错措施可以采用极其廉价的节点来构成云,因此用户可以充分享受“云”的低成本优势。
三、云计算存在的信息安全
作为一项可以大幅降低成本的新兴技术,云计算已受到众多企业的追捧。然而,云计算所带来的安全问题也应该引起我们足够的重视。
云计算使公司可以把计算处理工作的一部分外包出去,公司可以通过互联网来访问计算基础设施。但同时,数据却是一个公司最重要的财富,云计算中的数据对于数据所有者以外的其他用户云计算用户是保密的,但是对于提供云计算的商业机构而言确实毫无秘密可言。随着基于云计算的服务日益发展,云计算服务存在由多家服务商共同承担的现象。这样一来,公司的机密文件将经过层层传递,安全风险巨大。
总的说来,由云计算带来的信息安全问题有以下几个方面:
(一)特权用户的接入
在公司外的场所处理敏感信息可能会带来风险,因为这将绕过企业IT部门对这些信息“物理、逻辑和人工的控制”。
(二)可审查性
用户对自己数据的完整性和安全性负有最终的责任。传统服务提供商需要通过外部审计和安全认证,但一些云计算提供商却拒绝接受这样的审查。
(三)数据位置
在使用云计算服务时,用户并不清楚自己的数据储存在哪里,用户甚至都不知道数据位于哪个国家。用户应当询问服务提供商数据是否存储在专门管辖的位置,以及他们是否遵循当地的隐私协议。
(四)数据隔离
用户应当了解云计算提供商是否将一些数据与另一些隔离开,以及加密服务是否是由专家设计并测试的。如果加密系统出现问题,那么所有数据都将不能再使用。
(五)数据恢复
就算用户不知道数据存储的位置,云计算提供商也应当告诉用户在发生灾难时,用户数据和服务将会面临什么样的情况。任何没有经过备份的数据和应用程序都将出现问题。用户需要询问服务提供商是否有能力恢复数据,以及需要多长时间。
四、云计算中确保信息安全的具体方法
(一)对保存文件进行加密
加密技术可以对文件进行加密,那样只有密码才能解密。加密让你可以保护数据,哪怕是数据上传到别人在远处的数据中心时。PGP或者对应的开源产品TrueCrypt等程序都提供了足够强大的加密功能。
(二)对电子邮件进行加密
为了确保邮件安全,使用Hushmail或者Mutemail之类的程序,对收发的所有邮件进行加密。
(三)使用信誉良好的服务
建议使用名气大的服务商,它们不大可能拿自己的名牌来冒险,不会任由数据泄密事件发生,也不会与营销商共享数据。
(四)考虑商业模式
在设法确定哪些互联网应用值得信任时,应当考虑它们打算如何盈利。收取费用的互联网应用服务可能比得到广告资助的那些服务来得安全。广告给互联网应用提供商带来了经济上的刺激,从而收集详细的用户资料用于针对性的网上广告,因而用户资料有可能落入不法分子的手里。
(五)使用过滤器
Vontu、Websense和Vericept等公司提供一种系统,目的在于监视哪些数据离开了你的网络,从而自动阻止敏感数据。比方说,社会保障号码具有独特的数位排列方式。还可以对这类系统进行配置,以便一家公司里面的不同用户在导出数据方面享有不同程度的自由。
参考文献:
[1]MICHAEL MILLER.云计算,2009,7
篇4
关键词:工程造价;预决算审核;问题;应对措施
在工程造价预决算审核中,存在着各式各样的问题,主要集中在设计概算、决算、施工图预算审核等方面。现在我来简要谈谈工程造价预决算中存在的问题以及应对方案。
一、工程造价预决算中存在的问题
1.1多算工程量和重复计算工程量
多算工程量和重复计算工程量虽然都会导致最后计算出的工程量与实际不符,但是其根本原因却是截然不同的。
多算工程量的差错可能主要出现在隐蔽工程和砼工程等方面,由于这些工程自身的结构复杂,桩、承台、梁、柱、板等零件的数量众多,导致计算统计数量困难,于是在计算截面面积时有时会采用多个界面组合的方法。同时,相重叠的部分也会致使多算,种种原因加起来导致最后计算出来的工程量大于实际的工程量。
而重复计算工程量则是由于为了使计算方便而产生的误差。比如已经单独列出过的零件如墙壁柱砖砌体,在计算墙砖项目的总量时由于墙壁柱砖砌体的数量比较少,就没有再次从中扣除,这样就导致了墙壁柱砖砌体的数量被计算了两次。同样的情况还发生在钢筋混凝土构件等小数量的零件上,归根结底只是为了使计算更方便,减少麻烦。
然而这些问题都不是无法避免的,只要做到细心认真。这就要求在计算工程量时,要实事求是,不马虎不松懈。要严格按照国家工程量计算规则来计算,在计算过程中严谨认真,结算出结果后首先结合自己的经验来判断是否合理,然后按照实际工程量来检查核对。[1]
在一般的民用建筑工程中,我们一般按照如下的要求来进行。钢筋混凝土每平方米折实厚度:地下室:1.0一1.5立方米/平方米(地下室面积);上部框架:0.3―0.35立方米/平方米(上部建筑面积);综合:0.4一0.45立方米/平方米(全部建筑面积)等。不同的结构有其自己固定的占地面积比,在这里我不再多举例。但需要指出的是,我们要严格的按照这些规定指标,不超标不乱造,重视国家标准,时时刻刻都能保证其正确性,同时也保证科学性和合理性。
1.2定额应用套价的问题
套用定额时要注意根据不同项目的不同特点选择合适的定额,由于定额自身的科学性与权威性,致使我们在套用定额时要更加的严谨,确保不出差错,一定要找到适用的定额再套用。在套用时要注意定额的适用界限、注释说明及单价换算等其他注意事项。[2]
1.2.1定额套用界限
一个适用的定额子目的确定往往要经过多重筛选,同一个项目可能有很多适用的子目,这时到底该套用哪一个就会出现意见分歧。在遇到这种情况时,我们要明智的选择,对于不同的子目要理智的分析其不同的特点,结合施工方案的自身特性来选择最合适的那一个,通常来说施工单位的选择方法是根据子目单价来选择。所以对于子目的选择,要求我们要明确划分定额中的同类工程量的子目套用界限,这样才能更好更快的选出最适合的子目来套用。
1.2.2定额适用范围
当工程施工项目已经结束或者已经被其他子目包括了的时候,这个项目是不能在原有子目中再度存在的。然而在原土碾压、平整场地等工程中,即使子目不再存在,施工单位为了牟取更多的经济利益,于是虚报工程造价,重新列出这些已经不存在的子目,无视工程类型。施工单位谋求经济利益的手段还有将一些定额内容已经很明确的小型拆除项目,比如凿除块料面层、结合层、清理基层、废渣堆放等,套用2次定额,提高工程量。在这种情况下我们应该将定额适用范围作出明确的规定与划分,并严格按照规定执行。
1.2.3定额单价换算
在进行定额单价换算的时候往往也会出现一些错误,这些错误主要集中于定额单价转换的方法选择不当以及套用定额单价时单价错误两个方面。在工程队施工时,经常通过一种方法来提高造价,即只换实际块料价但不换定额的含量,这样会导致造价的大幅度增加,至于为什么会增加,现在让我来阐述。在块料子目中,实际尺寸经常会与定额尺寸不相符,会发生这种情况的原因在于实际块料的尺寸小,即实际用量少于定额,又由于块料越少,缝隙越多,因此这表明,块料少的时候,同正常情况相比块料面积也必然减少,这样就会导致造价的增加。[3]
二、应对措施
2.1正确地掌握新材料新工艺新技术的使用
任何事物都是在不断发展中前行的,只有掌握了新的技术,灵活使用新材料,才能更好的发展,对于工程造价预决算审核也是一样。在过去,我们使用的方法主要是套用定额,但随着建筑行业的不断发展,对于现如今的情况这个方法已经渐渐不能胜任,使用起来越来越吃力,出现了各方面的问题。因此在技术方面,我们要创造并熟练运用新的技术。在材料方面,新型材料已经大范围覆盖了过去的木材等材料。铝合金、轻钢龙骨吊顶、不锈钢饰面、特种玻璃等新型材料走进了人们的生活。但在人们还没有完全习惯这些新型材料的当下,市场上会出现各种质量不同价格各异的相同材料,这会给预决算编审工作带来许多的困难。于是就要求决算人员能够“慧眼识英雄”,在了解市场、熟悉各家产品的质量、价格的前提下,不断更新手头信息,对定额造价按实际情况不断地作出合适的调整,正确计算出实际造价。同时不能忘记遵守原有的规则。规则与实际相结合,才能作出最科学最正确的造价,避免发生由于不熟悉市场而造成的被施工单位抬高价格的情况。
2.2以实事求是的原则进行编审工作
工程造价的预决算最重要的要求就是实事求是,这也是作为一个造价师应遵守的原则。在面对不同承包形式时,无论是平方米造价包干还是别的承包形式,都要准确的进行工程造价,绝不忽略预决算编审工作,严格的进行工程预算。在进行工程预决算编审工作时,既不能多算也不能少算,多算会使得施工人员通过少量劳动得到大量的与劳动量不相符的利润,而少算会使工程的进行由于资金的缺乏而难以再进行下去,再次追加资金的投入是一件很麻烦的事情。避免在施工时不严格按照图纸施工的情况。正确的进行工程预决算编审工作也能保证工程完成的质量。[4]
三、结论
对于预决算编审人员,我们要求他熟悉各项规定,具有将预决算编审做好的实际能力,同时掌握建筑行业各方面的知识,熟悉不断动荡的行情。只有做好了工程造价预决算审核,才能使工程施工得到完善。对于国家发展的大局建设也能做出应有的贡献。
参考文献
[1]陈美兰;房地产企业整体成本控制论析[J];国际商务财会;2011年05期
[2]刘立涛 冯尊荣 田昆;建筑工程中造价管理的重要性[J];价值工程;2011年30期
篇5
关键词:绝缘子;憎水性;稀疏表示;图像识别
中图分类号:TM855 文献标识码:A
与传统电瓷、玻璃绝缘子相比,复合绝缘子因其具有优异的耐污闪性能而在电力系统中被广泛使用.复合绝缘子的憎水性和憎水迁移性是其具有较强耐污闪性能的基础,然而其在运行中因受到紫外线、污秽、电磁场等条件的共同作用会出现老化现象,使得复合绝缘子憎水性下降,严重老化的绝缘子甚至会丧失其憎水性[1-2].因此有必要定期对运行中的复合绝缘子的憎水性进行检测,及时更换憎水性不合格的绝缘子.目前现场测量复合绝缘子憎水性的方法主要为喷水分级法[3],该方法将复合绝缘子憎水性分为HC1至HC7 7个等级,其操作简单,对检测设备要求低,但完全依赖于人的主观判断,容易引起检测结果的不一致性.
目前,国内外一些学者提出了基于绝缘子憎水性图像的智能检测方法,文献[4-5]采用图像预处理去除噪声和杂波,利用方向滤波、自适应滤波等方法提取图像的水珠或者水迹边缘,对水珠特征参数进行统计以后利用K邻近算法进行模式识别,从而确定憎水性等级.这种方法克服了目测的主观性,但是由于图像分割处理中很容易出现过度分割或者欠分割现象而导致分割失败,使得后续的特征值提取失准从而导致分类算法无法进行.如图1所示为运用先进的水平集方法对去噪后憎水性图像进行分割时,出现过分割和欠分割的现象.
本文采用稀疏表示分类算法(Sparse Representation Classification, SRC)对复合绝缘子憎水性图像进行识别与分类.稀疏表示的算法是由Wright等于2009年提出应用于人脸识别领域中的算法[6].在该方法中一个测试样本被所有训练样本稀疏线性表示,然后从中找出对测试样本表示误差最小的一类训练样本.这一研究为稀疏表示在图像识别中的应用开辟了新的方向.本文运用稀疏表示分类算法对复合绝缘子憎水性图像进行分类,通过对稀疏表示系数以及最小残差的计算找出样本库中与测试图像最接近的训练图像,从而判断测试图像所对应复合绝缘子的憎水性等级.
1稀疏表示算法
由于拍摄图片光照条件、拍摄角度、拍摄距离等实际因素的影响,即使是同一等级的水珠图像也会呈现出多种不同的效果,所以在选择训练样本时,要综合考虑各种水珠图像所可能呈现的情况.以HC1级别的憎水性图像为例,此时的复合绝缘子憎水性能较好,喷水后复合绝缘子伞裙表面会呈现出单个独立的水珠.但由于受到拍摄条件的影响,水珠的大小、形状、分布有很大的不同.为了能使训练样本最大限度的代表HC1级别憎水性图像的特征,选取具有不同大小水珠、不同光照条件、水珠分布疏密不一致、以及水珠重心倾斜不同角度的憎水性图像作为训练样本集.对于HC4~HC6级别的憎水性图像,由于这些类别复合绝缘子表面出现了不同程度的污秽,使得拍摄所得水珠图像的背景进一步复杂化,需要考虑背景中污秽的分布以及污秽等级的影响.本文所用到的部分HC1~HC6的训练样本图像如图2所示.
3实验结果统计与分析
3.1可理解性分析
一个分类模型的质量通常由两方面进行评估决定:分类试验的准确率以及该模型的可理解性.图4(a)和(b)给出了同属憎水性等级HC1级的两个测试样本,图4(c)和(f)为利用训练样本库里所有样本图像对测试样本进行稀疏表示所得的两组稀疏表示系数和利用式(6)计算得到的各类表示误差.从图4(c)中可以看出:第1类训练样本所对应的稀疏表示系数明显大于其他几类的稀疏表示系数.这说明训练样本集中第1类样本对稀疏表示的贡献最大,这也在图4(d)表示的各类测试误差中得到了体现.因此我们仅通过图4(c)就可判定测试样本属于第1类,即该憎水性图像所对应的复合绝缘子的憎水性属于HC1级.但是,在对第2个测试样本图像进行测试时,仅根据图4(e)的稀疏表示系数对其憎水性级别进行划分有一定的困难,各个类别所对应的稀疏表示系数变化跨度很大,系数之间大小相近的也很多.此种情况下通过进一步计算该测试图像与稀疏表示各类之间的残差来对测试图像进行分类.由图4(f)可知:第1类训练样本与测试图像之间的残差最小,以此可判定该测试样本属于第1类,即该憎水性图像所对应的复合绝缘子憎水性等级为HC1级.
通过这个例子可以看出,利用稀疏表示对复合绝缘子憎水性图像进行分类时,稀疏表示的系数具有以下两个特点:
1)测试样本所对应类别的训练样本参与该稀疏表示的比例最大.
2)同类测试样本所对应的稀疏表示系数都比较接近.
3.2实验结果分析
据文献[11],憎水性为HC1~HC2级的复合绝缘子可以继续入网运行,HC3~HC5级时需要进行跟踪监测,HC6~HC7级的复合绝缘子必须退出运行.本文在实验测试阶段将复合绝缘子憎水性试验图像分成继续运行,继续观测,退出运行3大类.将HC1~HC2分为第1类,HC3~HC5分为第2类,HC6~HC7分为第3类.相对应的样本训练集也进行了相应的调整,形成了具备上述3大类共107幅标准憎水性图像的训练样本库即训练样本空间,其中第1类样本40幅,第2类样本30幅,第3类样本37幅.由于第1类样本图像中水珠较多,导致图像情况复杂,故相应增加了第1类样本图像的数量.
4结论
测试结果表明:运用稀疏表示分类算法对复合绝缘子憎水性图像进行检测分类具有较高的准确率和可行性.复合绝缘子图像光照情况复杂,水珠分布随机不规则,可见该算法对外界环境的改变具有一定的鲁棒性.与传统的憎水性图像识别分类方法相比,稀疏表示分类算法避开了复杂的图像分割和特征提取过程,大大简化了复合绝缘子憎水性检测步骤.如何通过丰富和优化憎水性图像训练样本库进一步提高算法准确率是今后努力的方向.
参考文献
[1]赵林杰,李成榕,熊俊,等. 基于带电检测的复合绝缘子憎水性评价[J]. 中国电机工程学报,2008,28(16): 135-142.
[2]张福林. 复合绝缘子外绝缘基材硅橡胶表面的憎水性和憎水迁移性机理分析[J]. 华北电力技术, 1999,3(1):19-21.
[3]STRI Guide921,Hydrophobicity classification Guide[S].Sweden: Swedish Transm Res Inst, 1992.
[4]BERG M. A digital image processing method for estimating the level of hydrophobicity of high voltage polymeric insulating materials[C]//1999 Conference on Electrical Insulation and Dielectric Phenomena.Austin:IEEE,1999:756-762.
[5]彭克学,王泉德,王先培. 基于表面喷水图像分析的绝缘子表面憎水性检测方法[J].绝缘材料,2005,7(1):47-51.
[6]WRIGHT J, YANG A Y. Robust face recognition via sparse representation[J]. IEEE Trans on Pattern Analysis and Machine Intelligence(PAMI), 2009, 31(2):210-227.
[7]DONOHO D, TSAIG Y. Fast solution of l1norm minimization problems when the solution may be sparse[J]. IEEE Trans on Information Theory, 2006,54(11):4789-4812.
[8]DONOHO D. Compressed sensing[J]. IEEE Trans on Information Theory,2006,52(4):289-1306.
[9]HUANG J, HUANG X, METAXAS D. Simultaneous image transformation and sparse representation recovery[C]//Proceedings of CVPR. Anchorage: IEEE,2008:1-8.
[10]DONOHO D, TSAIG Y. Fast soluion of l1-norm minimization problems when the solution maybe sparse[R]. Department of Statistics, Stanford University, USA,2008.
篇6
关键词:人眼视觉特性;Butterworth滤波器;空间频率;彩色图像滤波
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)16-3893-03
已有的研究表明,空间频率变化影响视觉纹理、面部模式和文字的识别绩效[1]。而其中空间频率的处理依赖于对变换域理论与人眼视觉特性的研究。但是是在以往的图像滤波处理中,仍然存在计算方式不统一、不明确,单位多样的问题,对研究结果之间的交流带来了诸多不便。该文通过已有的图像空间频率和视觉空间频率的公式,结合Butterworth滤波器的传递函数,提出了一种更加简单、直观的滤波器截止频率参数计算方法,并结合MATLAB对彩色图像进行了实际的处理和具体的分析。
1 视觉上的空间频率和图像空间频率的转换关系
人眼视觉特性(HVS)是图像处理技术的理论基础,在应用人眼的感知特性进行图像处理的过程中,最关键的是将人眼视觉特性及其模型与图像的变换域特征结合起来,也就是将视觉的空间频率和图像的空间频率建立联系,利用频率之间的联系就可以实现对图像的滤波处理。
根据上式及公式(5),也可以得出位置[(u,v)]的点对应的图像空间频率[υ]。
3 基于人眼视觉特性的Butterworth滤波器空间频率的计算方法
本文采用的滤波器为巴特沃思滤波器,它在线性相位、衰减斜率和加载特性三个方面具有特性均衡的优点。因此在自动控制、图像、通信等众多领域得到了广泛的应用。因为Butterworth低通和高通滤波器的传递函数用到的参数均相同[3],故这里就以Butterworth低通滤波器为例阐述频率参数的计算方法。
已知n阶截止频率为Do的Butterworth低通滤波器的传递函数为:
5 总结
从图像处理效果看出,在具体的滤波实验中,只要设定好[f0]的数值,就可方便计算出Do的值,并应用MATLAB进行图像处理。由于多数的图像处理研究中经常将空间频率的单位设定为cpi(cycle per image)、cpf(cycle per face)等,而其数值就是[α](各自对应的视角)与[f0]的乘积,即Do。通过公式(7)可看出两频率之间的转换关系是一个非常简单的表达式,在图像处理中,可以减少很大的图像处理的计算量和复杂程度,并应用公式(8)和程序直接进行高低通的滤波处理。这表明提出的计算方法和彩色图像滤波程序是一种简单、直观的处理方式。希望在图像处理技术中能够得到较好的应用。
参考文献:
[1] 郭小朝.空间频率、笔画数及字频对汉字识别的影响[J].人类工效学,1999,5(4): 5-7.
篇7
1、引言
随着经济的迅猛发展,汽车的迅速普及,根据社会对汽车产业的要求,车辆的各方面指标都受到人们越来越多地关注,汽车涂装过程中的瑕疵直接影响汽车的外观质量,因此如何在生产过程中利用计算机视觉检测技术检测出并及时修补汽车涂装过程中产生的瑕疵就成了首要的任务[1]。本文的研究内容是首先了解计算机视觉检测系统的工作原理,汽车涂装瑕疵的种类,然后结合两者的特点,应用计算机视觉检测系统检测汽车涂装瑕疵。该研究的价值在于两方面:①对于汽车生产的自动化和过程自动化,计算机视觉是现实真正意义的自动的基础和一种重要的质量控制的手段;②对于汽车涂装瑕疵的修补可以提高其修补的精度。
2、汽车涂装瑕疵的计算机视觉检测系统
汽车涂装瑕疵检测系统主要包括照明系统、图像采集卡、CCD摄像机、计算机以及软件处理等几个主要部分[2]。综合计算机视觉检测系统的构成和线结构光测量的原理,基于计算机视觉的汽车涂装瑕疵的检测系统大致是这样构成的:将线结构光投射到被测物上,所形成的光斑作为传感信号,用CCD摄像机采集光斑图像,采集到的图像信号被传输到计算机,根据图像处理和计算机视觉检测系统的处理产生处理结果,返回到涂装生产线,对车身的涂装进行修正,从而提高产品质量。汽车涂装瑕疵的视觉检测系统如图1所示[3]。
3、计算机视觉检测
计算机视觉是计算机对图像进行自动处理并报告“图像中有什么”的过程,也就是说它识别图像中的内容。图像中的内容往往是某些机器零件,而处理的目标不仅要能对机器零件定位,还要能对其进行检验。计算机视觉系统基本原理:机器视觉系统通常采用CCD相机摄取图像,将其转化为数字信号,再采用先进的计算机硬件与软件技术对图像数字信号进行处理,从而得到所需要的各种目标图像特征值,并在此基础上实现模式识别、坐标计算、灰度分布图等多种功能。计算机视觉系统能够根据其检测结果快速地显示图像、输出数据、指令,执行机构可以配合其完成指令的实施。计算机视觉系统主要由图像获取、图像分析和处理、输出显示或控制三个功能模块组成[4]。视觉检测按其所处理的数据类型可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测。另外,还有X射线检测、超声波检测和红外线检测。一个完整视觉检测系统包括:图像采集、图像分割、零件识别、模型匹配和决策判断。Newman[5]等描述了利用深度图像进行零件检测的AVI系统,具有一定的代表性。一个典型的AVI系统如图2所示。
4、汽车涂装瑕疵的检测算法
由于汽车涂膜中一些缺陷的边界比较模糊,例如:气泡、爆裂气泡孔、气泡针孔、抽缩等等。边缘处灰度变化很小,直接用传统的微分边缘检测算法无法有效的检测出来。所以对缺陷模糊边缘的检测成为了算法的关键[6]。本文介绍了基于线结构光的边缘检测方法。汽车涂装表面被光源投射器发出的线结构光照射,反射出的图像被CCD摄像机所接收传输到计算机视觉检测系统中。若涂装表面没有瑕疵,则产生图3的图像。若涂装表面有瑕疵,则产生图4的图像[7]。
篇8
一、计算机视觉检测技术含义
计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。
二、计算机视觉检测的基本原理
要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computer vision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。
作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。
三、亚像素检测技术
随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。
边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。
四、计算机视觉检测技术在机加工零件检测中的应用要素与过程
(一)曲阵CCD相机
面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。
(二)工业定焦镜头
在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。
(三)数字图像采集卡
随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。
(四)标定板
为提高测量精度,需要进行摄像机标定。标定过程中,采用NANO公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。
(五)背光源
背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。
五、结语
随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。
【参考文献】
篇9
1计算机视觉概述
1.1计算机视觉学概述
从某种意义上说,计算机视觉学是一门在20世纪60年代兴起的新学科。它是一门边缘学科,融入了很多学科的特点,具有很强的工程性特征。比如,图像处理、应用数学、光电技术。换个角度来说,计算机视觉同属于工程领域、科学领域。
1.2计算机视觉的应用
计算机视觉的应用能够使计算机具有和人一样的视觉功能。在生活和生产过程中,照片资料、视频资料的处理是计算机视觉应用的主要方面。比如,在航空事业方面,对卫星照片的翻译;在医学领域中,主要用于辅方面的诊断;在工业生产方面,由于各种复杂因素的影响,计算机视觉在这方面的应用显得特别简单,有利于相关系统的实际构成。
2目标图像检索存在的问题
从某种角度来说,目标图像检索需要分为特征匹配、特征提取两个方面。它们表达了不同的含义。对于特征提取来说,它是图像进行检索的第一步,其提取结果会对进一步的研究造成直接的影响。而对于特征匹配来说,其匹配的准确度会直接影响图像检索系统的返回结果。但在目标图像检索完善的过程中,遇到一些问题阻碍了这两个方面的完善。因此,本文作者对其中的一些予以了相关的探讨。
2.1环境因素不断变化
对于目标图像来说,环境因素是影响其准确率的重要因素。同时,在复杂混乱的环境中,由于受到众多干扰物的影响,加上部分目标图像区域被遮盖,致使目标图像信息不够全面,使目标物体特征的提取难度进一步加大。
2.2图像噪声的影响
子为了更好地模仿生活中的图像检索,数据库中的图像也会随之发生一系列的变化。比如,尺度、角度、光照。而其中图像噪音的影响会使目标物体的外观发生对应的变化。在此基础上,严重降低了目标图像信息获取的准确度。
2.3目标图像检索训练数据的自动标注
由于处于网络中的图像资源信息过于繁多,需要采用手工的方式对它们进行标注。但这种方法非常浪费时间,准确率也比较低。很显然,这就需要目标检索图像能够具有自动标注的能力。实际上,图像检索方法过分依赖人工标注信息。而这些信息很多收到来自各方面因素的影响。比如,认识差异因素、个人经验。以至于对图像产生误解。
3基于计算机视觉下的目标图像检索技术
3.1以多尺度视觉为纽带的目标图像检索方法
该种目标检索技术的应用主要是为了提高目标图像检索的准确率,能够实现目标图像训练数据的自动化标注。该类技术主要是用于那些没有遮挡,不需要进行监督的目标图像检索方面。具体来说,它需要经过一系列的训练。在训练的过程中,以统计学习为纽带,对相应多尺度的目标检测模型进行适当的训练。在此基础上,以该模型为基点,对图像中那些显著性的区域进行合理地提取。比如,该区域的亮度、颜色。最后,需要对用于该实验研究中的概率潜在语义分析模型进行合理地利用。总之,利用这种检索方法可以对图像中那些显著目标所处的区域自动进行检测。同时,对其中目标图像的显著性进行合理地排序,能够提高检索引擎所返回图像结果的准确度。
3.2以彩色LBP局部纹理特点为媒介的目标图像检索方法
这种目标图像检索方法能够有效地解决图像信息采集过程图像噪声以及其它相关因素对所提取纹理特征的影响,提高了图像目标的准确率。对于这种图像目标检索方法来说,它把图像彩色空间特征和简化的LBP特征有机地相融合。在此基础上,该类方法增加了光照的不变特性,却保留了LBP局部的旋转特点。在提高图像检索速度方面,主要是利用原来的LBP特征来丢失其中的彩色信息。以此,使其中的特征维度能够在一定程度上降低。同时,这种目标图像检索方法的应用可以使对应计算方法的难度得以降低,还能对角度等变化状态下的目标图像进行准确地识别以及检索。
3.3以视觉一致性为桥梁的目标图像检索方法
从某个角度来说,它的应用主要是为了提高图像搜索引擎的返回效果,使局部噪声图形具有更高的显著性特征。一是:站在客观的角度,对搜索引擎返回结果的目标显著图予以准确的计算。此外,还要对其中的目标显著系数进行适当地过滤。二是:以所有图像为基点,以显著目标为导向,采取视觉一致性的模式。三是:以视觉一致性为基础,对其中的不同目标图像信息进行客观地分类。这种以视觉一致性为核心的方法能够有效地提高图像检索结果的准确率。更重要的是,在提高图像搜索引擎检索性能的同时,能够及时为用户选出最优的图像信息。而这些信息资源和用户寻找的主题信息密切相关。
4结语
篇10
关键词:计算机视觉;研讨式教学;小组探讨;课前回顾
作者简介:陈芳林(1983-),男,湖南株洲人,国防科学技术大学机电工程与自动化学院,讲师;周宗潭(1969-),男,河南洛阳人,国防科学技术大学机电工程与自动化学院,教授。(湖南 长沙 410073)
中图分类号:G643.2 文献标识码:A 文章编号:1007-0079(2013)26-0065-02
进入21世纪,创新型人才的培养成为各国政府和高等教育界关注的一个焦点。世界各国研究型大学的共同特点是在研究生教育阶段致力于培养富有创新意识和创新能力的高级人才。[1]研讨式教学是培养研究生创新精神、科研能力的有效途径,教师讲解与学生探讨两部分相结合是研讨式教学采用的主要模式。[2]将课程分成两部分之后,教师讲解的时间就必须压缩,教师一方面需要思考如何在较短的时间内完成课程的讲解,同时还需要考虑课程讲解要与学生探讨部分紧密结合。因此,如何上好研讨式教学教师讲解这部分课,越来越受高等院校的重视。本文针对笔者教授工科研究生课程“计算机视觉”的实践与经验,阐述了笔者对于如何上好研讨式教学教师讲解这部分课的个人体会。总结为两点:第一,首先要充分做好课程准备;第二,上课环节采取回顾—案例—小结的讲解方式。下面从课程准备、课前回顾、课程讲解、课后小结四个方面分别阐述(如图1所示)。
一、“计算机视觉”课程准备
要上好一门研讨式教学的课程,一定要结合该门课程的特点,量身定制课程内容,进行精心准备。本节先介绍“计算机视觉”课程的特点,然后结合该门课程的特点,介绍笔者对于“计算机视觉”的课程准备。
1.“计算机视觉”课程特点
“计算机视觉”是“数字图像处理”和“模式识别”等课程的后续课程。该课程重点在于图像或者图像序列的分析理解。课程知识在机器人导航、侦查、测绘、测量、精密加工和目标跟踪等多个领域都有广泛的应用。[3]近年来基于视觉信息的控制反馈也开始受到广泛关注。国内高校一般都为研究生开设了此门课程。
计算机视觉技术应用广泛、算法原理涉及面广:涉及到概率与数理统计、信号与系统、图像等基础知识。“计算机视觉”是一门重要的控制类、电子类及计算机类专业研究生的选修课程,它内容广泛、综合性强,研讨能力的培养显得非常关键。
2.课程准备
首先,结合“计算机视觉”课程内容广泛、技术日益更新和丰富的特点,将课程36学时分为12次课,每次课为3小时,每堂课教师讲解一个专题。这种设计,一方面可以更广地涉及计算机视觉的各个领域;另一方面以专题的形式来讲解,可以将学生带入到该专题,介绍基本背景、理论、知识和方法,让学生有一个初步的了解,方便课后学生对感兴趣的专题进一步深入挖掘与研究。
其次,在课程开始之前,教师仔细统筹,安排好每次课的专题,这样既方便学生一开始对整个课程有一个整体的了解,也方便学生选择课堂研讨的题目与内容。根据12个专题,将各个专题讲解的内容与课件在开课之前准备好,这样有利于把握各个专题之间的前后承接关系。例如,“区域”与“分割”是既有区分又有联系的两个专题,在课程开始之前,将课件准备好,就有利于宏观把握,在“区域”专题提到的分割算法,就不需要在“分割”专题再次重复,而在“分割”专题可以结合前面“区域”专题进行互相补充,以帮助学生融会贯通。
最后,在每个专题上课之前,再对课件进行精雕细琢,主要是对内容分好层次,对方法进行分类,力图在较短的时间内,让学生对该专题有较全面的认识。例如,在讲解图像分割时,由于图像分割方法非常多,可以将分割方法分为若干个大类,每个大类只讲1~2个方法。这样既可以尽可能涉及更广的领域,又可以提高讲解的效率。
二、“计算机视觉”课前回顾
课前回顾是指每堂课的前面一小段时间用来回顾上一堂课的内容。虽然课前回顾时间非常短,一般为3~8分钟,但是课前回顾是课堂教学中的一个重要环节。课前回顾可以帮助学生加强将要学习的内容与已学过内容之间的联系。通过课前回顾,学生可以回忆前续课程所讲解的概念、理论、算法的步骤等内容,有助于解决新问题或者理解新知识。
课前回顾最重要的是既要复习前续课程的内容,又要注意将前续内容与当前内容联系起来。由于讲解时间有限,要使研讨式教学的教师讲解部分效率高,教师帮助学生回忆上堂课的概念、模型、算法等内容,就变得非常重要。如果不做课前回顾,那么当讲到某处新知识时,往往需要停下来,将前续课程再讲一遍,否则学生无法理解新的知识,这样就降低了教学的效率。
课前回顾的时间,一般以3~8分钟为宜。课前回顾的形式可以多样化,如讲解课后作业、回顾概念、提问等。笔者认为应根据当天课程与前续课程的关系,采取合适的方式。各种方式结合使用,提高课前回顾的效率。
三、“计算机视觉”课程讲解——案例教学
案例教学已经成功地应用于数学、计算机科学等领域的教学。通过案例,学生可以很快地掌握相应的概念、算法的步骤等,从而提高教师讲解部分的效率。[4]例如,在讲解马尔科夫随机场时,笔者通过案例式教学,将马尔科夫随机场用一个生活中的例子来向学生解释。首先,将马尔科夫随机场分解成两个重要的概念,分别是随机场与马尔科夫性,然后将它们对应到例子中,帮助学生理解。
随机场包含两个要素:位置(site)和相空间(phase space)。当给每一个“位置”中按照某种分布随机赋予“相空间”的一个值之后,其全体就叫做随机场(如图2(a))。[5]这个概念非常抽象,难以理解。笔者应用案例式教学,拿庄稼地来打比方。“位置”好比是一亩亩农田,“相空间”好比是种的各种庄稼。给不同的地种上不同的庄稼,就好比给随机场的每个“位置”,赋予“相空间”里不同的值。所以,可以形象地理解随机场就是在哪块地里种什么庄稼的布局(如图2(b))。
马尔科夫性指的是一个随机变量序列按时间先后顺序依次排开时,第N+1时刻的分布特性,与N时刻以前的随机变量的取值无关。为了更直观地理解马尔科夫性,笔者仍然拿庄稼地打比方,如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关,与其他地方的庄稼的种类无关,这种性质就是马尔科夫性。
符合上述两个特征,那么这些地里种的庄稼的集合,就是一个马尔科夫随机场。通过案例式教学,笔者发现可以加深加快学生对课程内容的理解,提高教师讲解环节的效率。
四、课后小结
课后小结指的是一堂课将要结束时,教师对本堂课进行一个简短的总结。许多成功的教师都会在其教学中坚持课后小结这个环节,给学生一个总体的印象,以帮助学生消化本次课程的内容。
研讨式教学教师讲解部分的课后小结与普通教学方式应有所区别。笔者认为这主要是因为通过课后小结可以将本次课程所讲内容与学生的研讨环节结合起来,而不仅仅是对内容进行简单的总结。
为了达到课后小结使本次课程内容与学生探讨环节建立联系的目的,笔者在教学中常采用如下方式:首先,像普通教学方式一样,总结本次课程内容;然后,在此基础上,抛出若干问题,这些问题,不需要学生马上解答,而是留给学生课后思考,提供他们选择研讨主题的素材;最后,介绍其他在本次课程中没有涉及到的前沿知识、方法与理论,拓宽学生的视野,从而增加学生选择探讨主题的覆盖面。
通过应用这种方式,笔者发现学生的思维更开阔,在探讨环节,学生往往可以选择一些比较新颖的主题(例如视频中不动点的检测等),而不仅仅局限于教师所讲内容,从而提高了研讨式教学的效果。
五、结论
在“计算机视觉”课程中引入研讨式教学,通过总体设计规划好整门课程内容,课堂讲解注意采用回顾—案例—小结的方式,笔者对如何上好研讨式教学教师讲解这部分课进行了个人经验的总结。通过本次教学改革,笔者体会到如果要提高教学效果,一定要注意教师讲解与学生探讨两个环节的紧密结合。
参考文献:
[1]侯婉莹.我国研究型大学本科生科研研究[D].济南:山东大学,
2009.
[2]张晴,李腾,韦艳,等.研讨式教学模式的理论研究[J].中国科技纵横,2011,(10).
[3]D.H .巴拉德.计算机视觉[M].北京:科学出版社,1987.