图像识别技术的基本原理范文
时间:2023-11-27 17:31:34
导语:如何才能写好一篇图像识别技术的基本原理,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++
目录
第1章绪论1
1.1课题研究背景1
1.2车辆牌照识别系统原理1
1.3车辆牌照识别在国内外研究现状2
1.4本文主要工作及内容安排3
第2章车辆牌照的定位方法4
2.1车辆牌照图像的预处理4
2.1.1256色位图灰度化4
2.1.2灰度图像二值化5
2.1.3消除背景干扰去除噪声6
2.2车辆牌照的定位方法简介6
2.3系统采用的定位方法7
2.3.1车辆牌照的水平定位7
2.3.2车辆牌照的垂直定位7
2.3.3定位的算法实现10
2.4实验结果分析12
第3章车辆牌照的字符分割13
3.1车牌预处理13
3.1.1去边框处理13
3.1.2去噪声处理13
3.1.3梯度锐化15
3.1.4倾斜调整16
3.2字符分割方法简介17
3.3系统采用的分割方法19
3.3.1算法介绍19
3.3.2算法的实现20
3.4字符分割实验结果21
第4章特征提取与字符识别22
4.1字符的特征提取22
4.2字符的识别方法简介23
4.3系统采用的识别方法24
4.3.1人工神经网络简介24
4.3.2BP神经网络识别车牌25
4.3.3BP神经网络识别算法实现28
4.4实验结果分析29
总结32
致谢33
参考文献34
第1章绪论
1.1课题研究背景
现代社会已经进入信息时代,计算机技术、通信技术和计算机网络技术的不断发展,自动化信息处理能力的不断提高,在人们社会活动和生活的各个领域得到了广泛的应用,在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。
随着汽车数量的急剧增加,车牌自动识别(licenseplaterecognition,LPR)技术日益成为交通管理自动化的重要手段[1]。车牌自动识别技术是计算机视觉、图像处理技术与模式识别等技术的融合,是智能交通系统中一项非常重要的技术。通过车辆牌照自动识别,就可以对运动车辆查询相关的数据库,根据提取的车辆信息,实现有针对性的车辆检查,极大的提高工作人员的效率,降低工作强度,同时也减少了国家财政收入的流失,减少交通事故的发生以及加强社会治安。因此对车牌识别技术研究有巨大的经济价值和现实意义。
由于车牌自动识别技术在智能化交通控制管理中发挥的重要作用,吸引了各国的科研工作者对其进行广泛的研究,目前已有众多的算法,有些已应用于交叉路口、车库管理、路口收费、高速公路等场合。由于需适应各种复杂背景,加之要识别的车辆种类繁多,颜色变化多端,以及检测时要适应不同天气变化导致的不同光照条件,因此,目前的系统都或多或少地存在一些问题。但随着计算机性能的提高和计算机视觉理论及技术的发展,这种技术必将日趋成熟。
车牌的定位与识别技术,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括小波分析、神经网络、数学形态学、模糊理论等数学知识的有效运用[2]。
本课题是对汽车图像进行分析,从算法角度来研究车牌的定位与识别。
1.2车辆牌照识别系统原理
篇2
Discussion and practice on "image processing technology"
Zhang Yongmei, Ma Li, He Li
(School of Information Engineering, North China University of Technology, Beijing 100144, China)
Abstract: The disadvantages, the characteristics and the content of the current teaching for "Image Processing Technology" are analyzed. Four teaching procedures including the selection of textbooks and expansion materials for initiative learning, application of modern teaching models and methods, strengthening teaching practice and reforming appraisal methods have been discussed and practiced. The result shows that it has obtained better teaching effects, improved the students' interest in learning and motivation to participate in scientific research, as well as the ability to solve practical problems.
Key words: teaching content; teaching method; assessment way; teaching practice
0 引言
图像信息是获取信息的重要来源,图像处理研究对于科学理论研究和工程应用有重要影响。研究图像处理和通信是导向智能计算机、智能机器人或多媒体通信系统的必由之路。现有的图像处理技术在很多方面给人们生活、学习、工作带来极大的便利,如:视频广播、遥感图像、医学图像(计算机X射线断层扫描技术CT,以及核磁共振成像MRI)等,计算机的发展使处理更复杂的图像成为可能。
图像处理是计算机应用领域中的一个重要方面,是模式识别、计算机视觉、图像通讯、多媒体技术等学科的基础,是一门涉及多领域的交叉学科。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让不同层次的学生能够理解和掌握图像处理在其应用领域的最新发展,故传统的常规教学已经不能满足课程的发展要求。目前的教学不足之处主要体现在:传统的图像处理技术教学大多数偏重于理论,缺乏图像处理技术与实践相结合的环节。本文结合计算机学科的特点和多年的教学经验,对图像处理技术课程的教学模式与实践进行了探讨。
1 课程特点和教学内容分析
人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。图像处理是利用计算机处理所获取视觉信息的技术[1]。图像处理技术的理论基础涉及了众多学科,包括数学、物理、信号处理和计算机科学等多个学科的知识,其内容广泛,理论抽象,不易理解。图像处理技术还有很强的实用性,因此理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。
图像处理技术已经成为众多高校的一门重要课程,该课程主要介绍图像的数学描述、图像的数字化、图像变换、图像增强、图像恢复、图像编码、图像重建、图像分割与边缘提取、图像的分析和识别等基本的图像处理方法,使学生能熟练地掌握图像处理的基本过程,并能应用这些基本方法开发图像处理系统。通过这样的内容设置,使学生能够真正掌握图像处理技术的基本思想和技术,为深入学习打下坚实基础[2]。
2 教学环节的探讨和实践
2.1 教材的选用和自主学习扩充性资料的选用
图像处理技术发展日新月异,虽然该课程已经有很多可选教材,但大部分教材内容比较陈旧,许多新的算法,新的思想都没有提到,学生无法从这些教材中获取图像处理最新的技术和发展趋势,因此我们选择了章毓晋编著、清华大学出版社的《图像工程》系列教材。该教材全面介绍了图像工程的第一层次――图像处理,图像工程的第二层次――图像分析,图像工程的第三层次――图像理解的基本概念、基本原理、典型方法、实用技术以及国际上相关研究的最新成果。同时我们要求学生将国外的经典图像处理的书籍作为参考书目,如:Rafael C Gonzalez主编的《Digital Image Processing》,并建议学生关注图像处理的一些重要期刊和国际会议,如:IEEE Transactions on Medical Imaging、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE International Conference on Image Processing、电子学报、CT理论与应用研究、模式识别与人工智能等。这样学生能熟悉一些专业术语,了解最新的前沿动态,并具备一定的英文文献阅读能力,为今后的科研和工作打下了坚实基础。
要求学生自主学习一些最新方法和技术,例如,深入分析中华人民共和国设计制造的玉兔号月球车的结构,给出玉兔号月球车如何通过全景相机、测月雷达、粒子激发X射线谱仪、红外光谱仪等仪器,对月表进行三维光学成像、红外光谱分析,开展月壤厚度和结构科学探测,对月表物质主要元素进行现场分析等探测的原理和方法。又例如,探讨将遥感图像应用于5.12汶川大地震的方法,2008年5月14日上午,中国科学院的两架高性能遥感飞机飞赴汶川,对地震灾区开展遥感监测和灾情评估工作,这两架飞机可分别提供高分辨率光学和雷达图像,具有全天候快速获取大面积灾情数据的能力,探讨如何根据汶川地震前、后图像,给出建筑物、河流、山体等关键区域的变化检测结果,为国务院和相关部门的抗震救灾工作提供咨询服务和决策依据。
2.2 采用现代化教学模式与方法
为了使复杂的算法和抽象的知识更加形象化,便于学生理解和提高学习兴趣,我们充分运用现代电子技术、工具和方法,采用多媒体形式进行课堂教学,利用VC、MATLAB编写一些典型的图像处理程序,并在课堂上演示这些程序,增加了课堂的信息量,提高了学生的学习兴趣,激发了学生自主学习,同时也为实验环节的开展奠定了一定的编程基础[3]。
此外,我们深入分析MOOCs、SPOCs以及“翻转课堂”教学模式等国际流行教育新概念,尝试开展图像处理技术的MOOCs,包括从课堂教学、学生学习进程、学生的学习体验、师生互动过程等教与学过程的完整系统在线实现。MOOCs是一个改变学习方式的时代产物,受到全球各地的重视。国内教育部三个教指委(计算机类专业、软件工程专业、计算机课程)2013年底专门召开会议研讨MOOCs。我们建立了校内MOOCs平台并对学生开放,将其作为课堂外学习的有效补充,这样可以方便学生随时随地学习,或者进行预习和复习。我们尝试了结合图像处理技术的MOOCs,探索创新教学模式与方法,稳步提高教学质量。
2.3 加强实践教学
图像处理技术可以广泛应用于数字电视、视频通话、宇宙探测、自然灾害预测、环境污染的监测、气象云图等应用领域,而教材一般只涉及到理论知识和算法,或者是对应用的简单介绍,对其设计实现介绍得很少,所以必须加强实践教学,将理论与实践结合起来,使理论指导实践,实践加强理论[4-5]。要求学生利用VC或者MATLAB进行实际程序设计,培养学生分析问题、解决问题的能力,具备图像处理系统的开发能力。
根据课程的教学要求设置了四个课外实验。①图像变换实验。要求对输入的图像,分别采用傅里叶变换、离散余弦变换、小波变换进行图像变换,分别给出变换前后的图像,并分析图像变换前后的视觉效果。②图像增强实验。将给定的图像进行增强处理,要求至少使用线性变换增强、对数变换增强、指数变换增强以及伪彩色增强处理,分析增强后的视觉效果。③图像编码实验。将给定的图像进行压缩处理,要求采用 Huffman编码方法,并计算压缩比。分析图像压缩后的视觉效果,并对图像压缩效果进行客观评价。④图像分割与边缘提取实验。分别利用边缘检测法、阈值分割法进行图像分割;分析图像分割后的视觉效果。学生完成所有实验后,我们安排了实验指导课,解决学生在实验中遇到的问题,进一步提高学生的算法设计能力和编程能力。
在课程教学中,我们还安排了三次专题讨论课,由教师指定具体题目,学生通过查阅相关文献,深入分析基本原理和方法,设计相应的算法,编程实现,并给出实验结果及分析,充分调动学生学习的积极性,提高学生利用理论知识解决实际问题的能力。三次专题讨论课分别是:
⑴ 数字图像表示及其处理专题讨论课。题目为:用VC或者Matlab实现常见图像文件格式的显示;常见的图像文件格式,以及用VC或者Matlab实现图像格式转换;给出国内外先进的图像处理系统软、硬件,名称、作用,以及先进性的体现。
⑵ 图像变换专题讨论课。题目为:给出小波变换常用的小波基的基本原理、具体应用,以及用VC或者Matlab的具体实现;给出小波变换、脊波变换、子波变换的基本原理、具体应用,用VC或者Matlab的具体实现;给出小波变换以及小波变换在图像处理中的具体应用,以及用VC或者Matlab的具体实现;给出快速傅里叶变换算法的具体内容,以及时间复杂度或者运行时间的分析。
⑶ 图像编码专题讨论课。题目为:给出小波变换图像编码的基本思想与特点,编码中需要解决的问题,实验结果及分析;给出基于感兴趣区域的小波图像编码方法的基本思想,具体步骤,实验结果及分析;给出几种图像编码质量评价方法,具体实现,实验结果及分析;给出基于子波变换的图像编码基本思想与特点,具体步骤,实验结果及分析。
此外,鼓励学生积极参与本校教师主持的科研项目,如国家自然科学基金、863项目、科技支撑计划,以及北京市自然科学基金等项目。这些项目涉及到视音频检索、视音频理解、视音频处理、网络信息分析、文字处理、信息检索、网络行为分析、图像识别等研究方向。通过参与项目,系统地锻炼了学生的科研能力和思维创新能力,也为今后的科研工作打下了坚实基础。
2.4 改革考核评价方式
考核是对学生学习成果的检验,考核目标不仅要检验学生对课堂教学内容的掌握程度,而且要对提高学生发现问题、思考问题、解决问题的能力起到作用。为了避免出现平时不努力,考前突击的情况,我们对传统的考核方式进行了改革。本课程的考核由两部分组成:平时成绩(占30%)和期末考试成绩(70%)。将平时的上课出勤、作业、实验和专题讨论成绩列入平时成绩。在整个教学过程中,严格要求学生,使学生重视教学的各个环节。
篇3
关键词:模糊控制;人工神经网络;人脸识别
中图分类号:TP18 文献标识码:A文章编号:1009-3044(2011)16-3904-03
随着人工智能技术的飞速发展,机器视觉已经成为当前人工智能研究领域的一大热点,很多国家的研究人员都开展了对机器视觉的研究,其中以机器视觉识别人脸最为困难,这主要是因为人的面部带有表情,不同的人具有不同的脸,而不同的脸具有不同的表情,不同的表情则具有不同的面部特征,如何让计算机通过机器视觉高效率的识别人脸,成为当前机器视觉和智能机器人关键技术领域的技术难题。
随着模糊逻辑控制算法和人工神经网络算法的发展,对于机器视觉识别人脸特征的算法也有了新的发展,目前多数研究算法所采用的人脸识别从实现技术上来说,主要可以分为以下几个类别:
1) 基于人脸几何特征进行的识别算法,该算法运算量较小,原理简单直观,但是识别率较低,适合应用于人群面部的分类,而不适宜于每一个人脸的识别。
2) 基于人脸特征的匹配识别算法,这种算法是预先构建常见的人脸特征以及人脸模板,构成人脸特征库,将被识别的人脸与特征库中的人脸进行逐一比对,从而实现人脸识别,该算法识别效率较高,但是应用有一定局限性,只能够识别预先设立的人脸特征库中的人脸模型,因此人脸特征库就成为该算法实现的技术关键。
3) 基于统计的人脸识别算法,该算法将人脸面部进行特征参数的划分,如两眼距离大小,五官之间距离等,通过构建统计特征参数模型实现对人脸模型的识别,该算法识别率较高,但是算法实现起来运算量比较大,且识别效率较低。
4) 基于模糊逻辑的人脸识别算法,这一类算法主要结合了模糊逻辑和神经网络能够自我训练学习的机制实现对人脸的识别,识别率较高,且算法运算量适中,但是算法的原理较难理解,且模糊逻辑控制规则的建立存在一定技术难度。
本论文主要结合模糊人工神经网络方法,将其应用于计算机人脸识别,以期从中能够找到有效可靠的人脸识别方法及其算法应用,并以此和广大同行分享。
1 模糊逻辑及人工神经网络在图像辨识中的应用可行性分析
1) 人脸识别的技术难点
由于计算机只能够认识0和1,任何数据,包括图像,都必须要转化为0和1才能够被计算机识别,这样就带来一个很复杂很棘手的问题:如何将成千上万的带有不同表情的人脸转变为数字信号并被计算机识别。由于人的面部带有表情,不同的人具有不同的脸,而不同的脸具有不同的表情,不同的表情则具有不同的面部特征,因此这些都成为了计算机识别人脸特征的技术难点,具体来说,人脸实现计算机识别的主要技术难度包括:
① 人脸表情:人有喜怒哀乐等不同表情,不同的表情具有不同的面部特征,因此如何分辨出不同表情下的人脸特征,这是首要的技术难点;
② 光线阴影的变换:由于人脸在不同光线照射下会产生阴影,而阴影敏感程度的不一也会增加计算机识别人脸特征的难度;
③ 其他因素:如人随着年龄的增长面部特征会发生些微变化,人脸部分因为装饰或者帽饰遮挡而增加识别难度,以及人脸侧面不同姿态也会对计算机识别带来技术难度。
2) 模糊人工神经网络在人脸辨识中的应用可行性
如上分析所示,计算机识别人脸,需要考虑的因素太多,并且每一种因素都不是线性化处理那么简单,为此,必须要引入新的处理技术及方法,实现计算机对人脸的高效识别。根据前人的研究表明,模糊人工神经网络算法是非常有效的识别算法。
模糊理论和神经网络技术是近年来人工智能研究较为活跃的两个领域。人工神经网络是模拟人脑结构的思维功能,具有较强的自学习和联想功能,人工干预少,精度较高,对专家知识的利用也较少。但缺点是它不能处理和描述模糊信息,不能很好利用已有的经验知识,特别是学习及问题的求解具有黑箱特性,其工作不具有可解释性,同时它对样本的要求较高;模糊系统相对于神经网络而言,具有推理过程容易理解、专家知识利用较好、对样本的要求较低等优点,但它同时又存在人工干预多、推理速度慢、精度较低等缺点,很难实现自适应学习的功能,而且如何自动生成和调整隶属度函数和模糊规则,也是一个棘手的问题。如果将二者有机地结合起来,可以起到互补的效果。
模糊逻辑控制的基本原理并非传统的是与不是的二维判断逻辑,而是对被控对象进行阈值的设计与划分,根据实际值在阈值领域内的变化相应的产生动态的判断逻辑,并将逻辑判断规则进行神经网络的自我学习,逐渐实现智能判断,最终实现准确的逻辑判断。相较于传统的线性判断规则,基于模糊规则的神经网络是高度复杂的非线性网络,同时由于其广阔的神经元分布并行运算,大大提高了复杂对象(如人脸)识别计算的效率,因此,将模糊神经网络算法应用于人脸的智能识别是完全可行的。
2 基于模糊人工神经网络的人脸识别方法研究
2.1 基于模糊神经网络的人脸识别分类器设计
1) 输入、输出层的设计:针对模糊神经网络层的输入层和输出层的特点,需要对识别分类器的输入、输出层进行设计。由于使用BP神经网络作为识别分类器时,数据源的维数决定输入层节点数量,结合到人脸的计算机识别,人脸识别分类器的输入输出层,应当由人脸特征数据库的类别数决定,如果人脸数据库的类别数为m,那么输入、输出层节点数也为m,由m个神经元进行分布式并行运算,能够极大提高人脸识别的输入和输出速度。
2) 隐藏层结点数的选择:由于一般的BP神经网络都是由3层BP网络构成:输入层,隐藏层和输出层,隐层的数量越多,BP神经网络越复杂,那么最终能够实现的运算精度就越高,识别率也就越高;但是随着隐层数量的增加,随之而来的一个突出的问题就是神经网络变的复杂了,神经网络自我训练和学习的时间变长,使得识别效率相对下降,因此提高精度和提高效率是应用模糊神经网络的一个不可避免的矛盾。在这里面向人脸识别的分类器的设计中,仍然采用传统的3层BP神经网络构建人脸识别分类器,只设计一层隐层,能够在保障识别精度的前提下有效的保障神经网络学习和训练的效率,增加人脸识别的正确率。
3) 初始值的选取:在设计了3层BP神经网络的基础上,需要确定神经网络的输入初始值。由于模糊神经网络是非线性的,不但具有线性网络的全部优点,同时还具有收敛速度快等特点,而初始值的选取在很大程度上影响神经网络的学习训练时间的长短,以及是否最终能够实现收敛输出得到最优值。如果初始值太大,那么对于初始值加权运算后的输出变化率趋向于零,从而使得神经网络自我学习训练趋向于停止,最终无法得到收敛的最优值;相反,我们总是希望初始值在经过每一次加权运算后的输出都接近于零,从而能够保证每一个参与运算的神经元都能够进行调节,最终实现快速的收敛。为此,这里将人脸识别的初始值设定在[0,0.2]之间,初始运算的权值设定在[0,0.1]之间,这样都不太大的输入初始值和权值初始值能够有效的保证神经网络快速的收敛并得到最优值。
如果收敛速度太慢,则需要重新设置权值和阈值。权值和阈值由单独文件保存,再一次进行训练时,直接从文件导出权值和阈值进行训练,不需要进行初始化,训练后的权值和阈值直接导入文件。
2.2 人脸识别的神经网络训练算法步骤
1) 神经网络的逐层设计步骤:神经网络需要按层进行设计,构建信号输入层、模糊层以及输出层,同时还要构建模糊化规则库,以构建神经网络模糊算法的完整输入输出条件。具体构建人脸识别的神经网络层可以按照下述步骤执行:
Step 1,构建信号输入层,以视觉摄像头为坐标原点构建人脸识别坐标系统,这里推荐采用极坐标系统构建识别坐标系,以人脸平面所处的角度与距离作为信号的输入层,按照坐标系的变换得到神经网络信号输入的距离差值和角度差值Δρ,Δθ,作为完整的输入信号。
Step 2,构建模糊化层,将上一层信号输入层传输过来的系统人脸识别信号Δρ与Δθ进行向量传输,将模糊化层中的每一个节点直接与输入信号向量的分量相连接,并进行信号矢量化传输;同时在传输的过程中,根据模糊化规则库的条件制约,对每一个信号向量的传输都使用模糊规则,具体可以采用如下的隶属度函数来进行模糊化处理:
(1)
其中c ij 和σij分别表示隶属函数的中心和宽度。
Step 3,构建信号输出层,将模糊化层经过模糊处理之后的信号进行清晰化运算,并作为最终结果输出。
关于模糊规则库的建立,目前所用的方法都是普遍所采用的匹配模糊规则,即计算每一个传输节点在模糊规则上的适用度,适用就进行模糊化规则匹配并进行模糊化处理,不适用则忽略该模糊规则并依次向下行寻找合适的模糊规则。当所有的,模糊规则构建好之后,需要对每条规则的适用度进行归一化运算,运算方法为:
(2)
2) 人脸的识别算法按如下步骤执行:
Step 1:一个样本向量被提交给网络中的每一个神经元;
Step 2:计算它们与输入样本的相似度di;
Step 3:由竞争函数计算出竞争获胜的神经元,若获胜神经元的相似度小于等于相似度门限值ν,则计算每个神经元的奖惩系数γi,否则添加新的神经元;
Step 4:根据学习算法更新神经元或将新添加的神经元的突触权值置为x;
Step 5:学习结束后,判断是否有错误聚类存在,有则删除。
其中,
(3)
di是第i个神经元的相似度值,β为惩罚度系数,ν为相似度的门限值。γ的计算方法是对一个输入样本x,若竞争获胜神经元k的相似度dk≤ν,则获胜神经元的γk为1,其它神经元的γi=-βdi/ν,i≠k;若dk >ν,则添加新的神经元并将其突触权值置为x。
实际上,网络训练的目的是为了提高本算法的权值实用域,即更加精确的实现对人脸特征的识别,从而提高算法的人脸识别率,当训练结束后,即可输出结果。
2.3 算法仿真测试
为了验证本论文所提出的人脸识别模糊神经网络算法的有效性和可靠性,对该算法进行仿真测试,同时为了凸显该算法的有效性,将该算法与传统的BP神经网络算法进行对比仿真测试。
该测试采集样本500张人脸图片,分辨率均为128×128,测试计算机配置为双核处理器,主频2.1GHz,测试软件平台为Matlab,分别构建BP神经网络分类器与本算法的神经网络分类器,对500幅人脸图片进行算法识别测试。
如表1所示,为传统BP神经网络算法和本论文算法的仿真测试结果对比表格。
从表1所示的算法检测对比结果可以发现:传统的算法也具有人脸特征的识别,但是相较于本论文所提出的改进后的算法,本论文提出的算法具有更高的人脸特征识别率,这表明了本算法具有更好的鲁棒性,神经网络模糊算法的执行上效率更高,因而本算法是具有实用价值的,是值得推广和借鉴的。
3 结束语
传统的图像识别技术,很多是基于大规模计算的基础之上的,在运算量和运算精度之间存在着不可调和的矛盾。因人工神经网络技术其分布式信息存储和大规模自适应并行处理满足了对大数据量目标图像的实时处理要求,其高容错性又允许大量目标图像出现背景模糊和局部残缺。相对于其他方法而言,利用神经网络来解决人脸图像识别问题,神经网络对问题的先验知识要求较少,可以实现对特征空间较为复杂的划分,适用于高速并行处理系统来实现。正是这些优点决定了模糊神经网络被广泛应用于包括人脸在内的图像识别。本论文对模糊神经网络在人脸图像识别中的应用进行了算法优化设计,对于进一步提高模糊神经网络的研究与应用具有一定借鉴意义。
参考文献:
[1] 石幸利.人工神经网络的发展及其应用[J].重庆科技学院学报:自然科学版,2006(2):99-101.
[2] 胡小锋,赵辉.Visral C++/MATLAB图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.
[3] 战国科.基于人工神经网络的图像识别方法研究[D].北京:中国计量科学研究院,2007.
[4] 王丽华.基于神经网络的图像识别系统的研究[D].北京:中国石油大学,2008.
[5] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[6] 金忠.人脸图像特征抽取与维数研究[D].南京:南京理工大学,1999.
篇4
Abstract: The teaching content and teaching mode for course of digital image analysis are researched in the paper, education reform measures is implemented from three aspects, the theory teaching, the practice teaching and the related scientific research. Project driven teaching is proposed to cultivate innovative and practice talents, the practice teaching is strengthened and the scientific research is introduced into the teaching process.
Key words: image analysis; teaching mode; teaching reform; project driven
0 引言
随着现代信息技术的快速发展,图像分析日益广泛地应用于军事目标识别控制、智能交通、医学图像重建、社会事务管理、生物特征识别,以及互联网相关产业等诸多领域,越来越多的研究者更加关注图像分析领域的研究工作[1-2]。而高等教育要与实际应用紧密联系,“图像分析”这门课程在高校电子信息类专业也有了越来越重要的地位。
图像分析是用模式识别和人工智能方法对景物进行分析、描述、分类和解释的技术,又称景物分析或图像理解。一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构,从而提取具有一定智能性的信息。图像分析侧重于研究图像的内容,包括但不局限于使用图像处理的各种技术,它更倾向于对图像内容的分析、解释和识别。
“图像分析”的教学目的是使学生了解和掌握数字图像分析的基本概念与主要内容,为今后的深入研究和开发工作打下良好的基础。其基本教学内容包括图像增强、图像分割、图像复原、图像描述、图像识别等理论和方法。该课程主要阐述数字图像分析中的基本概念、基础理论和常用算法,介绍数字图像分析研究中的基本问题以及解决这些问题的原理和实现方法,使学生能够编程实现简单的图像处理算法,能够逐渐解决数字图像分析领域的实际问题。
“图像分析”课程属交叉学科,其起点高、难度大,既有较强的理论性,又与实践紧密结合,目前的教学现状表明,学生对本课程往往入门时就心存畏惧,深入学习困难,不管是考试成绩还是实践动手能力都不理想,教学上存在许多问题。如何引导学生明确学习目的、转变思想观念,如何在教学过程中合理利用多重教学手段、灵活采用教学相长的方法激发学生的学习兴趣,成为教学中必须解决的难题。
1 课程教学现状分析
经过对国内多所高校的调研发现,现行的教学模式存在严重的弊端。在目前的图像分析课程教学中,教师只是按部就班地按照教学大纲进行讲授,而对于程序运行实现及实际应用部分大纲中并没有严格的要求,所以多数教师也就只讲解理论,对程序实现则省略掉或是一带而过。而学生也只是按部就班地对理论知识进行学习,没有结合相关的应用,所以随着课程内容的深人,学生会感觉到枯燥乏味,对该课程逐渐失去了兴趣。即便是认真学习的学生,也是一直处于被动学习的状态。至于考试,只需要按照教师的授课内容认真复习就可以拿到优异的成绩。很多学生直到他们学完了该门课程,也没弄清楚这些图像处理的方法该如何具体实现,而且对于如何应用到实际生活和研究当中,也是一无所知,更谈不上创新能力、实践能力和综合能力了。该课程目前的教学方法大大影响了学生的创新实践能力的培养。长此以往,高分低能的现象将会日趋严重。因此,图像分析课程教学改革迫在眉睫。
2 课程教学改革措施
2.1 教学内容和方法的改革
图像分析本身为交叉学科,与图像处理、模式识别、信号分析多领域存在密切联系,而课程内在耦合性并不强,目前还没有一个完备的课程体系,许多教学实践难以组织。一般除了图像分析课程的基本内容,根据教材丰富程度的不同,可能还包括图像的数据结构、图像重建、图像识别、图像的小波分析,以及图像的数学形态学分析。其内容庞杂,难度也偏大,在有限的教学时间内往往难以将全部内容讲透,传统的教学模式只能以理论介绍为主,忽视实现步骤,造成学生在学习时普遍感到过于抽象。故有必要优化教学课程设置,精简课程教学内容。课堂讲授中,要抓住重点难点进行讲解,鼓励学生课下自主学习,有疑问主动讨论求教,以此来提高教学质量。
教学内容中不能只有理论知识,还要与图像分析相关应用软件结合起来,如Matlab、Opencv、Image Analyzer等,必要的时候也可以用目前较流行的Photoshop软件举例。这样和软件结合起来讲解,学生可以看到实实在在的图像变化过程,学习兴趣自然就提高了。而且学生也比较容易理解图像分析的基本原理,听起来也不会觉得枯燥,无形中提高了学生的学习效率。同时学生学会了一门语言,用以实现各种图像处理过程,为以后的学习和工作打下坚实的基础。
传统教学中理论学时与实验学时的分配比例一般为3:1,高校普遍偏重理论教学,而忽视了实验教学。理论教学是一种被动的单向的学习模式;而主动性的、互动式的实验教学更能调动学生的积极性,有利于学生自主的去发现问题分析解决问题。因此,要优化理论教学与实验教学的课时比例,加大实验教学的课时,通过实验加深对理论基础的理解。
2.2 强化实验教学
选择图像分析中最重要的算法作为实验课教学的主要内容,覆盖图像分析中图像增强、图像压缩、图像分割、形态学处理、图像特征描述等各个重要部分。图像的读取和显示、图像的直方图均衡化、图像的平滑滤波和锐化滤波、快速傅里叶变换、频域上的高通和低通滤波、Hough 变换、图像的阈值化、图像的膨胀、腐蚀和开闭操作、细化算法等实验完全能包含图像分析领域理论。
实验教学[3]要求学生提前阅读课程实验指导书,了解实验内容,进行初步的设计分析,自己编写核心代码,自行设计实验测试用例,预测实验结果。实验课上认真演示图像处理的效果,将实验结果与预测结果相比较,对出现的问题耐心分析和总结,按要求撰写实验报告,从而加深对数字图像分析概念和方法的理解。引导学生利用所学到的知识,来解决图像分析领域简单的实际应用问题,要把课堂上讲授的理论知识和现实生活中应用的具体例子相结合,将最新的科研前沿动态和信息反馈给学生。
2.3 将科研引入教学
科研中的图像分析相关部分要进人到教学中,让学生在学习理论知识的基础上,了解该方向的前沿技术和应用领域,这对以后的工作有重要的引导作用,也能够激发学生的探索能力和创新灵感,达到真正的学以致用。同时形成科研带动教学,教学促进科研的良性循环[4]。
将科研引入教学,开展项目驱动教学,让学生接触一些具体的项目,在做这些项目时要用到哪些知识点,如何综合运用它们,都是项目中必须解决的问题。通过项目驱动教学的方式,学生的综合实践能力将得到进一步提高。
项目驱动教学的关键是项目的选择和设计,它的好坏直接影响到教学的开展。图像分析项目驱动教学的示意图如图1所示。由图1可知,这一互动式的教学模式重点在于师生的交流反馈,学生是学习的主体,是项目的承担者 、实施者,老师在项目中主要起组织引导的作用。在项目驱动教学实施中,教师不是直接把知识技能传递给学生,而是学生在教师的指导下去选择“项目”,分析“项目”,并最终完成“项目”。学生不再盲目的把学习当任务,而是以项目需求驱动,有目的、有针对性的学习,变被动地接受知识为主动地寻求知识。学生学习的主动性和创新意识在项目实施的过程中不断强化。
根据课程的知识层次和内容体系把理论学习与科研项目相结合。譬如设计“车牌识别系统研究[5]”来展开课堂教学,如图2所示。由图2可知,“图像分析”的大部分教学内容都可通过“车牌识别系统研究”这一项目组织起来。以“实施项目”的方式引入有关概念和主题,展开教学内容深入学习,将学生的“被动学习”转换为“兴趣驱动”,从而提高教学效率。
另外,根据学校的实验条件,还可设计“脑部CT图像处理”、“运动目标检测研究”、“人脸识别系统”等项目,从而融合图像分析各方面的知识点。
整个项目的实施分为两个阶段:理论学习和项目实施。在理论学习阶段,可以引入大量应用实例,授课时重点阐述诸如医学图像处理、运动目标特征提取、智能视频监控、基于图像的工业检测、图像压缩在3G通信技术中的应用等实例。通过对具体项目的讲解,让学生对项目的理论基础有初步的了解,而这种将深奥的理论实例化,使学生易于接受,激发了学生的学习兴趣和对项目的探索激情。在第二阶段的项目实施中,将项目分成若干个小组,在教师的指导下,各小组召开会议,分析项目需求,明确项目任务,进行成员分工,确定各分工的职责及项目实施计划,在此阶段,教师扮演项目顾问的角色,解答小组成员项目实施中遇到的各种问题。学生在教师的指导下完成对项目的需求分析、系统设计、编码实现、测试部署的整个过程,达到学生在完成项目的过程中理解学科知识、掌握综合技能的目的。
项目完成之后,需要对项目进行总结和反馈。各小组提交项目结题材料,以论文答辩的形式在班上演示各小组项目成果,介绍项目实施过程、成果、优势及不足,总结项目实施阶段的经验教训,回答现场提问。在听取其他小组报告的基础上自我总结,找出自己的不足,查缺补漏,提高专业理论基础及定向分析解决问题的能力。最后,以学生自评、组内成员互评、教师点评的方式来确定每位学生的最终成绩。
篇5
关键词:PCB;图像处理;视觉检测
中图分类号:TP277文献标识码:A文章编号:1009-3044(2012)07-1648-06
当今世界科技发展日新月异,电子产业的发展直接制约着国民经济的腾飞与否,而PCB电路板制作工艺的提高对促进电子产业的发展至关重要,能否有效精确地检测PCB电路板的缺陷一直都是电子行业的研究热点。国外的印刷电路板自动检测技术一直领先于国内,国内的很多厂家不得不采用昂贵的外国技术,虽然近年国内的印刷电路板自动检测技术发展迅速,但大都没有取得令人非常满意的结果。加入研究这一领域的热潮,赶超外国的先进技技水平,打断外国垄断技术,对于发展国民经济具有十分重要的意义。
1 PCB检测系统的硬件设计
1.1 PCB检测系统的硬件组成框图
虽然本文所做的工作主要是软件方面,但对于硬件系统的设计也是至关重要的,它对于建立有效的计算机视觉识别检测系统,起着决定性作用。因此,必须在综合考虑系统性价比和系统性能的基础上,设计出合理的硬件系统[9]。PCB检测系统的硬件组成框图如图1所示:图1 PCB检测系统硬件组成框图
1.2系统的硬件组成
系统的硬件组成[10]主要包括:计算机主机、CCD摄像机、图像采集卡、照明系统及相关的设备。
2 PCB电路板缺陷检测识别
PCB电路板在电子工业中的应用越来越广泛,如何降低电路板的故障率、提高电路板的质量直接影响到整个产业的发展。因此,对于PCB电路板缺陷的识别技术的发展至关重要。PCB电路板的缺陷很多[16],主要有短路、断路、划痕、凸起、空洞、缺焊、过焊等等,由于实验室设备限制和个人水平所限,本文主要研究的内容是PCB电路板短路与断路的检测识别
近年来出现了很多图像检测算法,这些算法大致可分为三大类:有参考算法、无参考算法以及混合型算法。有参考算法分为两大类:图像对比法和模型对比法。无参考算法是一种不需要标准图像的检测算法,它是基于一定的设计规则来进行检测的。混合型方法是将有参考算法与无参考算法混合使用,从而发挥出各自的优点。比如,模板匹配法与数学形态学方法结合使用,或者连接表方法与数学形态学方法结合使用等。本文中短路与断路的检测识别采取了图像对比法,即将经过一定处理后的图像进行相减,从而分析相应的结果;而对焊点缺陷的识别主要采用模板匹配法与数学形态学方法结合使用。
2.1 PCB电路板缺陷检测识别的主要流程图
图2为子程序流程图;图3为主程序流程图。
2.2 PCB电路板短路与断路的检测识别
2.2.1边缘检测
在对图像进行基本的处理过后可以将图像与背景分割开来。边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。
这些包括:深度上的不连续;表面方向不连续;物质属性变化;场景照明变化。边缘检测是图像处理和计算机视觉中,尤其是特征提取中的一个研究领域。
图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。有许多方法用于边缘检测,它们的绝大部分可以划分为两类[17]:基于查找一类和基于零穿越的一类。基于查找的方法通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向。基于零穿越的方法通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian过零点或者非线性差分表示的过零点。
1)Roberts算子
边缘,是指周围像素灰度有阶跃变化或屋顶等变化的那些像素的集合。图像的边缘对应着图像灰度的不连续性。显然图像的边缘很少是从一个灰度跳到另一个灰度这样的理想状况。真实图像的边缘通常都具有有限的宽度呈现出陡峭的斜坡状。边缘的锐利程度由图像灰度的梯度决定。梯度是一个向量,?f指出灰度变化的最快的方向和数量,如式2-1所示。
?f=(决定的。
因此最简单的边缘检测算子是用图像的垂直和水平差分来逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)
因此当我们想寻找边缘的时候,最简单的方法是对每一个像素计算出(2,4)的向量,然后求出他的绝对值,然后进行阀值操作就可以了。利用这种思想就得到了Roberts算子,由式2-5所示。
R(i,j)=
(式2-5)
它是一个两个2×2模板作用的结果。
2)Sobel算子
该算法通过2个3*3的模板,对选定的二维图像中同样大小窗口进行卷积,通常是一个模板对一个边缘响应大,另一个模板对水平边缘响应大,两个卷积值对最大值作为该点对输出。对于图像上的任意点(i,j)进行卷积,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)则输出图像公式如式2-8所示。
用sobel算子检测阶跃边缘得到的边缘宽度至少为两个宽度。3)Laplacian边缘检测算子
Laplacian算子定义由式2-9所示。
Δ2f(x,y)=
(式2-9)它的差分形式由式2-10所示。
Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}
=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)
Laplacian算子是一种各向同性算子,在只关心边缘的位置而不考虑其周围的灰度象素差值时时比较合适,Laplacian算子对孤立象素的响应要比对边缘或线的响应更要强烈,因此只适用于无噪声图像。
原图像与用三种边缘检测算子处理后的图像如下所示:图6 Sobel边缘检测图7 Laplacian边缘检测
从上面四幅图分析比较可得出结论:用Roberts边缘检测得出的图像较之其他方法更为清晰,噪点更少,图像更为连续,所以本文中采用Roberts算子来进行边缘检测。
2.2.2阈值分割
阈值分割法是一种基于区域的图像分割技术,其基本原理是:通过设定不同的特征阈值,把图像象素点分为若干类。常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始灰度或彩色值变换得到的特征。设原始图像为f(x,y),按照一定的准则f(x,y)中找到特征值T,将图像分割为两个部分,分割后的图像为:
若取:b0=0(黑),b1=1(白),即为我们通常所说的图像二值化。
在数字化的图像数据中,无用的背景数据和对象物的数据经常放在一起,同时,图像中还含有各种噪声,因此可以根据图像的统计性质,从概率的角度来选择合适的阈值。
1)最大方差阈值法
把待处理图像的直方图在某一阈值处分割为两组,当被分割成的两组间的方差最大时,便可以决定阈值了。
设灰度图像f(x,y)的灰度级为0-L,灰度级I的像素为Ni,则图中:
总象素数N=∑j=0 i=LNi(式2-11)灰度级i出现的概率Pi= 1-ω(K)(式2-16)则两组间的数学期望为ω0μ0ω1μ1=μ(式2-17)两组间的方差为ρ2(k)
ρ2(k)是K的函数,计算k取从0,1,2…L时ρ2(k)的值,当多的值为最大时,K即为阈值。
2)双峰法
根据图像的直方图具有背景和对象物的两个峰,分割两个区域的阈值由两个峰值之间的谷所对应的灰度值决定。设灰度图像f(x,y)的灰度级为0-L,灰度i的像素为Pi,分别计算
因为实际PCB电路板有着许多的划痕、污点等,使用最大方差阈值法时,会在处理后的图像上产生许多误点,而影响实际结果的分析,而双峰法能够顺利地滤除这些干扰,这个结论在分析对比以上图像时也可得出。所以本文选用了双峰法来进行阈值分割。
2.2.3粒子分析与图像对比
经过边缘检测和阈值分割的图像中会存在许多瑕点,这些点会影响到最后的图像识别与分析,有可能会增加多余的残留图像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能进行去除,如图11和图12所示。图11原图像图12粒子分析
将标准PCB图片减去缺陷缺陷PCB图片,便可以得到缺陷板的断路部分的图像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到断路部分的具体分析,如图13示。
将缺陷PCB图片减去标准PCB图片,便可以得到缺陷板的短路部分的图像,与上述相同的方法,便可以得到短路部分的具体分析,如图14所示。
3结束语
利用LABVIEW来进行PCB电路板缺陷的识别与检测是一项非常好的课题,它在近些年已经得到了一定的发展,并将得到更大的进步。限于本人能力和时间,本文的研究还未涉及很深的领域,可以在以下方面加以改进:
1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的设计可以再利用其他语言如VISUAL BASIC,C++等编程语言加以辅助设计,相信可以取得更加令人满意的结果。
2)由于实验设备等其他因素,本文中只重点研究了PCB电路板短路与断路的检测识别,PCB电路板的其他缺陷还有待于进一步的分析研究、分类和总结,并设计出更好的检测方法,以真正满足PCB电路板检测的需求。
3)照明设备的限制在很大程度上影响到了图像的检测效果,为取得PCB缺陷检测的进一步进展,在照明设备的选择上必须重视,并且设计出更好的图像采集系统。
4)在识别与检测手段上,可以引入更新更好的方法,而不要局限于在传统的方法中分析比较,例如基于BP神经网络的识别检测,图像的模糊决策等将有待于进一步研究。
总之,基于LABVIEW的机器视觉检测系统已经取得了不错的进展,高速发展的PCB制造技术和计算机技术对于PCB缺陷的检测提出了更高的要求,同时也大大地促进了PCB缺陷检测技术的发展。利用机器视觉检测在未来的较长的一段时间内将占据检测行业的半壁江山,相信在未来会取得更大的发展。
参考文献:
[1]程学庆,房晓溪.LabVIEW图形化编程与实例应用[M].北京:中国铁道出版社,2005.
[2]胡仲波.基于虚拟仪器技术的PCB视觉检测系统[D].南京:南京理工大学硕士学位论文,2006.
[3]段峰,王耀南.机器视觉技术及其应用综述[J].自动化博览,2002,19(3).
[4]周长发.精通Visual C++图像处理编程[M].北京:电子工业出版社,2004.
[5]陈锡辉,张银鸿.LabVIEW 8.20程序设计从入门到精通[M].北京:清华大学出版社,2007.
[6]郑伟.图像法检测印刷电路板缺陷[M].西安:西安理工大学,2002.
[7] National Instruments,IMAQ User Manual Concepts[Z].1999.
[8]李强.PCB板缺陷自动检测技术的分析研究[D].合肥:合肥工业大学,2002.
[9]傅茂名.基于形态边缘检测算法的一种改进[J].电子科技大学学报,2005(2).
[10]王思华.计算机视觉新技术及其在IC标记质量检验系统设计中的应用[J].电子技术应用,2000(9).
[11]岳永哲.图像处理技术在阅卷系统中的应用[D].北京:北京工业大学,2006.
[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.
[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.
[14]高育鹏,杨俊,何广军.基于图像识别的自动阅卷系统研究[J].现代电子期刊,2006(22).
[15]杨青燕,彭延军.基于灰度图像的答题卡识别技术[J].山东科技大学学报:自然科学版,2009(3).
[16]周海涛,韩晓军.基于数字图像处理的答题卡识别方法研究[J].电脑知识与技术,2008(28).
[17]周万珍,郑广,王建霞,等.数字图像处理技术在客观题阅卷中的应用[J].数学的实践与认识,2006(8).
[18]王胜春.基于SVM的信息卡识别系统[D].长沙:湖南师范大学,2008.
[19]吴志明.SMT系统中焊点位置的检测[D].哈尔滨:哈尔滨工业大学,2006.
[20]杨敏,王春青,邹增大,等.表面组装印刷电路板上焊点信息的自动获取[J].焊接学报,2005,39(6).
篇6
针对乳腺X光医学图像多分类问题中训练速度比较慢的问题,提出超球体多分类支持向量数据描述(HSMCSVDD)分类算法,即把超球体单分类支持向量数据描述直接扩展到超球体多分类支持向量数据描述。通过对乳腺X光图像提取灰度共生矩阵特征;然后用核主成分分析(KPCA)对数据进行降维;最后用超球体多分类支持向量数据描述分类器进行分类。由于每一类样本只参与构造一个超球体的训练,因此训练速度明显提高。实验结果表明,这种超球体多分类支持向量数据描述分类器的平均训练时间为21.369s,训练时间比Wei等(WEI L Y, YANG Y Y, NISHIKAWA R M, et al. A study on several machinelearning methods for classification of malignant and benign clustered microcalcifications. IEEE Transactions on Medical Imaging, 2005, 24(3): 371-380)提出的组合分类器(平均训练时间40.2s)减少了10~20s,分类精度最高达76.6929%,适合解决类别数较多的分类问题。
关键词:
乳腺X光图像;多类支持向量数据描述;灰度共生矩阵;核主成分分析
0引言
乳腺癌是女性常见的肿瘤疾病之一,由于乳腺癌的病发机理还未完全弄清楚,因此早期诊断对防治乳腺癌十分重要[1]。乳腺癌的临床诊断方法包括触摸式诊断、组织学诊断、细胞学诊断和影像学诊断四大类,其中影像诊断是最适合适龄女性乳腺癌诊断方法,乳腺X光摄影技术是最常见乳腺癌早期诊断方法[2]。随着计算机技术的不断发展,医学图像上的计算机辅助诊断技术也得到了迅猛的发展,其中常用的方法有关联规则、决策树、遗传算法、人工神经网络神经网络、贝叶斯、粗糙集、模糊聚类和支持向量机(Support Vector Machine,SVM)等。支持向量机在近些年发展比较迅速,它是建立在统计学习理论中的VC理论和结构化风险最小原理基础上实现的一种机器学习方法[3],能较好地解决小样本、非线性、高维数和局部极小点等实际问题。Tax等[4]在1999年提出支持向量数据描述(Support Vector Data Description, SVDD),它是一种源于统计学习理论和SVM的全新的数据描述方法,与SVM寻求最优超平面不同,SVDD包容所有目标样本数据的最小超球体。并且相比SVM,SVDD有着复杂性低、易移植和训练速度快等优点,在信用卡欺诈检测、入侵检测、人脸识别领域等有着广泛的应用,同时SVDD在解决不平衡数据分类和多示例分类中已成为一种新方法。SVDD在单分类问题中分类效果比较好,其中超球体单分类支持向量机[5]表现的效果更好,但是超球体单分类SVM缺乏有效的训练算法,所以其在应用中受到限制。在实际问题的解决中,很多分类问题都是包含多个类别的多分类问题,而目前大多数多分类器基本上都是由二分类器组合而成的,当分类类别数达到一定的数量时,这种经二分类器组合而成的多分类器将会遇到诸如样本训练阶段速度较慢的问题。例如在医学图像识别问题中,从图像中提取出来的信息特征量往往比较大,如果直接用二分类器组合而成的多分类器,训练速度相对来说较慢,而文献[6-7]中分别提到的关于多球体支持向量数据描述和多分类支持向量机的基本思想和实现对进一步研究多分类问题提供了帮助。
Wei等[8]提到用级联AdaBoost对标准医学图像数据集进行分类,分类精度达到80.3%,但是训练时间比较长,平均训练时间为40.2s。文献[9]中提到对标准医学图像数据集进行分类的方法,如果只使用ID3进行分类,分类精度为43.3%,只使用K最近邻(KNearest Neighborhood,KNN)分类法进行分类,分类精度为40.3%,而使用ID3和KNN的组合分类器进行分类,分类精度为47.6%。文献[10]中提到对标准医学图像数据集进行分类的方法,用主成分分析(Principal Component Analysis,PCA)和基于规则的粗糙集进行分类,分类精度为69.27%;用BP(Back Propagation)神经网络进行分类,分类精度为51.51%;用学习向量量化(Learning Vector Quantization, LVQ)神经网络分类器进行分类,分类精度为63.63%。从文献[8]中可以看出分类精度虽然达到80.3%,但是训练速度比较慢;而文献[9-10]中的分类精度比较低。
针对上述问题,本文提出基于超球体多分类支持向量数据描述方法。一些冗余的特征信息不仅会增大分类算法在构建分类模型时的数据量,而且还会影响分类器的分类效果;所以本文提出的超球体多分类支持向量数据描述算法优点在于分类模型建立前期先运用核主成分分析(Kernel Principal Component Analysis,KPCA)来有效地对数据进行降维,然后在构建分类模型时使每一类样本只参与构造一个超球体的训练,以此来直接构造多个SVDD超球体的多分类器,在保证分类精度的基础上有效地提高了训练速度。乳腺X光医学图像标准数据集MIAS(Mammographic Image Analysis Society)[11]分类实验效果表明:与文献[8]相比,超球体多分类SVDD分类器的训练时间减少了10~20s,而且分类精度最高达到76.6929%。
1KPCA和SVDD的基本原理
1.1核主成分分析
篇7
关键词:实践教学;教学改革;柔性制造系统
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)47-0179-02
一、引言
实践教学是高等教育的重要环节,是实现人才培养目标的有效途径和重要保证。随着社会的进步和发展,对人才的需求也发生了很大的变化,给实践教学带来一些新的问题和新的挑战。我校机械电子工程专业的培养目标中强调了机电结合的高级工程技术人才,为了培养“厚基础、宽口径、高素质、强能力”的创新型工程技术人才,适应现代社会的要求,就必须要优化实践教学内容,推进实践教学方法和实践教学体制改革。而营造培养高素质创新工程技术人才的实践教学环境,提供合适的实践训练平台是达到培养目标的重要保障。为此,我校2012年在共建基金支持下成立了柔性制造实验室,通过柔性制造系统对实际工业自动化生产中的模拟运行,让学生了解和掌握现代机电系统运行控制技术,培养学生的实践能力和创新能力。本文围绕该柔性制造系统在我校机械电子工程专业实践培养上的应用,就我校在教学改革上的措施进行论述。
二、柔性制造系统
柔性自动生产线是将微电子学、计算机信息技术、控制技术、机械制造和系统工程有机地结合起来,是一种技术复杂、高度自动化系统,柔性制造技术更是当前机械制造业适应市场动态需求及产品不断迅速更新的主要手段,是先进制造技术的基础。
通过该系统,能使学生可通过实验了解柔性制造自动化生产实训系统的基本组成和基本原理,能为学生提供一个开放性的,创新性的和可参与性的实验平台,让学生全面掌握机电气一体化与物流技术的应用开发和集成技术,能够帮助学生从系统整体角度去认识系统各组成部分,从而掌握柔性制造相关系统的组成、功能及控制原理。促进学生在机械设计制造、电气自动化、数字控制技术、机器人技术、计算机技术、传感器技术、生产线技术等方面的学习,并对数控加工、电机驱动及控制技术、PLC控制系统的设计与应用、机器人控制技术、高级语言编程等技能得到实际的训练,激发学生的学习兴趣,使学生在光机电气一体化系统的设计、装配、调试能力等方面均能得到综合提高。系统组成如图1所示,共分为总控系统、自动化立体库及码垛机、自动化输送线系统单元、CCD形状颜色尺寸检测单元、上下料搬运机器人单元、数控加工单元、串联机器人装配与分拣单元、视觉导引搬运AGV几个单元部分。系统模拟某自动化加工、分拣、自动装配及自动出入库完整制造过程。立体库由两排货架及中间的码垛机构成,实现毛坯及成品部件的存储;传送线负责从立体库取件、传送工件到到各工作单元及传送入库;通过图像识别功能,对工件进行形状与颜色识别,通过信息识别,六自由度行走搬运机器人可选择把工件放入相应的数控加工设备(车削加工中心或铣削加工中心)当中。加工完毕,通过CCD视觉装置进行高度与直径等尺寸识别。并为下一工序做好准备。
该柔性制造系统可联机/单机两种运行模式,方便学生进行PLC控制、生产线控制、机器人控制及数控机床应用实训。
三、柔性制造系统在机械电子工程专业实践能力培养中的应用
1.课程实验实训。利用该柔性制造系统的各组成单元,对原有相关课程中的实验内容进行了调整整合,增加了综合性实验环节内容设计,根据教师授课情况,结合学生特点进行选取。主要服务的课程包括:机电传动与控制(步进电机、伺服电机控制)、PLC控制技术(立体库码垛机控制、传送线控制)、机器人技术(分拣机械手、搬运机械手)、机床数控技术(数控加工单元)、传感与测试技术(传送线、CCD等单元)、机电一体化技术。
2.实习实训环节。根据专业特点及实习实训要求,对原有实习实训环节进行了改革。将原第七学期三周的实习环节分割成几个模块,其中一个模块是2.5天的柔性制造系统实习实训模块,每次二十余人分成多个小组进行该模块的实习实训。对学生获得的专业知识和专业技能进行的一次全面考核和综合检验。按照机械电子工程专业设置的要求,通过柔性制造系统平台开展的集中实践教学环节,让学生完成的主要任务为:气路、电路或控制回路的构成的模拟设计及运行调试;根据工作要求对PLC控制程序进行修改或编写,模拟实际的控制过程;对人为设定的故障(电气及PLC故障)进行故障诊断及排除练习,提高学生解决实际问题的能力;模拟系统的各单元之间可以通过I/O进行通讯,将多个加工单元连接构成系统。通过这个教学环节,让学生自己动手来搭建实际机电一体化设备,以此来提高学生解决实际工程问题的能力。实习的内容:①柔性制造系统基础知识教学。主要讲授柔性制造系统技术的一些基本概念,让学生对柔性制造系统有全面的了解和认识。②立体库系统设计。通过对立体库实际操作,了解立体库工作过程;以立体库结构设计及PLC控制为主要教学内容,了解并掌握立体库结构设计技术,学生能够完成单元格的设计出图。了解立体库控制要求,采用PLC实现取、送工件的控制设计。③搬运线设计。以搬运线为教学对象,使学生了解掌握生产线工作原理及操作方法,了解生产线基本结构及控制方法,了解典型分拣、传送、检测环节的设计方法及操作。④AGV寻迹车设计。了解寻迹车基本结构组成和功能;了解AGV寻迹车车体结构设计方法,了解寻迹车控制原理和操作。⑤机械手。了解工业机器人基本原理,了解和掌握工业机器人机构及基本结构设计知识,掌握工业机器人操作知识,了解和掌握机器人控制原理,掌握机器人编程控制,利用测绘技术实现实物的测绘建模使学生在扫描和建模。⑥数控机床编程操作。以典型车、铣零件为对象,让学生能够通过动手实践将其数控加工程序编制出来,并在数控车及数控铣削加工中心完成各自零件的装夹、对刀及加工仿真操作。
本实习重点强化动手能力的训练,鼓励学生在对柔性制造系统全面了解和认识的基础上,独立完成系统的运行和各分系统的设计操作。
四、结论
柔性制造实验教学系统的建成与投入使用,丰富提高了我校机械电子工程专业在开放性实验室的实验教学和实训的能力。以此平台为基础,在授课教师及实验教师的共同努力下,有针对性地开展相关实验、实训项目,使学生可以更好地掌握机械、电子、电气、液压、自动控制、数控等专业知识,并以实际设备为对象,建立机电一体化设备调试、运行、维护等相关能力,有效地对应本专业培养目标要求。经过学习和训练,学生的综合素质得到提高并激发了部分学生的专业学习兴趣和科技创新兴趣,为今后的能力培养和就业发展打下了基础。
通过一年多时间的应用,实验、实训等项目内容在不断充实完善,在其间也发现了一些问题,例如包括对指导教师的能力要求、系统运行耗材费用控制等将在今后工作中逐步完善。
参考文献:
[1]王伟,王殿君,申爱明,等.柔性制造系统在机电一体化专业综合训练中的应用[J].安徽师范大学学报,2010,33(6):554-557.
篇8
一、 数控机床故障诊断原则
1. 先外部后内部
数控机床是机械、液压、电气一体化的机床,所以故障的发生必然要从这三者之间综合反映出来。所以要求维修人员掌握先外部后内部的原则,即当数控机床发生故障后,维修人员应采用望、闻、听、问等方法,由外向里逐一进行检查。
例1:一数控车床刚投入使用的时候,在系统断电后重新启动时,必须要返回到参考点。即当用手动方式将各轴移到非干涉区外后,再使各轴返回参考点。否则,可能发生撞车事故。所以,每天加工完后,最好把机床的轴移到安全位置。此时再操作或断电后就不会出现问题。
外部硬件操作引起的故障是数控修理中的常见故障。一般都是由于检测开关、液压系统、气动系统、电气执行元件、机械装置出现问题引起的。这类故障有些可以通过报警信息查找故障原因。对一般的数控系统来讲都有故障诊断功能或信息报警。维修人员可利用这些信息手段缩小诊断范围。而有些故障虽有报警信息显示,但并不能反映故障的真实原因。这时需根据报警信息和故障现象来分析解决。
例如:台立式加工中心采用FANUC-OM控制系统。机床在自动方式下执行到X轴快速移动时就出现414#和410#报警。此报警是速度控制OFF和X轴伺服驱动异常。由于此故障出现后能通过重新启动消除,但每执行到X轴快速移动时就报警。经查该伺服电机电源线插头因电弧爬行而引起相间短路,经修整后此故障排除。
2. 先机械后电气
由于数控机床是一种自动化程度高,技术复杂的先进机械加工设备。机械故障较易发现,而系统故障诊断难度要大一些。
3. 先静后动
维修人员要做到先静后动,不可盲目动手,应先询问操作人员故障发生的过程及状态,查看说明书、资料后方可动手查找故障原因,继而排除故障,
4. 先公用后专用
公用性问题会影响到全局,而专用性问题只影响局部。
5. 先简单后复杂当出现多种故障相互交织掩盖、一时无从下手时,应先解决容易的问题,后解决较大的问题。常常在解决简单的故障的过程中,难度大的问题也可能变的容易,理清思路,将难度较大的变得容易一些。
6. 先一般后特殊
在排除某一故障时,要先考虑最常见的可能原因,然后再分析很少发生的特殊原因。
二、 数控系统自诊断技术及故障排除方法
所谓系统诊断技术,就是利用数控装置中的计算机及相关运行诊断软件进行各种测试。
1. 自诊断技术
1) 开机自诊断:数控系统通电后,设备内部诊断软件会自动对系统中各种元件如CPU、RAM及各应用软件进行逐一检测并将检测结果显示出来,如检测发现问题,系统会显示报警信息或发出报警信号。开机自诊断通常会在开机一分钟之内完成。
有时开机诊断会将故障原因定位到电路板或模块上,但也经常仅将故障原因定位在某一范围内,这时维修人员需查找相关维修手册根据提示找到真正故障原因并加以排除。
2) 运行自诊断:运行自诊断也称在线自诊断,是指数控系统正常工作时,运行内部诊断程序,对系统本身、PLC、位置伺服单元以及与数控装置相连的其它外部装置进行自动测试、检查,并显示有关信息,这种诊断一般会在系统工作时反复进行。
3) 脱机诊断:当系统出现故障时,首先停机,然后使用随机的专用诊断纸带对系统进行脱机诊断。诊断时先要将纸带上的程序读入RAM系统中,计算机运行程序进行诊断,从而判定故障部位,这种诊断在早期的数控系统中应用较多。
2. 人工诊断技术
数控系统的故障种类很多,而自诊断往往不能对系统的所有部件进行测试,也不能将故障原因定位到具体确定的元器件上,这时要迅速查明原因就需要采用人工诊断方法。人工诊断方法有很多种,最常用的有:功能程序测试法、参数检查法、备件置换法、直观法、原理分析法等,现简介如下: 1) 功能程序测试法:这种方法将数控系统中的G、M、S、T、功能的全部指令编成一个测试程序,穿成纸带或存储到软盘上在进行诊断时运行这个程序,可快速判定哪个功能出现问题,这种方法一般在机床出现随机性故障时使用,也可用于设备闲置时间较长重新投入使用时测试用。
2) 参数检查法:一般系统的参数是存放在RAM中的,一旦出现干扰或其它原因会造成参数丢失或混乱,从而使系统不能正常工作,这时应根据故障特征,检查和核对有关参数,在排除某些故障时,有时还需对某些参数进行调整。
3) 备件置换法:是将系统中型号完全相同的电路板、模块、集成电路或其它零部件进行互相交换比较,或利用备用的元器件替换有疑点的部件,从而快速有效地确定故障部位。
4) 直观法:直观法是利用维修中常用的“先外后内”的原则,利用观察零部件的工作状态、听声音、摸发热等方法,进行逐个检查,如利用视觉可观察内部器件或外部连接的形状上的变化;利用听觉可查寻器件发出的异常声音;利用嗅觉或触觉可查寻过载、高温等现象;等等。
5) 原理分析法:当采用其它检查方法难以奏效时,可以从电路基本原理出发,一步一步用万用表、逻辑表、示波器等工具对测点进行检查对照,最终查明故障原因。
3. 高级诊断技术1) 在高级诊断中,常用的方法主要有以下几种方法:
2) 自修复诊断:自修复诊断一般是指在系统内设置不参与运行的备用模块。自修复程序在控制系统每次开机运行,当发现某模块有问题时,系统会把故障信息显示在屏幕上,同时自动查寻备用模块,故障模块的工作即被备用模块取代,维修人员可根据提示更换下一故障模块。自修复诊断方法需要较多的备用模块,这会使系统体积增大,价格提高。
3) 诊断指导专家系统:近年来,随着图像识别、声音识别、自动翻译和智能工业机器人等技术的发展,这些技术越来越多地被应用到数控机床上。诊断专家系统以专家知识、经验为基础,自动模仿专家利用知识解决复杂问题的思维活动,这就使普通工作人员同样能对故障做出具有专家级水平的诊断结论。
篇9
关键词: 城市;航空摄影测量;发展趋势
Abstract: The paper combine with author’s work experience, in-depth analysis of the future urban Aerophotogrammetry development trend introduced for reference.Key words: City; aerial photogrammetry; trends
中图分类号:{P286+.4}文献标识码:A文章编号:2095-2104(2012)
回顾过去, 城市航测走过了艰难曲折的历程, 我们为所取得斐然业绩的今天而自豪, 随着科学技术的快速发展, 城市航测经历了从模拟测绘时代向数字测绘时代的跨越, 正积极朝向信息化测绘时代迈进。由于发展应用的拓展和延伸, 城市航测与RS ,GIS,GPS 集成技术更趋紧密,而成为地球空间信息技术的组成部分, 随着计算机技术和互联通信技术的发展, 地球空间信息技术的下一个发展目标是空间信息网格技术, 实现这一目标任重道远, 城市航空摄影测量者将面临着前所未有的机遇和挑战。
自 20 世纪 80 年代初起,北京、上海、沈阳、武汉等十几个城市陆续开展了航空摄影测量技术测制城市大比例尺地形图的生产应用, 随着生产发展的需要, 各城市测绘单位先后组建了航测机构开展航空摄影测量业务,自 CJJ8-85《城市测量规范》颁布实施后, 大比例尺航测成图技术的应用在国内各城市测绘单位快速的得到推广应用。上世纪 6 0 年代末摄影测量技术在国际上开始由“模拟到解析”的过渡, 我国城市测绘系统的航空摄影测量也在上世纪 80 年代初到 9 0 年代基本实现了这一过渡, 在城市建设和城市规划管理及城市重大设施的设计与建设中起到了积极作用。自 1983 年 5 月在江苏省镇江召开了由国家城市勘测主管部门主持的“城市航空摄影测量经验交流会”至今, 我国城市航空摄影测量的发展走过了不平凡的历程,回顾城市航空摄影测量的发展进程, 展望未来城市航测的发展趋势, 对谋划、布局今后城市航测的发展, 探索其发展规律, 以新的思路和对策迎接新时代的挑战具有重要的意义。
1.大比例尺航测成图成为城市基本地形图成图的主要方式
城市大比例尺地形图精度要求高, 长期以来主要通过平板仪、经纬仪配合小平板仪的作业方法来实现的。这种方法劳动强度大, 成图周期长, 成本高, 因而难以适应城市建设发展与城市规划、管理的需要。采用航测法实施大范围的大比例尺的成图需要一、二级精密立体测图仪方能保证精度, 在上世纪 8 0 年代初这类仪器往往需要进口, 而且价格昂贵, 有的甚至需要申请国家外汇额度进行配置。而当时我国城市测绘经费的来源是在城市维护费和规划业务费中安排一定数量的城市勘测基础业务费用, 高昂的仪器购置费用一般城市难以解决, 大多数城市航测成图设备仅有1818 立体坐标量测仪、国产 HJ - 24 或 Hi- 3 纠正仪、PC - 1500 计算机、单投影仪等, 如何使这些设备在城市大比例尺航测成图的生产中形成良好的效益是当时鱼待解决的问题。从我国大多数城市处于地势平坦(间有小丘陵) 的地理环境方面出发, 经过反复研究试验, 航测综合法成图得到大家的认同和普遍的应用, 航测综合法是摄影测量与平板仪测量相结合的一种方法,它可以使内、外业分工流水作业, 人力资源得到充分的应用。
城乡建设环境保护部在杭州市就城市大比例尺航测成图及其设备配套问题, 邀请部分省、市、自治区的有关专家和工程技术人员参加的技术论证会。参会人员从理论与实践、质量与速度、经济与效益等不同角度将城市大比例尺航测成图法与常规平板仪、经纬仪配合小平板仪作业方法进行了比较一致认为: 城市大比例尺航测成图是城市基本地形图测绘的
主要手段。为了加快城市大比例尺地形图的成图和更新, 与会专家认为根据航测综合法的基本原理而形成的“解析综合法”、“数字解析法”、“桩点透刻法”等 3 种方法符合当时国情和城市测绘部门的现实条件, 是一种行之有效的方法。
2.大比例尺航测计算机辅助成图技术的广泛应用
航测机助成图技术是城市航空摄影测量从模拟经解析向数字化方向发展的重要阶段。2 0 世纪初奥地利维也纳军事地理研究所制成了“自动立体测图仪”, 到上世纪60 至 7 0 年代, 这种类型的仪器发展到了顶峰。由于这些仪器均采用光学投影器、机械投影器或光学——机械投影器“模拟”摄影过程, 用它们交会被摄物体的空间位置, 所以称其为“模拟摄影测量仪器”, 因而这一发展时期也被称为“模拟摄影测量时代”。在模拟摄影测量的漫长发展阶段中,摄影测量科技的发展可以说基本上围绕着十分昂贵的精密立体测图仪进行的, 所以我国城市测绘部门拥有立体测图仪的数量是十分有限的。20 世纪 80 年代至 90 年代城市规划、建设和土地管理及其各相关专业由于采用 CAD 技术而需要数字化地图。由于模拟测图仪测绘的地形图都是线划产品, 用于建立地理信息基础库时, 还需要将地形图数字化, 增加了工作量。在这样的背景下如果仍用精测仪单纯生产线划地形图已不符合实际发展需要了, 所以在这个时期城市各测绘部门都对已有的模拟仪器进行技术改造, 增加计算机与接口设备, 用计算机辅助测图, 提高测图效率, 并使产品具有线划与数字两种形式, 可以直接进入地理信息库而形成机助成图系统, 成为当时城市航空摄影测量的主要技术手段。
3.数字摄影测量——城市航测的现代化
城市测绘部门随着数字化测图技术内、外业一体化的实现、基础地理信息系统的建立, 数字摄影测量成为基础地理信息获取和快速更新的重要数据。数字摄影测量系统除了胜任解析测图仪的一切功能外, 还具有诸如图像识别、影像的比较分析、任意方式的纠正和数据库管理等功能,以测绘常规地形图为主的城市航测成图将全面转向以实现 GIS 数据库的自动建立和更新。由于有了良好的经济支撑, 当前国内一些大、中城市测绘部门在配置上述两类型数字摄影测量系统的同时购置高精度影像扫描仪及图形输出设备, 从而形成了较为完善的城市大比例尺航测数字产品的生产规模和能力。
4.城市航空摄影测量的展望
利用高分辨率 CCD 相机所摄倾斜影像, 根据建筑物的几何条件与约束条件, 按照透视变换原理直接获取等主距的平行影像进而获取建筑物立面影像的方法, 随后依最少的地面控制, 将平行影像放大到给定比例尺的数字城市中, 这种方法可大大加快车载系统大比例尺建筑物立面影像的获取过程, 不受建筑物高低的影响, 可用于机载、固定和人工作业多种测量模式, 解决了航空摄影测量的“盲区”, 将成为数字城市建设的核心技术之一。
近期国内外已将数码航空摄影技术推向实用化阶段, 在我国一些城市也已进行了数码航空摄影的实践, 该技术彻底抛开了常规航摄作业中对底片冲洗等十分繁冗的工作, 省去了胶片冲洗、影像扫描等专用设备及相应工序, 可将影像数据直接在计算机中进行后处理, 使航测作业从摄影、测量到最终成图全过程的数字化, 随着研究、实践进程的不断深化, 该技术会不断成熟、完善,应引起城市航测界的高度关注。
当前商业化的高分辨率遥感影像诸如IKONOS, EROS, QuickBird 等已出现好几年, 由于它们具有强大的几何量测能力,已在中、小比例尺地形图中得到充分应用。我国也自主研发了较高分辨率的遥感卫星, 并获取了大量的对地观测影像。未来还有发射更高分辨率卫星计划, 所获取的高分辨率卫星影像将拥有巨大的应用市场, 为此, 城市测绘部门应予以密切的关注, 使其完全依赖航空摄影生产地形图的手段得到根本性的改变。
5.结语
数字航空摄影测量技术正在逐步取代传统方法,在此重大革新的关口,笔者基于多年工作经验,结合大量相关文献,对城市航空摄影测量的发展趋势进行了详细的分析和探讨,对未来的发展提出了一定的展望。
参考文献:
篇10
论文关键词:人类智能,人工智能,认知,心理学
人工智能技术无论是在过去,现在还是将来,都作为科学研究的热点问题之一。人类对自己本身的秘密充满好奇,随着生物技术的飞速发展,人类不断破译人体的生命密码。而以生物科学为基础的人工智能技术也得到了长足的发展。人们希望通过某种技术或者某些途径能够创造出模拟人思维和行为的“替代品”,帮助人们从事某些领域的工作。为了让计算机能够从事一些只有人脑才能完成的工作,解脱人的繁重的脑力劳动,人类对自身的思维和智能不断地研究探索。但是,科学技术是一柄双刃剑,人们对人工智能技术的飞速发展存在着恐慌。如果机器真的具有了人类的智能,在未来的某一天,他们会不会取代人类而成为地球的主宰者?人类智能和人工智能,谁才是未来的传奇?
1.你在和谁说话?
“先进的人工智能机器人不但拥有可以乱真的人类外表,而且还能像人类一样感知自己的存在。”这是人工智能发展到高级阶段的目标和任务。那么,我们在不久的未来能否实现这样一个目标呢?人类真的能发明出足以乱真的智能人类吗?隔着一堵墙,我们是否能分辨出正在与我们对话的是一部机器还是人类?
1.1. 人工智能的定义
人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是相对于人的智能而言的。正是由于意识是一种特殊的物质运动形式,所以根据控制论理论,运用功能模拟的方法心理学,制造电脑模拟人脑的部分功能,把人的部分智能活动机械化,叫人工智能。人工智能的本质是对人思维的信息过程的模拟,是人的智能的物化。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能发展的过程归纳为机器不断取代人的过程。
1.2. 人工智能技术的发展
几个世纪以来,人类依靠智慧,发明了许多机器,使人类能够从许多体力劳动中解放出来。从1956年正式提出人工智能学科算起,40多年来取得长足的发展,成为一门广泛的交叉和前沿科学。科学家发明了汽车,火车,飞机,收音机等等,它们模仿我们身体器官的功能,但是这些不能模仿人类大脑的功能毕业论文格式范文。当计算机出现后,人类开始真正有了一个可以模拟人类思维的工具,在以后的岁月中,无数科学家为这个目标努力着。1997年5月,IBM公司研制的深蓝(Deep Blue)计算机战胜了国际象棋大师卡斯帕洛夫(Kasparov)。在一些地方计算机帮助人进行其它原来只属于人类的工作,计算机以它的高速和准确为人类发挥着它的作用。计算机的出现,使得人工智能有了突破性的进展。计算机不仅能代替人脑的某些功能,而且在速度和准确性上大大超过人脑,它不仅能模拟人脑部分分析和综合的功能,而且越来越显示某种意识的特性。真正成了人脑的延伸和增强。
1.3. 人工智能的研究领域
人工智能是一种外向型的学科,也是一门多领域综合学科。它不但要求研究它的人懂得人工智能的知识,而且要求有比较扎实的数学基础,哲学和生物学基础,只有这样才可能让一台什么也不知道的机器模拟人的思维。而人工智能的最根本目的是模拟人类的思维,因此,它的研究领域与人类活动息息相关。什么地方只要有人在工作,他就可以运用到那个领域。
现阶段主要研究领域有专家系统,机器学习,模式识别,自然语言理解,自动定理证明,自动程序设计心理学,机器人学,博弈,智能决定支持系统和人工神经网络等等。
2.机器真的可以思考吗?
机器真的可以思考吗?机器的思考归根结底还是模仿人类的思维模式,正是“思考”这一人类的本质属性,使得人工智能和心理学从最初就紧密地联系在一起。心理学研究人脑中信息的输入、输出、存储和加工,并研究人脑各个部位的功能。最早的双核计算机模仿人的左右脑,在人脑不同区域主管各个不同功能这一原理的基础上,来设计负责不同功能的芯片。以此为出发点,心理学家和计算机学者进一步合作,通过研究人解决问题的方法来研究开发人工智能。随着人工智能的发展,所要求实现的职能愈加复杂,但最基本的方式还是逻辑推理和归纳,这正是心理学家和逻辑学家的专业领域。心理学家以研究探讨人类逻辑思维方式为人工智能提供了基本原理和原则。
2.1. 人类意识的本质
意识是世界的内在规定、一般规律和组成部分,是具有客观实在性同世界的其它组成部分处在对立统一关系中的事物。意识普遍存于世界和万物之中,世界是包含意识的世界,万物是包含意识的万物。没有意识存在于其中的世界不是我们现实生活中的世界,没有意识存在于其中的万物也不是我们天天眼见手触的万物。有了意识的存在,世界和万物就有了生机和活力。
2.1.1. 意识是与物质相对应的哲学范畴,与物质既相对立又相统一的精神现象。
意识是自然界长期发展的产物,由无机物的反应特性,到低等生物的刺激感应性,再到动物的感觉和心理这一生物进化过程是意识得以产生的自然条件。意识是社会的产物,人类社会的物质生产劳动在意识的产生过程中起决定的作用。辩证唯物主义在强调物质对意识起决定作用的前提下肯定意识对于物质具有能动的反作用,在意识活动中人们从感性经验抽象出事物的本质、规律形成理性认识,又运用这些认识指导自己有计划、有目的地改造客观世界。
2.1.2. 从意识的起源看,意识是物质世界发展到一定阶段的产物;从意识的本质来看,意识是客观存在在人脑中的反映。
意识是人脑对客观存在的反映:第一,正确的思想意识与错误的思想意识都是客观存在在人脑中的反映;第二,无论是人的具体感觉还是人的抽象思维,都是人脑对客观事物的反映;第三,无论是人们对现状的感受与认识,还是人们对过去的思考与总结,以至人们对未来的预测,都是人脑对客观事物的反映。 意识的能动作用首先表现在,意识不仅能够正确反映事物的外部现象,而且能够正确反映事物的本质和规律;意识的能动作用还突出表现在,意识能够反作用于客观事物,以正确的思想和理论为指导心理学,通过实践促进客观事物的发展。
2.2. 人类意识与人工智能的关系
认知心理学和人工智能,是认知科学的两个组成部分。人工智能使用了心理学的理论,心理学又借用了人工智能的成果。人类意识与人工智能两者具有以下关系:
l人工智能是研究用机器模拟和扩展人的智能的科学。它撇开了人脑的内在结构和意识的社会性,而只是把人脑作为一种信息处理的过程,包括信息的接收、记忆、分析、控制和输出五部分。现代科学技术用相应的部件来完成着五个过程,就构成了人工智能或电脑。
l人工智能可以代替人的某些脑力劳动,甚至可以超过人的部分思维能力,随着现代科学技术的发展,它发挥着越来越重要的作用。人工智能的出现不仅解放了人的智力,而且为研究人脑的意识活动提供了新的方法和途径。它说明了人的意识活动不管多么复杂,都是以客观物质过程为基础的,而不是什么神秘的超物质的东西,人们完全可以用自然科学的精确方法来加以研究和模拟,它进一步证实了辩证唯物主义意识论的科学性毕业论文格式范文。
l人工智能的产生和发展,深化了我们对意识相对独立性和能动性的认识。机器思维即人工智能表明,思维形式在思维活动中对于思维内容具有相对独立性,它可从人脑中分化出来,物化为机械的、物理的运动形式,部分地代替人的思维活动。
随着科学技术的发展,人工智能将向更高水平发展,反过来推动科学技术、生产力和人类智慧向更高水平发展,对人类社会进步将起着巨大的推动作用。
3. 人工智能的未来
人工智能是为了模拟人类大脑的活动而产生的科学,人类已经可以用许多新技术新材料模拟人体的许多功能,诸如皮肤,毛发,骨骼等等,也就是说,人类可以创造出“类人体”。只要能够模拟人的大脑的功能,人就可以完成人工生命的研究工作,人创造自己,这不但在科学上,而且在哲学上都具有划时代的意义。这就是人工智能承担的历史使命。
在科学技术日新月异的今天,知识爆炸,科技的增长超出了人类承受的速度。各种新科技的出现层出不穷,随之而来的成果简直让人瞠目结舌,克隆、基因芯片、转基因等等,人类自身的秘密开始一层一层的揭开。我们人脑的复杂结构,人体的基因链也逐渐被科学技术解剖。我们希望将来的人工智能机器能将我们从繁重的体力劳动和脑力劳动中解放出来心理学,例如机器人做家务,带孩子,做司机,秘书等等一系列我们不愿意花太多精力或者有太多限制条件的工作。然而,人类由于多种“性能”都不如机器人,反而退化成为机器人的奴隶?他们会不会有一天无法忍受人类对他们的“剥削”和“压迫”,挑战人类的统治?很多的科幻作品和电影中都预言了这样的场景,未来的智能机器人和人类争夺有限的地球资源,并最终打败人类,成为新的地球统治者。这也正是绝大多数心理学家和哲学家对人工智能的发展忧心忡忡的原因。
人工智能的发展,也只能无限接近于人的智能,而不能超越人的智能。因为人工智能技术的本质,是模拟人类的思维过程,是为人类服务的。我们在进行发明创造的同时,担心被我们所发明的物质所毁灭。正如人类发明了原子能,用于取代正在逐渐消逝的矿物能源,然而当原子能用于军事领域的时候,他产生的力量也足以毁灭人类文明。科技本身并不是问题,人类如何运用自己掌握的技术,才是问题的关键。我们最大的敌人不是我们发明的技术,而是我们自己本身。
【参考文献】
1.李建国人工智能与认知心理学[J]. 西南师范大学学报 1986年4月第二期 142-146页
2.郑南宁认知过程的信息处理和新型人工智能系统[J]. 中国基础科学.科学前沿2008年 9-18页
3.蔡自兴,徐光祐人工智能及其应用(第三版)[M].北京.清华大学出版社 2004年
4.(美)Sternberg,R.J.认知心理学[M] .北京.中国轻工业出版社 2006年
5.(美)Nils J.Nilsson 人工智能[M].北京. 机械工业出版社 2004年