神经网络的训练方法范文
时间:2024-03-28 18:12:39
导语:如何才能写好一篇神经网络的训练方法,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:带有局部搜索的量子粒子群算法;RBF神经网络;结构优化;参数优化
中图分类号:TP181文献标识码:A
文章编号:1004-373X(2010)04-157-03
RBF Neural Network Training Based on MQPSO-LQPSO
CAI Jiliang,YE Wei
(College of Science,Air Force Engineering University,Xi′ an,710051,China)
Abstract:Quantum-Behaved Particle Swarm Optimization with Generalized Local Search Operator(MQPSO -LQPSO) is a very successful algorithm of modified QPSO.This algorithm is used to find the best structure and parameters of RBF neural network.They are both determined when finishing training.Experiments on functional approach show this method is effective.
Keywords:MQPSO-LQPSO;RBF neural network;structure optimization;parameter optimization
0 引 言
径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)是一种生物背景很强的前向神经网络,具有逼近能力强、学习速度快、鲁棒性强、泛化能力高等优点,在图像处理、自动控制、预测、信号处理、模式识别等多个领得到了广泛应用。
然而RBF神经网络存在着结构难以选取、参数的问题,许多学者对其训练方式进行了改进。与进化算法如遗传算法GA[1]、蚁群算法ACO[2]、粒子群算法PSO[3]、量子粒子群算法QPSO[4]等相结合是一个重要的改进方向。然而GA、ACO算法较为复杂,PSO算法简单但不能以概率1收敛到全局极小点,QPSO算能以概率1收敛到全局极小点,但搜索能力不够好,这些使得网络或陷入局部极小,或运算时间长,一定程度上影响了网络的性能。本文用简单且收敛性更好的QPSO改进型算法MQPSO-LQPSO来训练网络,将网络的结构也作为编码对象,在确定网络参数的同时也确定了网络的结构,提高了精度。
1 RBF神经网络
径向基函数神经网络是J.Moody 和C.Darken于20世纪80年代受人脑感受野的局部调节及重叠性启发而提出的,已经证明它能以任意精度逼近任意连续函数。径向基函数神经网络由输入层、隐层和输出层组成,其结构如图1 所示。输入层只传递输入信号到隐层;隐层传递函数由辐射状作用的非线性基函数组成,一般用Gauss径向基函数;输出为为线性传递函数。具有n个输入,h个隐节点,m个输出的径向基函数网络第i个模型输出为:
yi=ti+∑hj=1wijexp(-x-Cj2/2σ2j)(1)
图1 RBF神经网络结构
2 QPSO算法[5,6]
在量子空间中,粒子的速度和位置不能同时确定,因此Sun等人用粒子运动的波函数来描述粒子的状态,并求解薛定谔方程,得到粒子在空间某一位置的概率密度函数,进而得到位置的分布函数,应用Monte Carlo方法(详见文献[5,6],最后得到算法的进化方程:
Pij(t)=φij(t)Pbestij(t)+[1-φij(t)]Gbestij(t),
φij(t)~U(0,1)(2)
Mbestij(t)=1N∑nj=1pi(t)=[1N∑nj=1pi1(t),
1N∑nj=1pi2(t),…,1N∑nj=1piD(t)](3)
xij(t+1)=Pij(t)+αMbestij(t)-xij(t)ln1uij,
if rand()>0.5
Pij(t)-αMbestij(t)-xij(t)ln1uij,
otherwise uij(t)~U(0,1)(4)
式中:N为群体的规模;D为粒子的维数;P为局部吸引子;Pbest是第i个粒子的自身最优位置参数;Gbest是粒子群中所有粒子到目前为止最优位置参数;Mbest为平均最优位置,它是所有粒子自身最优位置的中心点;α为控制因子,用来控制粒子的收敛速度,是算法中惟一的控制参数。一般取1~0.5随迭代次数线性递减时,收敛效果最佳。
3 MQPSO-LQPSO的基本原理[7]
一个好的启发式搜索算法不仅要具有在未知区间上良好的全局搜索能力和在已搜区间上精细的局部勘探能力,而且还要使二者达恰当的平衡。QPSO具有良好的全局收敛性,但同时还需要一种有效的局部搜索机制,以便更好地搜索全局最优解。可以利用QPSO具的全局收敛性,将其在一个较小的局部范围内全局搜索,以达到增强局部搜索能力。基于这一思想,作者将较大规模的QPSO称为MQPSO,做全局勘探,将较小规模的QPSO称为LQPSO,做局部开发,继续搜索当前MQPSO搜索到的以Gbest为中心的某一邻域。LQPSO仍是一个完整的QPSO,只是其规模比MQPSO小,表现在搜索的范围和粒子的个数和迭代次数上。MQPSO搜索的范围是整个可行解的空间,而LQPSO的搜索范围是当前最优解的邻域,其邻域表达式为:
N(Gbest,radius)=Gbest•rand(1-radius,
1+radius)(5)
式中:radius
这种改进的算法在不增加计算次数的条件下,具有更好的搜索能力。
4 基于MQPSO-LQPSO的RBF神经网络训练方法
建立RBF网络的关键在于确定RBF网络隐层数据中心的个数h、数据中心的位置Cj、扩展常数σj,以及输出权值wij。设网络训练集X={(Pk,yk)|k=1,2,…,N},其中,Pk为输入,yk为目标输出,则神经网络的输出均方误差为:
mse=1m×n∑nk=1(yk^-yk)2(6)
式中:m为输入样本的维数;yk^为Pk对应的网络输出。由式(1)可知,它是关于h,Cj,σj和wij的函数,基于MQPSO-LQPSO的RBF神经网络训练就是让其达到最小,因此可将它作为MQPSO-LQPSO的适应度函数,而将h,Cj,σj和wij作为参数。粒子采用实数编码,由于h表示隐层神经元的个数,是正整数,可假设hmax为事先设定好的最大隐节点数。若hi>0(i
基于MQPSO-LQPSO的RBF神经网络训练方法具体描述为:
(1) 归一化处理样本;
(2) 随机生成初始种群,采用上述编码方式对各粒子的位置进行编码,并确定Pbest和Gbest;
(3) 重复下列步骤,直到满足MQPSO最大迭代次数或达到函数全局极小值的终止条件:
① 把每一向量映射为网络的一组神经网络参数值,并组成网络;
② 按照式(2)~(4)更新MQPSO中所有的粒子;
③ 输入训练样本进行训练,对每一个体进行评价,计算其适应值,并确定Pbest和Gbest;
④更新MQPSO粒子的Pbest和Gbest;
⑤按式(5)计算MQPSO的Gbest邻域,并在Gbest的邻域实行LQPSO操作;
⑥将LQPSO搜索到的Gbest赋给MQPSO的Gbest。
(4) 输出最佳参数值作为优化结果,算法结束。
5 仿真实验
Hermit多项式是一种常用的神经网络逼近测试函数,为:
f(x)=1.1(1-x+2x2)exp(-x2/2)
下面用MQPSO-LQPSO-RBF实现Hermit多项式逼近,并与文献[4]相比较,以0.08为步长同样在[-4,4]之间均匀采样101个实数值作为网络的训练输入样本,其相对应的函数值作为训练输出样本以此构成网络的训练样本集。同时在[-4,4]之间随机采样100个实数值作为网络的测试输入样本,其相对应的函数值作为测试输出样本,以此构成网络的测试样本集。实验中RBF神经网络隐含层预设为8,输入和输出层各取一个神经元,径向基函数采用高斯函数。因此网络中需要优化的参数为8个高斯函数的中心,8个高斯函数的扩展常数以及8个输出层的连接权值和1个输出偏移,共33个参数,即QPSO算法和IMQPSO-LQPSO算法中的粒子将在33维的空间中搜索,寻求满足最小均方误差要求的参数向量。
采用MQPSO-LQPSO算法中MQPSO的学习算法参数α作为迭代次数的函数从数从1~0.5线性减小,粒子数均为30。MQPSO-LQPSO中LQPSO的规模为5×6,参数α保持0.5 不变。总的最大计算适应度函数次数为12 000次,收敛最小误差为1×10-6。经仿真知最佳隐层个数为6。仿真结果如图2所示。比较结果如表1所示。
图2 迭代次数为200时的仿真结果
表1 MQPSO-LQPSO-RBF和QPSO-RBF的逼近效果比较
MQPSO-LQPSO-RBFQPSO-RBF[4]
训练集上的均方误差8.2×10-55.17×10-4
测试集上的均方误差9.7×10-55.10×10-4
从图2中仿真结果可以看出,逼近图形和原图形几乎重合;从表1中比较结果可以看出,改进算法有更小的均方误差,可见改进算法能很精确地实现函数逼近。
6 结 语
本文用性能比QPSO算法强的MQPSO-LQPSO算法来训练RBF网络,用这种方法改进的RBF网络不仅可以在确定网络的结构的同时确定网络的参数,还可以获得更好的逼近效果,因而是有效的。但注意到若预设的隐层节点较多,会导致搜索维数增加,从而降低搜索效率,因此下一步的工作是改进网络编码方式,用较小的维数来表示较大规模的网络,以增强算法的鲁棒性。
参考文献
[1]赵志刚,单晓红.一种基于遗传算法的RBF神经网络优化方法[J].计算机工程,2007,33(6):221-222.
[2]满春涛,李晓霞,张礼勇.一种基于ACO的RBF神经网络训练方法[J].哈尔滨理工大学学报,2007,13(1):56-58.
[3]梁桂兰,徐卫亚,何育智,等.PSO-RBFNN模型及其在岩土工程非线性时间序列预测中的应用[J].岩土力学,2008,29(2):995-1 000.
[4]陈伟,冯斌,孙俊.基于QPSO算法的RBF神经网络参数优化仿真研究[J].计算机应用,2006,26(8):1 928-1 931.
[5]Sun J,Feng B,Xu W B.Particle Swarm Optimization with Particles Having Quantum Behavior[A].Proceedings of 2004 Congress on Evolutionary Computation[C].2004:325-331.
[6]Sun J.A Global Search Strategy of Quantum-behaved Particle Swarm Optimization[A].Proc.2004 Congress on Cybernetics and Intelligent Systems[C].2004.
[7]Wang Jiahai,Zhou Yalan.Quantum-Behaved Particle Swarm Optimization with Generalized Local Search Operator for Global Optimization[A].ICIC 2007[C].Berlin Springer-Verlag,2007:851-860.
[8]刘兴华,刘宪英,胡泽.基于RBF神经网络系统辨识研究[J].现代电子技术,2004,27(24):57-59.
篇2
关键词:空间目标;红外辐射;自适应时延神经网络;目标识别
中图分类号:TP391.41;P472.1
0 引 言
随着军事斗争空域的扩展,特别是空间电子对抗的兴起,大气层外的空间目标数量迅速增加。空间目标群在大气层外飞行时,由于距离探测器较远,它们在探测器上所成形的像的面积较小,可近似为点目标,无法从形状上对它们进行分别。同时由于没有大气衰减的影响,空间目标及其伴飞物的速度、运动轨迹也基本相同,这使得用于识别目标的信息很少。红外光谱辐射是物体的本质属性,它不仅易于测量,而且对于不同空间物体具有不同的辐射特性,因而有效利用红外光谱辐射信息对空间目标进行识别已成为倍受关注的研究课题之一[1[CD*2]3]。时延神经网络(Time Delay Neural Network,TDNN)[4[CD*2]7]是一种常用的空间目标识别方法,它在BP网络的基础上加入延时器,具有记忆功能,同时它以目标的红外辐射度作为特征输入,解决了空间点目标特征提取困难的问题,对红外辐射序列具有较好的识别效果。但由于它对所有时刻的输入样本采用固定的时延,对红外辐射强度变化剧烈的目标识别效果较差。本文通过对目标在大气层外飞行过程中的红外辐射强度序列仿真数据进行分析,提出利用自适应时延神经网络[7[CD*2]10](Adaptive Time[CD*2]Delay Neural Network,ATNN)对目标进行识别。ATNN是在TDNN的基础上改变延时器的时延,针对不同输入采用可以自适应调整的时延,更加适应复杂环境下红外辐射度变化剧烈的红外点目标识别。在研究了自适应时延神经网络(ATNN)的网络结构后,对网络的权值和时延变化进行了推导,提出基于ATNN的红外点目标识别训练方法,最后利用空间目标的多波段动态红外辐射强度仿真数据进行目标识别实验研究。实验结果表明,本文所提出的方法对空间红外点目标识别率较时延神经网络方法约高4%,有较好的抗噪性能,在空间红外点目标识别领域中也有较好的应用前景。
1 自适应时延神经网络识别方法
1.1 ATNN网络模型及识别算法
自适应时延神经网络(ATNN)是由多层前馈感知器引入自适应时间延迟器扩展而来的。图1为一个┤层自适应时延神经网络的结构图,网络中相邻两层节点之间的连接为并行延迟单元组成的自适应时间延迟器。图2为网络的第l-1层的节点i与第l层的节点j之间的自适应时间延迟器结构,节点i与节点j之间有n个连接,每个连接k都有独立的时间延迟
对于三层ATNN网络,假设输出层第j个节点在tn时刻的期望输出为dj(tn),则网络在
以上权值和时延推导过程参考了文献[10]的推导过程。
1.2 ATNN网络目标识别训练过程
基于ATNN网络模型以及对神经网络权值和时延的修正过程,进一步提出基于ATNN的红外点目标识别训练方法。在训练过程中,为避免误差发生大幅度的振荡,采用批处理的训练方法,即当训练集中的所有样本训练完成一次后,只对网络的权值做一次更新。训练流程如图3所示,训练步骤如下:
(1) 从每类目标中选取一定数目的特征序列构成训练集T,设特征序列的长度为S;
(2) 构建三层自适应时延神经网络,设定网络的收敛误差为E
(3) 初始化的ATNN网络权值和时延;
(4) 置s=0,总误差E=0,权值变化Δωjik,l-1=0,时延变化Δτjik,l-1=0;
(5) 令s=s+1,根据式(1)~式(3)计算当输入┑s个序列特征时隐含层和输出层的输出;
(6) 计算并累加误差E=E+es,根据式(4)~┦(12)计算并累加第s步权值和时延的变化量,
(7)若s
(8)若E
2 目标识别实验研究
2.1 参数选择方案
ATNN网络识别方法需要确定网络结构,包括输入/输出神经元数、隐含层层数及隐含层神经元数的设计和各层神经元激活函数的选择。理论上单隐含层网络可以实现对任何不相交凸类域模式的正确分类,含┝礁霆隐含层的神经网络可以实现对不相交的任意形状类域模式进行正确分类。综合考虑识别效果和网络复杂程度,在此采用单隐含层ATNN网络;输入层神经元数目由样本数据特征维数决定;输出层神经元数等于样本的类别数。某类样本对应的期望输出编码为:对应的样本类别的输出为1 ,其他输出均为0。隐含层和输出层的激活函数则采用Sigmoid 函数,即:
2.2 实验结果与分析
实验采用空间某观测点观测四类目标在大气层外飞行过程中红外辐射强度序列的仿真数据,时间长度为1 000 s,探测波段为3~8 μm和8~16 μm,采样频率为10 Hz。在同等条件下仿真四次,其中训练样本集为┑谝华次仿真结果,测试样本集为另外三次仿真结果。
由于太阳、观测点的位置以及噪声等的存在,给目标特征的提取带来了很大困难。本文在分析红外辐射数据的基础上采用文献[11]中所提出的特征提取方法,采用波段比值作为神经网络的输入。由于同一观测点,可视为各类目标的外在条件基本相同,因而通过比值就可以消除太阳辐射及探测距离等外部因素的影响。┟扛霆目标的特征选择如下:
式中:IM(t)表示目标在中波波段的红外辐射强度;IL(t)表示目标在长波波段的红外辐射强度;F1(t)是反映目标红外辐射度比序列;F2(t)和F3(t)是目标在┝礁霆波段上经过归一化处理的辐射度序列。由于有4类目标,每类目标的特征数目为3,所以网络的输入层节点数为3,输出层节点数为4。实验采用TDNN网络和ATNN网络在同等条件下对目标进行识别。网络为┤层,节点数分别为3,10,4;网络延时器的基本时延为1 s,输入层节点到隐含层节点之间的连接数为8,隐含层节点到输出层节点之间的连接数为6,ATNN网络的延时器初始化时延与TDNN网络延时器的时延相同;程序总迭代次数设为1 000;学习步长取为Е仟1=0.5/(1+k),η2=0.3/(1+k)。其中,k为当前已经迭代的次数。识别结果如表1所示。
表1列出在信噪比为30 dB,20 dB及10 dB条件下两种网络对测试样本集的识别结果。结果表明,ATNN网络对各目标的识别率都要高于TDNN网络,而且在10 dB的信噪比条件下,ATNN网络仍具有良好的识别效果,说明ATNN网络具有良好的抗噪性。
3 结 语
基于红外辐射信息对空间点目标进行识别是国内外关注的热点课题之一。在此研究了用于空间目标序列识别的自适应时延神经网络模型及其学习算法,并对算法中权值和时延的变化进行了推导。以目标红外辐射强度比值作为特征,应用ATNN网络并利用探测器对空间目标红外辐射仿真数据,进行了目标识别实验研究。实验结果表明,利用自适应时延神经网络对空间红外点目标的正确识别率高,有较好的抗噪性能,因此,在空间红外点目标识别领域中有良好的应用前景。
参 考 文 献
[1]武春风,张伟,李洁,等.基于时空信息的红外成像系统在探测识别目标时所面临的问题及分析[J].光学技术,2005,31(2):231[CD*2]234.
[2]丰松江,聂万胜.中段弹道导弹和背景红外辐射研究概况[J].红外,2006,27(11):19[CD*2]22.
[3]舒锐,周彦平,陶坤宇,等.空间目标红外辐射特性研究[J].光学技术,2006,32(2):196[CD*2]199.[LL]
[4]肖怀铁,付强,庄钊文,等.宽带毫米波雷达目标时延神经网络识别新方法[J].红外与毫米波学报,2001,20(6):459[CD*2]463.
[5]刘志刚.红外成像点目标的检测与识别技术研究[D].长沙:国防科技大学,2005.
[6]Cheryl Resch.Exo[CD*2]atmospheric Discrimination of Thrust Termination Debris and Missile Segments[J].Johns Hopkins APL Technical Digest,1998,19(3):315[CD*2]321.
[7]Haykin S.神经网络原理[M].叶世伟,史忠植,译.北京:机械工业出版社,2004.[HJ*2]
[8]Lin D T.Trajectory Production with the Adaptive Time[CD*2]delay Neural Network[J].Neural network,1995,8(3):447[CD*2]461.
[9]Lin D T.The Adaptive Time[CD*2]Delay Neural Network:Cha[CD*2]racterization and Applications to Pattern Recognition,Prediction,and Signal Processing[D].University of Marvland at College Park,1994.[HJ*2/3][HJ]
[10]Xiao Huaitie,Zhuang Zhaowen,Chen Zhenpin.AircraftTarget Recognition using Adaptive Time[CD*2]delay Neural Network[A].Aerorpace and Electronics Conference\[C\].1997,2:764[CD*2]768.[HJ*2/3][HJ]
[11]朱海峰,韩建涛,姜卫东,等.基于多光谱的空间点目标特征提取与识别[J].光电子技术,2005,25(1):16[CD*2]20.[HJ*2/3][HJ]
[12]陈景文.自动识别技术及其在军事领域中的应用\[J\].现代电子技术,2006,29(19):30[CD*2]31,39.
[13]赵士文,卢珞先,王昱.一种快速目标检测跟踪方法研究与实现\[J\].现代电子技术,2007,30(22):55[CD*2]57,60.
作者简介 吕江北 男,1985年出生,河北石家庄人,硕士研究生。主要从事自动目标识别技术研究。
篇3
关键词 BP神经网络;遗传算法;教学质量评价
中图分类号TP18,G420 文献标识码A 文章编号 1674-6708(2010)26-0184-01
1 基于遗传算法的神经网络训练方法
1.1 GA-BP算法的概述
遗传算法[1]从一组随机产生的初始解(称为群体)开始搜索过程,群体中的每个个体是问题的一个解,称为染色体,这些染色体在后续迭代中不断进化,称为遗传。遗传主要是通过选择、交叉、变异、运算生成下一代群体,就这样经过若干代进化之后,算法收敛于最好的染色体,即为问题的最优解。那么可以将遗传算法引入BP神经网络的训练,对权值的初始值进行全局优化,这样可避免 BP神经网络陷入局部极小值,并提高其收敛速度[2,3]。
1.2 用遗传算法学习和对神经网络权值的优化
为了方便理解,我们以基础的三层BP神经网络来进行说明。取WIHij为输入层中第i个结点与隐含层第j个结点的连接权值;WHOji为隐含层中第j个结点与输出层第i个结点的连接权值[4]。遗传算法学习BP网络的步骤如下:
1)初始化种群P,包括交叉规模、交叉概率pc、突变概率pm等,初始种群取60;
2)计算每一个个体评价函数,并按权值将其排序。
3)以概率pc对个体Gi和Gi+1交叉操作产生新个体和无交叉操作的个体进行直接复制;
4)利用概率pm突变产生Gj的新个体;
5)将新个体插入到种群P中,并计算新个体的评价函数;
6)如果找到了满意的个体,则结束,否则转3)。
最后,将群体中的最优个体解码即可得到优化后的网络连接权系数。接下来则与神经网络的基本算法相同。
2 实例分析
算法效果测试
根据《正方教学管理系统教学质量评价指标》以及[5]中建立的评价指标体系,我们选取10个二级指标作为输入神经元,取输入层的个数为10。而我们将教学质量评价的等级分为3类:当输出为:{0,0,1}时为“优秀”;当输入为{0,1,0}时为“良好”;当输入为{0,1,1}时为“良好”[6]。隐含层神经元的个数6较为适宜。
用matlab进行编程[2,7],经过大约350代的搜索后其平均适应度趋于稳定,图1为期网络训练误差变化曲线,经过改进的神经网络经过9步迭代即可达到精度的要求,较之于基本的BP神经网络都有较大的改进和提高。
回想结果TT为:
该结果基本接近实际的评价情况,其对应的教师的评价为良好、优秀、优秀、一般、一般,可见其评价是比较准确的。
从数据的结果上看,用GA训练的BP神经网络的权值可以得到满意的结果,但因为改进后的算法会对大量的数据进行编码、解码、交叉、变异等相关遗传操作,所以,时间比普通BP算法的运行时间要长。
3 结论
将全局优化算法GA引入BP 网络训练的权值初始确定,充分发挥了遗传算法的全局寻优能力和 BP 算法的局部搜索优势,形成了一种新的GA-BP算法。该算法能较好的避免BP算法陷入局部最小点、收敛速度慢的问题,是一种快速、可靠的方法。根据该算法建立了有效的教学质量评价模型,检验的结果表明该算法减少了误差,完全可以满足实际应用的要求。
参考文献
[1]史忠植.人工智能[M].北京:国防工业出版社,2007.
[2]田雨波.混合神经网络技术[M].北京:科学出版社,2009.
[3]卢宏,吴翠琴.BP神经网络的遗传优化及其应用研究[J]. 江西理工大学学报,2009,30(5):51-54.
[4]原清,贺新锋,刘湘崇.遗传算法和神经网络在导弹测试 设备故障诊断中的应用研究[J].测试技术学报,2002,16(21):702-706.
[5]彭志捌.模糊综合评判在教学质量评价中的应用[J].高等 建筑教育学报,2008,17(6):20-23.
篇4
关键词:心理学;效度;一般能力倾向成套测验(GATB);人工神经网络(ANN)模型;大学生
一、问题提出
一般能力倾向成套测验(General Aptitude Test Battery,GATB)是美国劳工部就业保险局历时50年,耗资数亿美元,研究了美国上万种职业后编制而成的著名测验。这套测验应用较广,已被大量研究证明具有良好的信效度,能够很好地预测职业成功和学术成就。GATB是适用于初三以上年级的中学生及成年人的团体测验,包含15种分测验(11种纸笔测验,4种操作测验),可在120~130分钟内测量9种与职业关系密切并有代表性的能力因素。这9种能力倾向因素为:一般智力、言语能力、数理能力、空间关系理解力、形状知觉能力、文书知觉能力、动作协调能力、手指灵活性及手部灵巧性。Hammond1984年对GATB的结构进行因素分析发现,GATB测量的其实是4种更普遍、更高层次的能力:言语能力、数理能力、工具组合能力和空间能力[1]。GATB在国外应用广泛,是升学、就业指导以及人员选择与安置的重要工具。而Droege等研究发现:GATB的一般智力、言语能力、数理能力和书写知觉测验可以作为预测学业成绩的良好工具[2]。R.L.Thorndike和E.P.Hagen报告,用GATB预测工程学校学生的专业成绩的R2最低0.46,最高0.58[3]。
个体在大学期间的专业学习将奠定他们一生职业生涯的基础。在美国,大学生入学之初,要进行一项学术能力测验(SAT),通过这种学术能力测验,可以预测大学生在大学期间的专业学习成绩。也有研究者应用一般能力倾向成套测验(GATB)来预测大学生的专业成绩。在预测方法方面,以前的研究大都是运用传统的多元回归算法。如果应用神经网络模型新技术,效度是否会有提高呢?这值得我们来探索一番。
人工神经网络(Artificial Neural Network, ANN)是近年来发展起来的一门新兴学科、新技术。它应用了一种信息处理系统或计算机模仿大脑的结构和功能,可称之为人脑处理信息方式的简化模型[4]。ANN今天已经成为世界关注的热点,引起各国政府与军界的高度重视。
目前人工神经网络(ANN)的算法基本成熟。人工神经网络包括三部分:输入层(input layer),隐藏层(hidden layer),输出层(output layer)。输入的数据显示在第一层,其值从每个神经元传播到下一层的每个神经元,最终从输出层输出结果。ANN是功能强大的函数估计器,只需基本的统计或数学知识就能够进行训练,并加以应用[4]。特别值得注意的是,它是一种非线性系统,具有一个隐藏层的神经网络算法,可以拟合输入和输出之间的任意非线性关系,而不要求资料满足正态分布或其他特殊分布,可以自由估计模型(即非参数模型)。因此,神经网络具有很强的综合能力,输入和输出间的联系可由训练习得,再运用于计算中[5]。
BP(back propagation)神经网络是ANN的一种,由James McClelland和David Rumelhart在1986年提出[6]。它是一种典型的前馈神经网络,其权重的调整采用反向传播的学习算法,神经元的变换函数是S型函数,输出量是0~1之间的连续量,可以实现从输入到输出的任意非线性映射[7]。通过对网络参数的选取,在确定了网络层数、隐含层神经元数、初始权重、学习速率、期望误差及最大步长后,构建神经网络模型。确定网络的结构后,利用输入输出样本进行训练,也就是对网络进行调整,多次反复,直到样本收敛,使网络实现给定的输入输出映射关系,从而获知最重要的影响因素。
从ANN诞生之日起,它与心理学就有着千丝万缕的联系。神经网络的灵感来自于神经元的信息处理功能,神经网络的训练则可以反映感觉、记忆、学习等认知过程[8]。ANN已被研究者广泛应用于视知觉识别[9]、技能培养[10]、语言发展[11]等认知领域。研究者发现,ANN对于内隐记忆、内隐学习等无意识认知过程有着极强的适应性[12,13],对神经网络来说,外界环境的每一次输入都可能会引起网络结构的重新调整(权重变化),从而改变该网络下一次的加工模式。
社会认知与ANN有着类似的信息加工过程。社会认知过程中,人们会按照某种规则对所经验的事件进行组织,从而影响他们在类似环境下对待相似对象的印象与态度。因此,许多研究者针对印象形成[14]、归因[15]、认知矛盾[16]、群体印象[17]等建立了各具特色的神经网络模型。
由于ANN的模仿对象是人脑神经系统的处理方式,因此,它在功能上也具有某些智能的特点。神经网络主要有以下几个基本功能:非线性映射、分类识别、知识处理。目前,神经网络已经广泛应用于信息领域、自动化领域、工程领域、医学领域、经济学领域等各知识领域中,其智能化的特征解决了许多传统信息处理方法无法解决的问题[18]。目前,学术界已经普遍认同,人工神经网络方法是一种有效的研究工具,能够代替传统的回归分析方法,并可以在不同的领域进行广泛应用。然而,心理测量学领域内运用人工神经网络方法的研究还相当少见。
本研究将使用神经网络算法,取代传统的回归分析,尝试检验一般能力倾向成套测验预测不同学科大学生的专业成绩的效度。
二、研究方法与研究过程
1.研究工具
以戴忠恒等修订的一般能力倾向成套测验(GATB)为研究工具,该测验共包括15种分测验,其中11种为笔试,分别为: 圆内打点测验、记号记入测验、形状相配测验、名称比较测验、图案相配测验、平面图判断测验、计算测验、词义测验、立体图判断测验、句子完成测验、算术应用测验;4种为器具测验:插入测验、转动测验、组装测验、拆卸测验。
本研究采用团体施测方式,每次施测有2名以上熟悉本测验所有项目的主试,最多对38名被试同时施测。首先由主试朗读指导语,在所有被试明白测验的要求和具体做法后开始测验。因11项纸笔分测验均为速度测验,所以由主试使用秒表准确计时。
2.研究对象
在江苏、安徽、上海等省市的7所院校对在校大学生进行团体施测。共施测1022人。其中男生521人(51.0%),女生501人(49.0%);“211工程”院校569人(55.7%),普通本科院校453人(44.3%);大一464人(45.4%),大二104人(10.2%),大三321人(31.4%),大四133人(13.0%);文科446人(43.7%),理科221人(21.6%),工科355人(34.7%)。
3.数据收集
随机选取其中652名大学生,对他们期末考试中的专业课成绩求出平均分并以班级为单位进行标准化,以此标准分作为衡量其专业成绩的标准。在652名大学生中,文科专业268人,占41.1%;理科专业218人,占33.4%;工科专业166人,占25.5%;年龄17~24岁,平均20±1岁;男生320人,占46.3%,女生371人,占53.7%。
三、构建神经网络模型
使用专业软件Clementine12.0构建神经网络模型。首先对样本数据进行归一化处理,以便更好地对数据关系进行映射,从而使其参数都落在(0,1)之间。归一化选用以下公式:
P=(p-pmin)/(pmax-pmin)
公式中,pmin,pmax分别表示归一化之前的最小值和最大值,P为归一化值,p为归一化之前的值。经过归一化转换的结果在本研究中以P表示,例如P专业课均分。
经过归一化处理后,开始正式建模。在Clementine中应用神经网络进行能力倾向对专业成绩预测的过程如下:首先选择数据源,将GATB的7项能力倾向数据选为输入变量,将标记专业课均分项选为输出变量。然后在字段选项中选择其中的分区节点,设置训练、测试、验证区域样本比例,这是构建神经网络模型所需要的一个设置。总体挖掘过程如图1 所示。
图1 数据挖掘过程
接着在模型里选择神经网络模型的训练方法。Clementine提供了快速、动态、多重、修剪、RBFN和穷举型修剪六种用于构建神经网络模型的训练方法(Silverston,数据模型资源手册)。选择快速的训练方法,即使用数据的简明规则和特征来选择适合的网络形状(拓扑)。
此后在模型中设置预防过度训练,将数据随机分割为训练集合和检验集合两部分,设置70%的样本为训练集合,并将随机种子设置为18。特定的随机种子通常会生成相同的随机值序列,产生相同的生成模型,从而使结果模型具有精确的可再现性。本研究中的预防过度训练与随机种子设置见图2。
图2 模型设置结果
四、结果分析
1.文科大学生一般能力倾向对专业成绩的预测模型
本模型显示出模型在生成前的选项和生成后的统计情况。结果显示模型对建模数据估计的准确率达90.247%,其中输入层有7个神经元,隐藏层有1∶3个神经元,输出层有1个神经元。
对各输入点的敏感度进行分析显示,各输入字段的相对重要性参数,按重要性排序为言语能力、一般智力、形状知觉、运动协调、数理能力、书写知觉、空间判断能力,其敏感性系数依次为0.523、0.191、0.09、0.053、0.05、0.047、0.045。
将Neural Net结果结点连接在数据流中的分区结点后,向数据流中增加分析节点,模型分析结果见图3,由图可知,文科学生一般能力倾向对专业成绩模型的平均预测误差在-0.004到0.036之间,绝对平均误差在0.103到0.105之间,该模型的预测误差在可以接受的范围之内。
图3 文科大学生一般能力倾向对专业成绩的预测模型分析结果
再向数据流中增加导出结点。将导出结点连接到Neural Net结果结点。设置该结点属性,将增添的字段的值设置为【abs(P专业课均分 - '$N- P专业课均分') / P专业课均分】 * 100,其中$N- P专业课均分是由神经网络生成的预测结果,如图4所示。该图形的横坐标为导出值,纵坐标表示一共有多少个样本的导出值落在相对应的横坐标上。由导出的定义公式可知,导出值越小,则表明预测值与实际值的差别越小。由输出图形可以看出,该模型已达到一定的精度。
图4 文科大学生一般能力倾向对专业成绩的预测模型精度直方图
2.理科大学生能力倾向对专业成绩的预测模型
理科大学生一般能力倾向对专业成绩预测模型显示模型对建模数据估计的准确率达90.979%,输入层、隐藏层、输出层的神经元个数与文科大学生模型的数量相同,分别为7个、1∶3个、1个。
理科大学生一般能力倾向对专业成绩预测的各输入点的敏感度分析显示:按重要性排序为数理能力、一般智力、空间判断能力、书写知觉、言语能力、形状知觉、运动协调,其敏感性系数依次为0.471、0.233、0.132、0.073、0.046、0.042、0.003。
图5 理科大学生一般能力倾向对专业成绩的预测模型分析结果
模型分析结果见图5,由图可知,理科学生一般能力倾向对专业成绩模型的平均预测误差在-0.022到0.006之间,绝对平均误差在0.091到0.097之间,结合图6可知,模型达到了一定的精度。
图6 理科大学生一般能力倾向对专业成绩的预测模型精度直方图
3.工科大学生能力倾向对专业成绩的预测模型
工科大学生一般能力倾向对专业成绩的预测模型显示模型对建模数据估计的准确率达90.381%,输入层、隐藏层、输出层的神经元个数与之前相同,分别为7个、1∶3个、1个。
工科大学生一般能力倾向对专业成绩预测的各输入点的敏感度分析结果显示:按重要性排序为空间判断能力、一般智力、言语能力、书写知觉、形状知觉、数理能力、运动协调,其敏感性系数依次为0.594、0.202、0.084、0.048、0.035、0.029、0.008。
模型分析结果(见图7)显示,工科学生一般能力倾向对专业成绩模型的平均预测误差在-0.044到0.008之间,绝对平均误差在0.106到0.115之间。模型精度直方图(见图8)显示,由图可知,导出值集中在一个很小的范围之内,模型达到了一定的精度。
图8 工科大学生一般能力倾向对专业成绩的预测模型精度直方图
五、讨论
神经网络具有的非线性映射、自适应学习、并行性、知识分布存储、逼近任意复杂连续函数等信息处理能力,克服了传统预测方法对于数据处理方面的缺陷,使神经网络能够在心理测量领域发挥重要作用。值得注意的是,回归分析要求数据正态分布、线性,以及连续变量这些比较严苛的条件,在神经网络模型中却不需要这些前提条件。也就是说,神经网络的算法具有非线性的特点。这可以大大弥补传统统计方法的线性模型的局限。
本研究以人工神经网络建模为统计手段,分别建立文、理、工三类大学生一般能力倾向对其专业成绩的预测模型,由建网信息和模型分析结果可知,三个模型对建模数据估计的准确率均达到90%以上,预测的平均预测误差在0.091到0.115之间,三个模型均达到了一定的精度。
首先, GATB的7项能力倾向对文科专业成绩的影响按重要性排序依次为言语能力、一般智力、形状知觉、运动协调、数理能力、书写知觉、空间判断能力,这一结果也可与文科专业大学生优势能力倾向互为佐证。言语能力的敏感性系数达到0.523,是影响文科专业成绩表现的关键能力,这一结果也符合我们研究前的假设和实际情况。文科类专业的学生通常对文字、语言更有兴趣,拥有较好的文字功底,将来所从事的职业多以文字工作为主,专业课程的设置与考核也是以此职业方向为导向,因而言语能力上得分突出的学生更有可能在文科专业的课程学习中达到优秀水平。
其次,对理科大学生而言,数理能力、一般智力和空间判断能力对其专业成绩预测的敏感性系数分别为0.471、0.233和0.132。数理能力是利用算术知识解决实际问题的能力,一般智力则是需要根据原理进行推理和判断的能力,而空间判断能力是要求在心理空间进行图形转换进而进行推理、判断的能力,这三类能力对学生的逻辑思维能力有较高要求,理科类专业侧重于理论研究和科学培养,尤需学生的理性思维、逻辑思维能力,因此,数理能力、一般智力和空间判断能力是理科学习关键之所在,理科专业要求报考者在这些能力上的发展达到一定的水平,而在这些能力倾向上得分较低的被试可能需要付出相当的努力才能够胜任理科专业的学习。
最后,工科类专业学生的专业成绩7项能力倾向按重要性排序依次为:空间判断能力、一般智力、言语能力、书写知觉、形状知觉、数理能力、运动协调。另外,空间判断能力也是工科类大学生的优势能力倾向,以往相关研究也表明,空间想象和空间思维能力对于工科学习是不可或缺的[19],尤其是机械制图等相关专业。工科专业侧重技术应用,学生动手能力较强,心理空间的运动能力依赖于实际动手能力的发展,动手能力的锻炼也会促进其空间想象能力的发展。值得注意的是,空间判断能力对于工科学生专业成绩的预测敏感性系数达到了0.594的水平――该项能力对工科学习十分重要,若发展良好,更可能在工科学习中脱颖而出。
纵观三类专业大学生一般能力倾向对其专业成绩的预测情况,不难发现,一般智力对于任何一类专业来说都是基础性的能力倾向。国外相关研究结果也发现,人们的智力和知识只要达到一定的水平,人们智力的高低差异对于工作效率不再有明显的影响,然而与专业紧密相关的能力倾向与工作效率之间始终有显著的正相关。本研究的结论在一定程度上验证了这一观点:对于不同的专业方向来说,每种专业类型都各有其关键的能力倾向。该专业的潜在报考者能否胜任该专业的学习和考核,关键能力倾向是至关重要之因素。
总而言之,人工神经网络模型对三类专业的专业成绩预测都具有较高的准确性,说明本研究整体的技术路线可行,GATB所测得的7项能力倾向的不同组合可以用来预测不同专业学生的专业成绩。通过人工神经网络模型,中学生可以根据自己在GATB的7项能力倾向上的得分情况预测自己报考三类专业的成绩水平,从而判断自己适合报考的专业方向。如能早日实现推广,将是教育界及广大学子喜闻乐见之事。
项目基金:全国教育规划课题(DIA080131)
[1] Hammod, M.. An investigation into the factor structure of the General Aptitude Test Battery[J]. Journal of Occupational Psychology,1984,57(1):4348.
[2] Droege, R. C.. GATB aptitude intercorrelations of ninth and twelfth garders: A study in organization of mental abilities[J]. Personnel & Guidance Journal, 1968,46(7):668672.
[3] 桑代克, R.L.,哈根, E.P.. 心理与教育的测量与评价[M]. 叶佩华,等,译. 北京:人民教育出版社,1985.
[4] 林耀斌,杜友福.基于Clementine神经网络的商品促销效果预测模型应用[J].电脑知识与技术,2009,5(34):90-92.
[5] 张菊英,韦健,杨树勤.神经网络模型在住院费用影响因素分析中的应用[J].中华医院管理杂志,2002,18(3):143-145.
[6] 严武.基于BP算法的住院天数神经网络模型建模研究[J].中国病案, 2009,10(11): 38-40.
[7] 易东,王文昌.回归分析的人工神经网络算法模型研究[J].中国卫生统计,1998,15(5).
[8] 郭秀艳,朱磊,魏知超.内隐学习的人工神经网络模型[J].心理科学进展,2006,14(6):837-843.
[9] Martin, G. L.. Encoder: A connectionist models of how learning to visually encode fixated text images reading fluency[J]. Psychological Review, 2004,111(3):617639.
[10] Berthier, N.E., Rosenstein, M. T., & Barto, A.G..Approximate optimal control as a model for motor learning[J]. Psychological Review, 2005,69(2):329346.
[11] Seidenberg, M. S..Connectionist models of word reading[J]. Current Directions in Psychological Science, 2005,14(5):12381242.
[12] 郭秀艳,邹玉梅,李强,孙怡.中学生颜色内隐学习特征的实验研究[J].心理与行为研究, 2003,1(2):122-127.
[13] 郭秀艳,朱磊.神经网络模型对内隐学习的探索[J].心理科学,2006,29(2):410-415.
[14] Kashima,Y., Kerekes, & Andrew. R.Z.. A distributed memory model of averaging phenomena in person impression formation[J]. Journal of Experimental Social Psychology, 1994,30(5):407-455.
[15] Read, S. J., & Montoya, J. A.. An auto associative model of causal reasoning and causal learning: Reply to Van Overwalle’s critique of Read and Marcus-Newhall[J]. Journal of Personality and Social Psychology,1996, 76(5):728742.
[16] Shultz, T., & Lepper,M.. Cognitive dissonance reduction as constraint satisfaction[J]. Psychological Review,1996, 103(2): 219240.
[17] Gureckis, T.M., Love, B.C.. Common mechanisms in infant andcategory learning[J]. Infancy, 2004,5(2):173198.
篇5
关键词:小波分析;神经网络;故障定位;配电网
作者简介:李晓东(1975-),男,宁夏吴忠人,宁夏电力公司吴忠供电局,助理工程师。(宁夏 吴忠 751100)
中图分类号:TM726 文献标识码:A 文章编号:1007-0079(2013)26-0201-03
配电网直接联系用户,其可靠供电能力和供电质量既是电力企业经济效益的直接体现,又对应着不可估量的社会效益。配电网故障自动定位作为配电自动化的一个重要内容,对提高供电可靠性有很大影响,也得到了越来越多的重视。本文在分析研究小波神经网络特征的基础上利用小波的时频分析能力与神经网络的非线性拟合能力来建立故障特征与故障点的映射,确定故障点的位置。
一、配电网的故障特点
配电网络拓扑结构复杂,节点众多且分布广泛。负荷沿配电线路分布不均匀,而且负荷性质也有很大差异,因此配网故障定位是一项十分艰巨的任务。配电网发生故障的几率远大于输电网,因为配电网的设备为分散分布,采集信号相对困难,而且信号传输的距离越远越容易发生畸变。配电网直接面向广大的用户,最易受到用户端多种多样不确定因素的影响,所以配电网的故障频率及操作频率都较高,运行方式和对应的网络拓扑经常发生变化。[1]同时,配电网具有闭环设计开环运行的特点,有时会出现短暂的闭环运行,给故障定位带来困难。
二、神经网络在配网故障诊断中的应用原理
人工神经网络(ANN)是一种连接机制模型,它是由大量人工神经元广泛互联而成的网络,是在微观结构上模拟人的认识能力,其知识处理所模拟的是人的经验思维机制,决策时它依据的是经验,而不是一组规划,特别是在缺乏清楚表达规则或精确数据时神经网络可产生合理的输出结果。ANN的最大特点是依靠并行调节人工神经元之间的连接权值来隐含地处理问题,具有很强的自适应和自学习能力、非线性映射能力、鲁棒性和容错能力。
应用神经网络进行电力系统报警处理和故障定位能在保护装置误动、数据丢失以及出现其他未考虑的报警类型时也能给出较精确的定位结果。[2,3]还可以结合小波分析比较精确地定位出故障位置进行隔离。
由于神经网络自身具有很多的优点,应用现代数学工具通过准确地提取故障电气量特征信息作为神经网络的输入进行训练来提高神经网络的定位性能将是一个很好的发展方向。
基于神经网络的诊断系统结构图如图1所示。
三、小波变换
小波变换是继Fourier变换之后又一有效的时频分析方法,可以在一个时间和频域的局域变换所以能有效地从信号中提取信息,可以对信号进行多尺度的细化分析。
小电流接地系统发生单相接地故障时,暂态接地电容电流幅值经常大于稳态时的几倍到几十倍,补偿的电感电流也会增大。[4]这种情况下小波变换可以将暂态信号映射到由小波伸缩而成的一组基函数上。该函数具有很好地频带分割性,再根据小电流接地系统发生故障时零序电流分量的特点,即故障线路上的电流幅值比非故障线路幅值大得多且极性相反这一特征来进行故障点的定位。
四、小波神经网络
1.小波神经网络的拓扑结构
小波函数作为神经网络的激励函数与普通神经网络的激励函数在本质上是一致的,但是小波神经网络只要尺度、位移以及权重的初始值设置得当,其函数逼近的效果更优于简单的神经网络。
在文献[5]中对小电流接地系统单相接地故障暂态信号用prony方法进行分析时,已证实故障点位置不同时对应的故障暂态信号的特征分量也不同,它们之间存在着特定的对应关系。根据这个原理就可以利用小波分析来获得故障暂态信号定时频窗特征,将它映射到距离平面上实现故障定位。
小波神经网络的结构如图2所示,共有四层,分别为输入层、小波变换层、隐含层、输出层。小波变换层选取的神经元激励函数为Morlet小波:
则在函数空间L2(R)中,一个信号f(t)的小波变换:
对网络的输出并不仅仅是简单的加权求和,而是先对网络隐含层小波节点的输出值进行加权求和,再通过Sigmoid函数变换,最终得到的网络输出,有利于处理分类问题,[6,7]同时降低训练过程中发散的可能性。
小电流单相接地故障检测系统的小波神经网络模型如图2所示,输入层的每一节点对应故障暂态时序序列,输出包含的单个神经元,其值反映的是故障点的位置。
2.小波神经网络的学习算法
进行训练时需要在权值和阈值的修正算法中加入动量项,利用前一步得到的修正值来平滑学习路径,防止陷入局部极小值,加速学习速度。[8]当逐个对样本进行训练时会引起权值与阈值修正时发生振荡,为避免这种情况的发生可以采用成批训练方法。
在式(1)中,当a>0时,信号f(t)可离散化fN(i),式(1)变为:
式子中,N为电流序列点总和,为信号的时间窗宽度。
前向运算:输入采样时间序列,小波变换层的输出为:
按照上式的算法,分别计算出小波变换层的输出量,其中j为小波变换层的总节点数。
隐层的输入矢量,其中K表示隐层节点个数。;隐含层输出矢量:;故障距离输出。
给定P(P=1,2,3……p)组输入输出样本,学习率为,动量因子是目标误差函数为:
式中:——输出层第n个节点的期望输出;——网络实际输出。
算法要实现的目标就是不断调整网络的各项参数,使最终的误差函数获得最小值。
隐含层与输出层之间的权值调整式:
输入层与隐层结点之间的权值调整式:
伸缩因子调整式:
平移因子调整式:
五、小波与神经网络在配网故障诊断中的应用
1.系统整体设计
本文采用EMTP/ATP软件进行仿真。设计系统为中性点不接地系统,母线电压等级为35kV,仿真时间是0.1S,故障发生时间是0.05S,采样频率是4000Hz,可充分满足暂态电容电流自由振动频率的要求;线路参数:正序阻抗;正序容纳;零序阻抗;零序容纳。图3为小电流接地系统。
变化故障点位置和接地电阻形成的学习故障模式集为:在配电网全程线路上选择故障点,是距离变化的步长,;故障过渡电阻。
2.故障定位效果分析
为了较好地检测训练后神经网络的真实定位效果,需要选取网络的非学习样本来检验。选取故障点故障过渡电阻。进行组合20×2=40个测试故障模式,按照与形成学习样本相同的预处理方法形成输入矢量集合,经过网络的前向运算得到故障的定位结果。
接地电阻时,故障定位结果,如表1所示。
接地电阻时,故障定位结果,如表2所示。
由表1和表2可得,经过训练后的小波神经网络可以很好地拟合输入矢量和故障点的位置对应关系。对于神经网络测试的样本,该误差基本在1%以下,具有较满意的定位结果。此故障定位方案之所以精确是因为两方面的原因:一是小电流接地系统通常情况下是直接面向用户的,为单电源系统,虽然具有复杂多变的运行方式,但大多数运行参数可知,该方案在一定程度上降低了运行参数的模糊性;二是小波神经网络在故障之后暂态高频信息的提取与应用是定位原理的关键所在。因此,经过训练后的小波神经网络故障定位精确可靠。
六、结论
本文利用小波神经网络的特点解决配电网故障定位中的问题,小波神经网络具备小波与神经网络共同的特点,既具有对非平稳随机信号所具有的优越的时频局部特性又具有非线性拟合能力,具有充分的理论依据。在对所建立的小电流接地系统进行仿真的结果分析可知,该定位方案精确度较高、方便可靠。
参考文献:
[1]郭三中.基于小波神经网络的配电网故障定位研究J].电力系统自动化,2010,(12):27-30.
[2]季涛,孙同景,薛永端.配电网故障定位技术现状与展望[J].继电器,2005,33(24):32-37.
[3]张振飞,夏利民.基于神经网络的滚动轴承故障诊断智能方法[J].信息技术,2008,(8):35-55.
[4]李振然.基于小波变换与BP神经网络相结合的配电网单相接地故障定位方法[J].继电器,2004,32(9):24-26.
[5]郜洪亮,杨学昌.一种配电线路单相接地故障测距算法[J].清华大学学报(自然科学版),1999,39(9):33-36.
[6]李玉,潘亚平,魏海平.小波神经网络及其研究进展[J].科技信息,2006,(9):24-25.
篇6
BP神经网络基于误差反向传播算法的多层前向神经网络。其中BP网络是目前应用最为广泛的神经网络模型之一。网络隐节点过多会导致算法存在过拟合现象,影响了网络的泛化能力,使得网络最终失去实用价值。在满足精度的要求下,逼近函数的阶数越少越好,低阶逼近可以有效防止"过拟合"现象。在实际应用中,还没有成熟的方法确定网络的隐节点,隐节点的确定基本上依赖经验,主要式采用递增或递减的试探方法来确定网络隐节点[1]。
2 遗传算法
遗传算法是自然淘汰、遗传选择的生物进化过程的计算模型,它是基于自然遗传、选择变异等生物机制的全局概率搜索算法。其应用优势在于处理传统搜索方法难于解决的复杂和非线性问题,包含问题编码、初始化群。
3 基于遗传算法的神经网络训练方法(GA-BP)
遗传算法优化神经网络的思路:改变BP算法依赖梯度信息来调整网络权值的方法,利用遗传算法全局性搜索的特点,寻找最佳网络连接权和网络结构,遗传算法在进化过程中能以较大概率搜索到全局最优解存在的区域,在遗传算法搜索到最优解附近之后,再采用训练样本优选最好的网络连接权系数及网络结构。
遗传-神经网络模型:
GA-BP算法的步骤:
3.2遗传算法是以目标函数最大值为适应度函数,函数为:
3.3基本解空间编码 遗传算法优化网络结构需对隐含层编码。编码的码串由控制码和权重系数码组成。控制码控制隐节点个数,由0-1组成的串,其中0表示无连接,1表示有连接。权重系数用浮点数编码。按一定的顺序组成一个长串,每个串对应一组解。
3.4初始群体由P个个体组成,每个个体由两个部分组成,第1部分是串长为l1 的0-1串;第2部分是区间[umin-δ1,umax+δ2 上的l2个均匀分布随机数。
3.5由控制码得到网络的隐节点数,由权重系数码可以知道网络的连接权值,输入用于训练样本,按照式(2)计算个体适应度。
3.6保留群体中适应度最高的个体,不参与交叉和变异运算,直接将其复制到下一代。 对其它个体,按归一化适应度大小为概率进行选择,进行遗传操作。当某个神经元被变异运算删除时,相应的有关权重系数编码被置为0,而当变异运算增加某个神经元时,则随机初始化有关权重系数编码。以Pc的概率对选择后的个体的Wij神经元权值进行交叉算子如下:
3.7将新个体放到种群P中,没有交叉、变异操作的个体直接生成新一代群体。反复4~8,每次群体就进化一代,连续进化到K代。把最终个体解码得到相应解,ANN误差平方和不合要求εGA则转4,继续遗传操作,反复进行如果N次依然不能达到要求则训练失败。以GA遗传出的优化初值作为初始权值,BP算法继续训练网络,直到给定精度εBP(εBP<εGA)或迭代次数,最终个体解码即得到网络连接权及隐节点数。
4 遗传算法的神经网络对心电图的自动识别
心电图在诊断心血管疾病等临床医学领域得到了大量应用,近年来,基于心电图的稳定性和唯一性,易于采集,不能复制和仿造等优势,其在身份识别领域也具有广泛的应用前景。
将测量电极放置在心脏或人体表面的一定部位,用心电图机记录出来的心脏电变化的连续曲线,即为心电图。将立体的P、QRS、T环经过投影到额面、水平面和右侧面上,临床上用心向量图表示;此即空间心电向量环的第一次投影。将额面心向量环的每一点依次再投影到各肢体导联轴上,可记录出各肢体导联的心电图;横面心向量环在各胸导联轴上的投影,可描记出各胸导联的心电图。此即心向量环的第二次投影。
4.1波形数据预处理 ①首先对心电信号进行高频滤波处理。由于数据是通过FRANK导联七电极采集的,所以心电信号必然夹杂有电极的50Hz交流干扰、肌电干扰等。需要对心电信号进行50Hz高频滤波处理,以去除工频和肌电干扰,可以采用多点平均值法进行滤波;②其次需要对心电图作基线漂移处理。心电信号的漂移主要有放大器零点漂移和呼吸交流漂移。放大器零点漂移体现在基线偏离原点上下移动,交流漂移表面为基线倾斜。
4.2波形识别 由于心电向量图是由各面心电图的各波起止点间的所有点组成的,所以绘制向量图前必须先将心电图的各波的起止点确定下来,这就是波形识别。主要是对选择的典型波形,识别出P波、QRS波、T波等各波段的特征点即峰点、起止点等。
4.3 QRS波群识别 QRS波群识别方法目前主要有闭值法、轮廓限制法、面积法、数字滤波法和倾斜法,该系统采用闭值法。这种方法通过对正交三导联同时记录的X、Y、Z心电信号进行空间向量模的运算,计算其空间向量长度,以最大空间向量长度作为闭值K,以K作为识别QRS波的依据。然后在K值前后一定时间内(30~80ms),对各点心电向量模值进行测量。如果连续若干点的模值相同,K前相同模值的第一个起点作为X、Y、Z三导联公共起点和K后最远点作为公共终点。再根据公共起点、终点范围、检测X、Y、Z导联中的QRS波的峰点和谷点的时间和幅度。
4.4 T波检测 T波比QRS波小,识别方法与QRS波有所不同。T波的识别方法在识别QRS波群基础上,规定在K值后一定时间(100ms)左右,寻找空间向量的最大值做为T波阐值Ko.以Ko值做为识别T波的依据。T波检测也用面积增量法,可直接或间接检测出T波峰值,T波始、终点及宽度。S-T段上升与下降程度采用传统的J+X法判别标准,J+X法中的J点是S点之后的第一个拐点,ST段被确定在J+X ms的心电信号部分,X的典型值为80ms,一般认为X在20~120ms范围中。ST段水平根据基线可以计算出其绝对值,或可表示为相对于R波峰值的归一化值。
4.5 P波检测 P波的识别方法与T波类似,只是搜 寻区间和闻值规定不同。P波检测是房室传导阻滞,P-R间隔检测的主要参数。但其幅度过小,实时检测十分困难。因此目前采用的方法主要是面积增量法。
4.6心电图的识别 本文收集了房室传导阻滞、S-T段下降、S-T段抬高、T波低平、T波倒置、正常窦律、正常七类心电图。提取其诊断特征值,将其输入神经网络进行训练,识别正确率可达到96%[5-10]。
5 结束语
心电图的识别分析,是一项笼琐而又细致的工作。心电图自动诊断可以将医务人员从烦琐的图形识别中解脱出来,提高工作效率。本文采用遗传算法优化三层BP神经网络的连接权和网络结构克服BP神经网络的瓶颈,有效提高神经网络泛化性能,并将其应用于心电图自动识别,得到了较高的识别率。
篇7
关键词:BP神经网络;成本估算;武器装备
一、我国常用的军品成本估算方法
针对武器系统的成本估算,国内外常用的一般方法有四种:参数估算法、工程估算法、类推估算法和专家判断估算法。
1.参数估算法,又称经验公式法。这种方法实际上是使武器系统的费用与武器系统的特点或重要参数之间建立起费用估算关系。而这些费用变量都有一个数学值范围,并不只是一个值。它的函数形式就是成本估算关系式。简言之,它是利用类似系统的历史费用数据去推导新型武器系统的费用。
2.工程估算法,又可称之为单价法或直接法。它的主要做法是根据工作分解结构在对各个独立部分和系统零部件的料、工、费进行详细估算的基础上,再将各单项估算值综合为总的成本费用。所以,该方法有时又被称为“自下而上”的成本估算法。
3.类推估算法实际上是将拟议中的产品、装备、系统功能与以前的某个系统的可比部分或类似部分进行直接比较。这种方法既可用于直接与具有同样操作或工作特性的类似系统进行比较,也可将被估系统直接与具有许多相同费用特性的不同系统进行比较。
4.专家判断法类似于专家推测法。它要求估算者拥有关于系统或系统部件的综合知识。在经验数据不足或没有足够统计资料的情况下,往往需要用这种方法。
除以上常用的4种方法之外,目前讨论的比较多的方法还包括以下3种:
1.灰色系统方法。通过对主导因素建立GM(1,1)模型,对关联因素建立GM(1,N)模型,最后得到系统的状态方程模型,按状态模型对系统进行预测。通常采用GM(1,1)和GM(1,N)相结合的方式。大致步骤为:一是确定系统的主导因素和关联因素;二是建立GM模型群,对主导因素建立GM(1,1)模型,其余因素建立GM(1,N)模型,组成线性方程组;三是根据GM模型组得出状态方程矩阵求解状态方程。灰色系统能够适应样本数较少的情况。如孙本海(2002)在他的硕士论文中使用灰色系统理论中的残差模型和改进的G-N迭代法构建了炮兵武器装备费用的参数模型。郭继周等人(2004)用灰色系统理论进行费用预测的方法,建立了GM(1,1)模型及GM(1,1)预测模型。陈尚东等人(2008)针对地空导弹维修费用数据量有限规律性不同的特点,选用灰色理论进行维修保障费用预测:首先,简要分析了GM(1,1)模型,讨论了维修费用数据的处理;然后,以某新型地空导弹武器系统为例,具体探讨了灰色预测模型的应用,并对比分析了老信息灰色预测、新信息灰色预测和新陈代谢预测模型的精度。
2.模糊综合评价方法。模糊综合评价方法(FCE)是一种应用非常广泛和有效的模糊数学方法。它应用模糊数学的有关方法和理论,通过建立隶属度函数,考虑不可量化因素的影响,进行综合分析和评价。如郭建华等人(2004)利用模糊综合评价模型对武器装备项目的研制费用进行了估算。
3.人工神经网络(ArtificialNeuralNetwork,ANN)方法。目前采用较多的是BP(BackPropagation)神经网络预测模型法,具体步骤:一是选取学习样本,对权值进行初始化;二是训练学习样本;三是用测试样本进行数据仿真。可以证明,对于任何一个在闭区间内的连续函数都可以用带一个隐层的3层BP网络来逼近。如刘铭等人(2000)提出了一种基于BP神经网络的防空导弹采购费估算模型,并对典型的防空导弹采购费进行了估算。刘国利等人(2003)根据导弹武器系统研制的特点,分析并确定了影响导弹武器系统研制费用的主要因素,提出了基于人工神经网络的费用预测模型。
军品的费用估算是一项持续性的工作,贯穿于军品研制的全过程,随着研制工作的进展,采用的估算方法应越来越详细、精确。以上介绍的7种方法各有各的特点,在不同的条件下都具有特定的使用价值,具体对比情况见表1。
二、ANN方法和BP网络的优点
神经网络的建模能力也是由参数决定的,但它有别于回归分析方法,它只限制所包含多项式的整体个数,不限制它们的阶数,即在参数一定的情况下,可以通过学习(即各分量的竞争)来合理选择任意阶数的项。这体现了神经网络的非线性特性,因而在总体上其精度由于传统的回归分析方法。
运用神经网络方法建模的另一个原因是,在实践中,我们虽然可能拥有已研制军品的相关费用数据,但这些信息常常是不完整的,而且往往含有伤残结构及错误成分,且具有不确定性,这些问题给以往的处理方式造成很大的困难。而神经网络可以通过不断地学习,从典型型号研制相关费用数据中学会处理这些问题,且能补全不完整的信息,并根据已学会的知识和经验对复杂问题做出合理的判断,以做出有效的预测和估计。
运用神经网络方法建模的一般过程包括确定系统需求描述、选择神经网络模型(包括神经网络结构、训练方法等)、数据预处理、确定神经网络的可执行代码、训练和测试等过程,具体情况见图1。
这里需要特别说明的是神经网络模型的选择问题。目前,在数于种网络结构、上百种训练学习算法中,应用最广泛、技术最成熟的是多层前向式网络结构,应用误差反向传播算法(ErrorBackPropagationLearningAlgorithm),简称为BP网络。这主要归结于基于BP算法的多层感知器具有以下一些重要能力。
1.非线性映射能力。BP网络学习能学习和存储大量输入-输出模式映射关系,而无须事先了解这种映射关系的数学方程。
2.泛化能力。BP网络训练后将所提取的样本对中的非线性映射关系存储在权值矩阵中,在其后的工作阶段,当向网络输入训练时未曾见过的非样本数据时,网络也能完成有输入空间向输出空间的正确映射。
3.容错能力。BP网络允许输入样本中带有较大的误差甚至个别错误。因为对权矩阵的调整过程也是从大量的样本对中提取统计特性的过程,反映正确规律的只是来自全体样本,个别样本中的误差不能左右对权矩阵的调整。
三、某型号无人机成本估算的BP模型
1.确定样本集。为了验证前文所说的BP神经网络在成本估算中的准确性,本文选择了八中型号的无人机来进行模拟运算。具体的数据见下表(表2)。
由表2可知,本文选择了与最后的整机价格有主要关系的6个性能指标,分别是导航定位精度、飞行高度、控制半径、最大平飞速度、续航时间和任务载荷。这六个性能指标是作为BP神经网络模型的输入项(in)存在的,而最后一项整机价格则是作为模型的输出项(out)。需要说明的是,根据前文的思路,本部分使用BP神经网络估算的应该是军品的成本,而不是军品的整机价格。在表5中之所以使用整机价格,主要是因为表中的价格是按照目前的军品定价模式计算出来的,即只要在整机价格的基础上除以(1+5%)就是飞机的成本。根据神经网络和本文研究的特点,此处使用整机价格并不影响最终结论的正确性。另外,为了保证结果的真实性,表中的整机价格在军方审价完成之后,承制方与军方最终的成交价格。还需要说明的是,有两个因素可能会影响本案例研究的精确性:一是为了搞好保密工作,本表格提供的数据是经过了脱密处理的。二是本文样本的数量不大,只有用来供神经网络学习的样本只有6个(前面6个型号),用来测试的只有2个(最后的2个型号),这必然会影响结果的精度。但是只要误差在本文认为的可接受的范围内(≤20%),本文就认为研究结果有效。
2.确定网络结构和算法。本案例的BP神经网络结构如图2。
由上图可知,该BP神经网络的结构由6个性能指标构成输入层,输出层只有一个节点即整机价格。中间的隐层包含7个神经元节点。
本文采用的是MATLAB的BP神经网络工具箱中的Trainlm函数建立的模型,它采用的是L-M算法。
3.数据标准化、训练和测试。本文采用的MATLAB版本是MATLAB7.70(R2008b),该版本的功能比较强大,对数据的要求不像以前的那么严格(以前版本的MATLAB要求节点输入和输出值的大小在[0,1]),所以笔者在并不需要对数据进行标准化。这样不仅能够减少模型的计算量,而且还有利于提高最终结果的精确度。
4.结果。根据前文构建的军品成本估算BP模型,以及上文确定的算法和过程,在经过了5次迭代后得到结果见表3。
由上面的结果可知,对高速无人机1和高速无人机2测试的误差都在20%以内,是在前文限定的范围内,因而笔者认为这个结果是可以接受的。并且,测试结果表明目前的定价还是略高于计算值。
四、存在的问题
在将BP神经网络模型应用于无人机的过程中,笔者认为以下几个方面的问题是比较难把握的。
1.输入层节点个数的控制。就本案例来说,输入层有6个节点,也就是6个性能指标。正如前文所言,选择的这6个性能指标是因为它们与最后的整机价格有主要关系。这个判断主要是根据专家的判断和实际的做法得出来的,所以其中的主观性很大。如果选择的尺度或标准稍微有所变化,那么指标的个数就会发生变化。而且我们如果要判断到底需要几个指标才能达到最好的预测效果。
2.隐层节点数的控制。这里包括两个问题:一是包括几个隐层?二是隐层中包括几个节点。一般来说一个隐层的BP神经网络就能很好的学习和测试,就笔者看到的文献而言,也主要是一个隐层。关于隐层中节点的个数,没有具体的规则,只能根据结果调整,这就对研究者使用MATLAB进行BP神经网络建模的经验和技术提出了挑战。
篇8
关键词:神经网络 汇聚节点 故障 应急处理
中图分类号:TP212 文献标识码:A 文章编号:1007-9416(2013)12-0135-02
助航灯光单灯监控系统可以实现对机场助航灯光的监控和自动巡检,在助航灯发生故障的时候能够及时将故障信息上报给监控中心,进而通知工作人员进行维修,保障了机场工作的正常运行。但传统的助航灯光单灯监控系统在机场使用时不可避免地出现了一些问题,比如故障信息误报、检测功能单一等等。无线传感器网络作为一门新兴的技术,正以其特有的优势越来越广泛地应用到各个领域。本文将无线传感器网络引入机场助航灯光单灯监控系统,实现助航灯的故障诊断,对提高灯光监控系统的可靠性,增强机场地面保障能力,保证飞机进近和着陆安全具有非常重要的意义。
1 无线传感器网络设计
1.1 结构设计
无线传感器网络的体系结构一般由传感器节点、汇聚节点、管理节点和互联网四部分组成,如图1所示。
在无线传感器网络中,大量传感器节点被随机部署在监测区域内,通过自组织方式形成网络,对目标进行监测。传感器节点获取的检测数据经本地简单处理后再通过邻近节点采用多方式传输到作为无线传感器网络与外部网络通信的网关节点的汇聚节点。汇聚节点又通过一系列的无线网络节点组成的传输网络把数据发送到远处的基站,基站再通过外部网络传输到远程数据库。数据经过处理后通过各种显示方式提供给终端用户。同时,用户和远程任务管理单元也可以通过外部网络与汇聚节点进行交互,向传感器节点控制命令和查询请求,并接受传感器节点发来的监测目标信息。
1.2 节点框架
通常,汇聚节点作为无线传感器网络的基节点,在模块设计上与传感器节点非常类似,也具有嵌入式微控制器系统、存储模块、通信模块和电源等功能模块。为了对上行数据进行融合处理,尽可能减少上行数据的总量,因此将数据融合模块作为汇聚节点的一个组成部分。为了能对上行数据进行融合处理,提出由嵌入式微控制器系统、数据融合模块、存储模块、通信模块和电源模块组成强汇聚节点,如图2所示。
数据融合模块将传感器网络的上行监测数据进行融合判决,再由汇聚节点将数据融合结果上传给观测者。而在带宽允许的情况下,汇聚节点再将原始数据转发给基站。这种设计可以提升在突发事件的情况下网络的实时性。该模块充分利用FPGA可并行计算的硬件资源和其硬件可配置的特性,实现高速数据融合处理。
2 算法模型
采用的神经网络算法模型如图3所示。
对于图3中的BP前向神经网络模型,设输入层含有M个神经元,采用线性恒等激励函数,对应的输入(第i个样本)因此为M维向量;隐含层内有L个神经元,激励函数可记为,采用Sigmoid激励函数;输出层神经元有J个,对应的激励函数可记为(与隐含层神经元的激励函数相同)。另外,期望输出(也称目标输出、样本输出)为J维向量;为输入层的第m个神经元到隐含层的第l个神经元之间的连接权值,而用于表示隐含层第l个神经元到输出层第j个神经元之间的连接权值;并可用和分别表示隐含层第l个神经元和输出层第j个神经元的阈值;表示隐含层第l个神经元的输出,它将被传递到输出层神经元作为输入的一部分,而表示输出层第j个神经元的实际输出。调整节点间连接的权重就是在训练神经网络时的工作。最早的也是最基本的权重调整方法是错误回馈法,现在较新的有变化坡度法、类牛顿法、Levenberg-Marquardt法和遗传算法等。无论采用哪种训练方法,都需要有一些参数来控制训练的过程,如防止训练过度和控制训练的速度。
设该神经网络的训练集为,其中对应输入,而为样本输出(用于对应校正图3所示的神经网络输出),为学习步长,该参数用来调节神经网络搜索最优权值的速度和振荡程度。
3 结语
本文以机场助航灯光为背景,对汇聚节点的数据融合算法进行了分析讨论,在C语言和Quartus II中进行仿真,并在FPGA上进行验证。通过两种方法进行权值处理。实验证明,该方法能提高处理速度与节约系统资源,并能有效地进行故障的应急处理。需要说明的是,该算法可推广至其它神经网络,并在相关领域中实用化。
参考文献
[1]李青云.民用机场助航灯光监控系统现状及发展趋势探究[J].价值工程,2010,29(20):149-149.
[2]王立文,李春,王丙元.助航灯光故障检测与诊断系统的研究与实现[J].电气应用,2007,26(6):106-110.
[3]Mourad,E,Nayak,parison-Based System-Level Fault Diagnosis:A Neural Network Approach[J].Parallel and Distributed Systems,2012,23(6):1047-1059.
篇9
关键词:多元支持向量机 离心式压缩机 故障诊断
The Application of Multi-Support Vector Machines in Fault Diagnosis for Compressors
Yu Huiyuan
(Well-Tech R&D Institutes, COSL, Yanjiao 065201, China)
Abstract: For solving the defect of traditional classificatory with many samples, a new classificatory recognizing faults based on Multi-Support Vector Machine (MSVM) is proposed for centrifugal compressors. SVM is a new machine study method which has excellent advantages in small-sample and multi-dimension binary classification. The new MSVM classificatory can be studied in a few samples rapidly to recognize several kinds of new faults. At the same time, the experiments showed that recognizing correct rate increased more greatly compared with traditional BP method.
Key words: MSVM; centrifugal compressor; fault diagnosis
一、引 言
压缩机在工业生产领域中具有非常重要的作用,由于故障原因造成的启停机一次所产生的经济损失是非常巨大的。如果能够事先准确诊断和预测出设备出现的各种故障,根据故障类型和实际情况采取相应的措施,就可以避免或减少经济损失。机械故障诊断学就是通过研究故障和征兆之间的关系来判断设备故障的。旋转机械的故障形式多种多样,故障产生的机理和原因也非常复杂[1],加之实际因素的复杂性,故障和征兆之间表现出的关系也较为复杂,即各类故障所反映的特征参数并不完全相同,这种关系很难用精确的数学模型来表示,这就给现场诊断带来了极大的困难。虽然神经网络具有充分逼近任意复杂非线性关系的能力和分类能力,但存在局部极小值、算法收敛速度慢、受网络结构复杂性和样本复杂性的影响较大、容易出现“过学习”或泛化能力低等缺点[2,3]。
支持向量机是一种新的机器学习方法,它较好的解决了非线性数据的分类问题,在小样本和二元分类方面有非常突出的优点。本文在分析了支持向量机的特点后,提出一种基于多元支持向量机的离心式压缩机转子故障分类识别方法,可以在较少样本情况下完成对分类器的学习训练工作,从而达到提高故障诊断效率的目的。
二、支持向量机分类原理
支持向量机不同于神经网络基于经验的算法,它是实现结构风险最小化原则的一种学习算法,是利用核函数把特征样本映射到高维特征空间,然后在此空间中构造分类间隔最大的线性分类超平面,所以支持向量机比较适合于小样本数据的分类。其基本思想如图 1 所示,图中圆点和三角点分别表示两类训练样本,H 为把两类样本完全无误分开的分类线,H1、H2 分别为通过样本中离分类线最近的样本且平行于分类线的直线,它们之间的间隔为分类间隔,图中的样本点就是支持向量。该最优面不但可将两类样本无误的分开,而且还要使分类间隔最大。前者保证经验风险最小,后者使问题的真实风险最小[4]。
不同的核函数将导致不同的支持向量机算法,常见的核函数包括多项式内积函数、径向基函数、S型内积函数等[5]。
三、基于MSVM的故障识别分类器
(一)基于MSVM的故障识别分类模型
由于SVM是二元分类器,诊断过程中,故障通常有多种类型。要对多种故障模式进行识别,必须构造一种多元分类器才能进行这种多种模式的识别。通常通过组合多个两类分类器的方法来实现多值分类器的分类,目前此类方法主要有以下几类算法:一对一算法(one-against-one,简称1-v-1)、一对多算法(one -versus-rest,简称1-v-r)和决策导向无环图算法(Decision Directed Acyclic Graph,DDAG)等几种,可参见文献[5,6]。通过比较分析,笔者采用一对一方法构造多元分类器[5],其基本思想是:对N元分类问题建立N(N-1)/2个SVM,每两类之间训练一个SVM将彼此分开。这种方法优点是单个SVM训练规模较小,分类器的推广能力强。
采用多元分类器训练数据样本后,在预测新样本时,使用成对的SVM进行比较,每次产生一个优胜者(即获得一个类别),然后在优胜者之间再次进行比较,直到最后仅剩一个优胜者。实际上,在预测新样本时,并不需要对每两类之间的优胜者再次进行竞争淘汰,只需比较两类之间获胜次数最多的类,即为新样本所属的故障类别。
(二)分类器的学习训练方法
本文的MSVM分类器训练程序采用的是LIBSVM开发函数库,在没有先验知识前提下使用径向基函数作为核函数。实验表明,通常情况下该核函数的分类效果略优于其他核函数。基于MSVM的故障分类识别分类器工作过程主要有学习训练和识别两个阶段,如图2所示。
图2 模分类器的工作过程
四、压缩机故障诊断实例
在离心式压缩机等旋转机械中,不平衡、不对中及油膜振荡是转子部件几种较常见的故障。目前人工智能方法在故障诊断领域已经得到较好的应用效果。但是,基于神经网络的诊断方法通常需要用大量的故障特征样本对模型进行训练,才能得到较为可靠的识别模型。然而,在机械设备实际故障样本的收集过程中,采集到的样本比较有限,尤其是某些故障样本的收集十分困难,这极大地限制了检测模型在模式分类过程中对训练样本的需求。而支持向量机在小样本和高维特征分类方面有突出优势,本文以离心式压缩机组转子故障为例,采用上述MSVM方法建立故障诊断模型。
(一)压缩机转子故障诊断模型设计
以转子不平衡、不对中及油膜振荡三种常见故障作为示例样本建立故障识别模型,将转子不平衡故障作为一类,转子不对中作为一类,油膜振荡作为一类。由于SVM是二元分类器,对于多种故障形式识别,必须构造一种多元分类器才能进行识别。由于本文采用一对一方法构造多元分类器建立故障识别模型,当需要对以上三种故障形式进行识别时,共需要构建3个SVM分类器。用SVM1来区分转子不平衡与不对中,SVM2识别转子不对中与油膜振荡,SVM3识别油膜振荡与转子不平衡。通过每两类样本分别对三个SVM分类器进行学习训练来寻求最优分类函数,以达到对建立识别模型的目的,模型如图3。
图3 多类故障识别模型
对于部件的有更多种故障模式存在的情况下,只需获取该部件对应故障状态下的特征样本,在原有模型基础上增加分类器即可,方法同上。不过对于多种故障模式下多元支持向量机模型的选择需要在速度、模型复杂度、识别效率等方面进行综合考虑。
(二)测试结果
为了考查模型的泛化能力,对诊断模型进行学习训练后,用训练后的分类器对45个测试样本进行分类试验。利用两类之间比较获胜次数最多的类,即为新样本所属的故障类别,如胜次相等,则为识别失败。表1为各类故障的分类识别结果。除3个待测故障的识别结果不太理想外,其余故障类型的识别结果都相当理想,本分类器的总体泛化能力为93.3%,结果令人满意。由此可见,该模型具有较好的泛化识别能力。
表1 识别结果
(三)与神经网络方法比较
为了与神经网络方法进行比较,同样利用故障样本对BP神经网络进行训练时发现,由于样本数量较少,网络训练陷入局部极值点,训练失败。因而表明MSVM能在较少样本情况下实现对分类器的学习训练。利用两组样本总和重新训练,在与BP神经网络同样的样本集均方误差情况下,发现其测试集均方误差一般比BP神经网络精度高;当训练样本集数目增加时,两者的泛化能力都有所提高,但BP神经网络提高速度要快于支持向量机;当样本集变化时,MSVM的测试集均方误差变化幅度小于BP神经网络,这些都说明了MSVM对训练样本数据的依赖程度比神经网络小。
取不同的收敛阈值对神经网络分类模型进行训练,并将它与MSVM方法的识别结果进行对比,如表2所示。从表中可以看到,支持向量机分类器的泛化识别能力明显优于神经网络分类器,可能是由于神经网络方法往往陷入过学习,即所谓的经验风险最小化,造成分类器推广能力泛化差于支持向量机。
表2 MSVM方法和BP神经网络方法识别结果对比
五、结论
由于支持向量机在小样本分类识别方面有独特优势,基于此设计了多元支持向量机的压缩机故障分类识别模型。试验证明,利用支持向量机对压缩机转子故障模式进行识别的方法是可靠和有效的,即使在小样本情况下,该方法仍可以有效地诊断出压缩机关键部件的工作状态和故障类型,解决故障诊断中少样本情形下模型训练不足和识别效率低的问题。因此,支持向量机在故障诊断领域是一种值得推广的方法。
参考文献
[1] 李小彭,罗跃纲,白秉三.模糊综合评判在机械故障诊断中的应用[J].沈阳工业大学学报.2002,24(5):439-442
[2] 朱君,高宇,叶鑫锐. 基于BP神经网络的螺杆泵井故障诊断方法[J].石油机械. 2008, 36(1):42-44
[3] 赵海洋,王金东,刘树林,等.基于神经网络和支持向量机的复合故障诊断技术[J].流体机械,2008,36(1):39-42
[4] 张学工.关于统计学习理论与支持向量机[J].自动化学报.2000,26(1):32-42
篇10
A
Hierarchy feature recognition based on feature face
PENG Sizhen, HAO Yongtao
(CAD Research Center, Tongji Univ., Shanghai 200092, China)
Abstract: To decrease the complexity of feature recognition, a hierarchy feature classification method based on feature entity, feature concrete face and feature virtual face is proposed. A hierarchy feature recognition method based on feature face is implemented by constructing two kinds of neural network input matrixes, and taking advantage of neural network in feature recognition. The example demonstrates that the method is more effective in recognizing feature of which the material is removed, but the range of feature recognition is somewhat limited.Key words:feature face; feature recognition; neural network
な崭迦掌冢2010[KG*9〗07[KG*9〗12 修回日期:2010[KG*9〗09[KG*9〗16ぷ髡呒蚪椋 彭思桢(1986―),男,山东临沂人,硕士研究生,研究方向为智能CAD,(Email);ず掠咎(1973―),男,山东威海人,副教授,博士,研究方向为企业信息集成系统、知识处理与挖掘、智能设计、分布式智能系统和ば槟庀质导际醯龋(Email)0 引 言
虽然对产品生产的自动化、智能化研究很多,但在工业上的应用效果并不理想.当前产品数据主要以较低层次的形式存储为主,如CSG和Brep这2种产品数据表示方法并不适合直接应用到产品设计之后的加工和制造中,特征识别技术的提出正逐步解决这个问题.
[1]
当前已提出很多种特征识别方法,如基于规则的、基于图的、基于几何解释的和基于体积分解的,这些方法都通过与特征库中已定义的特征类型进行比较来识别特征.但是,特征库不可能包含所有的特征类型,也不可能为特征库中所有的特征类型添加约束信息.另外,这些方法还存在效率低和没有学习能力等缺陷.
[2]人工神经网络具有学习和反馈的能力,在分类和特征识别领域有极大优势.
[3]
特征的类型越来越多,对特征进行准确、有效的分类是特征识别的基础,利用层次性分类方法可缩小特征对应的范围,从一定程度上降低特征识别的复杂度.层次性特征分类必然要求多层次的人工神经网络输入表示.
本文提出层次性特征分类方法以及特征实体、特征实面、特征虚面的概念,构造2个人工神经网络输入表示矩阵,用人工神经网络识别不同层次的特征,并研究人工神经网络的结构和训练方法.特征识别框架见图1.ね 1 特征识别框架1 特征分类及表示1.1 特征分类
目前存在许多特征的分类方式,STEPAP224是被广泛应用的特征分类方法之一.在STEPAP224中,加工特征被定义为1种生成特征,这种生成特征识别出为获得最终几何形状需从初始块中移除的材料体积;定义16种加工特征,如洞和狭槽等.作为1种国际标准,STEPAP224在特征分类上存在一定优势,但仍有以下缺点
[4]:(1)分类不严密,存在某些重叠的情况;(2)分类不完整,未包含所有的基础加工实体;(3)加工特征的定义不准确,STEPAP224定义移除材料的加工特征,但不适合定义添加材料的特征.为克服上述缺点,提出产品层次特征分类,见图2.ね 2 产品层次特征分类じ梅椒ǘ陨产中各个角度的加工特征进行层次分类,本文重点研究产品内延特征,其在第1层中包含5种基本特征类型,详细的分类层次见表1. 基于层次的特征分类方法不仅可清晰地描述各类特征之间的关系,而且可通过层次性特征识别减少特征识别的复杂度.每层特征的数量较少,使每个特征类型具有1个输出神经元成为可能.表 1 内延特征层次分类原始层内延特征第1层圆孔圆锥孔槽袋阶梯第2层通孔盲孔通圆锥孔盲圆锥孔通槽盲槽封闭袋开口袋通阶梯盲阶梯1.2 特征表示方法
有效的特征表示是构造特征识别的基础,目前广泛使用的特征表示方法是AAM(Attributed Adjacency Matrix),其由AAG(Attributed Adjacency Graph)转化而来,主要描述特征模型的几何和拓扑信息.该方法存在以下缺点
[5]:(1)表达形式不唯一,对于不同的特征,AAG可能具有相同的表达;(2)随着组成特征的面的增加,矩阵的大小急剧增加;(3)不仅需要利用启发式方法将AAG分解成几个子图,而且需要通过询问1组关于AM(Adjacency Matrix)布局和子图面数量的12个问题将每个矩阵转换为表示向量;(4)可识别的特征的范围有限,不能识别涉及到第2特征面的特征,如T槽.
为解决表达形式不唯一的问题,提出1组新概念,用以形成新的输入表示构造方法.
特征实体 实体等价于为得到某个外部特征的轮廓而加载到原始材料上的体积.
特征实面 物理上包含模型外部特征的基本形状的面,属可见的特征面.
特征虚面 与特征实面一起构成特征实体的边界面,是为描述特征实体虚拟出来的1种不可见的特征实体面,在描述特征实体时使其具有可见性.
图3为特征实体、特征实面、特征虚面及特征拓扑结构.特征虚面、特征实面表达内延特征的拓扑结构也可扩展到外延特征中,此时的特征虚面以特征之间相交面的形式出现.
(a)零件中的特征(b)移除的特征实体(c)特征拓扑结构图 3 特征实体、特征实面、特征虚面及特征拓扑结构2 人工神经网络的输入
以图3的特征拓扑结构为基础,结合层次性特征分类方法,构造2类人工神经网络输入以识别不同层次的特征.2.1 第1层输入构造
为实现表达形式的唯一性,从特征实体面的类型与特征面之间的角度关系出发,对组成特征实体的特征实面进行有序化处理.首先构造1个特征实面权重函数,其作用是根据组成特征的各个面的类型及相互间连接关系,对各个特征面进行赋值,形成特征实面序列构造的基础,其形式为ИW=S×10-T+v×0.1И式中:S为与当前实面邻接的特征实面数量;T为与当前实面邻接的特征虚面数量;v为面类型值.以图3为例,实面1与实面2,3和4邻接,故S=3;与虚面1邻接,故其T=1.面类型与面值的对应关系见表2.け 2 面类型与面值的对应关系面类型柱形面部分柱形面圆锥面部分圆锥面半圆面平面面值123456采用深度搜索方法进行特征面序列构造.首先选中权重最小的面,从此面出发,优先选择与此面连接且权重最小的面作为序列的下一元素,否则选择具有较小相交角度的面作为序列的下一元素,直到所有特征实面都加入到序列中为止.图4为某特征面序列构造的过程.け嗪糯选特征面目标序列1{f1, f2, f3, f4}NULL2{f2, f3, f4}f13{f2, f3}f1, f44{f2}f1, f4, f35NULLf1, f4, f3, f2图 4 特征面序列构造的过程ひ酝4序列为基础,如果特征实面数量超过5,需进行简化处理:如图5(a)所示的包含7个特征实面的特征,根据其拓扑结构信息可简化为图5(b)中含有5个特征实面的形式,构造如图5(c)所示的特征实面邻接图. (a) 7个特征实面的特征(b) 5个特征实面的特征 ぃc)简化的特征实面邻接图ね 5 复杂特征的简化と绻特征面满足如下规则,则可进行简化处理.
规则1 如果面fi,f
ij
利用特征实面邻接矩阵可识别特征的5个基本类型,为方便CAPP(Computer Aided Process Planning)的应用,需更细化地识别特征类型.
[6]为此,构造特征虚面方向矩阵.特征虚面方向矩阵是个6×6的矩阵,它描述在+x,+y,+z,-x,-y和-z 6个方向上虚面的连接性,用V[i,i]表示在i方向是否存在特征虚面.如果i≠j,则V[i,j]表示在i方向上和j方向上的虚面是否存在连接性.类似地,特征虚面方向矩阵也是对称的.为简化输入,将21位的编码作为人工神经网络的输入.图7为特征虚面方向矩阵实例.ね 7 特征虚面方向矩阵实例3 人工神经网络的构造和训练
由于采用层次性特征分类方法,故构造如下的1个层次性特征识别网络.(1)第1层用于识别5个基础特征类.识别中用到特征实面邻接矩阵输入向量,且输出神经元代表特征类型.对于特征识别,同时激活2个类不可行,因此只有1个输出神经元被激活,即其值大于阈值
0.5.如果1个或更多的输出神经元被激活,代表网络的模式不属于1个已知类型.为确定人工神经网络的结构,须调整隐藏层的数量、每个隐藏层神经元的数量以及调整学习率.含有17个神经元的3层结构的隐藏层被证明最合适.(2)第2层基于第1层,方便CAPP应用程序更进一步的识别.第2层中识别的人工神经网络结构被设计成相同的步骤.如通过各种试验,狭槽或阶梯分类器以特征虚面方向矩阵为输入,输入层包含21个神经元,每个隐藏层包含18个神经元,输出层包含2个神经元.(3)最后,利用经常被用在特征识别系统中的BP算法进行网络训练.4 基于特征面的层次识别方法实例
以所构造的人工神经网络输入矩阵、人工神经网络拓扑结构以及训练为基础,用图6和7所示的实例验证该方法的有效性.
(1)构造特征实面邻接矩阵.输入层的输入序列为6 3 0 4 0 6 3 3 0 6 4 0 6 0 0,将其输入3层(15个神经元的输入层、7个神经元的隐藏层以及5个神经元的输出层)的人工神经网络中,得到的识别见表3.
表 3 袋特征识别结果特征类型圆孔圆锥孔一般孔槽/阶梯袋耦合度0.000 49.573E-60.009 320.015 120.981 9ぃ2)构造特征虚面方向矩阵.输入层的输入序列为1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0,将其输入3层人工神经网络(21个神经元的输入层、18个神经元的隐藏层以及2个神经元的输出层)中,得到的识别结果见表4.
表 4 开口袋特征识别结果特征类型封闭袋开口袋耦合度0.002 50.991 4び墒道可知,本文提出的方法可识别相对简单的特征.5 结束语
从层次性特征分类方法出发,借助特征的特征面构造用于层次性特征识别的2类人工神经网络表示矩阵.该方法在识别去除材料的特征时比较有效,可更好地应用到CAPP中,提高生产的自动化和智能化,但也限制该方法识别特征的范围.扩大特征识别的范围及对特征关系的识别是后续研究的重点.参考文献:
[1] DING Lian, YUE Yong. Novel ANNbased feature recognition incorporating design by features[J]. Computers Industry, 2004, 55(2): 197222.
[2] ZZTaRK N, ZZTaRK F. Neural network based nonstandard feature recognition to integrate CAD and CAM[J]. ComputersIndustry, 2001,
45(2): 123135.
[3] DING Lian, MATTHEWS J. A contemporary study into the application of neural network techniques employed to automate CAD/CAM integration for die manufacture[J]. Computers & Ind Eng, 2009, 57(4): 14571471.
[4] TSENG YuanJye. A modular modeling approach by integrating feature recognition and featurebased design[J]. Computers Industry, 1999,
- 上一篇:未成年网络保护法案例
- 下一篇:管理科学特点