梯度下降法的基本原理范文

时间:2023-11-14 17:40:51

导语:如何才能写好一篇梯度下降法的基本原理,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

梯度下降法的基本原理

篇1

关键词:人工神经网络 反向传播算法 故障诊断

1 引言

随着经济的发展,空调系统得到了越来越广泛的应用,空调设备已成为重要的生活必备品之一。这就要求空调系统可靠性高且功能齐全,而且在故障诊断维修服务方面达到一定的水平。国内目前的大部分空调系统中无故障诊断系统,当空调系统出现故障后,维保人员往往不能及时、准确地了解系统出现故障的原因及相关信息,空调系统无法得到及时修复,这种情况急需得到改善。

2 关于故障诊断技术

故障诊断FD(fault diagnosis)是一种了解和掌握设备在使用过程中的技术,确定其整体或局部是否正常,早期发现故障及其原因并能预报故障发展趋势的技术。在诊断过程中,必须利用被诊断对象表现出来的各种有用信息,经过适当地处理和分析,做出正确的诊断结论。在制冷暖通空调领域,1987年在彦启森教授的建议下,才开始了故障诊断专家系统在制冷暖通空调领域的研究应用[1]。

3 人工神经网络用于空调系统故障诊断的基本原理

人工神经网络(Artificial Neural Network.简称ANN)正是在人类对其大脑神经网络认识理解的基础上人工构造的能够实现某种功能的神经网络。它是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。它实际上是由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统。

典型的神经网络结构如图1所示。

在众多的人工神经网络模型中,最常用的是BP(Back Propagation)模型,即利用误差反向传播算法求解的多层前向神经网络模型[2]。BP网络在故障诊断、模式识别、图像识别、管理系统等方面都得到了广泛的应用。本文讨论利用神经网络中的BP模型进行空调系统的故障诊断。

首先需要进行知识的获取。由专家提供关于各种空调系统故障现象(征兆集)及相应的故障原因(故障集)实例作为学习样本。将数据分为两部分,一部分用于训练网络,另一部分用于测试。将训练网络的数据按一定顺序编码,分别赋给网络输入、输出节点,通过神经网络学习算法对样本进行学习,经过网络内部自适应算法不断修正权值,直到达到所要求的学习精度为止。此时在大量神经元之间联结权值上就分布着专家知识和经验。训练完毕后,再将测试网络的数据从初始状态出发,向前推理,将显示出的故障结果与实际的测试数据结果相比较,如果误差很小,说明网络的权值建立正确;如果误差较大,说明网络的权值建立有误,需要重新进行网络的训练。

将训练样本训练完毕后,即可进行空调系统的故障诊断。只要实际输入模式接近于某一个训练时的学习样本的输入模式,则可产生出接近学习样本的输出结果,也就是所谓的自联想功能。同时,由于网络计算上的大量并行性,当机器运行状况改变,出现网络学习未考虑的情况时,系统亦能给出正确分类结果。同时将新数据并入网络,实现系统的自适应。一般来说,学习的故障实例样本越多,诊断结果的准确率越高。

4 BP学习算法

BP算法因其简单、易行、计算量小、并行性强等优点,是目前神经网络训练采用最多也是最成熟的训练算法之一。BP算法的实质是求解误差函数的最小值问题,由于它采用非线性规划中的梯度降法(Gradient Descent),按误差函数的负梯度方向修正权值 [3]。其主要思路是如果求出训练网络的指标函数误差:

一般的BP算法称为标准误差逆传播算法,也就是对应每一次输入都校正一次权值。这种算法不是全局误差意义上的梯度下降计算。对各个神经元的输出求偏导数,那么就可以算出误差对所有连接权值的偏导数,从而可以利用梯度下降法来修改各个连接权值。真正的全局误差意义上的梯度下降算法是在全部训练模式都学习完后才校正连接权和阈值。其计算流程如图2所示:

5 故障诊断实例 5.1 空调系统故障诊断的BP网络建立

空调系统故障模式及故障机制分析[4]如表1所示

表1 空调系统故障模式及故障机制分析 表示

符号

表示

符号

房间温度均偏高

1.冷冻机产冷量不足

2.喷水堵塞

3.通过空气处理设备的风量过大,热交换不良

4.回风量大于送风量

5.送风量不足(可能空气过滤气堵塞)

6.表冷器结霜,造成堵塞

相对湿度均偏低

7.室外空气未经加湿处理

系统实测风量大于设计风量

8.系统的实际阻力小于设计阻力

9.设计时选用风机容量偏大

房间气流速度超过允许流速

10.送风口速度过大

篇2

关键词:人脸检测;BP网络;遗传算法;GABP网络

中图分类号:TP183 文献标识码:B 文章编号:1004373X(2008)1615403

Face Detection Based on GABP Neural Network

JIAO Libao,PENG Yan,CHEN Chunlan

(Sichuan University of Science &Engineering,Zigong,643000,China)

Abstract:The constringency of the conventional BP neural network algorithm is too slow and local constringency is not ideal,which effect working performance.The lack above and face image data too big,a new method that the face detection method based on GABP neural network is introduced in this paper.Making the Genetic Algorithm (GA) search algorithm is used to train the network with updating the weights to minimize the error between the network output and the desired output.Then the BackPropagation (BP) algorithm is used to further train the artificial neural network used for face detection.The experiment indicate This network convergence rate is not only quick,moreover easy to achieve the optimal solution.This network has the high detection precision to the face image detection.

Keywords:face detection;BP neural network;genetic algorithm;GABP neural network

1 引 言

人脸检测是图像处理和识别领域的一个重要研究的课题,具有广泛的应用价值,例如档案管理系统、人机交互、驾驶执照、身份证的识别检测,刑侦破案中犯罪嫌疑人照片的识别等,可以说人脸检测是一种重要的个人身份鉴别的方法。本文将神经网络和遗传算法有机的结合起来,建立了一种遗传神经网络,然后利用优化后的神经网络较好地解决人脸检测中往往存在的噪声、残缺和戴眼睛的人脸图像等。GABP网络的应用于人脸检测具有检测速度快、检测精度高等特点。

2 遗传算法对BP网络的优化

2.1 BP神经网络的基本原理

BP(Back Propagation,反向传播)网络是神经网络的一个分支,又称误差信号反馈网络[1]。误差反向传播的BP算法简称BP算法,其基本思想是有导师学习,可按梯度下降法实现快速收敛。典型的BP网络是3层前馈阶层网络(如图1所示),即输入层、隐含层(中间层)和输入层。一个3层的BP网络可以完成任意的n维到m维的非线性映射。

图1 BP网络结构BP算法的学习过程由正向传播和方向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层,每层神经元(节点)的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转至方向传播,将误差信号(理想与实际输出之差)按连接通路反向计算,由梯度下降法调整各层神经元的权值,使误差信号减小。神经网络理论已经证明BP网络具有强大的非线性映射的能力,一连续函数或映射均可采用3层网络加以实现。

假设训练集包含M个样本,中间层的单元数是L,对第P个训练样本(p=1,2,…,M),单元j的实际输出为opj,它的第i个输入为opi,则:Upj=∑Ni=0WjiOpj。

其中Wji为神经元i与神经元j之间的连接权值。隐层神经元的输出采用S 函数激发:Opj=f(upj)=11+exp(-upj);

误差性能指标函数为:E=∑PEp;其中EP=12∑jdpj-Opj.2;式中,dpj表示对P个训练样本,单元j的期望输出。训练网络的目的是找到一组权重,使误差函数极小化。根据梯度下降法,输出层及隐含层连接权值学习算法为:

若权值的变化量记为ΔWij,取ΔWij正比于-EPWji,即ΔWij=ηδpjOpj;其中η为学习因子(可调整权值),令-EPuji=δpj,则EPWji=EPupiupjWji=EPujiOpj=-δpjOpj。用θi和φj分别表示输出单元和隐含层的阈值。其阈值变化分别记为Δθi和Δφj,г蜚兄滴:ИЕ泉i(n+1)=θi(n)+Δθi(n);

φj(n+1)=φj(n)+Δφj(n)И2.2 GABP网络

遗传算法GA (Genetic Algorithm)是基于生物进化原理的一种具有鲁棒性的自适应优化方法[2]。遗传算法遵循通过基于问题样本适应度函数对初始群体选择、交叉和变异操作,来指导学习和确定搜索的方向。由于采用种群的方式组织搜索,所以它可以在全局解空间内的多个区域内寻求最优解[3],而且特别适合大规模并行处理。对于BP网络来说,也存在着不足,BP算法从本质上讲属于梯度下降算法,因而不可避免的具有一些缺陷,如:易陷入局部极小点[4] 、训练速度慢[5]等。还有初始随机加权的大小,会对局部最小部分产生很大的影响[6]。在优化问题中,如果目标函数是多峰的,或者搜索空间不规则,就要求所使用的算法必须具有高度的鲁棒性,以避免在局部最优解附近徘徊[7]。所以遗传算法和BP网络的结合正好优劣互补。遗传算法和神经网络的结合对于寻求全局最优解其效果要优于单个的使用遗传算法或神经网络,为充分结合遗传算法和BP神经网络的长处提出了GA对BP的优化,从而获得网络的最优设计的新方法。

由于遗传算法的搜索不依赖梯度信息,也不需要求解函数可微,只需要求解适应度函数在约束条件下可解。 并且遗传算法具有全局搜索的特性,用遗传算法优化神经网络的连接权和网络结构,可以较好地克服BP神经网络结构确定过程中所带来的网络振荡,以及网络极易陷入局部解问题,并且有效提高神经网络的泛化能力。因此,利用遗传算法全局性搜索的特点,寻找最为合适的网络连接权和网络结构的方法来改变BP算法依赖梯度信息的指导,从而达到对网络结构和网络连接权值、阀值的最优配置。

通过使用GA在由BP网络初步确定的基本解空间上(网络连接权和神经元阀值的取值范围) ,通过对基因的选择,交叉变异操作。对样本个体不断择优进化,直至进化K(总的进化代数由初始时给定)代后,选取个体中适应度最大的个体来确定网络的结构和网络的权值和阀值。

GABP优化算法步骤描述如下:

(1) 确定网络结构;

(2) 产生初始种群;

(3) 输入训练样本;

(4) 得到个体误差,计算适应度值;

(5) 判断是否满足要求?是,则停止转入(6);否,则继续训练,对网络进行优化,产生新的阈值和权值;

(6) 得到GA优化的网络。

从算法过程可以看出,GA优化BP网络目的是确定网络最优的权值和阈值,而在训练过程中就是要不断调整权值和阈值,直到总误差函数是满足条件,训练结束,其GABP网络训练的流程图(如图2所示)。

图2 GABP优化算法训练流程3 GABP人脸检测

这里采用ORL人脸数据库进行仿真实验。剑桥olivetli实验室拍摄一系列人脸图像,共有40人,每人有不同的表情或不同视点的10幅图像,计400幅图像(图3为其中一些人脸样本)。这些图像为灰度图像,倾斜角一般不超过20°,这里在每个人的10幅图像中取5幅图像作为训练样本对本系统进行训练,并进行标准化,得到各点灰度值,送入GABP网络训练,调整权值和阈值,直到误差足够小或迭代到一定的次数,当训练结束,将权值和阈值保存在文件中。在GABP网络中,由于BP网络中输出值与期望的输出值之间的误差平方和EP越小,则表示该网络性能越好,可以选择一种适应度函数:f(x)=1EP+1。

图3 部分ORL人脸样本接下来将训练好的网络进行分类,装载权值和阈值文件。选择剩余的每个人5幅图像用来分类,进行标准化,送入GABP网络进行检测。采用基于金字塔的子采样过程,具体过程如下:首先将灰度图像以1.2的比率重采样缩小,而在每一级尺度变化中,以25×25的窗口大小,从上而下,从左到右扫描图像,步长为2个像素,最后将该窗口内的625个像素点的灰度值送入已经训练好的GABP网络进行人脸的判别,这个过程循环往复,直到尺度变化后的图象小于窗口大小为止。判别过程为:将数据输入GABP网络后,获得2个输出output(0)和output(1),如果output(0)大于output(1)则判断为检测正确,如果output(0)小于output(1)则判断为检测错误,最后计算出检测精度,如图4所示。

图4 GABP人脸检测流程 分别采用本文的算法和传统BP算法,其识别结果为,如表1所示。

表1 两种方法用于人脸检测的效果对比

网络类型收敛步数正确率传统BP算法38189.5%GABP算法23693.73%

对2种方法用于人脸检测的效果对比可以看出,基于GABP网络的人脸检测方法与传统BP网络的方法相比,检测率高出4个百分点左右。此外,GABP优化的神经网络在训练过程中不断的调整权值和与阈值,输出网络最优的权值和阈值,使总误差函数

满足条件,训练结束。从而提高训练速度,避免了在局部最优解附近徘徊。因此它的学习速度很快,在同等条件下,传统的BP网络收敛为381步,而GABP优化后的网络仅为236步。

4 结 语

此文介绍一种GABP神经网络的人脸检测算法,通过实验分析了该算法的性能。测试结果表明,该算法能明显提高检测精度,证明了遗传算法优化的BP网络在人脸检测的实际应用中是可行的。

参 考 文 献

[1]曾黄麟.智能计算[M].重庆:重庆大学出版社,2004.

[2]Golder G D.Genetic Algorithms in Search,Optimization and Machine Leam [M].London:AddisonWesley Pubishing Company Inc,1990.

[3]Bhatnv,Mcavoy T J.Determining Model Structure for Neural Models by Networks Tripping [J].Computer and Chem.Engng.,1992,16 (4):271281.

[4]潘昊,王晓勇,陈琼,等.基于遗传算法的BP经网络技术的应用[J].计算机应用,2005,25(12):2 7772 779.

[5]李敏强,徐博艺,寇纪凇.遗传算法与神经网络的结合[J].系统工程理论与实践,1999,(2):6569,112.

[6]樊为民.基于遗传算法的神经网络算法研究[J].太原师范学院学报:自然科学版,2004,3(4):1417.

[7]李建珍.基于遗传算法的人工神经网络学习算法[J].西北师范大学学报,2002,38(2):3337.

[8]陈耀明.小波变换在图像数据压缩中的应用\.现代电子技术,2007,30(6):136138.

作者简介 焦利宝 男,1983年出生,河南新乡人,硕士研究生。研究方向为人工智能控制及智能信息处理。

彭 男,博士研究生,教授,硕士生导师。研究方向为主要从事计算机应用、人工智能与智能控制、专家系统方面的研究。

篇3

【关键词】数字通信;自动调制识别算法;研究

所谓的数字通信信号自动调制识别技术主要是对通信系统中的信号进行处理,包括:信号调制、信号检测、信号提取等处理技术。自动信号自动调节识别技术在通信领域获得了很大的发展,而且有很多的相关研究正在不断的涌现。数字通信信号自动调制识别技术属于非合作通信的基础,在民用和军用上都相当广泛。

一、数字通信信号调制识别方法分类介绍

通常数字信号调制识别的方法有传统两大分类,一类为基于决策理论的最大似然识别法;二类为特征提取的统计模式识别算法。而在统计模式识别法则主要有模式识别以及特征提取等,根据不同的调制信号中的不同设计来识别所有的分类器[1]。特征提取常常是对信号频谱、瞬时信号、均值、星座特征以及高阶统计等进行主要特征进行提取。决策理论的方法中,主要利用假设检验以及概率等来描述调制模式的识别问题,通过最小的识别误差来对调制模式进行检测判断,因此可将其划分为最优分类器。

二、调制识别技术概念

(一)调制

所谓的自动调制识别算法中的调制主要是当消息在传输过程中由于存在着频率较低的频谱分量,且不利于信号的直接传播,那么通信系统往往需要加入调制过程以此来达到信道调制的效果。调制技术可以对信号的频谱进行搬迁,将通信信号的频谱搬到既定的位置上,然后将通信信号转换成为适合信道传输的信号[2]。调制技术的方法种类有很多,而且根据信号的类型可将调制方法分为数字信号调制和模拟调制;根据信号在调制之后的频谱类型可分为线性调制以及非线性调制。线性调制是通过改变载波的幅度来达到对基带调制信号的频谱搬移,此时的信号也保持了基带信号的结构和线性关系,所以线性调制也被称为幅度调制。而非线性调制则是通过改变载波的频率和相位来实现频谱的搬迁,即始终保持载波的幅度不变,而载波的频率和相位却发生改变。

(二)识别

通信信号自动调制的识别主要是在进行信号调制的过程中清楚信号的调制参数以及信息内容等。可判断出信号所采取的调制方式,同时还可以根据某些调制的信息来确定调制的参数,那么我们在进行调制的过程中选取适当的算法为计算提供准确的参数[3]。识别技术中其主要的核心为分类器设计、特征提取等,其征的提取主要是对信号进行分析,根据不同的信号的时频域分析来进行特征识别。

三、自动调制识别算法探索

(一)自适应lr算法

Lr算法属于BP神经网络算法的一种,lr值本是固定不变的。但是自适应lr算法确有着其自变的规律,若计算过程中可以在较平坦的曲面提高lr,反而加速了收敛减少了lr。可以表示为:w(k+1)=w(k)-η(k)F(w(k))。据该公式可知,通调整η(k)可以获得较之BP神经网络更快的收敛速度。Lr算法中将动量和自适应lr梯度算法结合起来,可以有效的提升学习的效率,还能够限制网络陷入局部极小值。

(二)L-M算法

L-M算法主要是利用目标函数进行一阶和二阶求导,其迭代式子为:w(k+1)=w(k)-(JT(k)J(k)+uI)-1J(k)(w(k)),u表示阻尼因子;I表示单位矩阵;J(k)表示雅克比矩阵。L-M算法则是通过调节阻尼因子来对迭代收敛方向实现动态调整。该算法则是结合了牛顿法和梯度下降法进行快速收敛。

(三)RPROP算法

RPROP算法与BP神经网络算法的改进有所不同,该算法在调整网络的过程中主要是利用函数的误差,针对阀值偏导数、网络权值等进行符号替代,可以有效的提升收敛的速度,这就解决了BP神经网络收敛速度慢的缺点[5]。RPROP算法在调整网络的时候,可以先设置一个权更新值“”,则全修正值为w,其算法的计算公式为:

wij(t)=-(t) >0 (1)

wij(t)=+(t) <0 (2)

wij(t)=0 其他 (3)

式中,t表示训练的次数,而RPROP算法则采用批处理方式进行训练。

则表示在地t时训练时,训练集的所有模式梯度累加。权更新值ij则表示在i、j此训练之后E上的梯度信息,更能够适应于学习更新。则其公式为:

ij(t)=η+×ij(t-1)

>0 (4)

ij(t)=η-×ij(t-1)

<0 (5)

ij(t)=0 其他 (6)

从上述的(4)、(5)、(6)式子看出,如果E的梯度符号发生改变,则表示wij变化太大,则ij应该乘以η-,使之减小。如果E上的梯度符号不变,则随着wij增大,ij应乘以η+,则可以有效的加速误差曲面的收敛。

四、结束语

数字通信信号自动调制识别在合作和非合作领域具有非常重要的价值,而且已经成为了当前重要领域的研究热点技术。随着通信信息技术的快速发展,对于自动化的要求越来越高,因此针对数字通信信号自动化调制识别算法具有非常重要的意义,值得我们不断进行研究。

参考文献

[1]李敏.数字通信信号自动调制识别技术的研究[D].哈尔滨工程大学,2012.

[2]芦跃.数字信号调制识别及参数估计研究[D].苏州大学,2013.

篇4

关键词: 回归测试; 测试用例; 神经网络; BP网络

中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2015)19?0114?03

Abstract: Regression testing means after modifying the source code, re?testing to confirm whether the discovered defect is repaired, and whether detection and modification have brought in a new bug or caused the errors in other codes which possesses a large proportion of the workload during testing procedure. The fundamental principle of neural network is analyzed, and the thought of BP algorithm is introduced into the case set selection of regression testing. The algorithm to select regression testing case package is presented. The functions which may be influenced by code modification are screened out by samples training, and the higher priority use case can be screened out. A set of regression testing strategy with high efficient and easy operation was summed up through the accumulation of testing practice.

Keywords: regression testing; testing case; neural network; BP network

0 引 言

软件分析,设计过程中难免有各种各样的错误,需要通过测试查找错误,以保证软件的质量。软件测试是由人工或计算机来执行或评价软件的过程,验证软件是否满足规定的需求或识别期望的结果和实际结果之间有无差别。大量统计资料表明,软件测试工作量往往占软件开发总量的40%以上。而回归测试作为软件生命周期的一个组成部分,在整个软件测试过程中占有很大的工作量比重,软件开发的各个阶段都会进行多次回归测试。在渐进和快速迭代开发中,新版本的连续使回归测试变得更加频繁,而在极端编程方法中,更是要求每天都进行若干次回归测试。因此,研究回归测试方法,尽可能地将软件存在的问题找出来,对保证软件质量和提升测试工作效率都是非常有意义的。

1 相关工作

1.1 回归测试

回归测试是指修改了旧代码后,重新进行测试以确认修改没有引入新的错误或导致其他代码产生错误。对于一个软件开发项目来说,项目的测试组在实施测试的过程中会将所开发的测试用例保存到“测试用例库”中,并对其进行维护和管理。当得到一个软件的基线版本时,用于基线版本测试的所有测试用例就形成了基线测试用例库。在需要进行回归测试时,就可以根据所选择的回归测试策略,从基线测试用例库中提取合适的测试用例组成回归测试包,通过运行回归测试包实现回归测试。

在软件生命周期中,即使一个得到良好维护的测试用例库也可能变得相当大,这使每次回归测试都重新运行完整的测试包变得不切实际。一个完全的回归测试包括每个基线测试用例,时间和成本约束可能阻碍运行这样一个测试,有时测试工作不得不选择一个缩减的回归测试包来完成回归测试。

1.2 相关技术的研究

测试用例的优化技术旨在以小的运行代价尽可能多地发现系统Bug。假设测试用例是能发现缺陷的;测试用例的运行效率是一样的。测试用例的集合的选取不仅是减少用例的数目,降低用例的执行代价,也需要考虑测试覆盖能力,即缺陷发现能力。在测试用例选择优化的问题上,已有很多文献对此进行了研究,如配对测试法[1]、关系树模型[2]、蚁群模拟退火算法[3]及一些其他新的理论和方法[4?7]。

2 回归测试用例集生成方法

2.1 基本原理

神经网络是通过对人脑的基本单元――神经元的建模和联接,探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。

神经网络的一个重要特性是它能够从环境中学习,并把学习的结果分布存储于网络的突触连接中。神经网络的学习是一个过程,在其所处环境的激励下,相继给网络输入一些样本模式,并按照一定的规则(学习算法)调整网络各层的权值矩阵,待网络各层权值都收敛到一定值,学习过程结束,从而以新的方式响应环境。

2.2 BP神经网络

Back?Propagation Network,由于其权值的调整采用反向传播(Back Propagation)的学习算法,因此被称为BP网络。网络中心思想是梯度下降法,通过梯度搜索技术,使网络实际输出值与期望输出值的误差均方值最小。网络的学习过程是一种误差边向后传播边修正权系数的过程。一般分三层:输入层(Input Layer),隐层(Hide Layer),输出层(Out Layer),也可以有2层或更多个隐层。层与层之间采用全互联方式,同一层单元之间不存在相互连接,如图1所示。

由于神经网络具有自学习、自组织和并行处理等特征,并具有很强的容错能力和联想能力,因此,神经网络具有模式识别能力。在神经网络识别中,根据标准的输入输出模式对,采用神经网络学习算法,以标准的模式作为学习样本进行训练,通过学习调整神经网络的连接权值。当训练满足要求后,得到知识库,如图2所示。

BP算法的具体步骤如下:

(1) 用小的随机数对每一层的权值[W]初始化,以保证网络不被大的加权输入饱和;

(2) 计算网络各层输出矢量以及网络误差[E;]

(3) 计算各层反传的误差变化并计算各层权值的修正值以及新权值;

(4) 再次计算权值修正后误差的平方和;

(5) 检查误差是否小于给定误差,若是,训练结束;否则继续。

输入信号[Xi]通过中间节点(隐藏层节点)作用于输出节点,经过非线性变换,产生输出信号[Yk,]网络训练的每个样本包括输入向量[X]和期望输出量[t](类别),网络输出值[Y]和期望输出值(真值)[t]之间的偏差,通过调整输入节点与隐藏层节点的连接强度取值和隐藏层节点与输出节点之间的连接强度以及阈值,使误差沿梯度的方向下降,经过反复学习训练,确定与最小误差项对应的网络参数(权值和阈值),训练即告停止。学习样本的数量和质量影响学习效果和学习速度。

为了训练一个BP网络,需要计算网络加权输入矢量以及网络输出和误差矢量,然后求得误差平方和。当所训练矢量的误差平方和小于误差目标,训练则停止;否则在输出层计算误差变化,且采用反向传播学习规则调整权值,并重复此过程。当网络完成训练后,对网络输入一个不是训练集合中的矢量,网络将给出输出结果。

2.3 回归测试用例包选取

基于全量的测试用例库,回归测试包的选择策略可遵循下述基本算法进行:

(1) 识别出软件中被修改的部分。

(2) 从原基线测试用例库[T]中,排除所有不再适用的测试用例,确定那些对新的软件版本依然有效的测试用例,其结果是建立一个新的基线测试用例库[T0。]

(3) 依据一定的策略从[T0]中选择测试用例测试被修改的软件。

(4) 如果必要,生成新的测试用例集[T1,]用于测试[T0]无法充分测试的软件部分。

(5) 用[T1]执行修改后的软件。

在上述步骤中,第(2)和第(3)步测试验证修改是否破坏了现有的功能,第(4)和第(5)步测试验证修改工作本身。第(3)步中,将神经网络知识结合到测试领域,通过对样本的学习,确认修改没有引入新的错误或导致其他代码产生错误。

其主要思想为:对于[q]个输入学习样本:[P1,P2,…,Pq,]已知与其对应的输出样本为:[T1,T2,…,Tq。]通过网络的实际输出[A1,A2,…,Aq]与目标矢量[T1,T2,…,Tq]之间的误差来修改其权值,使[Al (l=1,2,…,q)]与期望的[Tl]尽可能地接近,使网络输出层的误差平方和达到最小。

3 回归测试实践的优化

在项目测试过程中,不仅需要应用高新的测试技术,也要从宏观上制定可行的测试策略,解决在有限的时间中使测试覆盖率最优化。本文从项目实践角度出发,提出以下的回归测试策略:

(1) 对所有已修复Bug进行验证;

(2) 对新增功能进行全量重点测试;

(3) 对原有功能,按优先级进行测试。基于一定的风险标准从基线测试用例库中选择回归测试包。首先运行最重要、关键和可疑的测试,而跳过那些非关键、优先级别低或者高稳定的测试用例,这些用例即便可能测试到缺陷,这些缺陷的严重性也较低,不影响系统的功能。一般而言,测试从主要特征到次要特征。

(4) 对修复的Bug可能会引入新的Bug的功能模块重点测试,可采用本文介绍的神经网络进行样本训练和用例筛选。将回归测试局限于被改变的模块和它的接口上。通常,一个回归错误一定涉及一个新的、修改的或删除的代码段。在允许的条件下,回归测试尽可能覆盖受到影响的部分。

(5) 如果情况允许,测试全部用例的策略是最安全的策略。但已经运行过许多次的回归测试不太可能揭示新的错误,而且很多时候,由于时间、人员、设备和经费的原因,不允许选择再测试全部用例的回归测试策略,此时,可以选择适当的策略进行缩减的回归测试。

4 结 语

将神经网络知识引入到测试领域是一个比较新的研究,本文就此方向进行了研究,并给出了实例说明。然而,BP神经网络需要大量的样本数据用来训练和测试,当样本数量不够时,预测的误偏差可能会较大,回归测试开始时,由于数据样本不足,可能会存在预测的偏差,所以下一步的研究方向将是如何克服这一问题。

参考文献

[1] 廖剑锋,蔡贤涛.组合测试中用例集的选择策略[J].计算机工程与应用,2012,48(11):65?70.

[2] 钮鑫涛,聂长海,CHAN Alvin.组合测试故障定位的关系树模型[J].计算机学报,2014,37(12):2505?2518.

[3] 聂长海,徐宝文,史亮.一种基于组合测试的软件故障诊断方法[J].东南大学学报:自然科学版,2003,33(6):681?684.

[4] 徐宝文,聂长海,史亮,等.一种基于组合测试的软件故障调试方法[J].计算机学报,2006,29(1):132?138.

[5] YILMAZ C. Covering arrays for efficient fault characterization in complex configuration space [J]. IEEE Transaction on Software Engineering, 2006, 32(1): 20?34.

篇5

关键词:BP神经网络;饲料产量;饲料产量预测;畜牧水产业

中图分类号:TP183 文献标识码:A 文章编号:2095-1302(2017)01-00-02

0 引 言

我国是世界上人口最多的国家,畜牧水产业的发展与我国国民生活息息相关。畜牧水产业的可持续发展需要饲料产业的支持。饲料产业为现代养殖业的可持续发展提供了重要的物质基础,为我国人民生活水平的提高作出了重大贡献[1]。

1979年,我国正式从传统饲料进入现代饲料工业时代。经过30多年的发展,我国饲料产量逐年增加,于2011年开始超过美国,跃居世界第一,同时我国饲料从一开始饲料产品品种单一,质量不高,到现在饲料产品多样化、系列化,且饲料产品质量管理体系不断完善,有力地推动了养殖业的快速可持续发展,加快了农业结构调整,增加了国民收入[2]。

目前,国内用于饲料产量预测的方法并不多,范润梅[3]提出的灰色预测理论建立了GM(1,1)模型用于预测20092011年我国饲料产量,该模型具有较好的预测精度。但由于灰色预测的理论缺陷,当数据波动较大时,GM(1,1)模型预测误差较大,有时不能满足预测需要。而BP神经网络具有强大的学习能力,可以逼近任意复杂的非线性函数,信息利用率较高,在预测中得到了广泛应用[4-6]。本文利用BP神经网络模型和灰色预测模型对我国20102015年的饲料产量进行了预测,结果表明,BP模型具有很好的预测效果,预测最大误差为5.79%,平均误差为3.56%,而灰色预测模型预测的最大误差为12.95%,平均误差为7.24%。因此BP神经网络模型能够更好地用于饲料产量的预y,具有更高的工程应用价值。

1 灰色理论模型

GM(1,1)模型的基本原理如下:

根据灰色理论的原理,本文建立灰色预测模型的步骤如下所示:

①输入样本数据,根据公式(3)对样本数据进行累加处理。

②根据公式(6)求得B和YN。

③根据公式(7)求得模型的累加预测值。

④根据公式(8)求得样本的预测值。

灰色预测模型流程图如图1所示。

2 BP神经网络模型

BP神经网络有一个输入层、一个输出层和一个或多个隐含层,同层神经元间无关联,异层神经元间向前连接。根据对象的复杂程度,选择适当的网络结构就可以实现从输入空间到输出空间的任意非线性函数的映射。BP神经网络拓扑结构如图2所示。

BP神经网络建模流程图如图3所示。BP神经网络模型的建立需要按照如下步骤进行:

(1)输入样本数据,对样本数据进行归一化处理。

(2)设置神经网络的误差精度、学习速率、最大训练次数等参数。

(3)使用梯度下降法对权值和阈值进行调整,同时使用反向传播算法对BP神经网络进行训练。

(4)训练合格则模型建立成功,否则继续训练。

(5)使用训练好的模型进行预测,输出预测值。

(6)对预测值进行反归一化处理,得到真实的预测值。

3 两种模型在饲料产量预测中的应用

本文取19922015年这24年的饲料总产量相关数据进行饲料产量预测,以1992为起点依次选取19年的数据作为训练样本分别采用灰色预测模型和BP神经网络模型来预测下一年的饲料产量,其预测结果和误差分别如图4、图5所示。

从图4可以看出,20112012年灰色模型和BP神经网络模型的预测值与实际值都能够较好地吻合,而2013年我国饲料产量下降,数据曲线不再线性增加,此时灰色模型的预测值就偏离了实际值,预测误差增大,但是BP神经网络模型的预测值还是可以与实际值较好地吻合。从图5可以看出,BP神经网络模型的误差大约为5%,而灰色模型的误差最大达到了10%以上。从图4和图5中可以看出,BP神经网络模型相比灰色模型具有更高的预测精度,能够更好地用于饲料产量预测。

4 结 语

由以上分析可知,采用灰色模型进行饲料产量预测时,当饲料产量减少,波动较大,灰色预测模型的预测误差就可能会增大。本文采用BP神经网络模型有效减小了波动时产生的预测误差,提高了预测精度,为饲料产量的预测提供了一种新的研究方法。但该方法并不能够时时优于灰色模型,因此该方法有待于进一步完善和发展。

参考文献

[1]马广鹏.我国饲料行业发展现状及趋势分析[J].饲料工业,2013(4):45-47.

[2]徐倩.畜牧饲料行业信息化管理进程[J].广东饲料,2015,24(8):10-13.

[3]范润梅,解沛,王征南.灰色预测模型在我国饲料产量预测[J].中国畜牧杂志, 2009,45(8):13-16.

[4]王启平.BP神经网络在我国粮食产量预测中的应用[J].预测 2002,21(3):79-80.

[5]周彩兰,刘敏.BP神经网络在石油产量预测中的应用[J].武汉理工大学学报,2009(3):125-129.

[6]徐黎明,王清,陈剑平,等.基于BP神经网络的泥石流平均流速预测[J].吉林大学学报(地球科学版),2013,43(1):186-191.

篇6

引言

分子蒸馏是一种新型的在高真空条件下进行的液-液分离技术,具有蒸馏温度低(低于物质沸点温度)真空度高,物料受热时间短,分离程度高等特点;且分离过程不可逆,没有沸腾鼓泡现象[1]。特别适用于分离高沸点、热敏性、高粘度和易被氧化的物质。但是分子蒸馏过程是一个极其复杂的过程,实际生产中除了发挥其优点外,还要要兼顾生产效率及产品质量,因此,分子蒸馏生产工程的工艺参数优化是一个多目标组合优化问题[2]。生产中根据生产目标选择相应的工艺指标,这就需要进行反复实验来获取目标下的最佳工艺参数值。由于分子蒸馏过程的复杂性,导致其工艺参数比较多,难以用数学方法来解决。而人工神经网络具有人体脑神经系统的信息处理机制,可以映射任何较为复杂的非线性关系,具有自学习能力。本文采用应用较为广泛的BP神经网络和遗传算法相结合,将其运用到分子蒸馏过程中的工业参数优化中,通过给定分子蒸馏的工艺参数及生产指标,经过大量样本的学习训练使网络达到允许的误差范围,映射工艺参数与生产指标之间的复杂非线性关系[3-4]。以该模型的预测性能输出作为目标函数,对工艺参数进一步优化,从而实现预定的工艺指标下的分子蒸馏工艺参数的优化。

1分子蒸馏参数测试实验

1.1分子蒸馏过程模型气体分子从液体表面溢出,由于其自由程的不同,与其他分子碰撞前的飞行距离各不相同。分子蒸馏技术就是利用不同种类分子逸出液面后平均自由程不同的性质实现分离的。Langmuir[5]根据理想气体的动力学理论提出了分子自由程的数学模型:式中,p为分子所处环境压强;λm为分子运动平均自由程;d为分子有效直径;T为分子所处环境温度;k为玻尔兹曼常数。由式(1)分子平均自由程公式可知,气体分子平均自由程与温度成正比,与压强反比。当加热板上的物料达到一定温度时,分子平均自由程大于板间距离的轻组分脱离加热板飞向冷凝板,在冷凝板上捕获,而平均自由程小于板间距的重组分到达不了冷凝板,从而实现了物质的分离。其分离过程如图1所示。

1.2实验设备本文在DCH-300三级分子蒸馏装置的基础上进行参数测试实验研究。实验装置的刮膜式短程蒸发器分子蒸馏过程为:液料放入原料罐被计量泵抽取。泵用稳定流量输送物料,经过管道被送入降膜器内的旋转分配器,在离心力的作用下,被甩向夹套加热室内壁,这时物料液体受重力的作用,沿着内壁向下流动,与此同时装在转轴上的刮板,把料液刮成簿膜,这样料液受加热而蒸发,由于在重力及离心力的作用下,不断地更新液膜。根据分子运动理论知道,液体混合物的分子受热后运动会加剧,当接受到足够的能量时,轻组分首先就会从液面溢出而成为气体分子,当气体分子逸出碰到内冷凝列管时,瞬即从气体变为液体并被柱下气相罐收集,重组分因达不到逸出温度,而仍然以液体状态流出蒸馏柱,由液相罐收集。图2为蒸馏装置的工艺原理图,其中,H1、H2、H3为三级的蒸发器,蒸发器面积分别为0.02m2,0.26m2,1.1m2。L1、L2、L3为三级的冷凝器,并且每一级的蒸发器都配有各自的刮膜电机,可以控制刮膜转速,提高蒸发速率,每一级的冷凝系统都与冷机相连,保证具有合适的冷凝温度。第二级包括一个水环真空泵、2个罗茨真空泵,1个增压真空泵构成的泵组,第三级包括旋片真空泵和增压泵,三级真空度越来越高,蒸馏的温度就可以逐级降低,达到负压低温蒸发的降低能耗的目的。

1.3实验方案及结果本实验采用了3次蒸馏,第一级蒸馏为预脱气、脱水处理阶段,即薄膜蒸发阶段,为确保后续蒸馏时具有足够高的真空,而除去物料的空气和溶剂等组份。物料进蒸馏器之前,经一级除气装置进行脱气处理,然后以一定的速率进入二级、三级分子蒸馏刮膜器中,在高真空和适宜的蒸馏温度下进行,分离出残余物和馏出物。实验安排采用在改变一个因素的单因素实验设计下,固定其他参数,对得到的实验结果进行比较,以便对这一因素的影响作出结论。实验水平如表1所示。本次实验共采用9组进行试验,通过改变蒸馏温度、进料速率和真空度等参数,对实验所得精油含量与得率的影响。实验结果如表2所示通过上述试验结果可以看出,并不是工艺参数(即蒸馏温度、进料速率和真空度的值)越大越好,且没有规律可循。也有采用正交试验进行工艺参数优化的方法,但对于分子蒸馏采取该种方法不可行,因为正交实验法是当真空度不变时,通过多次实验得到最佳温度,在此温度下再通过多次蒸馏实验摸索最佳真空度,而分子蒸馏的蒸发器的温度与真空度是具有耦合关系的量,当真空度改变,物质的沸点发生改变,即真空度变化,最佳蒸馏温度随之改变,因此为了提高生产效率及产品指标,进行高效、高质地分离提取,本文采用了基于BP网络和遗传算法的分子蒸馏工艺参数优化方法。

2BP神经网络及遗传算法优化模型的建立

2.1基本原理人工神经网络信息处理、鲁棒性、自学习及非映射能力较强,遗传算法具有并行、随机和自适应搜索等优点[6]。本文采用神经网络与遗传算法相结合的优化设计方法,充分利用二者优点。基本原理是:首先通过试验获得目标函数与工艺参数之间的离散试验数据关系。将试验数据作为网络的样本,对网络进行训练,当网络达到误差要求时,存储权值阈值,利用网络的记忆功能,建立起工艺参数与指标之间的非线性映射关系。再利用遗传算法对这一黑匣型的函数求解。上述优化问题的数学表达形式为:其中,xi表示神经网络的输入,yi表示神经网络的输出,f是评价函数。算法的实现过程为:运用试验获得的大量样本对网络进行训练,建立稳定的BP网络预测模型,对训练好的模型在一定范围内随机产生多组输入向量,通过BP预测出相应的输出量,再通过评价函数,计算个体适应度值,再利用遗传算子通过适应度值调整输入向量,产生具有更好适应性的新的种群。通过遗传算子的计算得到优化目标,相应输入即为目标的优化结果。

2.2BP神经网络预测模型BP神经网络是目前应用最广、最为成熟的1种采用误差反向传播的前馈型多层神经网络。包括输入层、中间层和输出层。选取1组训练样本提供给神经网络,经过隐含层激活函数后向输出层传播,隐含层的输出作为输出层的输入,最后获得网络的输入响应。接下来进行的误差的反向传播阶段,即按照网络输出与目标值之间的误差减小方向传播,从输出层到隐含层再到输入层,逐层修正各层之间的连接权值[7-8]。含有一个隐层的3层BP神经网络可以任意精度逼近任何有理函数。本文采用单隐含层的BP神经网络作为预测模型,其模型结构如图3所示。大量学习样本对BP神经网络进行训练后,分子蒸馏工艺参数与产品指标之间就会通过神经网络建立起1种能映射二者之间内在关系的连接关系,即获得产品指标预测的BP神经网络模型。本文在Matlab7.0神经网络工具箱的基础上[8-9],安排了18组试验样本,选择9组作为训练样本,其余9组作为测试样本,网络结构为3×6×2,输入层节点为3,分别为蒸馏温度,真空度及进料速率;隐层节点为6,输出层为2,分别为产品的含量和得率。数据归一化处理,训练时,不同的训练函数的训练速度和精度不同,这里采用梯度下降法,训练误差曲线如图4所示。经过42次的网络训练,网络的训练误差值就收敛到预定的目标误差0.001。训练后的神经网络用于产品指标预测,由预测结果与试验结果进行比较可知,训练后的神经网络具有较高的预测精度。

2.3优化模型的建立遗传算法是1种通过模拟自然进化过程,根据自然选择和遗传算法,进行随机、自适应搜索最优解的方法。遗传算法将自然界适者生存、劣者淘汰的生物进化原理引入到待优化参数问题中,将待优化变量进行编码,组成初始种群,将其按一定的适应度函数及遗传算子的操作,即选择、交叉和变异,选择适应度值较大的个体,形成高适应值的新群体,经过反复进行,最终找到适应度最大的个体[10],此时的个体即为优化结果。本文以遗传算法作为蒸馏工艺参数的优化方法。式中,W1和W2分别为工艺权值,T1,T2分别为含量与得率的目标值。可见目标函数越小预测值越接近目标值,当目标函数最小时对应的工艺参数值为最优值。遗传算法在进化搜索中基本不利用外部信息,仅以适应度函数为依据,个体的适应度越大,表明其适应能力越强[12-15]。建立的目标函数需符合适应度函数要求,本文采用的适应度函数就是目标函数的倒数。工艺参数优化流程如图5所示。经过遗传算子作用后的工艺参数作为神经网络的输入,通过训练好的神经网络模型输出目标函数值,再计算个体适应度函数值,再进行选择,交叉概率为0.8,变异概率为0.01等遗传操作获得新一代种群。通过反复进化计算,直至适应度函数值趋于稳定,此时的输入值为最优解,优化结果如图6所示。此时W1=W2=0.5,达到稳定后的适应度值为38.97。此时蒸馏温度为120℃,进料速率295r/min,进料速率60L/h。

篇7

Abstract: In order to improve the busy airport emergency management ability, and provide scientific basis for the busy airport emergency plan, a new method based on the combination of grey model and improved support vector regression model is proposed. Time series prediction is done to the abnormal peak traffic on the busy airport flights small sample.

关键词: 灰色模型;支持向量回归机模型;高峰航班流量;小样本;时间序列预测

Key words: grey model;support vector regression model;peak flight flow;small sample;time series prediction

中图分类号:V355;F224 文献标识码:A 文章编号:1006-4311(2014)11-0316-02

0 引言

随着我国民航事业的迅猛发展,空中交通流量骤然增加,航班流量是民航空中交通管制的重要数据,是评定民航空管发展水平的关键指标。对非常态的高峰航班流量进行预测,不仅有助于提高繁忙机场的应急管理能力,而且还能为繁忙机场制定应急预案提供科学依据。但是因为繁忙机场的非常态高峰航班流量受到诸多因素的影响作用,系统的发展变化并非是线性的,而是高度非线性的,所以就很难直接的发现描述系统发展变化规律的函数。

目前采用最多的是灰色预测方法或支持向量回归机方法(SVR)。文献[1]采用灰色预测对航班流量进行预测,灰色预测方法在解决繁忙机场非常态高峰航班流量这种“部分因素已知,部分因素未知”的“小样本”、“贫信息”的时间序列预测中是一种非常有效的方法,先对原始数据进行生成处理,淡化或消除冲击扰动对系统行为数据序列的影响,然后利用生成数据序列建立预测模型,但是灰色模型预测的精度并不高。文献[4]采用SVR模型对航班流量进行预测,SVR是基于统计学习理论框架下的一种新的通用机器学习方法。它首先较好地解决了以往困扰很多学习方法的小样本、过学习、高维数、局部最小等实际问题,其次具有很强的泛化能力,是解决小样本时间序列预测建模的又一种可行的有效途径。将灰色模型与SVR模型两者相结合――灰色支持向量回归机模型,利用灰色预测方法中“累加生成”的优点,削弱原始数据序列中随机扰动因素的影响,使杂乱无章的原始数据中所隐藏的规律显露出来,使数据更具有规律性,得到便于SVR学习的新序列,进而建立优于单一SVR方法的预测模型。

1 GM(1,1)预测模型

令原始数列x(0)=(x(0)(1),x(0)(2),…,x(0)(n))为非负,用累加生成法对原始数列进行一次累加生成x(0)的1-AGO序列为:

x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中x(1)(k)=■x(0)(i),(k=1,2,…n)。GM(1,1)的灰微分方程模型为

x(0)(k)+az(1)(k)=b(k=2,3,…,n)(1)

其中,GM表示Gray Model(即灰色模型),方程的阶数和变量均为1,x(0)(k)为灰导数,a为发展系数,b为灰作用量,z(1)(k)为白化背景值。相应的白化微分方程为

■+ax■=b(2)

记u=(a,b)T,Y=(x(0)(2),x(0)(3),…,x(0)(n))T,B=-Z■(2) 1-Z■(3) 1 ┆ ┆-Z■(n) 1

按最小二乘法得出灰参数■=(a,b)■=(B■B)B■B■Y。

GM(1,1)的灰微分方程的解为

■(k+1)=(x(1)(0)-■)e-ak+■(3)

将其累减还原得到非负原始序列x(0)的预测值为

■(k+1)=a(1)■(k+1)=■(k+1)-■(k)(4)

2 改进的SVR预测模型[3-5]

2.1 SVR原理 假定在航班流量预测问题中,待拟合样本数据集为(x1,y1),(x2,y2),…,(xn,yn)其中n为样本集容量。SVR在处理非线性问题时先用非线性映射?准(・)将样本数据x映射到高维特征空间H中去,并在这个空间中对函数f(x)=w・?准(x)+b做线性回归处理。根据SVR结构风险最小化原理,函数f(x)应使如下风险函数最小

R(w)=■w2+C■L(f(x■)-y■)(5)

式中w为回归系数向量,C为一大于零常数称为惩罚系数,控制对超过不敏感值误差的样本数据的惩罚程度,

L(f(x■)-y)为损失函数,依据航班流量预测的特点,这里笔者选取ε不敏感损失函数为式(7)。

L(f(x■)-y)=0,f(x■)-y■

ε为不敏感值,控制着模型精度。

由于要考虑允许拟合误差,引入松弛因子ξ和ξ*。于是航班流量回归估计问题就转化为在约束条件(8)下的最小化函数(7)的问题。R(w,ξi,ξ■■)=■w2+C■(ξi+ξ■■)(7)

s.t.f(x■)-yi?燮ξ■■+εy■-f(x■)?燮ξi+εξi,ξ■■?叟0i=1,2,…,n(8)

先对式(8)采用拉格朗日乘子处理,然后按照对偶原理将式(8)转化为下面的凸二次规划问题w(α,α*)=■(αi-α■■)yi-■(αi-α■■)ε-■■(αi-α■■)(αj-α■■)?准(xi)・?准(xj)(9)

s.t.■(αi-α■■)=00?燮αi,α■■?燮C(10)

这里α,α*是拉格朗日乘子,可以由式(9)求出,αi或α■■不等于零的项所对应的样本数据就被称为支持向量,此时拟合函数就变成f(x)=■(αi-α■■)k(xi・x)+b(11)

这里k(xi・x)=?准(xi)・?准(x)称为核函数,能够满足Mercer条件,xi为支持向量,x为待预测数据。

2.2 参数优化 SVR模型参数有惩罚因子C,所选用核函数的参数γ和ε不敏感值,恰当的参数组合可以提高回归模型的泛化性能。主要的参数选择算法有留一法、交叉验证法、试凑法、网格搜索法、梯度下降法和免疫算法等。本文采用网格搜索法和计算精度较高的交叉检验法确定参数。

3 灰色支持向量回归机预测模型

繁忙机场航班流量受诸多因素影响,有的因素数据不易测量,有的则尚未可知,所以本文利用灰色模型和支持向量回归机的优点,建立灰色支持向量回归机模型。

建模主要步骤如下:

步骤一:利用GM(1,1)预测方法得到非负原始序列x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),x(0)(i)>0,i=1,2,…,n的1-AGO序列

x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),x(1)(k)=■x(0)(i),k=1,2,…,n。

步骤二:核函数K(xi,x)及参数的选取。

步骤三:利用SVR方法,求出优化问题的最优解,找出支持向量。

步骤四:构造出回归决策函数f(x)。

步骤五:将1-AGO序列x(1)的预测值■求出。

步骤六:累减还原,得出预测模型,

■(k+1)=a(1)■(k+1)=■(k+1)-■(k)。

4 繁忙机场非常态高峰航班流量预测

4.1 选择最优参数 使用灰色支持向量回归机方法预测机场航班流量,首先确定惩罚因子C,ε不敏感值和核函数,以及所选取的核函数的参数。文献[5]研究表明:非线性输入值不能作为线形核函数的输入;出于对训练性能的综合考虑,经过比较,这里的输入核函数采用在处理时间序列问题时表现比其他核函数更佳的径向基核函数

k(xi,x)=exp(-γxi-x2)(12)

采用网格搜索法和计算精度较高的K-CV方法确定参数,基本原理是让C和γ在一定的范围划分网格并遍历网格内所有点进行取值,对于取定的C和γ利用K-CV方法得到在此组C和下γ训练集验证分类准确率,最终取使得训练集验证分类准确率最高的那组C和γ作为最佳的参数。

4.2 仿真实验及结果分析 以首都国际机场2009年~2013年春节期间航班流量数据中的旅客流量为例,对灰色支持向量机预测方法的实际预测效果进行验证。由于春节前后近6周都处于航班旅客流量高峰期,所以有必要对春节前后共6周每周的平均每天航班旅客流量进行预测。

以2009年~2010年的首都国际机场旅客流量数据即编号前24个作为学习样本(其中a~f表示春节月中第一周到第六周)。然后以2013年春节期间6周的平均每周的航班流量数据即编号后6个作为测试样本,进行仿真实验,同时,为了便于比较本文方法的有效性,还利用GM(1,1)模型和单一的SVR模型对原始数据进行预测。将3种模型的预测结果做出对比,取得的仿真实验结果。

从图1可以看出离原始数据最近的是灰色支持向量回归机预测数据,由此可知利用灰色支持向量回归机模型预测的结果精度比GM(1,1)模型和单一的SVR方法预测精度更高,结果较为准确可靠。由仿真实验结果能够得出灰色支持向量回归机模型在为繁忙机场航班流量预测方面优于GM(1,1)模型和单一SVR模型。因此,用灰色支持向量回归机模型对首都国际机场2016年的春节期间的航班流量进行预测,预测结果见表1。

5 结束语

灰色支持向量回归机模型发挥了中“累加生成”的优点,削弱了原始数据中的随机性,增强了规律性,同时避免了GM(1,1)模型存在的理论缺陷,尽管组合模型中有个别数据拟合误差偏大,但从整体预测效果看,仍然优于单一GM(1,1)模型或SVR模型。由于繁忙机场航班流量的产生受多种因素影响,包括当年年度国民经济增长水平、票价浮动等诸多因素,因此,下一步要做的是,预测繁忙机场非常态高峰航班流量时,不应仅仅考虑时间因素,也应综合考虑各种因素,以建立更准确地预测模型,为繁忙机场的应急管理提供更好的参考。

参考文献:

[1]李旭.昆明空域航班流量预测[J].中国民航大学学报,

2012,30(5):5-8.

[2]国栋,张竞博,何圣关.基于支持向量机的互连导线串扰分析及预测[J].科学技术与工程,2013,13(7):1816-1820.

[3]张卫华,孙浩,穆朝絮.基于支持向量机的交通安全预测模型及仿真研究[J].系统仿真学报,2009,21(19):6266-6270.

篇8

论文关键词:BP神经网络;电力企业;信息化水平;评价;指标体系

0引言

电力行业是国内应用信息技术较早的行业之一,先后经历了生产过程自动化、管理信息化等建设阶段。目前,电力信息化呈现出基础设施齐备、数据庞杂、应用广泛等特点,已从量化范畴提升到质的高度。对电力企业进行有效的信息化评价和管理,是提升信息化水平和实现企业信息化可持续发展的重要保障。

如何积极开展信息化建设来降低运营成本?通过何种指标来科学评价我国电力企业的信息化发展水平?这是当前电力行业必须解决的一个问题,而目前我国还没有一套完整的电力企业信息化水平评价指标体系正式。通过构建科学、实用、有效的电力企业信息化水平评价体系,采用具有学习、记忆、归纳、容错及自学习、自适应能力的BP神经网络算法,科学、有效、客观地评价电力企业信息化水平,有利于规范和完善电力企业信息化建设,促进电力信息化健康,快速地发展。

1电力企业信息化水平评价指标体系的建立

1.1建立的原则

(1)简明科学原则。评价指标体系应明确反映电力企业信息化水平高低与指标间的关系,避免无关的指标列入,指标体系的大小也应适宜。若评价指标体系过大、指标层次过多、指标过细,则势必将评价者的注意力吸引到细小问题上;而若评价指标体系过小、指标层次过少、指标过粗,则不能充分反映和评价电力企业信息化的整体设计与使用情况。

(2)公正合理原则。即评价指标应能客观、公正、合理地体现电力企业信息化水平的动态性。

(3)易于操作原则。评价指标体系在实际应用中应具有可操作性,指标含义明确、可靠,数据易于收集,可供不了解指标体系建立过程的人员进行操作与应用。

(4)以定量指标为主,辅以一定的定性指标。评价指标尽可能以定量指标为主,但全部采用定量指标也不能完全反映电力企业信息化水平的整体情况,所以要辅以一些描述性的定性指标。

1.2指标体系的内容

结合电力企业信息化水平评价指标体系建立的原则,从3个层次来构建电力企业信息化水平评价指标体系,主要由业务支持程度、IT绩效水平、信息技术水平、IT管理能力、IT持续发展能力等五大方面构成,如表l所示。

1.3指标值的确定及归一化处理

在上述55个三级指标中,有定性指标和定量指标之分。根据指标的评价准则又可分为3类指标:正向指标、负向指标和优化指标。由于不同的指标从不同侧面反映电力企业信息化水平,指标之间又由于量纲不同,所以无法进行比较。因此,为了便于最终评价值的确定,需要对各指标进行无量纲化处理,即对评价指标做标准化、正规化处理,以便消除指标量纲的影响。考虑神经网络训练的收敛问题,对所有指标分3种情况进行无量纲化处理。

(1)定性指标。定性指标有工程建设情况、信息安全措施、信息安全制度的完善程度、信息安全制度的执行情况、企业职工IT素质等。这些指标的评价值采用专家打分的办法进行评价,取值为0.0~1.0之间。

(2)正向定量指标。是指标值越大越好的指标,包括:设备的运行率、安全运行时间、物资供应保障率、劳动生产率、网络覆盖率、联通率等。因这类指标越大越好,故选用所有电力企业的最大值为该指标的理想值,进行无量纲化处理。

(3)负向定量指标。是指其值越小越好的指标,包括采购成本、生产成本、平均响应时间等。这类指标是越小越好,因此,选取所有电力企业的最小值为该指标的理想值,并进行无量纲化处理。

(4)优化指标。是指标具有一个最优的取值范围,太大或太小都不好的指标,包括电力企业资产负债率指标,该指标如果太大说明企业在信息化投资建设中将会出现资不抵债的情况,不利于电力企业的发展;如果该指标值很小则说明在企业信息化建设中没有发挥有限资本的价值。一般该指标取40%~60%比较理想,然后进行无量纲化处理。无量纲化处理方法如下:

(1)有量纲向无量纲的转化。采取一种二次抛物偏大型分布的数学模型描述:

(2)无量纲指标的处理。采取线性递增函数进行描述:

2电力企业信息化水平评价的神经网络专家系统

2.1 BP神经网络的基本原理

人工神经网络(ANN)是由大量简单的处理单元组成的非线性、自适应、自组织系统,它是在现代神经科学研究成果的基础上,试图通过模拟人类神经系统对信息进行加工、记忆和处理的方式,设计出的一种具有人脑风格的信息处理系统。它可广泛应用于预测、分类、模式识别和过程控制等各种数据处理场合,相对于传统的数据分析处理方法,更适合处理模糊、非线性和模式特征不明确的问题。

BP神经网络是单向传播的多层前向神经网络,网络可分为输入层、中间层(隐含层)和输出层,其中输入和输出都只有1层,中间层可有1层或多层。同层的网络结点之间没有连接,每个网络结点表示一个神经元,其传递函数通常采用Sigmoid型函数。每对神经元之间的连接上有一个加权系数W,它可以加强或减弱上一个神经元的输出对下一个神经元的刺激。这个加权系数通常称为权值,修改权值的规则称为权值算法。建立在BP神经网络基础上的专家系统根据一定的算法,通过对样本数据的学习确定网络权值。神经网络专家系统的权值确定、结构稳定后,就可以处理新的数据,给出相应的输出。

2.2基于BP网络的电力企业信息化水平评价的学习过程

BP神经网络电力企业信息化水平评价模型中,输入层包含55个神经元,分别接受55个电力企业信息化水平评价中三级指标的样本数据输入;中间层包含26个神经元;输出层有1个神经元,就是电力企业信息化水平评价结果,相应的BP网络结构如图1所示。

由于神经网络各层的初始连接权值是任意的,必须先对神经网络进行训练,使电力企业信息化水平评价结果的实际输出与期望值的偏差尽可能小。BP神经网络通过训练将学习样本的真实值与网络输出的误差反向传播到各层的神经元,采用梯度下降法不断调节各层的权值,减小因权值带来的偏差,从而使训练样本真实输出与网络输出的误差控制在设定的0.001误差范围内。具体BP神经网络学习过程如下:

(1)根据电力企业信息化水平评价指标要求,提供训练集。选人对网络输出即电力企业信息化水平有影响的三级指标x1,x2,……,x55作为输入自变量,以此确定输入节点的个数(本网络有55个输入节点);

(2)进行初始化。置所有权值为随机任意小,给定学习精度£一10,目标误差为0.001,读入网络初始权重及学习样本。这里可通过对电力企业300名职工开展问卷调查,随机抽取前100组记录(样本序号为1~100)作为神经网络辩识模型的训练样本;

(3)按BP算法训练网络。学习过程流程如图2所示;

(4)判断学习精度是否达到要求,如达到转入下一步执行;否则返回上一步继续学习;

(5)储存并输出权值。利用训练好的网络进行测试(采用10个样本记录为例),输出电力企业信息化水平的最终评价结果。

3实验结果及分析

采用BP神经网络对电力企业信息化水平进行辨识,输入层、隐含层和输出层的结点数分别为55×26×1。根据经验和试验,前100组记录用作学习样本,作为训练神经元连接权值用,学习精度£=1×10;后10组(样本序号为291~300)样本作为测试检验用。经过反复多次学习,其学习结果(测试)如表2所示。