神经网络含义范文
时间:2024-03-29 11:12:51
导语:如何才能写好一篇神经网络含义,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:电阻点焊;神经网络;消音锯片
0序言
电阻点焊过程是一个高度非线性,既有多变量静态叠加又有动态耦合,同时又具有大量随机不确定因素的复杂过程。这种复杂性使得传统方法确定最佳工艺参数存在操作复杂、精度低等缺陷。
本文通过深入研究提出了一种神经网络优化消音锯片电阻点焊工艺参数方法。以试验数据为样本,通过神经网络,建立焊接工艺参数与焊接性能之间的复杂模型,充分发挥神经网络的非线性映射能力。为准确预测点焊质量提高依据。在运用试验手段、神经网络高度非线性拟合能力结合的方式,能在很大程度上克服传统方法的缺陷,完成网络的训练、检验和最优评价,为电阻点焊过程的决策和控制提供可靠依据。
1原理
人工神经网络是用物理模型模拟生物神经网络的基本功能和结构,可以在未知被控对象和业务模型情况下达到学习的目的。建立神经网络是利用神经网络高度并行的信息处理能力,较强的非线性映射能力及自适应学习能力,同时为消除复杂系统的制约因素提供了手段。人工神经网络在足够多的样本数据的基础上,可以很好地比较任意复杂的非线性函数。另外,神经网络的并行结构可用硬件实现的方法进行开发。目前应用最成熟最广泛的一种神经网络是前馈多层神经网络(bp),通常称为bp神经网络。
神经网络方法的基本思想是:神经网络模型的网络输入与神经网络输出的数学关系用以表示系统的结构参数与系统动态参数之间的复杂的物理关系,即训练。我们发现利用经过训练的模型进行权值和阈值的再修改和优化(称之为学习)时,其计算速度要大大快于基于其他优化计算的速度。
bp神经网络一般由大量的非线性处理单元——神经元连接组成的。具有大规模并行处理信息能力和极强的的容错性。每个神经元有一个单一的输出,但可以把这个输出量与下一层的多个神经元相连,每个连接通路对应一个连接权系数。根据功能可以把神经网络分为输入层,隐含层(一或多层),输出层三个部分。设每层输入为ui(q)输出为vi(q)。同时,给定了p组输入和输出样本 ,dp(p=200)。
(6)
该网络实质上是对任意非线性映射关系的一种逼近,由于采用的是全局逼近的方法,因而bp网络具有较好的泛化的能力。
我们主要是利用神经网络的非线性自适应能力,将它用于消音锯片的电阻点焊过程。训练过程是:通过点焊实验获得目标函数与各影响因素间的离散关系,用神经网络的隐式来表达输入输出的函数关系,即将实验数据作为样本输入网络进行训练,建立输入输出之间的非线性映射关系,并将知识信息储存在连接权上,从而利用网络的记忆功能形成一个函数。不断地迭代可以达到sse(误差平方和)最小。
我们这次做的消音金刚石锯片电焊机,通过实验发现可以通过采用双隐层bp神经网络就可以很好的反应输入输出参数的非线性关系。输入神经元为3,分别对应3个电阻点焊工艺参数。输出神经元为1,对应焊接质量指标参数。设第1隐含层神经元取为s1,第2隐含层神经元取为s2。输入层和隐含层以及隐层之间的激活函数都选取log-sigmoid型函数,输出层的激活函数选取pureline型函数。
2点焊样本的选取
影响点焊质量的参数有很多,我们选取点焊时的控制参数,即点焊时间,电极力和焊接电流,在固定式点焊机上进行实验。选用钢种为50mn2v,φ600m的消音型薄型圆锯片基体为进行实验。对需要优化的参数为点焊时间,电极力和焊接电流3个参数进行的训练。最后的结果为焊接质量,通常以锯片的抗拉剪载荷为指标。
建立bp神经网络时,选择样本非常重要。样本的选取关系到所建立的网络模型能否正确反映所选点焊参数和输出之间的关系。利用插值法,将输入变量在较理想的区间均匀分布取值,如果有m个输入量,每个输入量均匀取n个值(即每个输入量有m个水平数), 则根据排列组合有nm个样本。对应于本例,有3个输入量,每个变量有5个水平数,这样训练样本的数目就为53=125个。
我们的实验,是以工人的经验为参考依据,发现点焊时间范围为2~8s,电极力范围为500~3000n,点焊电流范围为5~20ka时,焊接质量比较好。我们先取点焊电流,电极力为定量,在合理的范围内不断改变点焊时间,得到抗拉剪载荷。如此,可以得到不同点焊电流和电极力的抗拉剪载荷。根据点焊数据的情况,我们共选用200组数据。部分测试数据如表1:
神经网络建模的关键是训练,而训练时随着输入参数个数的增加样本的排列组合数也急剧增加,这就给神经网络建模带来了很大的工作量,甚至于无法达到训练目的。
3神经网络
我们用200组训练样本对进行神经网络训练,以err_goal=0.01为目标。调用matlab神经网络工具箱中的函数编程计算,实现对网络的训练,训练完成后便得到一个网络模型。
程序如下:
x1=[2.1 2.5 3 3.5 4……]; %点焊时间输入,取200组
x2=[1.3 1.5 1.9 2.1 2.3……];%电极力输入,取200组
x3=[9 10 11 12 13……];%点焊电流输入,取200组
y=[2756 3167 3895 3264 2877……]; %输出量,取200组
net=newff([1 10;0.5 3;5 20],[10 10 1],{'tansig''tansig''purelin'});
%初始化网络
net.trainparam.goal = 0.01;%设定目标值
net=train(net,[x1;x2;x3],y);%训练网络
figure; %画出图像
选取不同的s1,s2,经过不断的神经网络训练,发现当s1=8,s2=6时,神经网络可以达到要求。工具箱示意图如下图1。
图 1工具箱示意图
工具箱示意图非常清晰地表示了本实验的神经网络的输入,输出以及训练的过程。
神经网络的训练结果,如图2所示:
图2神经网络的学习过程
图中可以看出双层网络训练的sse在训练100次时,已经接近0.0001,效果较理想。
为了验证经过训练的网络模型的泛化能力,在输入变量所允许的区域内又另选多个样本进行了计算。发现:利用bp神经网络模型计算的测试输出与期望输出值相符,误差小于2%。
在已经训练好的网络中找出最大值:
for i=2:10 %点焊时间选择
for j=0.5:0.1:3%电极力选择
fork=5:0.1:20%点焊电流选择
a=sim(net,[i,j,k]);%仿真
ifa>n %比较仿真结果与最大值,取最大值n=a;
i(1)=i;%最大值的时间
j(1)=j;%最大值的电极力
k(1)=k; %最大值的电流
end
end
end
end
将i(1),j(1),k(1)以及n输出,n为最大值。得到点焊时间为3.4s,电极力为12.7kn,点焊电流为11.8ka,此时的抗剪拉剪载荷为4381n,为训练结果的最大值。将点焊时间为3.4s,电极力为12.7kn,点焊电流为11.8ka在点焊机上进行实验,得到结果为4297n。并且通过与实际的结果相比较,发现误差也在2%以内。
4结论
1)本文采用了插值法作为选取bp神经网络训练样本的方法。并且在数据变化剧烈的地方多选取了75组数据,这样可以得到较高精度的网络模型,使点焊模型的可行性。
2)基于此方法建立了三个点焊参数的bp神经网络模型,而且所建的bp模型具有较高的精度,可以很好的描述了这三个点焊参数与点焊质量的映射关系。
3)由于神经网络模型将系统结构参数与传统动态特性参数之间的物理关系,反映为神经网络模型的网络输入与网络输出的数学关系,因此,在神经网络模型上进行结构修正与优化比在其他模型上更直接,简单与高效。
本文采用神经网络的方法优化复合消音锯片的点焊工艺参数,为分析点焊质量提供了很好的辅助手段。通过与以前工艺相比较,提高了点焊质量。
参考文献:
[1] 方平,熊丽云.点焊电流有效值神经网络实时计算方法研究.[j].机械工程学报,2004(11).148-152.
篇2
欧阳亮(1984―),女,湖南大学工商管理学院(长沙,410082)。研 究方向:金融工程与风险管理。
[关键词]汇率预测;汇率波动;神经网络
汇率作为一个重要的经济变量,其变动对国民收入的增减、工农业的发展、国内利率、就业 等各方面都有着重要的影响。因此,汇率预测受到广泛的关注,大量的计量经济模型和时间 序列模型被用于汇率预测。其中,人工神经网络(Artificial Neural Networks, ANN)作为 一种非参数的数据驱动型的方法,不需要对数据特征进行事先假设,通过合理的样本训练, 学习专家的经验、模拟专家的行为,并引入非线性转换函数来求解各种复杂的非线性问题, 具有很强的模式识别能力和高速信息处理能力,从而在时间序列数据预测方面有独特的优 势。[1]
利用神经网络方法预测汇率波动,国内外学者已经进行了比较广泛的研究。总结国内外学者 的研究成果,用神经网络预测汇率有3个层次。它们分别是同质神经网络模型、 异质神经网络模型和神经网络组合模型。
一、汇率预测的同质神经网络模型
同质神经网络预测模型是用神经网络根据历史汇率数据来预测未来汇率,这是作为一种汇 率预测的非参数方法提出来的。由于汇率波动具有非线性相关性和 长效记忆性,因此通过历史数据进行汇率预测是一种可行的方法。同质神经网络预测模型认 为;汇率有一个隐含的生成机制,历史汇率和未来的汇率都由这个机制生成,通过对历史数 据的观测,识别这个生成机 制,就可用这个生成机制预测未来的汇率。由于神经网络是一个数据驱动的自适应的非参数 方法,不基于假设,即使产生数据的过程是未知的,或者很复杂,神经网络也能识别。
用同质神经网络进行汇率预测,是根据汇率的历史数据加上输入延迟来预测汇率的变化或变 化趋势。用于汇率预测的神经网络模型很多,其中最常用的是多层后向神经网络模型,即BP 神经网络。BP神经网络一般采用三层结构:输入层、隐含层、输出层。BP神经网络的算法 和训练如图1。
以t时刻汇率种类R的预测为例,滞后期为n,预测长度为L。输入层的数据是从时刻t开始前n 期的历史汇率观测值序列,yt,…, yt-n,输入才由长度n的滑动窗口产生。输出层 依次输出从t时刻开始的L个汇率预测值,yt+1,…, yt+L。相邻汇率的时间间 隔是等长的。汇率预测的同质神经网络模型的结构如上图2。
用同质神经网络预测汇率的研究很多,1993年,Refenes等人采用神经网络方法预测汇率变 动,他们将数据分成训练组(Training Subsample)、测试组(Testing Subsample)和预测组( Forecasting Subsample),先用训练组和测试组数据训练神经网络,然后用预测组数据进行 预测,这种尝试以及随后的评议肯定了神经网络在一定的情况下比“标准”的预测方法表现 要好。[2]Kuan和Liu(1995)用神经网络对5个不同币种兑美元的汇率进行预测。这5 种货币包括英镑、加拿大元、德国马克、日元以及瑞士法郎。研究发现神经网络对日元和英 镑的预测的均方差(MSE)很低,但对其余3个币种的预测效果一般。[3]De Matos(19 94)通过对日元期货预测比较了多层后向神经网络(MLFN)和重复网络的预测效果。[4]Zhang和Hu(1998)用多层后向神经网络对英镑和美元的汇率进行预测,发现神经网络的预 测效果明显优于线性模型,尤其在预测期比较短的时候。[5]
虽然研究表明神经网络的预测效果比其他方法好,但是其预测精度和可靠性仍然不尽人意。 对此,学者们对神经网络进行了改进,提出了诸如聚类神经网络、重复神经网络、广义回归 神经网络、模糊神经网络等经改进的神经网络进行汇率预测,或者将其他方法与神经网络结 合,以改善神经网络的预测能力。例如,Shazly等(1999)用遗传算法训练神经网络的权值。 惠晓 峰和胡运权等(2002)结合遗传算法,提出了基于实数编码的GA-BP神经网络汇率预测人民币 兑美元汇率的模型。姚洪兴, 盛昭瀚和陈洪香(2002)提出了一种改进的小波神经网络结构。
这些研究在一定程度上提高了神经网络的预测效果,但是神经网络的结构、训练算法、阀值 函数的选择以及滞后期的确定等问题仍然难以解决。而且,汇率由历史汇率唯一决定这一 前提也缺乏足够的理论支持。
二、汇率预测的异质神经网络模型
用异质神经网络模型进行汇率预测,是指在预测过程中,考虑影响汇率的各种因素,如利率 、通货膨胀率、原油价格、货币供应、贸易收支差额、消费价格指数、消费信心指数等,根 据这些影响因素来预测汇率。Shazly(1997)选取一个月欧洲美元存款利率、一个月欧洲外币 存款利率、即期汇率 和一个月的远期汇率作为输入变量,预测一个月后的即期汇率。结果表明,神经网络的预测 效果比通过远期汇率进行的预测效果要好。[6]杨火斤 和马洪波(1999)选取GNP、CPI、工业股 票价格指数、短期利率、货币供应量、长期利率6个影响因素,将这些变量作为神经网络的 输入变量,训练神经网络根据这些变量预测汇率。[7]Hui Xiao-feng等(2005)也用 模糊神经网 络进行汇率预测,输入的变量包括两国的CPI和GDP、两国的利率差、货币供应比、净出口额 等。[8]
异质神经网络模型的网络结构和训练算法与同质神经网络相似。区别在于同质神经网络的输 入是一段时滞的历史汇率数据,是一维的数据,而异质神经网络的输入数据是多个变量的数 据,是二维的数据。令x1, x2,…, xn分别表示影响汇率变动的各个因素,异质神经 网络的结构如图3所示。
图3 异质神经网络模型
随着布雷顿森林体系的崩溃,各国纷纷采用浮动汇率制度,影响汇率变动的因素更加多样化 、复杂化,难以确定。因此,学者们开始用神经网络与其他预测方法结合使用。一种是与基 本因素分析模型如购买力平价模型、利率平价模型等相结合。根据这些模型确定的影响因素 作为神经网络的输入变量,通过神经网络训练优化变量的权值,从而进行汇率预测。例如, Qi和Wu(2003)用基于货币理论的神经网络对英镑和马克1个月、6个月、12个月的汇率进行预 测,输入变量为货币供应量M1,各个国家的实际工业生产收入、利率作为输入变量。Lee和W ong(2007)用微观结构理论和宏观经济的6个变量作为神经网络的输入,预测汇率波动。
另一种方法是用神经网络与协整方法结合。先通过协整分析确定影响汇率变动的因素,再用 神经网络确定各变量的权值。Inc和Trafalis(2006)构建了一个结合协整方法和人工神经网 络的汇率预测模型方法,先用协整方法确定对汇率有影响作用的变量,然后用ANN对这些变 量进行非线性组合,预测汇率。[9]
异质神经网络模型将汇率视为整体经济系统中的一个变量,汇率波动受众多因素的影响,因 此汇率的波动是根据这些影响因素的波动来预测的,与同质神经网络模型相比有更强的理论 支持。但是,它的预测效果取决于影响因素的选择,因此汇率的影响因素的选择是异质神经 网络预测模型的关键。
三、汇率预测的神经网络组合模型
神经网络进行汇率非线性组合预测是一个两步组合预测模型。Bates和Granger(1969)证明了 预测方法的线性组合比单模型能产生更小的误差。[10]此后,一些学者在这方面做 了很多研 究。在众多的组合方法中,神经网络非线性组合是最广泛使用的方法。Hu和Tsoukalas(1999 )用不同的GARCH模型预测条件波动,并对这些预测值分别进行线形和非线性组合,结果表明 用神经网络进行非线性组合的预测效果是最好的。[11]Tseng等(2002)用BP神经网 络和时间 序列模型――SARIMA模型进行组合,用SARMIA(Seasonal Autoregression Moving Integrat e Average)对汇率进行线性预测,再用神经网络处理SARMIA模型预测的残差,进行汇率预测 。[12]用同样的方法还有Zhang(2003)用ARIMA和ANN组和对英镑和美元汇率进行预 测。[13]Yu, Wang和Lai(2005)组合广义线性自回归模型(GLAR)和神经网络进行 汇率预测。[14]
用神经网络对汇率进行非线性组合预测时,是将汇率数据分解成线性部分和非线性部分。先 用基本因素模型或者参数模型对汇率进行第一步预测;然后用神经网络对第一步预测残差进 行非线性组合;再根据两步的预测结果进行汇率预测。或者用神经网络对不同的参数模型的 预测结果进行非线性组合。下面以神经网络和ARIMA模型的非线性组合为例,说明神经网络 组合模型的基本原理。
(3)用神经网络mode残差:[AKn^]t=f(et-1,et-2,…,et-n)[JY](4)
其中,f表示神经网络的预测的非线性函数,et是随机误差。
(4)组合ARIMA和神经网络:[AKy^]=[AKl^]+[AKn^]t[JY](5)
神经网络组合模型使用神经网络和线性方法进行非线性组合,考虑了汇率作为一个复杂系统 同时具有线性和非线性特征的实际,充分利用了参数方法和非参数方法的优势,并综合了各 种汇率理论的分析结果。大量的实际研究表明,组合预测的效果比单独用线性模型或单独用 神经网络预测的效果要好。
四、比较与结论
同质神经网络预测模型是根据历史数据进行汇率预测,是用一维的数据训练神经网络。它没 有 考虑汇率作为经济系统中的一个变量,受到众多因素的影响,而仅仅把汇率视为一系列没有 经济含义的无规则数据。而异质神经网络模型则把汇率视为复杂经济系统中的一个变量,认 为在统计上无规则的汇率数据是由众多因素共同决定的。异质神经网络模型用二维数据进行 训练,与同质神经网络模型相比,其预测有更充分的理论支持。但是,影响汇率的因素至今 没有定论也没有统一的选取法则。
同质神经网络预测模型和异质神经网络预测模型都将汇率视为单纯的非线性变化的时间序列 ,而实际汇率的波动不是单纯的线性或非线性的,而是同时包含线性和非线性模式,因此单 纯的线性模型和非线性模型都不能很好地预测汇率。而神经网络组合预测模型则与前两种方 法有本质的不同,它同时考虑了汇率的线性和非线性特征,在线性预测的基础上再进行非线 性组合,充分利用参数方法和非参数方法的优势。一方面,研究表明线性预测有很多效果很 好 的方法,如ARIMA,GARCH等参数模型;另一方面,这些模型都基于很强的假设条件,不同的 条 件下预测效果有很大差别。因此,在实际预测时候,很难确定某个模型比其他模型有更好的 样本外预测效果。最优模型的选择是件很困难的事情。用神经网络组合模型,避免了 最优模型选择的问题,又综合了不同的汇率理论的分析结果。
另外,同质神经网络预测模型和异质神经网络预测模型都是单模型的一步预测的方法,研究 表明单一的模型往往只能适应某一特定的情况或者反映一部分的信息,而实际汇率是一个复 杂的系统,组合不同的参数模型或者参数模型不同参数的预测结果,能够较大限度地利用各 种预测样本信息,比单个预测模型考虑的问题更系统、更全面,从而提高了预测的精度。
自2005年7月21日起,中国实行汇率改革以来,央行入市干预的力度明显减弱。由市场供求 关系决定的人 民币汇率受到众多因素的影响,波动幅度较以往明显加大。用神经网络组合模型对人民币汇 率进行预测,充分考虑了汇率波动的复杂性。结合线性方法和非线性方法的优势,能抓住汇 率波动的线性和非线性特征,并能全面挖掘和反映样本信息,有较好的样本外预测效果。因 此,神经网络组合模型是人民币汇率预测的最佳选择。
但是,用神经网络组合模型进行汇率预测也存在一些难以解决的问题。首先是神经网络自身 的优化问题,如隐藏层数及隐藏层结点数的确定、激活函数的确定、局部最优等,神经网络 的结构直接影响着预测效果。其次,在神经网络进行组合预测时,如何选择被组合的模型以 及模型的个数,是另外一个难以解决的问题。第三,神经网络可以根据残差最小的原则不断 地调整参数来改变预测效果,但是它不能改变输入数据,而汇率数据往往是剧烈波动,存在 噪音的。因此,如何对数据进行除噪,优化神经网络的输入数据是另一个值得研究的问题。
主要参考文献:
[1]Guoqiang Zhang, Eddy Patuwo, Michael Hu. Forecasting with artificialneural networks: The state of the art[J]. International Journal of Forecastin g, 1998, 14: 35-62.
[2]Refenes. Constructive learning and its application to currency excha nge rate forecasting. In: Neural networks in finance and investing: using artifi cial intelligence to improve real world performance, 1993, 465-493.
[3]CM Kuan, T Liu. Forecasting exchange rates using feedforward and rec urrent neural networks[J]. Journal of Applied Econometrics, 1995, 10(4): 347-6 4.
[4]De Matos. Neural networks for forecasting exchange rates: [disserta tion n]. Canada: The University of Manitoba, 1994.
[5]Gioqinang Zhang, Michael Y. Hu. Neural Network Forecasting of the Br itish Pound/US Dollar Exchange Rate[J]. Omega, Int. J. Mgmt Sci, 1998, 26(4):495-506.
[6]Mona R. El Shazly, Hassan E. El Shazly. Comparing the forecasting pe rformance of neural networks and forward exchange rates[J]. Journal of Multina tional Financial Management, 1997(7): 345-356.
[7]杨 火斤, 马洪波. 人工神经网络在中长 期汇率预侧中的应用[J]. 系统工程, 1999, 17(1): 18-24.
[8]HUI Xiao-feng, LI Zhe, WEl Qing-quan. Using fuzzy neural networks fo r RMB/USD real exchange rate forecasting[J]. Journal of Harbin Institute of Te chnology (New Series), 2005, 12(2): 189-192.
[9]Huseyin Ince, Theodore B. Trafalis. A hybrid model for exchange rateprediction[J]. Decision Support Systems, 2006, 42(10): 1054-1062.
[10]Bates JM, Granger CWJ. The combination of forecasts[J]. Operation s Research Quarterly, 1969, 20: 451-68.
[11]Michael Y. Hu, Christos Tsoukalas. Combining conditional volatilityforecasts using neural networks: an application to the EMS exchange rates[J].Journal of International Financial Markets, Institutions and Money, 1999, (9):407-422.
[12]Fang-Mei Tseng, Hsiao-Cheng Yub, Gwo-Hsiung Tzeng. Combining neuralnetwork model with seasonal time series ARIMA model[J]. Technological Forecas ting & Social Change, 2002, 69: 71-87.
[13]G peter Zhang. Time series forecasting using a hybrid ARIMA and neu ral network model[J]. Neuro computing, 2003, 50: 159-175.
[14]LeanYu, Shouyang Wang, K. K. Lai. A novel nonlinear ensemble foreca sting model incorporating GLAR and ANN for foreign exchange rates[J]. Computer s & Operations Research, 2005, 32: 2523-2541.
Forecasting Exchange Rate with ANN: A Comparative Anal ysis
Xie Chi1 Ouyang Liang2 Abstract:With the popularity of floating exchange rate system,a lot of methods with parameter and non-parameter are adopted to forecast the ex change rate, and ANN is one of them. There are three types of ANN for exchange r ate forecasting, namely the homogenous ANN model, the heterogeneous ANN model an d the hybrid ANN model. This paper researches on the three models, specificallytheir characteristics and limitations, and draw the conclusion that both ANN mod el give full consideration to the linearity and nonlinearity characters of the e xchange rate. The ANN model can offer better results in a more systematic and co mprehensive way, because it adopts the thoughts integrating the analysis of diff erent exchange rate theories, and broadly utilizes the forecast samples.
Key words:Exchange Rate Forecasting; Exchange Rate Fluctuation;ANN
篇3
Abstract: In order to further improve the ability of BP neural network fitting with complex functions, this paper further optimizes the genetic algorithm by changing the weights and threshold of BP neural network and applies this design model to the prediction system of vehicle sales. In order to compare its prediction effect with that of the traditional BP neural algorithm, this paper carries out the prediction simulation to compare the accuracies of the two. The simulation results show that the improved algorithm has better fitting ability and higher prediction precision for the data which has obvious linear correlation.
关键词:预测;神经网络;线性相关;遗传算法
Key words: prediction;neural network;linear correlation;genetic algorithm
中图分类号:F224 文献标识码:A 文章编号:1006-4311(2016)12-0074-04
0 引言
以时间序列预测汽车销量的方法在当今的预测汽车销售领域中占了绝大多数,比如我们所熟悉的有线性回归法、季节预测法[1]等等。线性回归法[2](如AR、MA、ARIMA模型等)能够体现销售量数据随时间变化的趋势,季节预测法能够有效地反映销售量随季节波动的特点。然而,除了汽车市场的内部影响因素之外,汽车销售量还受到市场环境变化等外部因素影响,如经济危机、限购政策、油价上涨、小排量购置税优惠政策等等[3]。在常见的预测模型中对非线性因素的处理方法存在着“自身的缺陷”,比如在外部因素引起市场一定的波动时,仅仅是靠时间序列模型的预测方法则很难做到精确。因此,在有效地收集、分析、掌握外部因素信息的基础上,将这些因素甄别和量化,反映到整个预测过程中,提高预测模型可使用的总体信息量,提高预测模型的预测质量,尤其在当市场环境有变化的情况之下,销售预测精确性将会获得较大的提高,并且更加趋近合理。
1 系统模型
1.1 系统分析
在不同的系统分析中,我们有时会采取不同的算法,每个算法都有各自的优势。遗传算法、BP神经网络和多元回归等算法也有着不同的优点[4],如遗传算法的全局寻优性, BP神经网络的优秀学习能力,从而避免了它们在各自单独使用时所存在的不足。我们把数据分为两个部分:线性相关和非线性相关,对这两部分采取相关性分析法进行处理。紧接着,充分利用BP神经网络与多元回归在处理数据方面的优势,分次处理数据的非线性和线性部分;最后,利用遗传算法所拥有的特性,即寻优特性,将已由BP神经网络和多元回归算法处理的数据整合在一起,最终的目的是使各项值得到进一步优化,如多元回归的权值、BP神经网络的连接权值以及阈值。
在这里,我们先暂定待处理的数据为DATA,DATA中包含的记录条数为U条。DATA的第k个记录含有M+N个自变量,记为X 其中:
k∈{1,2,…U},i∈{1,2,…M+N};1个因变量(期望值),记为Yk其中k∈{1,2,…U}。
1.2 相关性分析
当我们要判定如国民收入和居民储蓄存款或者身高和体重,这些变量之间的关系时,我们首先会去判定这两个变量或两个数据集合间是否存在线性相关时,这里就引出了我们所要用到的判定相关系数Pearson[5]。Pearson相关系数的作用最重要的是用来判定定距变量间的线性关系和两个数据集合是否在一条线上。某些情况下我们会用到Pearson简单相关系数r。其计算公式为:
我们根据所得r的数值来判断两者相关度的强弱。一般说来,当相关系数的绝对值越大或者相关系数越接近于1或-1的情况下,相关度是越来越强的;而相关系数越趋近于0,相关度就会变得越来越弱。
若相关系数r>0.6,认定自变量Xi与Y线性相关,否则为线性不相关。根据文献[6]可知,本文研究的BP神经网络中,输入数据Xi i∈{1,2,…N}与输出数据Y在Xi i∈{1,2…N}与Y线性相关,在Xi i∈{N+1,N+2…N+M}与Y线性不相关。
1.3 BP神经网络
输入层、输出层和隐含层[6]是BP神经网络的三个组成部分,其中输入层和输出层各一个,而对于隐含层,在理论上,它的数量是不会受到任何限制的,但BP神经网络在一般情况下仅设置一个或者两个隐含层。在这个神经网络中,输入信号经过作用函数的作用之后,在其信号传至隐层节点之时随即把它得到的输出信号传递到输出层节点上,同样经过处理后而得到的输出便是最终的结果。作用函数S型函数在本文中的节点之间会被用到,它的计算公式为:f(x)= 。
本文构建的神经网络模型如图1所示。
由图1可知,我们这个神经网络模型共有四层。模型的第一层X即是输入层,它是以非线性相关的Xi i∈{N+1,N+2…N+M}的数据作为其输入的;神经网络包括的两个隐含层分别是第二层J和第三层I;神经网络模型的输出层就是第四层BY。例如图1上的J层第1节点,当它和第I层的第2个节点连接时,权值的计算值则为W 。如若模型采用的节点作用函数为f(x)= ,则可以得到该节点的输出为Y =f( W Y -B )。该式中W 、Y 和B 分别表示某一节点与其上层节点之间的连接权值、上层各节点的输出值和节点的阈值。根据公式:E=(t-BY)*BY(1-BY),它表示的含义是网络误差的计算,在式中t的含义是输出的期望值。将网络误差与最大允许误差进行比较:
BP神经网络在模式匹配、模式分类、模式识别和预测分析等方面[7],性能优势十分明显。
虽然BP算法是网络结构中应用比较普遍的算法之一,而且BP算法在应用上也取得了一定的成功,但是BP算法本身还是存在着不可避免的局限性:
①在BP神经网络算法中,它为了不使加权值过大,通常选取较小的随机数(如0~0.2之间)作为初始权值,同时设置网络在初始阶段就处于S型函数的饱和区,就是在这样给定初值的范围内,有些取值也会使算法的结果值陷入局部极小,一旦有了某些局部极小点[8]的牵累,就会引起训练的振荡而达不到我们所想要的稳定,同样也会陷入局部极值的不利情况。
②在BP算法中,我们需要设置一些参数的初始值,以便网络训练得以进行。如初始权重值,隐层节点个数值,当我们在设置没有任何参考时,可能会致使网络训练的失败或者说执行的并不如我们所预料的结果那样,与理想有所差别。但是这些参数的选取过程又缺乏严格的理论依据,需要根据我们过往的经验以及一定的实验来选取,才可保证它的选取值合适与否。
③在BP算法中,它存在一个遗忘所学样本的趋势,就是在每当其输入一个的权重值时,会导致阈值不断地修改,所以前面已学的学习样本必然会受到后面每次所输入样本的影响。
2 一种BP神经网络和线性回归优化的遗传杂合算法
为了实现网络训练的过程并得到全局相应的最优化的解,我们提出一种基于BP神经网络和线性回归优化的遗传杂合算法。在文章的前面我们知道,传统的BP神经的学习过程存在一些不足,我们提出的这种算法会把BP神经网络和遗传算法结合起来,利用遗传算法的全局寻优特性,来实现网络的训练,得到全局相应的最优解。改进的算法模型如图2。
待处理数据Xi i∈{1,2…N}和Y,我们假定两者是呈线性相关的。首先对线性不相关数据进行BP神经网络处理输出为BY,BY与存在线性相关的数据进行多元线性回归。
模型误差:
2.1 改进算法模型的遗传优化
在生物进化机制的搜索方法中有自然选择和自然遗传,而本文改进的遗传算法就是基于这些内容的。现如今有一种算法正趋于发展成为自适应启发式概率性迭代式全局搜索算法[9]。某个优化问题的解集,也就是它的搜索空间,并且映射搜索空间为遗传空间。我们随机产生的一组初始解,在遗传算法中称作此初始解为群体,它所产生的后代中不断地传下去并且一代一代地进化,我们称之为遗传。我们找到收敛为最佳的染色体,即是最优解。
将以上改进的遗传优化算法运用到BP神经网络的权重、阈值以及回归系数上,可以达到优化这些参数的目的,使网络误差值最小。在本文的实验中,由生物种群的概念,我们视BP神经网络和回归系数的所有权值为一个种群。本文的实验是基于遗传代数1000、种群60所进行的遗传算法优化训练过程。即为图3所示过程。
2.2 算法详细流程
①样本值归一化处理。
对原始样本值X,Y按照公式X′= -1,Y′= -1归一化处理作为模型输入数据,归一化处理后数据在[-1,1]之间。式中X′、Y′为归一化后的数值,Ymin、Xmin为原始数据最小值,Ymax、Ymax为原始数据最大值。
②参数集。
将模型中待优化参数BP网络权重W 、阈值B 与回归系数?孜组成一个参数集C={W ,B ,?孜},C作为染色体,Ci为单个基因。
③编码。
编码方式中有一种称为实数编码的,它是指个体编码的长度与决策变量的个数相等,在合理具体的条件范围内,用一个实数表示某个体的每个基因值。该方法中用到的值是决策变量的真实值,因此我们又称它为:真值编码方法。考虑我们实验过程所需要的算法,这种编码方式对于我们的实验十分合适。
④初始化种群。
种群大小N=60,随机生成第一代个体C 其中t为代数t=1,i表示个体编号i∈{1,…, },C 表示第一代的第五个个体。
⑤个体适应度。
我们以f =Emax-E(C )为个体适应度函数,能够满足我们的要求。式中f 表示第t代的第i个个体的适应度计算值,Emax为最大系统误差,E(C )为C 个体的系统误差。
⑥选择操作。
在试验中我们需要知道选择概率值,所以由前公式f =Emax-E(C )和公式P = 两者结合便可以计算出选择概率。我们在pop(t)代中根据所计算得到的概率值随机的选择一部分个体染色体遗传到下一代,为pop(t+1)代。将选择出的个体染色体暂且称为一个中间代mespop(t),并将其作为下面遗传操作(交叉、变异)的对象。
⑦交叉算法。
我们先假设要交叉的两个父体对象分别为Pi=(p ,
⑧变异算法。
在选择交叉的遗传过程中,我们也需要考虑到遗传变异这一情况。所以我们采取了一种特殊的变异算法:边界变异。它在遗传的后代种群中选择中间代mespop(t)代,又在其中选择N对个体,当交叉概率为Pc时,以此概率值指导个体进行遗传变异。边界变异的取值方法的多样性也正是后代种群群体多样性的特点。其变异位的值往往是在它的边界上,因为在边界上,通常存在着许多约束优化的最优值,也就是其编码位取值范围的边界之一。在中间代mespop(t)完成交叉和变异所形成的下一代中pop(t+1)进行个体适应度值计算的操作。
3 仿真结果和分析
仿真实验中,分别采用多元线性回归、传统BP神经网络和本实验算法对多元线性方程、多元非线性方程、含有线性和非线性部分的方程进行拟合。
多元线性方程:
多元非线性方程:
含有线性和非线性部分的方程:
3.1 样本数据
样本输入数据是在考虑影响汽车销售多方面因素的前提下,如:经济危机、限购政策、油价上涨、小排量购置税优惠政策等,在Matlab平台下拟合而成。样本输入数据为xi∈[-1,1],样本总数为20,随机生成20组数据作为样本值(图4)。
选用第一行到第四行作为式(8)的输入函数值,如图5。
选用第一行到第二行作为式(9)的输入函数值,如图6。
选用第一行到第二行作为式(10)的输入函数值,如图7。
3.2 仿真结果
式(8)多元线性回归、BP神经网络、改进算法仿真结果(图8)。
式(9)多元线性回归、BP神经网络、改进算法仿真结果(图9)。
式(10)多元线性回归、BP神经网络、改进算法仿真结果(图10)。
多元线性回归、BP神经网络、改进算法拟合三种方程误差平方和如表1所示。
3.3 仿真结果分析
由结合改进算法的特点和对比分析所得到的实验结果,我们可以得到以下三点结论:①多元线性回归在拟合线性方程时所产生的误差比较小,而在拟合非线性方程时,产生的误差略大。②BP神经网络在拟合存在非线性数据时,误差较小,在拟合线性方程时存在明显的不足。③三种算法在拟合非线性和线性结合方程时,本实验的误差要比单纯拟合非线性方程小很多,与理论预期明显相悖。对于这种情况的原因,结合理论,本文总结出可能存在的两小点:1)数据的输入值范围在[-1,1],范围太小,对函数值得影响不显著;2)由于实验采用拟合函数的形式,函数关系内部过于简单。
4 结论
用改进算法拟合复杂函数的能力比单纯依靠线性回归和BP神经网络存在明显的优势。影响商品销售的因素有很多,各种因素对销售的影响也各不相同,传统的BP神经算法可以很好的预测效果。但是BP算法在处理那些同销售值存在较大相关性的因素时,不能突出它的优势。我们通过把影响销售较大的因素与其他因素直接加权相加得到销售值,最后通过遗传算法来优化权值。这也就是我们研究本文算法的目的之所在。
参考文献:
[1]张彦铎,李哲靖,鲁统伟.机器人世界杯足球锦标赛中多机器人对目标协同定位算法的改进[J].武汉工程大学学报,2013(02):69.
篇4
关键词:电力系统; 短期负荷预测; 预测方法; 实际应用
随着计算机应用技术与电力系统短期负荷预测快速发展,在自组织灰色神经网络的非线性动力学性质,主要采用动力学系统理论来分析电力系统短期负荷预测自组织灰色神经网络的演化过程和吸引子的性质,促进自组织灰色神经网络的协同行为和集体计算功能和电力系统短期负荷预测以及电力系统发电计划的重要组成部分,也是电力系统经济运行的基础管理。促进国家电网运行的安全性、稳定性及经济性,优化电能质量控制及准确的优化电力系统短期负荷预测效果。因此,在电力系统短期负荷预测的关键是提高定位精确度。在当前电力发展迅速和供应紧张的情况下,合理优化电力系统短期负荷预测也是我国实现电力市场的必备条件,具有重要的自组织灰色神经网络中的实用价值。
1 大规模电力系统短期负荷预测原理研究
短期负荷预测包括两方面的含义对未来需求量的预测和未来用电量的预测。电力需求量的预测决定发电、输电、配电系统新增容量的大小;电能预测决定发电设备的类型。短期负荷预测的目的就是提供短期负荷发展状况及水平,同时确定各供电区、各规划年供用电量、供用电最大短期负荷和规划地区总的短期负荷发展水平,确定各规划年用电短期负荷构成不同的预测目的,短期负荷预测可分为超短期、短期和中长期的预测。一般说来,一小时以内的短期负荷预测为超短期负荷预测,用于安全监视、预防性控制和紧急状态处理;日短期负荷和周短期负荷预测为短期负荷预测,分别用于安排日调度计划和周调度计划和月至年的短期负荷预测为中期短期负荷预测,主要确定电网的运行方式和设备大修计划。
1.1 大规模电力系统短期负荷预测中的基于电力系统调度中的研究
短期负荷预测是电力系统调度、实时控制、运行计划和发展规划的前提,是一个电网调度部门和规划部门所必须具有的基本信息。提高短期负荷预测技术水平,有利于计划用电管理,有利于合理安排电网运行方式和机组检修计划,有利于节煤、节油和降低发电成本,有利于制定合理的电源建设规划,有利于提高电力系统的经济效益和社会效益。因此,短期负荷预测已成为实现电力系统管理现代化的重要内容。随着首都经济社会的快速发展和人民生活水平的不提高,电力需求持续快速增长,在度冬、度夏及特殊天气日,极易出现极端短期负荷。在这种情况,为了进一步优化输电和配电等运行方式安排,提高电网运行的安全性和经济性,改善供电质量,保证社会的正常生产和生活,提高经济效益和社会效益,将短期负荷预测作为电网调度机构的一项极其重要的工作。短期负荷预测的结果是电力系统运行的基础数据,其精度直接影响运行的安全性和经济性。因此,提高预测精度也是每个短期负荷预测人员追求的最高目标。根据不同的预测目的,短期负荷预测可分为超短期、短期和中长期的预报。
2大规模自组织灰色神经网络中的基于自组织灰色系统方法研究
自组织灰色神经网络中的电力系统短期负荷预测是既含有已知的确切的信息又含有未知的非确切的信息的系统。如果将影响短期负荷的各种复杂因素联合起来看成一个集成大系统,那么它兼有确定性和不确定性,本征性和非本征性自组织灰色系统特征。实际的短期负荷历史资料能够清晰的显示出其自组织灰色系统特征,年月日的短期负荷既有逐年增长趋势确定的一面,同时又有每年每月每日短期负荷随机变化的不确定性的一面。自组织灰色系统理论可以用少量的数据做微分方程建立起预测的模型,从理论上可以使用于任何非线性的短期负荷预测。将一定范围内变化的历史短期负荷数据列进行累加,使其变成具有指数增长规律的新数列,然后就生成的新数列建立自组织灰色模型,最后通过累减生成得到短期负荷预测值。对于具有波动性变化的电力短期负荷,可以建立等维新息自组织灰色预测模型,有效提高预测精度。
2.1大规模自组织灰色神经网络中的基于自组织灰色短期负荷预测模型研究
随着自组织灰色神经网络模型是指利用神经网络良好的非线性映射能力来求解GM(1,1)模型的自组织灰色微分方程,优化自组织灰色电力系统短期预测负荷模型研究(如图一)。
(图一)
GM(1,1)模型的自组织灰色短期负荷预测微分方程为:(1)
其解是时间响应模型,用离散形式可表示为:(2)
图一中,BP网络隐层B的传递函数取为S型函数:(3)
其它各层的传递函数为线性函数:(4)
对(2)式可进行如下变换:
(5)
设偏置值,是电力系统短期负荷中的神经元的权值,k为短期负荷预测网络输入,设,则该自组织灰色短期负荷预测模型的网络参数为:
(6)
启用自组织灰色神经网络短期负荷预测模型权值的来不断修正相当于对参数a、u的不断修正和完善电力系统短期负荷预测。该模型能够解决求解参数a、u算法的缺陷问题。
3 结束语
综合上述自组织灰色神经网络搭建的电力系统短期负荷预测模型学习方法和数据样本,使自组织灰色神经网络就可以据此生成相应的权系数矩阵控制系统,进而实现期望目标输出。因此,一旦给定了经过训练的权系数矩阵和短期负荷预测自组织灰色神经网络的拓扑结构,就可以对被测点进行短期负荷预测[1]。但BP网络学习、记忆的不稳定性以及较慢的学习速度却影响着它的进一步普及,实践证明,自组织灰色神经网络有能力优化电力系统短期负荷预测应用研究。
参考文献:
[1]于繁华,刘仁云.计算智能技术及其工程应用[M].北京:科学出版社,2010.6
[2]施彦等.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009.12
[3]牛东晓.电力短期负荷预测技术及其应用[M].北京:中国电力出版社,2009,6.
[4]罗云霞、李燕.电力系统基础[M].郑州:黄河水利出版社,2009,1.
篇5
关键词:期货;主成分分析;RBF神经网络;预测
1引言
在对实际问题进行描述和处理中,为了能够获得更加全面的信息,我们经常需要统计多个变量的数据。但是这些多个变量之间经常存在一定的相关性,并不是每个变量都是我们所需要的,或者说它们携带的信息可能是重复的。因此我们希望用少数几个变量来代替原有的多个变量。主成份分析法的基本思想就是通过对原始数据的降维,将多个相互关联的变量转化为少数几个互不相干的变量的统计方法。
由于期货价格的变化是一个非线性的时间序列,利用传统的统计方法对期货的价格直接进行预测,所得到的结果不是很理想。而神经网络在非线性模式中具有优势,因而它不需要建立复杂的数学模型就可以完成期货价格预测。基于BP网络和RBF网络的预测都有较好的结果,但是相对BP网络而言,利用RBF神经网络不仅解决了常用BP网络易陷入局部最小的问题,而且训练时间更短,预测的精度也比BP网络高得多。本文提出使用基于主成分分析法的RBF神经网络方法对期货价格进行预测。通过主成分分析法对原始数据降维,然后,再用这些个数较少的新输入变量作为RBF神经网络的输入进行模拟预测。由于主成分之间是相互独立的,所以由各主成分组成的输入空间不存在自相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度。
2主成分分析法简介及RBF神经网络算法概述
2.1主成分分析法
主成分分析法的步骤如下:
(1)原始数据的标准化处理。
主成分分析法的目的就是使用较少的变量代替并综合反映原来较多的信息,综合后的变量就是原来多变量的主要成分,利用这些综合后的主要成分去代替原来的变量去解决实际问题。这里首先利用以下公式对原始变量进行标准化处理。其中原变量为xij,其含义为第j个变量的第i个值,则处理后的变量值为yij,
(3)计算矩阵R的特征根和特征向量。
利用R的特征方程|R-λi|=0求出其特征根,其对应的特征向量利用|R-λi|A=0和AA''''=1求得。然后对所求得的特征根按照大小顺序进行排列。
(4)计算方差贡献率与累计方差贡献率。
利用公式Ki=λi/∑ni=1代入所求的特征根λi,求出各个主成分的贡献率Ki,其贡献率就代表了原数据信息量的百分比。
(5)确定主成分计算其得分值。
主成分的确定方法主要有两种:(1)当前K个主成分的累计贡献率达到某一特定值的时,则保留前K个主成分。一般采用超过85%以上。(2)选取特征值大于1的主成分。这两种可视情况进行选取,一般前者取得主成分要多,后者要少,通常情况下是将两者结合一起来进行使用。
2.2RBF神经网络算法概述
径向基(RBF)网络是以函数逼近理论为基础构造的一类向前网络。其网络结构为三层,隐含层采用高斯函数为激励函数,理论上,只要隐含层中有足够的径向基神经元,径向基函数网络就可以逼近任何非线性函数。输出层为简单的线性加权函数,其网络结构如图所示。
其中W1i为每个隐含层神经元与输入层相连的权值向量,Xq为输入矢量,b1i为阈值。则隐含层的第i个神经元的输入为:
kqi=j(w1ji-xqj)2×b1i
输出为:
rqi=exp((-kqi)2)=exp(-(||w1ji-Xq||×b1i)2)
输出层的输入则为各隐含层神经元的加权求和。由于激励函数为线性函数,因此输出为:
yq=∑ni=1ri×w22
RBF网络首先通过无教师学习确定训练输入层与隐含层间的权值w2。再通过有教师学习,确定训练隐含层与输出层间的权值w1i。在RBF网络训练中,隐含神经元的数量确定是一个关键的问题。其基本原理是从0个神经元开始训练,通过检查输出误差使网络自动增加神经元。每次循环使用,使网络产生的最大误差所对应的输入向量作为权值向量w1i,产生一个新的隐含层神经元,然后检查新网络的误差,重复此过程直到达到误差要求或最大隐含层神经元为止。由此可见,径向基函数网络具有结构自适应确定、输出与初始权值无关等特点。
3改进的RBF神经网络对期货价格的实例预测
3.1主成分分析
期货的价格是受很多因素影响,如国家政策、季节气候、供求关系、战争等,所以其价格会上下波动,呈现出一个非线性时间序列。其交易价格本文选取2007年6月7日至8月29日燃油0801每个交易日的开盘价、最高价、最低价、收盘价、交易量、持仓量、前5日均价、前10日均价为初始变量,每个变量60个数据,前59个为训练样本,最后一个为检测样本。考虑到期货交易与股票交易的不同,其交易方式是双向交易,从投资者获利的角度考虑,其并不像股票市场一样单纯的考虑股票价格增长,加上每个星期正常的期货交易日仅为5天,所以在这里我们考虑选取后5日均价作为预测目标,这样的选择更有实际意义。在这里本文直接利用SPSS软件包,选择数据降维,再选用主成分分析,可以直接得到各个主成分的方差累计贡献率,如表1所示:
从表中我们可以看出,第一个主成分主要包含了开盘价、最高价、最低价、收盘价、以及前5日均价共五个变量的信息,第二个主成分主要包含了成交量和持仓量两个变量的信息,而第三个主成分则主要包含了前十日均价一个变量的信息。由此可以看出,通过数据降维,将原来的8个变量,转化为现在的3个变量了。
3.2神经网络的设计及训练
现设计一个三层的神经网络,输入层有3个神经元,输出层神经元为1个。利用下式对输入、输出值进行标准化,可使得输入、输出值其均落在[-1,1]区间。
xn=2*(x-minx)/(maxx-minx)-1
在matlab的神经网络工具箱中用newrb函数设计这个径向基函数网络,用其作函数逼近时,可自动增加隐含层神经元,直到达到均方误差为止,利用语句:net=newrb(P,T,GOAL,SPREAD)进行网络设计,其中GOAL为均方误差,这里取值为0.0001,SPREAD为径向基函数的扩展速度,其值越大,函数的拟合就越平滑。经过试验,当其取0.058时,其预测效果最好。把2007年6月7日至8月28日的燃油0801选定的主成分作为输入的训练样本,标准化的后5日均价的值作为输出的训练样本,8月29日的数据作为测试样本,计算结果如下:
4结语
由此可看出基于主成分分析法的径向基神经网络较一般的径向基网络有更简洁的网络结构,对于相对比较复杂的期货价格预测,基于主成分分析法的径向基神经网络得到的结果也更加精确。不过径向基神经网络本身对扩展速度的选择没有一个固定的标准,不同的值得到的结果有较大的偏差,这是该网络的一个缺陷,也是今后研究的一个方向。
参考文献
[1]黄颖,白玫,李自珍.基于主成分-BP神经网络的期货市场预测[J].数学的实践与认识.2007,(7):23-26.
[2]刘兴彬,万发祥.RBF神经网络主成分分析法在交通量预测中的应用[J].山西科技,2001,(1):54-56.
篇6
随着我国社会主义现代化建设不断加快发展的过程中,城市化进程在不断的推进,而作为我国国民经济中最为重要的电力发展的建设开始迎来了新的挑战和压力,尤其是随着电力规模的不断扩大,建设的周期延长以及范围的不断加大,都给电力工程的造价带来了巨大的挑战。在这样的发展趋势下,为了有效让电力建设的发展具有一定的安全性保障,并在可行性的工程造价的顺利开展下,通过数据挖掘和神经网络技术的应用,来促进我国电力建设的发展。本文也将从这两个方面的技术应用来展开较为系统的分析。
【关键词】
数据挖掘;神经网络技术;电力工程造价;应用分析
随着科学技术的发展,经济全球化的趋势,数据挖掘已经在全世界范围内得到了广泛的关注和应用,并得以快速发展起来,而其中最根本的原因在于全球化的科学信息技术的发展和快速世界化的感染和流行,使得互联网技术在几年内瞬间发展起来,造成了数据过量和信息膨胀的现象,因此人们在这种形势下,急需要通过一种新型的技术来对这些信息进行处理,通过筛选和提取最有效、最有价值的部分出来,因此数据挖掘起到了重要作用,而在电力工程的造价应用,通过数据挖掘和神经网络技术,实现了其更加系统化的发展。
1数据挖掘的定义
数据挖掘的源起与发展可追溯回到20世纪80年代。这种数据的挖掘从不同的角度理解,有不同的含义,而其实最主要的意思是把海量综合性的数据通过挖掘出最有用、最有效的模式和知识的一个过程,并通过这种数据的挖掘来对未知的潜在的内容进行提取。因此从广义上来将,这种数据挖掘的定义是一个从不完整的、不明确的、大量的并且包含噪声,具有很大随机性的实际应用数据中,提取出隐含其中、事先未被人们获知、却潜在有用的知识或模式的过程。这个过程事实上也即是数据挖掘的最根本目的,对复杂而混乱的信息进行分析和处理,并提取最有用的知识和信息给决策者。另一方面,从技术角度而言,数据挖掘的实现是借助一整套全面的数据计算,实现对海量数据信息的提取过程,并使得这部分被提取出来的信息是对人们在概念、模式以及规律等方面是最有价值的。它的这种技术操作主要是对历史数据信息的分析,并把隐藏在潜在中的数据和关系分析挖掘出来,从而提供给人们对未来可能发生的结果起到协助分析研究的作用。
2通过神经网络技术建立数据模型
神经网络技术的实现,是通过这种技术来对人的大脑所具有的结构和功能进行模拟化,并达到具有模式识别的计算模型,其组成部分包括了隐层节点、输入节点以及输出节点三个部分。而关于隐层的部分,组成可是一层或多层的形式,一个神经网络的组成包括了非常多的成层排列的节点,数字信息的传输就依靠这些节点的存在。输入信号,最有特点的神经网络是采用一个输入层和输入层以及位于中层的很多节点而组成起来的,并每个节点把输入的信息作非线性处理后,然后把输出的数字化结构传送到另外的节点,从而反复循环下去,就通过多个节点的作用函数之间的共同功能的发挥来得到最终的结果。
3数据挖掘与神经网络技术的电力工程造价中的应用
3.1对历史数据的搜集和整理
对数据和资料的搜集工作,主要有电力系统的内部资料内容,以及在互联网技术的帮助下所搜寻获取到的数据资料,而且包括在持续一周左右的时间被研究用电地区的电力负荷所使用的历史数据信息,并对所进行搜集的该地区的时间天气情况、气温高低、湿度大小以及是否是工作日的信息内容。然后将这些搜集到的信息资料进行汇总整合,然后筛选出预测所要求的数据和信息内容。在这个过程中,需要注意的是,筛选数据要选择与当前时间最接近,而且具有较安全和可靠的数据来源,只有这样才能从根本上确保电力负荷预测的质量,才能达到电力负荷预测要求的准确度,从而使得所建立的负荷预测模型的使用更加合理,才能真正表现出电力负荷数据的有效规律。
3.2对历史电力负荷数据的预处理
在大多数情况下,负荷预测所得到的结果在质量上与所选用资料和数学的质量相比较,并没有绝对的优势,因此如果所搜集的数据要进行负荷预测模型的这部分数据则要通过预处理的过程才能确保数据的质量。而这种预处理除了通过比较老式的人工审核的办法以外,还可以通过数据的挖掘来提高对数据处理的工作效率和质量,并对数据中存在的异常值进行及时的发现和处理修改,这也是一种为工作人员在出现部分数据的疏漏时进行填补的作用。
3.3建立负荷预测模型来进行负荷数据的预测
为了有效而准确的测出负荷数据,可通过建立负荷预测的模型,这种模型的种类较为多,包括人工神经网络模型、专家系统模型等,但到底使用哪种模型来对数据进行预测才能达到预期的预测效果和质量,还需要通过慎重选择才能实现。
3.4对预测结果的误差分析
一个短期的电力负荷预测模型如果已经建立完成,那么要判断其预期的效果是否有效和准确,那么就要对这种预测模型的预测结果进行误差分析即可。这种误差的分析是因为预测模型的输出结果相似于预测日的负荷值,因此利用这种与真实数据之间的差值进行误差的大小确立起预测结果是否准确有效。另外一方面,不仅如此,还可以在这种误差分析的作用下,来对预测工作和预测的方法积累更多的实用性的经验。尤其是在我国电力改革在快速发展的状态下,电网的运作方式已经开始从各个方面包括规划、建设、规模以及范围都发生了改变,所以要求电网建设要具备更加规范化和科学合理化的标准进行更进一步的发展和完善,并在当前科学技术的支持作用下,引入科学的管理理念、先进的数据分析方法以及信息化技术,在技术的不断推动应用下,让人们对相关数据信息的获取量更多。所以,在预测数据方面的技术还需要不断得到更加深入的发展,才能为我国的电力建设提供更加有力的帮助。
3.5数据挖掘与神经网络技术的电力造价应用总结
在电力造价的应用过程中,其数据挖掘和神经应用的技术应用实现了对电力数据结果、运行速度之间的关联性,并对我国的电力建设发挥着重要的积极意义。而通过数据挖掘和神经网络技术的造价预测模型的建立,得出了更加多元化的输入和输出,这反映除了在电力工程造价过程中的多元非线性映射问题,所以通过模糊的神经网络来实现对电力工程造价的核心计算办法。在神经网络的技术应用下,实现了数据信息的搜集和筛选,但实质上这个神经网络的推理筛选过程还有一定的无法确切的解释。而模糊系统则通过逻辑推理和专业领域的知识让技术的应用更加具有一种指向性。基于神经网络的模糊系统能够综合两者的优点,有效的通过这种数据挖掘和神经网络技术的应用,提高了互联网技术应用的容错性和泛化能力,并提高了模型建立的有效性。
4结束语
综上所述,在我国的电力工程造价预测和改革发展的过程中,数据挖掘以及神经网络技术在其中起到了不可替代的关键性作用,并为了电力建设的发展带来了非常实用性的价值。通过数据挖掘技术来对大量的综合信息数据进行预处理和筛选,来达到数据信息所能起到的最大的作用,并在神经网络技术对所创建的专业模型的应用,让人工预测和审查的被动性得到了解决,并提高了电力工程造价过程中人为因素的消极影响,而更好的保障了信息结果的有效性。
作者:刘勇华 单位:广东汇盈电力工程有限公司
参考文献
[1]欧阳子才.数据挖掘和神经网络技术的电力工程造价应用[J].中华民居,2013,18(21):279~280.
篇7
(浙江交通技师学院,浙江金华321015)
摘要:基于预测控制算法的动态矩阵控制理论,改进得到了算法模型的误差相关矩阵,给出约束多变量DMC模型以及神经网络误差补偿的动态矩阵控制验证,在误差控制仿真验证中,应用神经网络误差补偿的预测控制效果优势明显,这一研究对模糊预测技术的进一步推广应用有一定的促进作用。
关键词 :动态矩阵控制;预测模型;神经网络;误差补偿
中图分类号:TN711?34 文献标识码:A 文章编号:1004?373X(2015)15?0087?03
收稿日期:2015?01?28
0 引言
随着社会经济进步与技术手段的不断创新,复杂系统的控制技术已经成为国内外控制科学研究者的重点研究话题之一。对大型的工业设备而言,控制主要体现为对系统的非线性和环境的不可控性的控制,而且受实际环境影响,各种技术性的约束问题也越来越明显。这些问题都使得控制技术在实际工业生产中的地位不断得到提升。而近年来国内外科学家一致推崇的模糊预测控制法[1?2]就是一种新的控制技术和手段。模糊预测控制是一种结合了模糊思想和预测思想的具体研究方法和手段,并且在现实应用中得到了一定程度的普及和提升。将模糊控制和技术手段相联系有利于提高控制效果。同时,预测作为一种较为传统和较为典型的控制方法,有利于更好地搭建二者沟通的桥梁。同时,预测控制是一种基于数学对象模型的优化控制方法,但是在实践中发现,系统的复杂性和精确性往往是负相关关系。一般而言,较为复杂的系统,难免影响到其精确性的实现,因此,要研究模糊环境下的预测控制技术手段的应用,以及其对拓展空间应用范围和提高其适应不同环境使用能力的重要意义。
通过实地走访和查阅相关学术资料总结得出:模糊预测的控制技术主要分为两大类别[3?4]:一是针对确定性不强的非线性系统;二是模糊预测和预测控制方法的结合使用。实践证明,前者有利于实现模糊模型和预测模型的相互转化,后者能够实现系统性能的总体提升[5?7]。基于这一背景,本文将重点分析基于神经网络预测控制模型的误差补偿控制手段,并进一步分析其使用机理和数学建模过程。相信这一研究对模糊预测技术的进一步推广应用有一定的促进作用。
1 预测模型设计
1.1 预测控制算法概述
预测控制算法究其本质,是一种以模型算法为基础,采用先进计算机手段进行具体计算的控制算法。这种算法的实际理论体系建立在离散控制系统基础之上。预测控制需要当前和过去的差距值,也需要应用一些现有的预测模型,以更好地对未来的运行进行预测与控制[8?10]。
模型控制作为一种基于脉冲响应而进行参考的模型具有很大的现实意义,并且是一种较为优良的内部模型。这种控制手段具体应用到了系统往期和现期的实际输入输出数据,从而代入相关模型中去,以更好地进行模型的预测和控制。这个过程是一个很复杂的过程,需要使用模型的误差衡量和校正系统,并与参考值进行具体比较,从而得出相关结论。而且,在这个过程中,需要使用二次型指标的具体计算,实现算法的多步骤控制。这个系统具有诸多优点,因此在电厂、化工厂等领域有较为广阔的使用前景。
动态矩阵控制(DMC)是一种有别于模型算法的新型算法结构。这种控制手段借助于工程上的一些具体手段,通过对运算量的缩减,以达到多变量控制的目的和预期。这个技术于20世纪70年代在美国壳牌公司率先使用,经实践检验证明有很大的作用。目前,已经有以该项技术为手段的商品化软件在市面上出售,销量很大。因此,动态矩阵控制也成为一种具有很大发展前景和潜力的线性模型。
在参数和非参数模型的使用下,有两种具体的算法可以进行使用。这两种算法的具体内容限于篇幅不做过多阐述。这两种方法都采用了多部输出预测和混动控制的相关策略,因此变得十分复杂。这个系统的原理是在20世纪80年代由Carcaia等人提出的,并且在实践中证明有效。而且,内部模型控制的理论和实践的发展,极大地促进了输出反馈扰动估计值的计算和反馈,从而实现对系统的合理预测与评估,进而提高系统的使用效率。
1.2 DMC优化模型设计
DMC 优化模型设计是一种较为方便的算法,在优化确定策略的具体使用中有广阔的空间和巨大的发展前景。这个算法的具体数学表达式如下:
式(1)表达的含义就是在选择的时刻上,通过增量的计算以实现对系统未来时刻的输出值的控制与预测。而且,通过这个技术的使用,能够尽可能地使输出值与预期值相近,从而避免因为数据的过大差异而导致一系列后续问题。再有,性能指标中对控制变量变化量的控制程度相对较强,这样处理的目的十分明确,就是要控制量的变化在一个可预见的范围内,不能超过太多。
虽然,不一样的时间段范围内有不一样的优化指标,但是各个指标的相对形式总体上是一致而不变的,即都具有式(1)的模式。这里介绍一下滚动优化的含义:滚动优化就是随着时间的推移而促进优化范围的深入与扩大。
如果考虑将向量和矩阵参与到运算中,则可以得到:
进而,有:
式中:Q,R 分别称为误差权矩阵和控制权矩阵。
如果将约束条件放宽,取最小的ΔuM (k) 可通过极值条件得到:
1.3 约束多变量DMC设计
对约束条件下的多变量DMC 设计而言,当具体的参数范围给定以后,结合具体的参数含义,可以计算得到阶段相应模型,即:
由式(4)进而推出下式:
根据数学知识(尤其是导数求解函数极值的相关内容),可以计算得到:
式中: Gij 和G 0ij 分别为P × M 和P × (N - 1) 阶矩阵,其元素由gsij (s = 1,2,…,N) 决定;hi 为P 维校正列向量,而:
将ΔUj (k) 化成全量形式,有:
1.4 设计动态矩阵控制仿真效果
对上述的动态矩阵控制仿真模型,应用数学模型可以简化记为:
式中:系统a(k) 是慢时变的,a(k) = 1.2(1 - 0.8e-0.1k) ,输入指令信号为:rin (k) = 10。由图1控制效果可知,设计的预测控制模型显然是合理有效的。
2 基于神经网络误差补偿的动态矩阵控制
基于神经网络误差补偿的动态矩阵控制是一种BP技术手段模型,而且能够反映出网络和计算之间的误差值:
式中:tpi 为i 节点的期望输出值;opi 为i 节点计算输出值。
基于BP 神经网络模型的基本原理,应用其在DMC,基于篇幅这里对其理论不进行详细描述。应用控制对象的近似数学模型为:
神经网络的结构选择,学习速度η = 0.5 和惯性系数α = 0.5,输入指令信号为rin (k) = 10。
图2 给出了上述模型的预测模型,从图中效果可知,其余实际输出基本类似,表明了这一模型的可用性。
3 控制模型效果的验证
为了进一步验证BP误差补偿的预测控制仿真程序效果,这里对异性控制对象进行进一步验证:y(k) = 1.5y(k - 1) - 0.7y(k - 2) + u(k - 1) + 1.5u(k - 2),控制信号为方波。
图3和图4分别为一般DMC控制和应用BP预测模型误差补偿效果,通过对比验证了这一模型的合理性与优越性。
4 结语
本文在原有动态矩阵预测控制的基础上,利用预测误差的历史数据建立误差预测模型的神经网络,经过实际对比以及相应的效果对比误差的预测器,在得到误差预测值的同时,实现了更简单的数学模型来构造动态矩阵预测控制算法,使得对模型失配具有较强的抑制能力,以上仿真结果验证了该算法的有效性。本文的这一研究对预测算法的进一步发展具有重要意义和应用价值。
参考文献
[1] 王家祥,何信.误差补偿和时滞辨识预测控制算法[J].电子科技大学学报,2005(6):817?820.
[2] 庞中华,金元郁.基于误差校正的预测控制算法综述[J].化工自动化及仪表,2005(2):1?4.
[3] 庞中华.广义预测控制算法及其仿真研究[D].青岛:青岛科技大学,2005.
[4] 李超.网络控制系统研究与设计[D].北京:华北电力大学,2012.
[5] 张杰超.预测控制在网络化自动发电控制系统中的应用研究[D].北京:华北电力大学,2008.
[6] 庄玲燕.基于预测控制理论的网络控制系统设计[D].杭州:浙江工业大学,2009.
[7] 张译江.神经网络方法在预测控制中的研究[D].无锡:江南大学,2011.
[8] 李肖.基于预测控制的网络控制系统时延补偿控制策略研究[D].济南:济南大学,2011.
[9] 刘俊红,李擎,张维存,等.一种采用神经网络进行预测误差补偿的DMC 算法[J].中南大学学报:自然科学版,2007,38(z):27?31.
篇8
【关键词】钻井机械 故障诊断 数据挖掘系统结构
数据的挖掘技术是采用一些技术由比较大型的数据库或者是仓库里面找到比较有价值的信息与知识,而这些信息与知识大多数的时候都是隐藏的。这些有价值的信息或是知识可以通过概念、条例以及规律等方式来进行表示。
1 数据的挖掘方式与钻井设备故障判断的含义
1.1 设备故障的判断技术
设备故障的判断技术主要是为了测量提取设备在运转中或者是处在静止状态中的信息,经过测量后信号的分析与研究,再将判断对象的以往情况相结合,从而通过订立设备的设备和零件的实际技术的情况,预测与故障状况相关的技术情况,再找到解决问题的措施。
1.2 数据挖掘的技术
数据的挖掘技术是采用一些技术由比较大型的数据库或者是仓库里面找到比较有价值的信息与知识,而这些信息与知识大多数的时候都是隐藏的。这些有价值的信息或是知识可以通过概念、条例以及规律等方式来进行表示。经过很多年数据挖掘的技术研究,用在数据的集中分析与提取的信息。从整体来说,数据挖掘的技术主要包括两种类型:探索性的数据挖掘与预测型的数据挖掘。探索性的数据挖掘技术主要是在不知道又什么模式出现的状况中通过数据来找寻模型的技术,主要包含了分群与管理的分析,频度的分析等,而预测型的挖掘技术主要是通过数据来找寻一定的变量和跟别的变量关系的技术。预测型的挖掘技术通常使用的是分类与聚类的技术,数值的预测技术。数据挖掘的技术所采用的计算方式有很多种,其中包含了统计方面的分析、设备的学习等。
2 钻井设备故障的判断数据挖掘体系的结构
钻井器械的故障判断数据挖掘体系可以提供一些访问安放钻井器械与故障数值的数据库、平面的文件和一些外部的接口。通过使用接口,数据挖掘的工具能够经过很多的途径来得到所需要的数据。进行数据的提取时,一定要对数据实行预期的处理,为了确保在数据库中寻找数据正确与统一。
挖掘库主要是数据挖掘的工具中的中心环节,在挖掘库里放置的使用数据挖掘的技术实行的钻井故障判断所需要数据、计算库以及信息库。计算库是用作储存放置能够实行的挖掘计算的方法门信息库是用作储存并且能够进行合理管理通过挖掘的引擎所形成的,通过模块明确评估的信息。数据挖掘的引擎主要通过规范的引导,全面地采用各种数据挖掘的工具,针对数据来源的至少实行整体的研究与深层次的发掘,采取有实际意义的方式,并且对评估的模块实行评估。
挖掘的截面是用作挖掘时候的交互与挖掘完成的可视性。经过交互让使用者对挖掘的程序实行了控制,如,挖掘的命令、对数据的挑选、数据的输入和计算方法的使用等。数据挖掘使用者并不是电子设备与数据库的专业技术工作者,他们是维护工作者。所以,为了使用者的方面操作,系统一定要提供比较合理的界面。通过时间的展开、空间的分辨以及运动发展等一些方式给使用者提供挖掘的结果。
3 根据神经网络对钻井器械故障判断的研究
3.1 神经网络的模型
神经网络是比较新型模拟人智能的一种方式与技术。跟以往的研究方式与专家体系不一样,它不但能够解决好已经知道的计算方式问题,还能够经过自身的组织与学习解决未知技术方式的问题。进行钻井设备故障的判断过程里,使用四层的神经网络,学习计算方法是误差的反方向的传播计算方式,也就是BP计算方法。
3.2 构建神经网络
如果系统简单的判断模型只有六种故障的特点,两种故障以及三种威胁的方式,对网络训练的例子需要挑选出比较适合钻井机械并且好符合以下的三方面的信息:
(1)故障的特点:对待每一个特点只需要收集有、无和没有记录的三种类型;
(2)故障:对于每一种故障也只可以收集有、无和没有记录的三种类型;
(3)维修的方法:对于每一种维修方法都只需要收集是或否两种类型。
3.3 根据神经网络进行推理
根据神经的网络推理是经过网络的技术来实行。将使用者所给出的原始证据用来输入网络,经过网络进行计算,从而获得输出的结果。
4 钻井机械故障判断
因为地处具有复杂和隐蔽性,而钻井机械的搬迁的频率也比较大,户外的工作环境也很恶劣等特征,钻井机械故障的判断难度就会随之而增加。故障判断的本质就是进行故障特点与原因分析,从故障特点来推理出来产生故障的原因,从而明确故障的种类,找到解决的方案。
在没有进行挖掘计算方法前,实行了多维的分析,经过人与计算机交换的操作,使用者可以在整个搜索的空间里控制搜索的程序,并且可以获得模式,最后产生知识。如,如果钻井机械的故障特点是由钻井的数据苦等数据里面通过计算而获得的钻井及其或者产生故障的时候故障的特点。
5 总结
综上所述,通过对钻井机械故障判断的数据挖掘系统结构的分析,主要阐述了数据挖掘系统与钻井机械故障的含义,数据挖掘系统的结构以及钻井机械故障判断的分析和研究等问题。主要是采用了数据的挖掘方式,分析一些比较复杂的有关钻井方面的机械故障判断问题,并且给出了有关钻井设备故障的判断有关数据挖掘的结构,还分析了钻井设备故障判断的网络,提供了可以供参考的系统模型。
参考文献
[1] 张允,张宁生,刘茜,宁刚.钻井机械故障诊断数据挖掘系统结构的研究[J].石油学报,2006,27(1)
[2] Olivia Parr Rud.数据挖掘实践[M].机械工业出版社,2003:1-5
[3] 杜家兴,徐宗昌,王铁宁.装备保障数据仓库与数据挖掘研究[J].计算机工程与应用,2004,40(9)
篇9
关键词:多变量财务预期模型 实证 比较分析
一、引言
随着我国市场经济体制改革的不断深化和资本市场的快速发展,现代企业由于外部市场竞争的加剧和内部经营管理的不善,不少公司也出现了财务危机。为了在激烈的市场竞争中求生存谋发展,企业有必要对其自身的财务状况进行预警分析,以应对各方面的风险,并防范财务危机的发生。
到目前为止,企业财务预警的研究已经积累了丰富的研究成果,即建立了多种财务预警模型对企业财务危机进行预测,并且已做了大量的实证研究。财务预警模型有单变量财务预警模型和多变量财务预警模型,但由于单变量财务预警模型只对单个财务比率的趋势分析,没有哪一个比率能够概括企业财务的全貌;另外,某些财务比率有可能被公司管理者进行过粉饰,单一的依靠某一比率做出的预测不一定可靠。因此,多变量财务预警模型逐步取代单变量财务预警模型成为广泛应用的模型。虽然多种多变量财务预警模型为现代企业预测财务状况提供了多种选择,但由于每种模型有其各自的前提条件以及模型自身的特点,这使得从众多模型中挑选出一种最具代表性的模型的可能性大大降低了。基于此,本文就国内外学者对各种多变量财务预警模型的实证研究情况进行总结和比较。通过对多种多变量财务预警模型的实证情况进行比较,一方面可以充分展示我国财务预警实证研究的发展状况;另一方面对我国财务预警实证研究存在的问题进行总结,就财务预警实证研究的未来发展方向提出建议。此外,也为多变量财务预警模型的相关使用者选择一种适合自己的预警模型提供了依据。
二、多变量财务预警模型的基本原理
国内外常用的多变量财务预警模型主要有以下四类:
2.1多元线性判定模型
多元判定模型中最著名的模型是美国 Altman(1968)的Z分数模型:Z=0.12XI+0.14X2+0.033X3+0.006X4+0.001X5,其中x1、x2、x3、x4、x5是五个财务指标。根据判别方程可以把单个企业的各种财务比率转换成单一的判别标准,或称为Z值,根据Z值将企业分为“破产”或“非破产”两类。国内学者周首华等(1996)以Altman的Z分数模型为基础构建了F分数模型,该模型加入了现金流量预测指标体系。
2.2主成分模型
该模型是国内学者张爱民等(2000)借鉴Altman的多元z值判定模型,运用统计学的主成分分析方法建立的。其主要思想是:通过对原始的财务指标相关矩阵内部结构关系的研究,找出影响上市公司的财务状况的几个综合指标,即主成分,使综合指标为原始指标的线性组合,综合指标不仅保留了原始指标的主要信息,彼此又完全不相关,同时比原始指标具有某些更优越的性质。该模型的差别方程式为:PS=V1Z1+V2Z2+V3Z3+V4Z4+V5Z5,其中,V1、V2、V3、V4、V5是系数,Z1、Z2、Z3、Z4、Z5是综合指标。
2.3多元回归模型
多元回归模型包括Logistic回归模型和Probit回归模型。Martin(1977)在财务危机预警研究中首次采用了多元逻辑回归模型。该模型假设企业破产的概率为P(破产取1,非破产取0),并假设Ln[ P/(1-P)]可以用财务比率线性解释。假定Ln[P/(1-P)]=a+bx,推导得出P=exp( a+bx)/[ 1+exp(a+bx)],从而计算出企业破产的概率。判别规则是: 如果 P>0.5,则判定企业为即将破产类型;如果P<0.5,则判定企业财务正常。Probit模型和Logistic模型相似。
2.4人工神经网络模型(ANN)
1990年Odom和Sharda第一次运用神经网络进行财务困境预测问题的探索。该模型由输入层、输出层和隐藏层组成,通过网络的学习和数据的修正得出期望输出,然后根据学习得出的判别规则来分类。
三、多变量财务预警模型的应用
目前传统的统计模型发展得比较成熟,计算也相对简单,应用也较为广泛。Z分数模型主要用于信用政策、信贷评审、贷款定价以及证券化等方面。主成分模型也相对简单可行,可以在实践中广泛运用,但该模型有一个明显的缺陷,即综合评分式权重的确定以及判定区间的确定都具有较大的主观性和不准确性,尤其是后者受样本数据分布的影响很大,从而会影响预测的准确度。Logistic模型与Probit模型的最大优点就是不需要严格的假设条件,克服了线性方程受统计假设约束的局限性,因而具有更广泛的适用范围。而对于人工神经网络模型,从理论上来讲,该模型应具有广泛的应用前景和应用价值,但在实际运用中却存在这样一些问题,如模型结构定义的复杂性、计算量过于巨大,而且其在决策方法中表现得像一个黑匣子,以致对它的接受和应用都较困难。另外,这种模型要求拥有大量的学习训练样本以供分析,如果样本数量积累得不足、没有足够的代表性和广泛的覆盖面,则会大大地影响系统的分析和预测结果。
四、多变量财务预警模型实证比较分析
4.1前提条件比较分析
在研究财务预警模型的过程中首先应该考虑各种模型适用的前提条件。多元判定模型和主成分模型通常形成一个线性判定函数式,据此判断待判企业的归属,一般要求数据服从正态分布和两组样本间协方差矩阵相等。Logistic模型和Probit模型均是为了克服简单线性概率模型的缺陷而建立起来的,一般采用最大似然估计方法进行估计,不需要满足正态分布和两组样本协方差矩阵相等的条件,得出的结论直接表示企业发生财务失败的可能性的大小。人工神经网络模型则对财务指标的分布没有特别的要求特别适合于变量服从未知分布,且自变量组间协方差矩阵不相等的情况。
4.2样本和数据选取的比较分析
财务危机预警的国内外研究者由于国情不同、研究目的不同,对财务危机含义的界定有所区别:国外学者大都以提出破产申请的企业作为研究对象;而国内学者则以沪、深两市因“财务状况异常”而被ST的上市公司作为研究对象。#p#分页标题#e#
国外的研究学者通常采用比较样本建模,即选择相同数量的破产企业和非破产企业。Altman(1968)则选取了33家1946~1964年间破产的且资产规模在70~2 590万美元之间企业和相同数量、同一行业、同等资产规模的非破产企业作为样本企业,数据来自《Moody的行业手册》。我国学者则大部分是选择近几年的ST公司和相应的非ST公司作为研究样本,其数据大部分来源于均来自上市公司公布的财务报表。如吴世农、卢贤义(2001)则选择了1998~2000年期间的70家ST上市公司和相对应的70家非ST公司作为研究样本。
4.3财务指标选取的比较分析
国外学者Altman(1968)选取了5个具有代表的会计比率类财务指标,构建了Z分数模型,他认为这些财务变量是评价企业总体财务状况的最佳指标。国内学者周首华(1996)的F分数模型是在Z分数模型的基础上加入了现金流量这一预测指标,证明在短期内许多公司财务危机和现金流断裂有直接关系。张爱民(2000)的主成分分析模型以及杨淑娥、徐伟刚(2003)运用主成分分析方法构建的Y分数模型中也仅涉及到会计比率类财务指标。直到2004年,张友棠引入了现金盈利值(CFV)与现金增加值(CAV)这两个现在指标概念,虽然这两个指标并未得到后来学者们的广泛使用,但这一思想深刻地影响着后来的学者们。在随后的绝大多数文献中就开始出现了现金流量类指标的身影,并且在越来越多的文献中占据主要地位。
Marttin(1977)首次构建多元逻辑回归模型时也只选取了25个财务比率。随后,Ohlson(1980)采用Logistic回归模型时,不仅以现金流量指标为基础,而且加入了非财务类指标,即公司规模、资本结构、业绩和当前的变现能力。随着财务预警研究与应用成果逐渐引入国内,基于非财务指标的财务预警思想也同时传入国内,非财务指标是在2004年后大量出现的,并且越来越多学者的研究表明非财务类指标与会计比率类指标和现金流量类指标相结合建立的预警指标体系,能够很大程度地提高预警模型的预测精度。国内学者杨保安(2001)首次应用人工神经网络模型时,只考虑了会计比率类的财务指标,杨淑娥等学者在研究人工神经网络模型时则加入了现金流量类指标。
从上述文献来看,在研究初期,学者们都只注重会计比率类的财务指标,但指标选取并非与模型是匹配的,而是随着研究的发展指标选取也在不断的进行完善,加进了现金流量类指标和非财务类指标,使模型能够更加准确预测现代企业的财务状况。
4.4模型预测准确度的比较分析
Altman(1994)以意大利工业企业为样本,比较了神经网络方法与线性判别方法,发现有时神经网络方法要优于线性判别方法,但由于神经网络有时过度训练产生了不合理的权重,从总体上看线性判别方法要优于神经网络方法。陈瑜(2000)对运用主成分分析、回归分析与判别分析对证券市场ST公司进行财务危机预测,结果表明:主成分分析方法的预测效果最好,回归分析法的预测效果次之,判别分析法的预测能力则随着年份的临近,正确性逐步提高。吴世农、卢贤义(2001)通过应用Fisher线性判定分析、多元线性回归分析和Logistic回归分析三种方法,分别建立三种预测财务困境的模型,并比较三种判定模型的效果,表明Logistic模型的判定准确性最高。乔卓等(2002)通过对Fisher判别模型、Logistic回归模型以及神经网络模型在财务困境预测中的比较研究,发现提前2年和提前3年神经网络模型的预测精度明显高于Logistic模型和Fisher判别分析模型。杨淑娥、黄礼(2005)分别采用BP人工神经网络工具和主成分分析法建立财务预警模型,并且对同一建模样本和检验样本进行预测,BP人工神经网络模型的预测精确度相比主成分分析模型的精确度有很大的提高。吕长江等(2005)分别运用多元判别分析、逻辑线性回归和人工神经网络对财务状况处于困境的公司进行预测比较分析。结果表明:三个主流模型均能在公司发生财务困境前1年和前2—3年较好地进行预测。其中,多元判别分析要逊色于逻辑线性回归,人工神经网络的预测准确率最高。
通过以上的比较,人工神经网络模型的预测能力要优于统计模型的预测能力,而要统计模型中,主成分模型的预测能力最优,回归模型次之,多元线性判别模型相对较差。然而,财务预警模型的优劣不能光凭预测能力的高低来判定,因为各种模型的适用的前提条件是有差异的。
五、结论与启示
综观国内外文献,财务预警研究对多变量财务预警模型的运用主要集中在以上几种模型上,其中人工神经网络模型在理论上是预测能力最强的模型,但在实务中应用却有诸多的问题,相比之下,统计模型简单可行,有更广泛的适用性。多变量财务预警模型只是为相关使用者提供一种预测财务风险并归避风险的方法,而不是强调模型本身的精妙性。加之,财务预警模型只是用财务报表进行财务预警,而不能对财务报告的真伪进行鉴别,很有可能对失真的财务报告进行预警,进而使预测结果发生偏差。因此,对财务预警的研究应该与财务失真的研究相结合,以提高财务预警预测的精确度。
参考文献:
[1]Altman E.I. Financial Ratio, Discriminate Analysis and the Prediction of Corporate Bankruptcy [J].Journal of Finance,1968,23(9).
[2]周首华. 论财务危机的预警分析—F分数模式[J]. 会计研究,1996,8.
[3]张爱民,祝春山,许丹健.上市公司财务失败的主成分预测模型及其实证研究[J].金融研究,2001(3).
[4]Martin D. Early Warning of Bank Failure:A Logistic Regression Approach [J]. Journal of Banking and Finance,1977(7).
[5]Odom M.D and Sharda R. A Neural Network Model for Bankruptcy Prediction. In Proceedings of the International Joint Conference on Neural Network Tool [J]. Financial Management,1990,2(6).
[6]吴世农、卢贤义. 我国上市公司财务困境的预测模型研究[J].经济研究,2001(6).
[7]杨淑娥,徐伟刚.上市公司财务预警模型——Y分数模型的实证研究[J].中国软科学,2003(1).
[8]杨保安,季海,徐晶等.BP神经网络在企业财务危机预警之应用[J].预测,2001(2).#p#分页标题#e#
篇10
关键词:模糊神经网络;扩展卡尔曼滤波;自组织学习
doi:10.3969/j.issn.1001-3695.2010.07.016
fast self-organizing learning algorithm based on ekf for fuzzy neural network
zhou shang-bo,liu yu-jiong
(college of computer science, chongqing university, chongqing 400044, china)
abstract:to construct an effective fuzzy neural network, this paper presented a self-organizing learning algorithm based on extended kalman filter for fuzzy neural network. in the algorithm, the network grew rules according to the proposed growing criteria without pruning, speeding up the online learning process.all the free parameters were updated by the extended kalman filter approach and the robustness of the network was obviously enhanced. the simulation results show that the proposed algorithm can achieve fast learning speed, high approximation precision and generation capability.
key words:fuzzy neural network; extended kalman filter(ekf); self-organizing learning
模糊神经网络起源于20世纪80年代后期的日本,由于其简单、实用,已经被广泛应用在工业控制、系统辨识、模式识别、数据挖掘等许多领域[1~4]。然而,如何从可用的数据集和专家知识中获取合适的规则数仍然是一个尚未解决的问题。为了获取模糊规则,研究人员提出了不同的算法,如文献[5]利用正交最小二乘算法确定径向基函数的中心,但是该算法训练速度比较慢;文献[6]提出了基于径向基函数的自适应模糊系统,其算法使用了分层自组织学习策略,但是逼近精度低。扩展卡尔曼滤波(ekf)算法作为一种非线性更新算法,在神经网络中得到了广泛应用。文献[7]利用扩展卡尔曼滤波算法调整多层感知器的权值,文献[8]利用扩展卡尔曼滤波算法调整径向基函数网络的权值。
本文提出了一种模糊神经网络的快速自组织学习算法(sfnn)。该算法基于无须修剪过程的生长准则增加模糊规则,加速了网络学习过程,同时使用ekf调整网络的参数。在该算法中,模糊神经网络结构不是预先设定的,而是在学习过程中动态变化的,即在学习开始前没有一条模糊规则,在学习过程中逐渐增加模糊规则。与传统的模糊神经网络学习算法相比,本算法所得到的模糊规则数并不会随着输入变量的增加而呈指数增长,特别是本算法无须领域的专家知识就可以实现对系统的自动建模及抽取模糊规则。当然,如果设计者是领域专家,其知识也可以直接用于系统设计。本算法所得到的模糊神经网络具有结构小、避免出现过拟合现象等特点。
1 sfnn的结构
本文采用与文献[9]相似的网络结构,如图1所示。其中,r是输入变量个数;xi(i=1,2,…,r)是输入语言变量;y是系统的输出;mfij是第i个输入变量的第j个隶属函数;rj表示第j条模糊规则;wj是第j条规则的结果参数;u是系统总的规则数。
下面是对该网络各层含义的详细描述。
第一层:输入层。每个节点代表一个输入语言变量。
第二层:隶属函数层。每个节点代表一个隶属函数,隶属函数采用如下的高斯函数:
μij=exp(-(xi-cij)2σ2ij);i=1,2,…,r; j=1,2,…,u(1)
其中:r是输入变量数;u是隶属函数个数,也代表系统的总规则数;μij是xi的第j个高斯隶属函数;cij是xi的第j个高斯隶属函数的中心;σij是xi的第j个高斯隶属函数的宽度。
第三层:t-范数层。每个节点代表一个可能的模糊规则的if-部分,也代表一个rbf单元,该层节点个数反映了模糊规则数。如果计算每个规则触发权的t-范数算子是乘法,则在第三层中第j条规则rj的输出为
φj=exp(-ri=1(xi-cij)2σ2ij);j=1,2,…,u(2)
第四层:输出层。该层每个节点代表一个输出变量,该输出是所有输入变量的叠加。
y(x)=uj=1wjφj(3)
其中:y是网络的输出;wj是then-部分。
2 sfnn的学习算法
如前文所述,第三层的每个节点代表一个可能的模糊规则的if-部分或者一个rbf单元。如果需要辨识系统的模糊规则数,则不能预先选择模糊神经网络的结构。于是,本文提出一种新的学习算法,该算法可以自动确定系统的模糊规则并能达到系统的特定性能。
2.1 模糊规则的产生准则
在模糊神经网络中,如果模糊规则数太多,不仅增加系统的复杂性,而且增加计算负担和降低网络的泛化能力;如果规则数太少,系统将不能完全包含输入/输出状态空间,将降低网络的性能。是否加入新的模糊规则取决于系统误差、可容纳边界和误差下降率三个重要因素。
2.1.1 系统误差
误差判据:对于第i个观测数据(xi,ti),其中xi是输入向量,ti是期望输出,由式(3)计算网络现有结构的全部输出yi。
定义:ei=ti-yi;i=1,2,…,n(4)
如果ei>ke ke=max[emax×βi,emin](5)
则说明网络现有结构的性能比较差,要考虑增加一条新的规则;否则,不生成新规则。其中:ke是根据网络期望的精度预先选择的值;emax是预定义的最大误差;emin是期望的输出精度;β(0<β<1)是收敛因子。
2.1.2 可容纳边界
从某种意义上来讲,模糊神经网络结构的学习是对输入空间的高效划分。模糊神经网络的性能和结构与输入隶属函数紧密相关。本文使用的是高斯隶属函数,高斯函数输出随着与中心距离的增加而单调递减。当输入变量采用高斯隶属函数时,则认为整个输入空间由一系列高斯隶属函数所划分。如果某个新样本位于某个已存在的高斯隶属函数覆盖范围内,则该新样本可以用已存在的高斯隶属函数表示,不需要网络生成新的高斯单元。
可容纳边界:对于第i个观测数据(xi,ti),计算第i个输入值xi与已有rbf单元的中心cj之间的距离di(j),即
di(j)=xi-cj;i=1,2,…,n; j=1,2,…,u(6)
其中:u是现有的模糊规则或rbf单元的数量。令
di,min=arg min(di(j))(7)
如果di,min>kd,kd=max[dmax×γi,dmin](8)
则说明已存在的输入隶属函数不能有效地划分输入空间。因此,需要增加一条新的模糊规则,否则,观测数据可以由已存在的距离它最近的rbf单元表示。其中:kd是可容纳边界的有效半径;dmax是输入空间的最大长度;dmin是所关心的最小长度;γ(0<γ<1)是衰减因子。
2.1.3 误差下降率
传统的学习算法把误差减少率(err)[5]用于网络生长后的修剪过程,算法会因为修剪过程而增加计算负担,降低学习速度。本文把误差减少率用于生长过程形成一种新的生长准则,算法无须经过修剪过程,从而加速网络的学习过程。
给定n个输入/输出数据对(xi,ti),t=1,2,…,n,把式(3)看做线性回归模型的一种特殊情况,该线性回归模型为
t(i)=uj=1hj(i)θj+ε(i)(9)
式(9)可简写为
d=hθ+e(10)
d=tt∈rn是期望输出,h=φt∈rn×u是回归量,θ=wt∈ru是权值向量,并且假设e∈rn是与回归量不相关的误差向量。
对于矩阵φ,如果它的行数大于列数,通过qr分解:
h=pq(11)
可把h变换成一组正交基向量集p=[p1,p2,…,pu]∈rn×u,其维数与h的维数相同,各列向量构成正交基,q∈ru×u是一个上三角矩阵。通过这一变换,有可能从每一基向量计算每一个分量对期望输出能量的贡献。把式(11)代入式(10)可得
d=pqθ+e=pg+e(12)
g的线性最小二乘解为g=(ptp)-1ptd,或
gk=ptkdptkpk;k=1,2,…,u(13)
q和θ满足下面的方程:
qθ=g(14)
当k≠l时,pk和pl正交,d的平方和由式(15)给出:
dtd=uk=1g2kptkpk+ete(15)
去掉均值后,d的方差由式(16)给出:
n-1dtd=n-1uk=1g2kptkpk+n-1ete(16)
由式(16)可以看到,n-1uk=1g2kptkpk是由回归量pk所造成的期望输出方差的一部分。因此,pk的误差下降率可以定义如下:
errk=g2kptkpkdtd,1≤k≤u(17)
把式(13)代入式(17)可得
errk=(ptkd)2ptkpkdtd,1≤k≤u(18)
式(18)为寻找重要回归量子集提供了一种简单而有效的方法,其意义在于errk揭示了pk和d的相似性。errk值越大,表示pk和d的相似度越大,且pk对于输出影响越显著。利用err定义泛化因子(gf),gf可以检验算法的泛化能力,并进一步简化和加速学习过程。定义:
gf=uk=1errk(19)
如果gf
2.2 参数调整
需要注意的是,不管是新生成的隐节点还是已存在的隐节点,都需要对网络参数进行调整。传统的方法是使用lls[10]方法对网络参数进行调整,本文提出使用ekf方法调节网络的参数。由于lls方法在确定最优参数时计算简单、速度快,但该方法对噪声敏感,其学习速度随着信噪比的增加而下降。另外,与lls方法相关的问题是其求解可能是病态的,这使得参数估计变得很困难。ekf方法由于其自适应过程比较复杂,计算速度没有lls方法快,但是ekf方法在噪声环境下具有鲁棒性,使用ekf方法可以实现一种健壮的在线学习算法。网络参数可以用下面的ekf[11]方法进行调整。事实上,网络的参数向量θ可以看做一个非线性系统的状态,并用下面的方程描述:
θi=θi-1
ti=h(θi-1,xi)+ei(20)
在当前的估计值i-1处将非线性函数h(θi-1,xi)展开,则状态模型可以重写为
θi=θi-1
ti=hiθi-1+εi+ei(21)
其中:εi=h(i-1 ,xi)-hii-1+ρi。hi是如下的梯度向量:
hi=h(θ,xi)θ|θ=i-1 (22)
参数向量θ使用下面的扩展卡尔曼滤波算法更新:
ki=pi-1hti[hipi-1hti+ri]-1
θi=θi-1+ki(ti-h(θi-1,xi))
pi=pi-1-kihipi-1+qi(23)
其中:ki是卡尔曼增益矩阵;pi是逼近误差方差阵;ri是量测噪声方差阵;qi是过程噪声方差阵。
全局扩展卡尔曼滤波算法会涉及大型矩阵运算,增加计算负担,因此可以将全局问题划分为一系列子问题从而简化全局方法。网络的前件部分具有非线性特性,利用扩展卡尔曼滤波算法对其进行调整;网络的后件部分具有线性特性,利用卡尔曼滤波算法对其进行调整,该方法等同于将全局方法简化为一系列解耦方法,可以降低计算负担。由于高斯函数的中心对系统的性能影响不明显,为了简化计算,只对高斯隶属函数的宽度进行调整。
前件参数使用如下的扩展卡尔曼滤波算法更新:
kδi=pδi-1gti[ri+gipδi-1gti]-1
δi=δi-1+kδi(ti-wi-1φi)
pδi=pδi-1-kδigipδi-1+qi(24)
后件参数使用如下的卡尔曼滤波算法更新:
kwi=pwi-1φti[ri+φipwi-1φti]-1
wi=wi-1+kwi(ti-wi-1φi)
pwi=pwi-1-kwiφipwi-1+qi(25)
2.3 模糊规则的增加过程
在sfnn学习算法中,模糊规则增加过程如下:
a)初始参数分配。当得到第一个观测数据(x1,t1) 时,此时的网络还没有建立起来,因此这个数据将被选为第一条模糊规则:c0=x0,δ1=δ0,w1=t1。其中δ0是预先设定的常数。
b)生长过程。当得到第i个观测数据(xi,ti)时,假设在第三层中已存在u个隐含神经元,根据式(4)(7)和(19),分别计算ei、di,min、gf。如果
ei>ke,di,min>kd,且gf
则增加一个新的隐含神经元。其中ke、kd分别在式(5)和(8)中给出。新增加的隐含神经元的中心、宽度和权值赋值为:cu+1=xi,δu+1=k0di,min,wu+1=ei,其中k0(k0>1)是重叠因子。
c)参数调整。当增加新神经元后,所有已有神经元的参数通过式(24)(25)描述的算法调整。
3 仿真研究
时间序列预测在解决许多实际问题中是非常重要的。它在经济预测、信号处理等很多领域都得到了广泛应用。
本文采用的时间序列由mackey-glass差分延迟方程产生,其方程定义为[5]
x(t+1)=(1-a)x(t)+bx(t-τ)1+x10(t-τ)(27)
为了能够与文献[5,6]在相同的基础上进行比较,取值δt=p=6,式(27)中的参数选择为:a=0.1,b=0.2,τ=17。预测模型表示为
x(t+6)=f[x(t),x(t-6),x(t-12),x(t-18)](28)
为了获得时间序列,利用式(27)生成2 000个数据,式(27)的初始条件为:x(0)=1.2。为了训练和测试,在t=124和t=1 123之间选择1 000个样本作为式(28)的输入/输出样本数据。使用前500个数据对作为训练数据集,后面的500个数据对验证该模型的预测性能。图2显示了sfnn生成的模糊规则数;图3显示了从t=124到t=623的训练结果;图4显示了sfnn良好的预测性能。表1列出了sfnn与其他算法的比较结果。表1显示,与ols、rbf-afs算法相比,sfnn具有最少的规则数、最小的误差和良好的泛化能力,同时具有快速的学习速度。sfnn的快速性就在于:采用无须修剪过程的生长准则,加速了网络学习过程;利用扩展卡尔曼滤波调整网络的参数,可以缩短网络的学习周期。从上面的分析可以看出,sfnn具有紧凑的结构、快速的学习速度、良好的逼近精度和泛化能力。
4 结束语
sfnn采用在线学习方法、参数估计和结构辨识同时进行,提高了网络的学习速度。基于该方法生成的模糊神经网络具有紧凑的结构,网络结构不会持续增长,避免了过拟合及过训练现象,确保了系统的泛化能力。
参考文献:
[1]
huang huan,wu cong-xin.approximation capabilities of multilayer fuzzy neural networks on the set of fuzzy-valued functions[j].information sciences,2009,179(16):2762-2773.
[2]deng xing-sheng,wang xin-zhou.incremental learning of dynamic fuzzy neural networks for accurate system modeling[j].fuzzy sets and systems,2009,160(7):972-987.
[3]韦玉科,汪仁煌,李江平,等.一种新的数据智能化处理算法[j].计算机应用研究,2008,25(5):1328-1329.
[4]chen sheng,hong xia,luk b l,et al.orthogonal-least-squares regression:a unified approach for data modeling[j].neurocompu-ting,2009,72(10-12):2670-2681.
[5]chen s,cowan c f n,grant p m.orthogonal least squares learning algorithm for radial basis function networks[j].ieee trans on neural networks,1991,2(2):302-309.
[6]cho k b,wang b h.radial basis function based adaptive fuzzy systems and their applications to system identification and prediction[j].fuzzy sets and systems,1996,83(3):325-339.
[7]rivals i,personnaz l.a recursive algorithm based on the extended kalman filter for the training of feedforward neural models[j].neurocomputing,1998,20(1):279-294.
[8]simon d.training radial basis neural networks with the extended kalman filter[j].neurocomputing,2002,48(1):455-475.
[9]wu shi-qian,er m j,gao yang.a fast approach for automatic generation of fuzzy rules by generalized dynamic fuzzy neural networks[j].ieee trans on fuzzy systems,2001,9(4):578-594.