神经网络预测方法范文
时间:2024-03-28 18:29:52
导语:如何才能写好一篇神经网络预测方法,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
【关键词】介损值;BP算法;人工神经网络
1.引言
当前的电容型电气设备绝缘在线监测与诊断还停留在一个简单处理数据的层次上,如果能够结合先进的数学工具进行分析,将有助于提高监测与诊断的应用水平。模糊数学、专家系统、神经网络、灰关联分析等理论在电气设备的绝缘监测与诊断方面已经有了广泛的应用,并提供较完备的知识与信息,提高了绝缘监测与诊断的准确性。
大量停电试验和专门试验的介损值结果统计分析表明,介损值会对温度的变化较为敏感,环境的湿度对介损值也会有影响。在分析了各种因素影响介损值的基础上,文献[6]提出了基于人工神经网络的电容型电气设备的绝缘状况的预测方法。人工神经网络方法能够根据大量的故障机理研究以及经验性的直觉知识归纳出典型样本,通过对神经网络内部的竞争达到问题的求解,从本质上模拟专家的直觉。在此基础上本文提出了基于人工神经网络的电容型电气设备的介损值的预测方法,以BP神经网络作为主要的研究方法。BP网络的预测结果的准确与否取决于学习样本的优劣,本文根据实际情况选取了神经网络的学习样本并进行了仿真,结果表明该预测方法的误差满足工程误差的要求,基于人工神经网络的介质损耗值的预测方法是可行的、正确的和有效的。
2.基于BP神经网络预测方法的确定
人工神经网络的模型有数十种,可分为三大类:前向网络、反馈网络和自适应网络。但在人工神经网络的实际应用中,绝大部分的神经网络模型都采用BP网络及其变化形式。BP(Back Propagation)网络是一种多层前馈型神经网络,其神经元的传递函数是S型函数,输出量为0到1之间的连续量,它可以实现从输入到输出的任意非线性映射。BP神经网络的主要优点:
(1)BP神经网络具有分布式信息存储能力;
(2)BP神经网络的容错性和大规模并行处理能力;
(3)BP神经网络具有自学习、自组织和自适应能力;
(4)BP神经网络是大量神经元的集体行为,表现出一般复杂非线性系统的特性;
(5)BP神经网络可以处理一些环境信息十分复杂、知识背景不清楚和推理规则不明确的问题。
基于以上优点,本文选用BP神经网络作为主要研究方法。
3.BP算法基本思想和网络的基本结构
BP神经网络是一个多层前馈神经网络,包括了输入层、隐层和输出层。这种网络在输入层和输出层之间至少有一个隐含层,每一个神经元结点都与其后一层的结点相连接,但是没有后层结点向前层结点的反馈连接。BP网络具有结构简单、可靠性强的优点,能够满足工业应用的需要,而且有关网络的机理和算法的研究都很丰富,是众多网络中最为成熟,应用最为广泛的一种,是复杂系统建模的优秀工具。
BP算法的基本思想:当一对学习样本提供给网络后,神经元的激活值从输入层经隐层向输出层传播,在输出层的各神经元获得网络的输入响应。接下来,按照减少目标输出与实际误差的方向,从输出层经过各隐层逐层修正各连接权值,最后回到输出层,这种算法为“误差逆传播算法”。随着这种误差逆的传播修正不断进行,网络对输入模式响应的正确率也不断升高。
三层前馈网络中,输入向量为X=(x1,x2, ……,xi,……,xn)T;隐层输出向量为Y=(y1,y2,……,yj,……,ym);输出层输出向量为O=(o1,o2,……,ok,……,ol)T;期望输出向量为d=(d1,d2,……,dk,……,dl)T。输入层到隐层之间的权值矩阵用V表示,V=(v1,v2,……,vj,vm),其中列向量Vj为隐层第j个神经元对应的权向量;隐层到输出层之间的权值矩阵用W表示,W=(W1,W2,……,Wk,……,Wl),其中列向量Wk为输出层第k个神经元对应的权向量。如图3-1所示。
对输出层,有
Ok=f(netk) k=1,2,…,l (1)
netk= k=1,2,…,l (2)
对于隐层,有
yj=f(netj) j=1,2,…,m (3)
netj= j=1,2,…,m (4)
以上两式中,转移函数f(x)均为单极性(或双极性)sigmoid函数,f(x)具有连续、可导的特点。式(3.1)到式(3.4)共同构成了三层前馈网的数学模型。
图1 三层BP网络
三层前馈网络的BP学习算法权值调整计算公式为:
(5)
(6)
其中:
(7)
对于一般多层前馈网,设共有h个隐层,按前向顺序各隐层节点数分别记为m1,m2,…,mh,各隐层输出分别记为y1,y2,…,yh,各层权值矩阵分别记为W1,W2,…,Wh,Wh+1,则各层权值调整计算公式为:
输出层:
j=0,1,…,mh;k=1,2,… (8)
第h隐层:
i=0,1,…,mh-1;j=1,2,…,mh (9)
按以上规律逐层类推.则第一隐层权值调整计算公式:
p=0,1,…,n;j=1,2,…,m1 (10)
容易看出,BP学习算法中,各层权值调整公式形式上都是一样的,均由3个因素决定,即:学习率η、本层输出的误差信号δ以及本层输入信号Y(或X)。
4.基于MATLAB的BP神经网络的实现
4.1 网络的输入层和输出层设计
大量停电试验和专门试验的介损结果统计分析表明,电容型设备的介质损耗值的大小与环境等外界因素之间有着密切的关系。基于此,本文提出了基于环境等外界因素影响分析电容型设备绝缘状况的BP神经网络模型,其示意图如图2所示。
图2 神经网络模型示意图
为了更好的体现输入和输出变量的相应关系,输入层神经元应尽可能多采集与输出量相关性大的信息。本文以某一时刻设备的电压、电流、电容、环境温度、湿度和介质损耗值所为网络的输入参数,所以网络输入层的神经元有6个。输出层只有一个即预测时刻的介质损耗值,则输出层只有一个神经元。
为了统一量纲和防止因净输入的绝对值过大而使神经元输出饱和,继而使权值调整进入误差曲面的平坦区。BP神经网络的训练样本在输入网络之前要进行必要的归一化,也就是通过变换处理将网络的输入、输出数据限制在[0,1]或[-l,1]区间内。归一化方法有很多种形式,本文采用如下公式来进行样本数据的归一化:
令P为网络的输入向量,t为网络的目标向量,p_test、t_test为网络的测试样本向量,利用MATLAB归一化的代码为:
归一化后的输入向量P
for i=1:6
P(i,:)=(p(i,:)-min(p(i,:)))/(max (p(i,:))-min(p(i,:)));
end
归一化后的输入向量A
for i=1
T(i,:)=(t(i,:)-min(t(i,:)))/(max(t(i,:))-min(t(i,:)));
end
测试样本向量p_test和t-test的归一化同输入向量p和目标向量t的归一化,归一化后的向量为P_test和T_test。
4.2 隐层神经元数的选择
在设计多层前馈网时,一般先考虑设一个隐层.当一个隐层的隐节点数很多仍不能改善网络性能时,才考虑再增加一个隐层。由于本系统是一个比较小型的网络,且各结点采用S型函数进行处理,故采用单隐层。
隐层的神经元数目选择是一个非常复杂的问题,往往需要根据设计者的经验和多次试验来确定。隐单元的数目与问题的要求、输入/输出单元的数目都有直接的联系。隐单元数目太多和会导致学习的时间过长、误差不一定最佳,也会导致容错性差、不能识别以前没有看到的样本。选择最佳隐单元数的参考公式:
(1)
其中,k为样本数,n1为隐单元数,n为输入单元数。
(2)
其中,m为输出神经元数,n为输入神经元数,a为[1,10]之间的常数。
(3)
其中,n为输入单元数。
由于单隐层BP网络的非线性映射能力比较强,本文采用了单隐层的神经网络,而中间层神经元个数需通过实验来确定,输入层神经元个数有6个,中间层神经元的个数选择3个值,分别为13、15和20,并分别检查网络性能。通过实际的迭代训练,设置多种不同的隐节点情况,用同一样本集进行训练,比较迭代训练实验的结果,从中确定网络误差最小时对应的神经元个数。
MATLAB代码为:
隐层单元个数向量
a=[13 15 20];
for i=1:3
net=newff(threshold,[a(i),1],{‘tansig’, ‘logsig’},‘traindx’);
net.trainparam.epochs=1000;
net.trainparam.goal=0.01;
init函数用于将网络初始化
net=init(net);
net=train(net,P,T);
Y(i,:)=sim(net,P_test);
end
figure;
绘制误差曲线
中间神经元个数为13
polt(1:6,Y(1,:)-T_test);
hold on;
中间神经元个数为15
polt(1:6,Y(2,:)-T_test);
hold on;
中间神经元个数为20
polt(1:6,Y(3,:)-T_test);
hold off;
通过3种情况下的误差比较发现,中间层神经元个数为13、20时网络的误差比较大,当隐层节点数为15时,网络误差较小,收敛速度较快能得到最理想的输出,网络的预测性能最好。
通过上述分析,可以确定本文设计的神经网络结构为6-15-1,网络中间层的神经元传递函数,采用S型正切函数tansig,输出层神经元传递函数采用S型对数函数logsig。这是因为函数的输出位于区间[0,1]中,正好满足网络输出的要求。
图3 预测误差对比曲线
本文所要解决的问题是根据环境等外界因素对设备的绝缘状况进行预测,对网络的训练速度和稳定性有较高的要求,因此选择traingdx函数作为训练函数,该函数结合了动量梯度下降算法和自适应学习速率梯度下降算法。
该算法的基本过程为:首先计算出网络的输出误差,然后在每次训练结束之后,利用此时的学习率计算出网络的权值和阈值,并且计算出网络此时的输出误差。如果此时的输出误差与前一时刻的输出误差的比值大于预先定义的参数max_perf_inc,那么就减小学习率(通过乘以系数lr_dec来实现),反之,就增加学习率(通过乘以系数lr_inc来实现)。再重新计算网络的权值和阈值以及输出误差,直到前后输出误差的比值小于参数max_perf_inc为止。
4.3 网络学习速率和动量系数的选择
学习速率大小的选择,直接影响训练时间,当学习速率的选择不当,特别在严重时,将导致网络完全不能训练,这是因为1986年Rumelhart等人在证明BP训练算法收敛中,假设了无限小的权重调节速率。实际上这是不可能的,因为这表示需要无限的训练时间,所以,实际上必须选一个有限的学习速率大小,即η的值取0.01到1。一般来说要根据实验或经验来确定,还没有一个理论指导。若η选得太小,收敛可能很慢:若η选得太大,可能出现麻痹现象。为了避免这种现象,通常会选择减少η,但又会增加网络的训练时间。动量项可以加快BP算法的学习速度,但选项的时候应当注意避免学习时产生振荡。
因此,本文在确定网络的学习速率和动量系数的时候,采用不同的值的组合,利用55组训练数据进行了若干次网络的迭代训练。本文根据比较结果确定学习速率为0.1,动量系数为0.7作为网络训练时的参数。
5.基于BP神经网络介损值的预测应用
本文所建立的BP网络是基于MATLAB中的GUI建立。图形用户界面GUI (Graphical User Interfaces)是神经网络的工具箱提供的人机交互界面,它引导工程人员一步步的建立和训练网络,避免了代码的编写过程。借助图形用户界面GUI,可比直接利用工具箱函数更快捷和方便的完成神经网络的设计与分析。
利用BP神经网络理论和经过以上训练得到的网络参数,利用Matlab软件提供的GUI构造出了基于环境等外界因素影响分析设备绝缘状况的BP神经网络模型。表1列出了本文研究中建立的BP网络的各个参数和函数。
网络所用的训练数据和测试数据均出自于某110KV变电站主变套管的在线监测的数据],本文采用其中的55组典型数据,其中50组数据用于网络训练(训练次数为1000次,训练目标为0.01),5组数据用于仿真预测,利用仿真函数获得网络的输出,网络的预测结果及误差见表2,可见预测值与实际监测值之间的误差非常小,能满足实际要求。
表1 基于BP神经网络的电容型设备绝缘诊断模型参数
名称 参数
输入层节点数 6
隐含层节点数 15
输出层节点数 1
训练函数 traingdx
学习函数 learngdm
学习速率 0.1
动量系数 0.7
表2 外界环境相同时介损值的实际值与预测值的对比
序号 电压 电流 电容 温度 湿度 实 际
介损值 预 测
介损值 误差
1 119 7.047 326.479 18 50 0.003906 0.004025 0.000119
2 119 7.057 327.545 17 52 0.000440 0.004386 0.000014
3 118 7.022 328.078 17 55 0.003946 0.004108 0.000162
4 119 7.059 327.035 16 55 0.004471 0.004512 0.000041
5 119 7.069 327.406 17 59 0.003249 0.003178 0.000071
6.结束语
本章通过对BP网络模型和学习算法的研究,深入分析了BP网络在函数预测方面的优点,确定了用BP网络来实现对容性设备介质损耗值的预测,得到的结论如下:
(1)通过对BP网络结构的研究,将三层前向神经网络结构进行了改进,适应了本文对介质损耗值的预测要求。
(2)BP网络的预测结果的准确与否取决于学习样本的优劣,本文根据实际情况选取了神经网络的学习样本并进行了仿真,结果表明该预测方法的误差满足工程误差的要求,及基于人工神经网络的介质损耗值的预测方法是可行的、正确的和有效的。
(3)数据预测具有一定的精度,但是还存在误差,需选择相关大的、较合理的输入向量,还可以对网络的结构和算法选择方面进行改进,选择更合适的训练函数使其收敛速度更快,误差更小。
参考文献
[1]张寒,文习山,丁辉.用人工神经网络预测基于泄漏电流、气象因素的绝缘子等值附盐密度预测[J].高压电器,2003,39(6):31-35.
[2]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2002.
[3]闫志忠.BP神经网络模型的改进及其应用研究[D].长春:吉林大学,2003.
[4]闻新.MATLAB神经网络仿真与应用[M].北京:科学出版社,2000.
[5]许东,吴峥.基于MATLAB6.X的系统分析与设计-神经网络(第二版)[M].西安:西安电子科技大学出版社,2002.
[6]丛爽.面向MATLAB工具箱的神经网络理论与应用[M].合肥:中国科技大学出版社,1998
篇2
关键词:城市道路;交通量;预测;神经网络
中图分类号:C913.32 文献标识码:A 文章编号:
1引言
随着我国城市化进程的高速发展,目前大多数城市道路出现交通堵塞、车速下降等现象,为适应城市建设的要求,对未来若干年的道路交通量预测是制定建设规划方案的一项重要的参考指标[1],对城市道路网的完善、建设城市环路、放射路等交通干线和快速干道系统以及交通的调整和运营管理具有非常重要的作用,所以道路交通量的预测越来越受到重视。但由于交通量是一个受多层次、多因素影响的复杂变量,在实际工作中,由于缺少足够的信息而无法确定模型参数,给建模和预测带来了困难。传统的预测方法有:四阶段法、线性回归法、随机时间序列法、专家预测法、指数平滑法和状态空间法等[2],这些预测方法虽然可以预测短时间内客运量变化的大致趋势,但需要事先知道许多参数以及如何根据不同的情况对这些参数进行修正。近年来出现的预测方法有:灰色系统模型法[3]、神经网络模型法[4]等。灰色系统预测本质是一种指数增长预测,要求原始时间序列是非负单调的,但是这个条件不一定能完全满足。本文在分析影响交通量各因素的基础上,针对城市道路交通特点,建立城市交通量神经网络预测模型,以鄂尔多斯市的交通量为例,通过对2007-2011年的交通量的预测,与实际结果相比较从而验证模型的精度和合理性。
2 交通量预测模型
2.1影响城市交通量的主要因素
影响城市交通量的因素很多,除城市社会经济现状、总体规划、人口等外,最重要的影响因素是车辆保有量及车速,影响城市机动车保有量的主要因素是生产总值GDP和人口密度的变化,目前车辆保有量大多由公安交警部门通过机动车辆的登记管理统计车辆的保有量。车速主要由安置在道边的测速仪器及装置来测量某一时段通过车辆的平均时速,从而掌握道路服务水平和拥挤程度,为路网交通分析和交通量预测建模提供数据。所以,选用城市的人口、车辆保有量、预测同时段的车速作为主要的影响因素。
2.2 影响因素的归一化处理
由于上述影响因素的量纲不同,为了研究问题的简化和统一,对原始数据进行归一化处理,转化为无量纲的表达式。其基本方法是将原始数据列通过适当的变换映射到有限区间。假设为原始数据列,归一化的序列,这里,其中和分别表示原始数据序列中的最小值和最大值,这样变换后的序列在区间[0,1]内[5]。
2.3对角回归神经网络滚动预测模型的建立
综合考虑各种影响因素,采用如图1所示的对角回归神经网络滚动预测模型[5],前端子网络的输出作为输入层的输入,经由中间层和输出层而得到输出结果,然后将输出反馈给输入端作为网络输入的一部分进行滚动预测,同时隐层的每一神经元接受自己输出的自反馈。这种模型能实现动态映射,在此,我们针对实际问题考虑多输入单输出系统,其数学描述如下:
(1)
其中对每一个离散时刻t,是模型的第i个输入;是第j个回归元的输入和,即第个回归元的输出;为神经网络的输出;为第j个回归权;指第i个输入神经元到第j 个回归神经元之间的连接权[5]。
令和为对象的希望和实际响应值,那么,模型的严格训练循环的误差函数为:
(2)
为加快收敛速度,避免迭代过程出现振荡,采用加入动量因子的方法来修正学习率,保证系统稳定并达到全局最优。
3 鄂尔多斯市交通量预测分析
3.1 数据预处理
由鄂尔多斯市统计局、公安交警部门和交通局提供的2002年~2011年共10年的人口数、车辆保有量及每月初统计的北门处上午7:00-9:00时段的平均时速分别如表2所示[6]。对这些数据进行归一化处理后的数据如表3所示。
表2原始数据
表3归一化数据
3.2预测及结果分析
对交通量进行预测时,只有当那些对交通量影响较大的因素都包含在输入之内时,才有可能作出比较精确的预测。这里,以2002年~2006年的交通量数据为学习样本,以2007年~2011年五年的数据作为测试样本,采用表3所示的归一化数据作为输入,在MATLAB上进行实验。取得的实验结果如表4所示。同时用四阶段法所得如表5所示。从表中可以明显看出,对角回归神经网络滚动预测法表现出了较高的预测精度能够得到满意的预测误差(不超过3%),其算法具有良好的收敛性,能保证满意的映度,预测结果能达到实际要求。
表4预测结果
表54种预测方法结果误差比较
4结论
本文针对我国城市交通的特点,综合分析影响城市交通量各因素的基础上,采用对角回归神经网络滚动预测模型对近年来的交通量进行预测分析,结果表明,此模型相比于四阶段法具有较高的预测精度,为城市路网规划提供了有利工具,便于管理决策者根据未来趋势及时制定规划方案。此模型同样适用于其它城市的交通量预测,具有很好的推广性。当然,本文没有考虑影响因素的相关性,这也是下一步的研究重点。
参考文献:
[1]冯兴杰,魏新,黄亚楼.基于支持向量回归的旅客吞吐量预测研究[J].计算机工程. Vol.31,No.14,2005.7,pp:172-173.
[2] Moghram L and Rahrnan S. Analysis and evaluation of five short-term load forecasting techniques [J]. IEEE Transactions on Power Systems, 1989, 4 (4):1484-1491.
[3] K.-H. Linwas and B.-D. Liu. A gray system modeling approach to the prediction of calibration intervals of Calibration Intervals [J]. IEEE Transactions on Instrumentation and Measurement, 2005, 54 (1): 297-304.
篇3
【关键词】物流;神经网络
【中图分类号】 U652.1+2【文献标识码】A【文章编号】1672-5158(2013)07-0173-02
1 物流预测及其现有的解决方法
由于我国地域广泛,物流路途较远。因此在我国社会状态下的物流在货物运送过程中出现一些不确定情况是非常常见的。这也就说明对于物流行业的预测其实就是对人们不确定的未来的事件进行估计,同时将产生这些不确定时间的几率尽可能的降到最低。同时我们也可以看出,预测的存在价值就在于未来的变化,如果在物流过程中是不存在不确定事件的,那么物流预测就没必要进行。基于这种情况,可以说对物流进行预测就是对未来事件进行一定程度上的把握。首先预测物流需要了解为什么会产生不确定事件;其次是明确不确定事件发展的方向和趋势;最后是分析不确定事件发生后的现实情况,以此为基础对未来事态的发展进行估计,尽可能的在最短时间内找出解决问题的根本。
物流行业在我国是一个新兴产业,最初的发展尤为重要。因此做好物流预测对整个物流行业的发展前景起到至关重要的作用。物流预测可以将不确定事件发生时的被动情况变为主动,当工作人员已经因为预测出到不确定事件发生,那么他们会制定相应的应急方案,那么在不确定事件发生时,工作人员只需要按方案采取行动即可。物流预测也对减小物流企业损失有很大的帮助,同时也是一股促进物流行业发展的巨大推动力。
在物流行业中的预测,也是需要以现实市场传递过来的消息以及环境、距离等具体因素为基础,在通过相关的神经网络技术进行物流预测。但是对于现实中的环境、距离以及收集到的信息都不可能是一成不变的,同时也可能会受到调研人的主观因素影响,进而使得物流预测的基础都存在一定的偏差,最终导致预测结果出现与现实不符的情况也是在所难免的。
2 人工神经网络BP算法
神经网络技术的发展历史悠久,并不是为了满足物流预测需求才产生的,相关研究人员从上世纪初就开始对这方面技术进行研究和分析。对于神经网络技术的发展经过可以根据其发展状态分为以下几个时期:首先,可以将它定义为开始阶段,在这一段时期内神经网络技术还没有完全成型,只是一些学者的理论研究,并没有多少科学依据;其次可以称为神经网络技术发展的低谷。在这段时间内基本很少有人涉猎这一领域,因此它的发展速度缓慢,没有取得任何实质性的突破。再次可以称为是神经网络技术的复兴阶段。在这一个时间段内,很多学者均进行了相关的研究,并在一定程度上取得了突破。最后的阶段是神经网络技术的一个蓬勃发展的阶段,在这段时间里,神经网络技术得到更多的研究人员的重视,同时也获得了相当大的进步和成就。直至目前,神经网络技术依然持续着它强劲的发展势头,在未来必将获得更大的突破。
基于上述情况,作者希望能够更加直观的介绍神经网络技术在物流预测中的应用。因此,在本文中,首先先对BP网络技术进行介绍。这种技术方法就是将神经网络技术应用到物流行业中去。下面通过分析这种技术的算法来进一步的了解它。
设p为输入:w为权值;b为域值:a为输出。
多层网络中的某一层的输出成为下一层的输入。描述此操作的等式为:
3 神经网络预测模型建立及应用
物流行业中进行预测一般先会制定预测方案,再从中选择出较为合适的方案。应用神经网络技术预测物流状况一般有以下几种常用的方案:第一种方案是以过去一段时间内的信息作为预测基础,再进行物流预测。当然这些历史信息必须是在规定时间范围内,并且近期内具体环境没有发生较大变化。第二种情况是以物流预测的相关数据为基础进行的预测。这种方案的优势在于更多地考虑了相关变量的细节分析。但是由于目前科学技术的发展环境下,尚对相关变量的研究有限,为了获得更为精确的预测结果,通常情况下会选择第一种方案进行物流预测。
在本文中,以湖北省在1990年到1998年这段时间内的公路输出量作为历史信息,采用上面介绍的方法进行神经网络技术在物流预测方面的应用分析,进而预测出未来两年内的湖北省公路货物输出状况。
通常情况下,该种方法是以七个相邻的点作为一组历史信息,在本文中,我们以其中的前六个点作为历史数据来估计第七个的数值。
经实验调整这里学习步长=0.04;权及域值的初始域(-0.05,0.05)。隐层采用s形结构,输出层采用线性结构,得到训练曲线:
4 小结
在我国,物流行业得到快速的发展,这是以先进的神经网络技术为依托的良好效果。在本文中,作者通过对湖北省公路货运状况的举例分析来证明了神经网络技术在物流预测方面的重要性,这也间接表明神经网络技术有利于物流行业的整体运转和发展,促进了我国经济建设速度的提高。当然神经网络技术自身仍存在一定的问题,需要在不断地实际运作中进行完善和改进。相信随着科学技术手段的不断提升,神经网络技术的发展前景将会无限的美好,同时也会在物流预测方面取得更好更快的发展。
参考文献
[1] 陈焰,刘兆峰.神经网络在企业流动资金需求量预测中的应用[J].武汉理工大学学报(社会科学版),2002年03期
篇4
关键词:回归神经网络;时间序列;数据预测;归一化方法
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)07-1508-03
在工业、气象、金融、地理、医药、交通、环境等领域,都存在大量需要进行分析与处理的数据信息,在对这些数据信息进行挖掘分析的过程中,为了能提高分析效能与提高分析性能,在进行数据分析初期阶段需要对原始数据进行预处理,将原始数据值通过某种算法转化为所需分布范围数据,即数据标准化处理。
利用神经网络模型来进时间序列数据趋势预测是一个已经开展了很长时间研究的热门话题,这方面也有了许多研究成果。Connor[1]等运用非线性自回归平均移动预测模型来进行时间序列问题鲁棒预测,cheung[2]等运用神经网络模型对未来的金融数据进行预测,Wang[3]等设计出一种基于回归神经网络的多维并行预测模型,文献[4] 采用基于自回归神经网络进行多维动态预测。在运用神经网络预测模型进行趋势预测时,需要对时间序列数据进行缺失值及数据标准化处理,下文运用多维动态预测模型对几种常见的数据归一化方法进行分析。
1 回归神经网络预测模型
图一为基于回归神经网络的多维动态预测模型[5]。网络模型分为输入层、分配层、隐层与输出层四层;隐层为具有延迟一步功能的反馈单元,作用函数为Sigmoid函数,输出层作用函数为线性累加函数。
2 数据归一化方法
数据归一化方法很多,用的较多的有线性归一化与非线性归一化两种方法。线性归一化方法主要运用极值或则均值通过线性运算公式对原始数据进行运算,将数据转换为[-1,1]区间内的数值;非线性归一化方法主要运用一些非线性行数对原始数据进行运算,将数据转换为一定分布范围数据。
从实验结果来看,初始数据的归一化处理方法对自回归神经网络预测模型的预测性能有明显的影响,线性归一化方法中最大值运算法要优于最大最小值法;非线性归一化方法中,对数运算法优于反正切运算法,总体来看,运用最大值运算法对初始数据进行归一化标准化处理适合于自回归神经网络预测模型。
4 结论
通过运用基于自回归神经网络的动态预测模型来分析几种常见数据归一化方法对模型预测性能的影响,结果表明,数据归一化方法的选择会对自回归神经网络预测模型性能有明显影响;对于自回归神经网络预测模型,运用最大值运算法来进行数据归一化处理要优于其它几种常见方法。
参考文献:
[1] Connor J T,Martin R. D,Atlas L E.Recurrent neural networks and robust time series prediction[J].In IEEE Trans. on neural networks,1994(5):240–254.
[2] Cheung Y M,Leung W M,Xu L.A RPCL-CLP architeeture for finaneial time series forecasting[C].Proceedings of IEEE International Conference on Neural Network,1995,2:829-832.
篇5
关键词:时间序列 神经网络 房地产价格预测 MATLAB
中图分类号:F293.3 文献标识码:A
文章编号:1004-4914(2015)09-284-02
随着MathWorks公司对MATLAB软件中的神经网络工具箱的功能加强,时间序列预测方法可以应用于诸多方面,房地产价格预测便是其一。时间序列预测分为三类:NARX网络类型,NAR网络类型和只有输入数据无输出数据类型(此类型不常用)。
人工神经网络,或神经网络,它是一种神经网络来模仿动物的行为特征,并制定分布式并行信息处理的算法数学模型。神经网络分为静态神经网络和动态神经网络,静态神经网络无反馈无记忆功能,与此相反,动态神经网络是一种有记忆功能并且网络不仅与当前输入也与之前输入有关。动态神经网络分为有反馈与无反馈两类。有反馈指该时间输出不仅依赖于当前输入,有可能依靠于前一个输入,同时也依赖于前一个输出;无反馈指该时间输出不仅依赖于当前输入,同时也依赖于之前的输入,即通过昨天和前天的房价,就可以预测出今天的价格。由此可知,动态神经网络适合时间序列预测,因为时间序列预测是一种有记忆功能,即不仅依赖于当前输入而且依赖于之前的输出的预测。
一、数据来源及处理
选取全国近18年房地产平均价格为基础样本做简单预测。为保证预测结果的真实性,1997-2011年数据全部采用。2012-2014年价格作为预测分析对象,不涉及在内,仅用于判断研究方法的可行性。
二、神经网络模型的训练
将原始数据导入MATLAB中,将需要训练的数据设置变量,便于之后训练。使用nnstart命令进入工具箱进行训练。数据采用动态神经网络无反馈模型,训练网络时把数据分为三类,即数据分割为训练数据、数据验证和数据检测。训练数据和数据验证决定神经网络测试的结果,数据检测只判断结果好不好。在此次训练中,三者比例为:70%、15%、15%,之后设置神经元个数和时间距离相关个数。在训练结束后要关注error图,结合error图进行有效的分析,如果不满意训练结果可以更改比例或神经元和时间距离相关个数,直到训练完成。
三、预测结果分析
利用训练成功后的预测模型,预测2012-2014年的平均房地产价格。再与实际价格进行比较,计算出相对误差并取平均值。
通过对基于动态神经网络的房地产预测模型预测的平均房地产价格比较实际价格可以看出:预测模型预测结果与实际价格相比,平均相对误差为1.72%;结合房价指数进行分析比较,发现二者之间差别不大,所以说明该预测模型具有很强的可操作性和实用性。同时,对2015年后的平均房地产价格通过时间序列预测方法和指数平滑预测方法比较后发现后几年内平均房地产价格增长稳定,增长趋势维持在8%左右。在动态神经网络中,时间序列预测法是基于时间数列所能反映的社会经济现象的发展过程和规律性,进行引申外推,预测其发展趋势的方法。当有一定时间的房地产价格后,可以结合之前的价格对之后的价格进行预测。另外,预测模型根据训练样本自动映射房地产价格的非线性关系。此外,由于神经网络具有去噪能力,有偏差的样本价格对模型的结果影响不大。
四、总结
随着经济的快速发展,以及国家对房地产事业的政策调控,即使在市场相对低迷的2015年,房地产作为国家的支柱性产业仍然对国家的经济建设有很大的影响。房地产价格预测是结合多方调研,查询相关资料,掌握充分信息进行分析预算,从而进行投资。对于广大人民来说他们格外关注房地产价格,利用动态神经网络进行时间序列预测房地产价格,得到的神经网络模型能够反映房地产价格的动态特性。虽然通过建模不能预测到其精确的发展趋势,但是当前房地产价格需要一个合理的预测模型来满足我国房地产事业的发展态势,因此时间序列预测房地产价格不失为一个好的可以提高各方面综合效益的模型,对房地产价格预测的发展具有极大的促进作用。
参考文献:
[1] 张晓平,周芳芳,谢朝.基于神经网络的房地产估价模型研究及其Matlab实现.技术经济与管理研究,2009(1)
[2] 龚卿,陈碧琼.中国房地产业发展与经济增长的动态关系分析.经济师,2006(11)
[3] 胡晓龙,郜振华,马光红.基于Elman神经网络的房地产价格预测.统计与决策,2008(7)
篇6
关键词:BP人工神经网络;RBF人工神经网络;经济增长预测
中图分类号:TP183文献标识码:A文章编号:1009-3044(2011)10-2345-03
The Study of Forecast of Zhejiang Province's Economic Growth Using BP and RBF Artificial Neural Network
BAI Xue-bing
(Zhengjiang University of Technology, Hangzhou 310014, China)
Abstract: Based on existing studies of economic forecasting methods, the article studies the Zhejiang province'sEconomic Growth Forecastusing BP and RBF Artificial Neural Network.Thedata research shows Artificial Neural Network hasgood precision, but different Artificial Neural Network have different behavior, some have big error. Artificial Neural Network can provide good reference for the making policy of sector of economy.
Key words: BP artificial neural network; RBF artificial neural network; economic growth forecast
1 经济预测概论
经济预测是与未来有关的旨在减少不确定性对经济活动影响的一种经济分析。它是对将来经济发展的科学认识活动。经济预测不是靠经验、凭直觉的预言或猜测,而是以科学的理论和方法、可靠的资料、精密的计算及对客观规律性的认识所作出的分析和判断。
2 人工神经网络经济预测技术
由于人工神经网络具有大规模并行处理、容错性、自适应和联想功能强等特点,作为非线性智能预测方法的人工神经网络预测方法成为国内外经济预测研究的一个热点。
人工神经网络不断应用于证券预测分析、企业经济战略预测、经济理论创新、经济预测预警等研究中,都得到了一定的效果。
3 BP与RBF神经网络预测模型分析
3.1 经济增长神经网络设计模型
3.1.1 宏观经济预测指标
经济增长率是判断宏观经济运行状况的一个主要指标。经济增长率指的就是不变价国内生产总值增长率(简称国内生产总值增长率。因此,判断宏观经济运行状况要落脚到对国内生产总值的核算上。在本文中我们采用GDP的增长率来作为预测目标。
3.1.2 神经网络设计模型经济模型的设计
本论文采用两种模型对经济进行预测。
1) 第一种 GDP预测模型:第n年的一、二、三产业的增长率作为输入,第n+1年GDP增长率作为输出。
2) 第二种预测模型。第n-3、n-2、n-1、n年的经济增长率作为输入,第n-1、n、n+1年经济增长率作为输出。
这里还要说明两个问题。第一我们用到的数据来自2009年 浙江省统计年鉴,它的网址是 。
3.1.3 神经网络模型结构
设计经济预测神经网络模型前,首先需要确定神经网络的结构,主要包括如下内容:网络的层数,每层的神经元数和激活函数等。采用的神经网络结构如图1。
3.2 使用BP在以浙江省过去的每年的GDP增长指数的基础上进行BP神经网络预测
3.2.1 学习样本的选择
本次实验使用Matlab 软件采用3层BP神经网络建立浙江省经济发展的的预测模型。输入层节点数为n=4,输出层节点m=3.而隐含层节点数的选择是人工神经网络最为关键的一步,它直接影响网络队复杂问题的映射能力,实验中我们采用试凑法来确定最佳节点数。现设置较少的隐节点训练网络,然后逐渐增加网络节点数,用同一样本进行训练,从中确定网络误差最小时对应的节点数,隐层、输出层神经元的转移函数,隐含层和输出层转移函数分别采用tansig和logsig,训练函数选择traindx。
3.2.2 数值归一化处理
对于浙江省经济增长序列Q=(Q1,Q2…,Qt)。设序列的最大值、最小值分别为Qmax、Qmin。对时间序列的值作归一化处理。
令xi=(Qi-Qmin)/(Qmax-Qmin)
3.2.3 样本数据训练和数据预测
采用1978~2003年的数据样本在MatLab7.0软件中对输入网络进行训练.隐层节点数先从4开始训练,逐步增加到12时,当数值 为10时预测结果较好。允许误差为0.001,训练3217次达到训练要求。
采用1978~2004年的数据作为第一组训练数据,2005-年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP, 采用1978~2006年的数据作为第一组训练数据,2007-年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表1所示。
3.2.4 数据分析
从2000-2004的拟合数据来看,相对误差比较小,BP网络对整个模拟数据的拟合程度还是比较好的,但是从2005-2009的预测数据来看预测数据的误差还是比较大的,这也说明对未来的预测是很难的。各种不确定的因素在起作用。
3.3 三种产业增加率BP确定法预测GDP
3.3.1 样本数据训练
将1978-2004年数据对输入网络进行训练。然后把需要预测的样本2000-2004年的样本数据输入网络,得到结果,然后用反归一化公式获得结果。在Matlab7.0中调用newff函数,建立一个3个输入节点、18个隐含层节点、一个输出结点的BP神经网络,隐含层和输出层转移函数分别采用tansig和logsig,训练函数选择traindx,允许误差为0.001,训练1748次达到训练要求。
采用1978~2004年的数据作为第一组训练数据,2005年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP, 采用1978~2006年的数据作为第一组训练数据,2007年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表2所示。
3.3.2 数据分析
从预测数据来看预测数据的误差尽管比上一种类型的数据要好,但是误差还是比较大的,但是考虑到预测的能力 ,数据还是可以接受的 。但是数据误差还是比较大的,这也说明对未来的预测是很难的,不是十分确定的,有些文章的数据精确度挺高的,但我想应该是不太可能的,也许有故意凑数据的嫌疑。如果预测一年的话,可以通过调整参数获得近似结果,但是很多年就很困难。
3.4 使用RBF在以浙江省过去的每年的GDP增长指数的基础上进行RBF神经网络预测.
3.4.1 RBF 神经网络模型设计
该种方式与第一种BP神经网络预测方法类似, 以以前四年的GDP增长率作为输入,后两年加以预测的年作为输出。输入层节点数为n=4,输出层节点m=3.而隐含层节点数的选择是采用matlab的newrbe自动来设置.然后用同一样本进行训练。
3.4.2 样本数据训练和数据预测
1) 采用1978~2004年的数据作为第一组训练数据,2005年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表3所示。这儿采用newrbe函数,spread参数为0.25。这是因为通过测试采用0.25获得的数据结果较好。
3.4.3 数据分析
从实验数据看,RBF对整个模拟数据的曲线拟合程度是相当完美,但是从2005-2009的预测数据来看预测数据的误差还是比较大的,这也说明RBF神经网络尽管曲线的拟合程度比BP网络好 ,但是从预测的能力来讲,并不比BP网络好,反而通过试验显得更差一些。这仍然表明对未来的预测是很难的。各种不确定的因素在起作用。神经网络的预测也只能作为参考之用,不能对各种的突发事件进行预测。
3.5 使用RBF三种产业增加率确定法预测GDP
3.5.1 RBF神经网络模型设计
该种方式与对应的BP神经网络预测方法类似, 以一年的三种产业增长率作为输入,后一年的GDP增长率预测作为输出。本次实验采用RBF神经网络建立浙江省经济发展的的预测模型。输入层节点数为n=3,输出层节点m=1.而隐含层节点数的选择采用RBF自动的newrbe方法实现。
3.5.2 数据处理
1) 采用1978~2004年的数据作为第一组训练数据,2005年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP, 采用1978~2006年的数据作为第一组训练数据,2007-年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表4所示。
3.5.3 数据分析
但是从2005-2009的预测数据来看预测数据的误差比上一组得RBF的误差还要大,几乎有点难以接受。这也说明RBF神经网络尽管曲线的拟合程度比BP网络好,但是从预测的能力来讲,并不比BP网络好,反而我通过试验更差一些。2009年的数据变得极为不合理,从而导致数据的偏差性很高。,从测试数据可看出,但是由于经济运行的复杂性,以及不可预知性,特别是由于2008的美国金融导致的世界范围的经济危机,导致经济数据的不可靠性大大增加,历史数据变得用处不太大。2009年的数据变得极为不合理,从而导致数据的偏差性很高。
4 总结与归纳
从我们的试验来看,各种神经网络的确可以对未来进行预测,但是精度多高却有一些问题,从我们的试验来看BP神经网络的数据要比RBF神经网络的数据要好,但是也只在一定范围内 ,四种检测方法,只有一种数据还略微能够接受。神经网络预测仍然需要不断的完善。
参考文献:
[1] 张德丰.Matlab神经网络应用设计[M].北京:机械工业出版社,2009.
[2] 高隽.人工神经网络原理及仿真实例[M].2版.北京:机械工业出版社,2007.
[3] 韩力群.人工神经网络理论、设计与应用[M].2版.北京:化学工业出版社,2007.
篇7
面对复杂的建筑经济管理问题,以往的大多数管理预测方法的应用弊端也逐渐体现出来。而利用神经网络则可以解决复杂的非线性问题,继而可以用于解决复杂和多样的建筑经济管理问题。因此,有必要对神经网络在建筑经济管理中的应用问题展开研究,继而更好的应用该理论解决建筑经济管理问题。
1神经网络与建筑经济管理
作为重要的人工智能分支领域,神经网络是用来处理非线性问题的有效工具。在特性上,神经网络具有较好的非线性映射能力,并且具有较好的适应性和容错性。在应用神经网络进行问题的计算时,不需要先验模型就可以直接从数据中获得学习规律。所以,可以用神经网络解决一些传统数学方法难以解答的问题,也可以完成对建模困难的复杂问题的处理。所谓的建筑经济管理,其实就是对建筑活动进行有效的预测和控制。在这一过程中,需要完成对建筑活动的真实描述和分析,并利用规律完成对各种现象的合理解释。但在实际工作中,建筑经济管理将涉及大量的变量,并且大多变量具有模糊性。在这种情况下,变量与常量之间常常体现出非线性的关系,继而难以利用传统数学解析式完成对变量的合理解释。而就目前来看,在建筑经济管理方面,利用神经网络可以解决管理中的复杂问题的处理。在工程造价预测、经济预警和招投标等多个方面,神经网络都具有较好的应用前景。
2建筑经济管理中的神经网络的应用
2.1在造价预测方面的应用
在建筑工程造价预测方面,神经网络可以应用于工程费用的估计。利用BP网络可以构造出工程成本预测模型,并真实完成对工程生产、管理等各个环节活动的模拟。而通过分析成本的各种组成,并完成对工程价值链构成的跟踪,则可以适应工程的成本变化,继而完成对工程造价成本的预测。就目前来看,已经有工程实例对神经网络在造价预测方面的应用进行了验证,而其取得的应用效果显然要好于传统方法。在应用神经网络进行工程估价时,可以利用网络的“特征提取器”完成对工程特征的提取。从大量的工程资料中,神经网络可以找出预算资料与工程特征之间的规律关系,并且完成对其它因素造成的资料偏差的纠偏,以便确保预测结果的有效性。此外,由于神经网络采用的是并行方式进行数据的处理,所以其能够尽快完成工程造价预测,继而满足建筑工作的造价分析需求。而利用神经网络完成工程造价预测,则可以帮助建筑承包商更好的完成项目资金的管理,继而避免出现资金短缺等问题。
2.2在风险预警方面的应用
在建筑管理活动中,将存在财务风险、金融风险和市场风险等多种风险,继而使建筑经济管理具有一定的风险性。而利用神经网络可以完成对风险的预警,继而使建筑经济管理的风险性得到降低。在利用神经网络进行工程经营风险和收益的评估时,神经网络系统可以算作是一种投资决策工具。具体来讲,就是需要对神经网络的非线性映射和模式分析能力进行利用,以便建立动态的风险预警系统。在此基础上,则需要将风险来源因素当做是系统的输入单元,继而得出相应的风险等级,并得出风险可能出现的区间。而输入的风险来源因素有多种,如项目复杂程度和不可预见因素等等。就现阶段来看,一个风险预警系统需要由多个神经网络构成,比如建筑项目投资风险预警系统就由多个ART网络、BP网络和一个MAXNET网络构成。
2.3在工程投标方面的应用
在激烈的市场竞争环境中,建筑企业需要提前分析出影响工程项目投标决策的因素,以便在竞争中取得胜利。而涉及的因素包含了市场条件、竞争对手情况和工程情况等多个领域的内容,并且因素本身多为模糊变量,所以很难确定因素对投标报价的影响。但是,利用神经网络则可以根据以往相似工程信息分析出因素与投标报价之间的关系,继而完成对工程报价的推理。而承包商根据这一推理结果,则可以确定需要采取的投标策略。同时,结合工程造价预测结果,承包商则可以完成对投标价格的确定,继而获得更大的竞争优势。就目前来看,神经网络在工程投标管理方面已经取得了一定程度的应用,有关的工程投标报价决策支持系统和招投标报价专家系统已经得到了提出[4]。通过将管理费率、竞争对手情况和市场条件等因素输入到系统的输入层,则可以得出工程投标报价的报价率。
2.4在其他方面的应用
除了以上几个方面,神经网络在建筑经济管理的其他很多方面都可以得到应用。首先,在建筑企业管理者制定经营决策时,神经网络可以为管理者提供决策支持。就目前来看,虽然可以利用统计学模型帮助管理者制定决策,但是这些方法无法处理数据不完整的复杂非线性问题。而神经网络可以从不可预见的数据中总结规律,继而为管理者解决复杂问题提供决策支持。其次,想要降低建筑工程成本,还要使工程资源得到优化配置。但就目前来看,没有数学模型可以完成对设计变更和设备条件等各种要素的影响效果的分析,继而难以帮助管理者合理配置建设资源。而神经网络可以完成对资源的预测,并确定资源的优先级,继而可以帮助管理者优化资源配置。此外,利用神经网络可以完成对已有数据和信息的全面分析,继而帮助管理者选择建筑材料、设备和施工方法。
3结论
篇8
关键词:铁路交通;信息预测;数据融合;神经网络
在城市地铁交通中,各车站交通流量信息(如候乘数量、下车数量等)的准确预测有利于地铁运行高效、及时地调度,从而既达到增加效益的经济目的,又可以更好地满足人们的乘车需求。传统的预测方法有回归分析算法以及Kalman滤波等。这些方法假定过程是平稳的,系统是线性的,系统的干扰是白噪声,因此在线性系统平稳的随机时间序列预测中能够获得满意的结果。然而,交通问题是有人参与的主动系统,具有非线性和扰动性强的特征,前述方法难以奏效,表现为以下缺点:①每次采样的数据变化较小时适用,数据变化大误差就大;②预测值的变化总是滞后于实测值的变化;③无法消除奇异信息的影响。基于小波分析的动态数据预测方法以小波变换后的数据进行预测,克服了传统预测方法不能消除奇异信息的缺点,有效地预测动态的流量信息[1]。但该方法只能对单个的数据序列进行处理,而事实上能够用于预测的数据可以是多方面的。
数据融合(Data2Fusion)技术起源并发展于军事领域,主要用于目标的航迹跟踪、定位与身份识别以及态势评估等[2]。传统的数据融合技术大多采用概率理论(如Bayes决策理论)对多种信息的获取与处理进行研究,从而去掉信息的无用成分,保留有用成分[3]。在信息处理中,分别运用各种体现数据不同属性特征的方法处理(如预测)后进行融合是一个有待深入研究的问题。为了充分利用各方面已有的数据,获得可靠的交通流量动态预测,本文借鉴数据融合的基本思想,提出了在数据处理方法上的融合预测方法。
1流量融合预测模型
1.1预测模型的结构
由于预测对象的复杂性,为了表现与预测对象相关联的其他对象或属性,每个关联对象(属性)用一个时间序列来表示,作为预测对象的相关序列。所有用于预测的相关序列构成预测对象的相关序列集。由于在预测中具有不同的作用,各相关序列将使用不同的处理和预测方法。在相关序列集上的地铁客流量融合预测模型结构,如图1所示。
下面针对城市地铁车站客流量的预测进行论述。
1.2构造相关序列集
为了预测车站(序号为0)在第i天t时刻的流量^F0i(t)(实测值为F0i(t)),设t时刻^F0i(t)的相关时间序列集为f(t)={fj(t),1≤j≤n}(1)式中,fj(t)为t时刻^F0i(t)的相关时间序列;n为相关时间序列数。
为了获得精确的预测,可以根据关联特性构造任意多个相关时间序列。本文意在阐明本算法的基本思想,将流量数据仅仅构造为3类相关序列:当前序列、历史序列和邻站序列。
当前序列预测时刻t之前本站最近k次流量按时间先后记录下来的数据构成的时间序列为当前序列,即
f1(t)={F0i(t-l),1≤l≤k}(2)
该序列数据的主要影响因素是时刻,同时还受人为、气温、天气等其他扰动因素的影响,数据分布的非线性特性较大,频带较宽。第l班列车的流量如图2所示。
历史序列同为工作日或同为节假日的相邻数天,其流量曲线形状相对类似,流量曲线相似的日期在预测中具有较大的参考意义。本站最近m天在时刻t的流量按日期先后记录下来的数据构成的时间序列为历史序列,即f2(t)={F0i-p(t),1≤p≤m}(3)工作日和节假日流量差别较大,可将它们分类处理。该序列整体分布较平稳,有震荡,但频带较窄。第p个工作日在时刻t的流量如图3所示。
邻站序列图4为本站与邻近2个车站24h的流量曲线经DB2小波3层变换后的近似分量,可见各分量关联性较大。如果根据以前的数据将各邻近车站相互关系解算出来,就可以利用这种函数关系预测时刻t在本站的流量。最近m天在时刻t的流量按日期先后记录下来的各邻站历史序列为本站的邻站序列,即
qf2+q(t)={Fi-p(t),1≤p≤m,1≤q≤s}(4)
q式中,Fi-p(t)表示第q个邻近站的第(i-p)天的流量;s表示邻近站数。
1.3相关序列的预测
由于各相关序列在预测中具有不同的影响,且分布规律和特点差异较大,因而各序列使用不同的预测方法。本文对当前序列进行小波分解后用Kalman预测,对历史序列直接进行Kalman预测,对邻站序列用幂级数多项式进行拟合。
1.3.1小波分析
根据设置的分解指数η对序列进行小波N尺度分解,得到一组低频信号和N组高频信号,对这N+1组信号分别用Mallat塔式算法重构到原尺度上,得到N+1组在原始尺度上的经过分解重构处理的信号。分别对信号用Kalman滤波进行预测,得到N+1个预测值,再将这N+1个预测值用权系数合成最终的预测值。具体算法请参见文献[1]。
1.3.2Kalman滤波离散线性Kalman滤波方程为
F(t)=Φ(t-1)F(t-1)+W(t-1)(5)式中,Φ(t)为系统状态转移量;W(t)为系统误差。Kalman滤波通过t-1时刻的状态F(t-1)估计t时刻的状态F(t)。具体算法请参见文献[1]。
1.3.3多项式拟合
分别对各邻站序列用幂级数多项式拟合本站数据,拟合模型如下
n
i
p
^Fp(t)=αp,i(t)F(t)(6)
i=0
i
6式中,Fp(t)为对第p个邻站在时刻t的流量的i次i幂;αp,i(t)为Fp(t)的系数。当n=2时,上述拟合算法简化为线性回归模型。
1.4流量的融合预测设预测对象共有n个相关的时间序列fi(t),经过预处理分别为fi(t),融合预测模型可表示^F(t)在f(t)上的映射,即^F(t)=ζ(f(t))=ζ(f1(t),f2(t),fn(t))(7)式中,ζ(·)表示映射关系。特别地,式(7)可简化为如下的线性映射组合^F(t)=αi(t)ξ(fi(t))(8)i=16
式中,αi(t)为t时刻的序列fi(t)的权系数;ξ(fi(t))为以fi(t)为依据的局部预测值。为了确定上述算法中映射关系ζ(·),本文采用神经网络进行解算。
2模型的神经网络解算
神经网络是由大量简单的神经元以某种拓扑结构广泛地相互连接而成的非线性动力学系统[4]。神经网络在数据融合技术中具有无法替代的作用,通过神经网络对各相关序列的局部预测进行最终融合,具体过程如下。
2.1数据的局部处理
广州市地铁某站一个方向的流量数据是以每班列车到站上车的人数记录的(流量单位:人/班)。根据2002年5月1日2003年3月2日的流量数据,运用本文算法进行预测。按照1.2节的方法构造了4个相关序列:当前序列f1(t)、历史序列f2(t)以及相邻2个车站的邻站序列f3(t)和f4(t)。
2.2神经网络的设计
因为3层神经网络可以一致逼近任何非线性函数[5]。采用具有单隐层的3层神经网络作为模型,即输入层、隐层和输出层。
以各相关序列的局部预测值作为输入向量,实测值F(t)为期望输出,有4个输入节点,1个输出节点。隐层神经元数量关系到网络的训练速度和精度问题。对于一定数量的样本,需要一定数量的隐层神经元数,神经元少了,不能反映样本的规律;多了,则神经网络以过于复杂的非线性关系来拟合输入输出之间的关系,使得模型的学习时间大大增加。本例中,8个隐层神经元数是最好的。以误差平方和SSE(Sum2SquaredError)作为训练评价标准,SSE=pj(Ypj-Opj)2,其中Ypj和Opj分别为输出层第j个神经元的第p个样本的期望输出和实际输出(本例中j=1,p=60)。
用MATLAB的ANN工具箱构造神经网络。隐层神经元的激励函数为tansig函数(正切S型传递函数),输出层神经元的激励函数为purelin函数(线性传递函数),这样整个网络的输出可以取任意值。采取批处理学习方式和快速BP算法训练。
2.3神经网络的训练
将网络的训练标准SSE设为64(60组训练样本),利用上述样本对神经网络进行训练,训练6000次时网络的权值和阈值将达到最佳值,即达到了训练目标。神经网络训练目标接近过程,如图5所示。
从图5中可以看出,训练开始时,网络收敛速度较快,接近目标时收敛速度会减慢。可见,训练次数越多,得到的结果越好。当然,这是以训练时间的增长作为代价的。
3实验对比分析
采用本文算法和传统的Kalman算法分别对2003年3月2日的各整点时刻的流量进行预测。算法各时刻均通过训练后的神经网络预测,预测与实测结果的比较,如图6所示。
传统的Kalman滤波是直接在当前序列的基础上进行预测的,预测与实测结果的比较如图7所示。2种预测方法的误差指标对比见表1。
表1实验结果对比
比较可得,由于传统的Kalman预测方法只能以某一类序列的数据作为预测基础,无法利用其他序列信息,且对变化大的数据采样要求较高,因而具有较大的误差,而本文所述方法有效地克服了这些缺点。
4结论
通过分析城市地铁站客流量的相互关系和特点,在对流量信息进行以预测为目的相关序列集构造的基础上,提出了一种基于数据融合的预测模型。该预测模型不仅是一个多信息接收和处理的融合模型,而且还是一个动力学系统,网络的训练样本也是动态的,如果训练的次数适当,预测的精度也可以随之变化调整。实验结果表明,基于数据融合的预测与传统的预测方法相比,由于充分利用了所有预测信息,在预测的准确程度上有较大提高。
参考文献:
[1]李存军,等.基于小波分析的交通流量预测方法[J].计算机应用,2003,23(12):7—8.
[2]权太范.信息融合:神经网络模糊推理理论与应用[M].北京:国防工业出版社,2002.
[3].信息融合技术[M].北京:国防工业出版社,1996.
篇9
关键词:神经网络;Adaboost算法;强预测器;迭代算法;税收预测
中图分类号: TP183
文献标志码:A
Tax forecasting based on Adaboost algorithm and BP neural network
LI Xiang*, ZHU Quan-yin
Faculty of Computer Engineering, Huaiyin Institute of Technology, Huai’an Jiangsu 223003, China
Abstract:
In view of the lower accuracy of traditional tax forecasting models, the authors put forward a method of combining the Adaboost algorithm with BP neural network to forecast revenue. Firstly, the method performed the pretreatment for the historical tax data and initialized the distribution weights of test data; secondly, it initialized the weights and thresholds of BP neural network, and used BP neural network as a weak predictor to train the tax data repeatedly and adjust the weights; finally, it made more weak predictors of BP neural network to form new strong predictors by Adaboost algorithm and forecasted. The authors also carried out simulation experiment for the tax data of China from 1990 to 2010. The results show that this method has reduced the relative value of mean error from 0.50% to 0.18% compared to the traditional BP network, has effectively reduced the effect when single BP gets trapped in local minima, and has improved the prediction accuracy of network.
英文关键词 Key words:
neural network; Adaboost algorithm;strong predictor;iterative algorithm; tax forecasting
0 引言
税收是实施财政政策的重要工具,也是联系宏微观经济的一种纽带。作为国家宏观调控体系的重要组成部分,税收也是国家驾驭市场经济最主要、最有效、最常用的手段之一[1]。因此,税收预测的科学性和准确性具有重要的研究价值。
税收数据是一种动态、非线性的时间序列数据,受到政治、经济、文化等因素影响,税收数据的预测精度主要取决于预测算法。国内外学者当前对税收预测的研究方法,主要集中于基于线性回归方法、时间序列分析方法和神经网络预测方法。文献[2]采用线性回归方法对税收进行预测,由于影响税收预测的因素较多,且这些因素之间表现出较强的非线性特征,所以线性回归模型预测的精度不高。文献[3-4]中提出使用反向反馈传播(Back Propagation,BP)神经网络进行税收预测,但该方法没有克服传统BP神经网络存在的缺陷,容易陷入局部极小值,算法收敛速度较慢。文献[5-6]中提出使用Elman神经网络进行税收预测,取得了比传统BP神经网络更高的预测精度。但由于Elman神经网路的学习过程与前馈神经网络类似,也会出现收敛速度慢和易收敛到局部极小的缺陷,导致预测结果不稳定[7]。
本文针对上述问题,提出基于Adaboost算法和BP神经网络的税收预测方法,并将该方法应用于我国1990—2010年税收数据仿真实验,证明了本文方法的有效性。
1 BP神经网络与Adaboost算法
1.1 BP神经网络原理
BP网络是典型的前馈神经网络,其权值训练中采用误差逆向传播的方式,具有非线性连续有理函数的逼近功能[8]。在信号前向传递过程中,输入信号从输入层进入,经过隐含层处理,到达输出层。每一层的神经元状态只影响下一层的神经元状态。判断输出层的结果是否为期望输出,如果不是,则转入反向传播,然后根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出[9]。由于结构简单,可调参数多,训练算法多,操控性好,BP 神经网络获得了广泛的实际应用[10]。BP神经网络的拓扑结构如图1所示。
篇10
关键词:电力市场;短期电价;时间序列法;神经网络;组合预测
中图分类号:TM731 文献标识码:A 文章编号:1006-8937(2012)35-0131-02
随着近年来全球电力市场的蓬勃发展,电价作为电力市场中的基本要素,其核心地位受到人们越来越多的重视。近年来国内外学者开始对电价预测进行了深入的研究,并提出不少行之有效的电价预测方法。本文对目前常用的3种短期电价预测方法进行介绍,并展望该领域研究发展的前景。
1 电价的特点及其预测的分类
1.1 电价的特点
当前电力市场交易中,一天通常被分为24或48个时段,每个时段的电价被拍卖产生出24个或48个电价,这些离散的电价按时间先后排列就形成了电价的时间序列。电价受负荷需求、输电阻塞、机组可用容量、社会经济形势、发电商市场力等因素影响,具有以下特点:
①较强的波动性。与负荷相比,电价的波动性要远远大于负荷。按波动率的大小可将电力市场分为稳定市场、近似稳定市场和不稳定市场。波动率高的市场电价比波动率低的市场电价要更难预测,结果难以保持在很高的精度。
②跳跃和尖峰特性。电价趋势会展现出跳跃特性,出现零电价、负电价和价格尖峰。电价跳跃的时间和高度在现有的预测方法中无法得到准确的预测。
③周期性。与负荷相似,电价变化也呈现出较强的周期性,包括日周期、周周期和月周期。研究表明,负荷的周期变化是电价预测必须考虑的一个重要因素。
④均值回复。电价和一般商品一样,围绕在价值附近波动,具有均值回复特性;但不同时段的电价的均值是不同的,且方差会随时间的变化而变化,不恒为一个常数,也就是说电价具有异方差特性。
1.2 电价预测的分类
按预测点的类型分,电价预测可分为市场统一出清电价预测、节点边际电价预测和区域边际电价预测。一般情况下所说的电价预测均指市场统一出清电价的预测。
按预测时间分,电价预测可分为中长期电价预测和短期电价预测。前者主要是月电价预测和年电价预测,但因受较多不确定因素影响,预测结果可信度低,目前国内外开展的研究也不多。后者主要包括周电价预测、日前电价预测和小时前电价预测,其中日前电价预测是目前电价预测研究的热点和重点。
按预测内容分,电价预测可分为确定性预测和空间分布预测,确定性预测的结果是给出一个确定的电价预测值,主要用于短期电价预测,是当前研究的热点。而电价空间分布预测则基于概率论和数理统计理论,确定预测电价的可能波动范围和某段时期内的均值,主要用于中长期电价预测。
2 短期电价预测方法
目前较为成熟的预测方法主要有时间序列法,以神经网络为代表的智能算法以及组合预测方法。
2.1 时间序列法
时间序列法是指利用电价时间序列自身的相关性,通过已有的数据样本建立电价的时间模型序列进行短期电价预测,其优点在于模型的各分量均有明确的物理意义,解释性强,容易理解。
常用的时间序列模型有自回归(AR)模型、动平均(MA)模型、自回归滑动平均(ARMA)模型及累积式自回归滑动平均(ARIMA)模型。由于AR模型、MA模型均具有较大的缺陷,目前在短期电价预测中运用较多的是ARMA模型和ARIMA模型。
ARMA是AR模型和MA模型的结合,预测思想为序列当前值yt是现在和过去的误差(at,at-1,…,at-q)以及之前的各序列值(yt,yt-1,…,yt-p)的线性组合,其数学表达式为:
yt=?渍1yt-1+?渍2yt-1+…+?渍pyt-p+at-θ1at-1-…-θqat-1(1)
式中,p,q分别为自回归阶数和滑动平均阶数?渍1,?渍2,…,?渍p和θ1,…θq,分别为自回归系数和滑动平均系数。
ARMA模型是建立在电价序列为平稳的随机序列的基础上,而实际的市场电价序列往往具有非平稳的特性,因此需对电价序列进行预处理,即先采用差分方法将电价序列平稳化,然后将预处理后的平稳序列通过ARMA模型建模,这就构成了ARIMA模型。文献[1]首次引入ARIMA模型预测电价,取得了较好的效果,但该文献并无考虑负荷等其他因素的影响,使得预测精度收到限制。
上述模型均假设电价序列的方差为常数,而如前所述,电价具有异方差性,这一特性可以用广义均值回复时间异方差(GARCH)模型来描述。GARCH模型认为电价的方差与历史电价及历史电价的方差均有关系,不再是满足正态分布的随机数。因此,GARCH 模型是一种使用过去电价变化和过去方差来预测未来变化的时间序列建模方法。文献[2]考虑了电价序列的异方差性这一因素,建立了基于时间序列条件异方差(GARCH)的电价预测模型,取得了平均误差5.76%的预测效果。
传统的ARMA模型和GARCH模型仅从电价时间序列本身所包含的信息来预测电价,并未充分考虑各种外部因素对电价的影响,存在一定的局限性,预测精度也不尽如人意,这一不足可通过引入外生变量来改进。研究表明,考虑外生变量的时间序列法预测精度能取得较理想的预测结果。
时间序列法的优点在于计算速度快,所需历史数据少,其难点在于如何选择恰当的模型,模型选择得准确才能保证预测的结果较为理想。影响电价的因素的多样性使得时间序列法在某些情况下受到限制,预测的精度较低。
2.2 人工神经网络法
时间序列方法仅从电价序列自身的发展规律来预测未来电价,且即使在引入了外生变量后,时间序列法考虑的因素仍然有限,无法处理很好的处理多变量问题,存在一定的局限性。而人工神经网络(Artificial Neural Networks,ANN)具有处理多变量和非线性的能力,在电力系统负荷预测、电能质量分析、低频振荡分析等领域都得到了广泛的应用。一般的神经网络认为是由大量的神经元所组成,每个神经元的输入输出关系可表示为:
y■=f■w■x■-θ■(2)
式中,x■为神经元的输入;w■为从神经元i到神经元j的连接权值;θ■为神经元i的阈值;f(g)为传递函数,它决定了某一神经元i受到激励信号x1,x2,…,xn的共同刺激到达阈值后以什么方式输出,y■为神经元的输出。
ANN具有自适应、自学习、容错能力强和并行分布信息处理的特点,国内外学者开始尝试用ANN解决短期电价预测问题,目前采用的较多的有前馈型神经网络( BP网络)、径向基函数( RBF)神经网络和小脑模型关节控制器(CMAC)神经网络等。
使用ANN进行电价预测时,模型的网络结构大多凭经验选取,因此ANN存在难以确定最优网络模型的问题,使得其预测精度的进一步提高存在一定的限制。
2.3 组合预测方法
由于电价的影响较多且各因素间关系复杂,而单一的预测方法由于其方法本身存在的缺陷而无法理想的预测短期电价。因此,国内外学者对组合预测方法进行了积极的探索。组合预测的主要思路是将两种或多种预测方法相组合,发挥每种预测方法的优点,从而建立具有更加准确预测效果的组合预测模型。
时间序列法具有所需数据少,计算速度快,模型物理意义明确的优点,但是对序列的非平稳特点无能为力,单纯使用时间序列法精度不高。而小波变换在时域和频域良好的分辨能力能将电价各个层次的特点分解出来,可根据分解结果分别建立不同的模型,达到提高预测的精度的目的。文献[8]利用小波变换对电价进行分解,得到各电价分量序列,再分别利用ARIMA模型进行短期电价预测,最后重构各分量序列得到最终的预测电价,但该文献没有考虑电价时间序列的异方差性,预测精度不甚理想。文献[9]利用小波变换将历史电价序列分解成概貌电价和细节电价,将历史负荷序列分解成概貌负荷和细节负荷,通过历史概貌电价和历史概貌负荷预测未来概貌电价、历史细节电价和历史细节负荷预测未来细节负荷,取得了较好的预测效果。
基于ANN的组合模型则是组合预测中研究的热点。神经网络传统的人工神经网络具有较好的非线性和自学习能力,但容易出现收敛速度慢,陷入局部最优值、隐含层神经元个数难以确定等缺点。学者尝试用其他数学方法与ANN相结合,来弥补ANN固有的不足,以取得更好的预测结果。其他数学方法与ANN相结合有两种形式,一种是辅助式结合,即采用其他数学方法对数据进行预处理,充分利用数据的有效信息,然后再用ANN对短期电价进行预测。一种是嵌套式结合,即用其他数学变换函数形成神经元,将其他数学方法与神经网络直接融合。
目前采用得较多的方法有小波分析、模糊分类、遗传算法、粒子群优化算法等。研究表明,由于组合预测方法具有扬长避短的优势,基于ANN组合预测模型的预测结果要明显好于传统单一的ANN模型。
3 结论与展望
本文对目前短期电价预测方法做了综合的归纳。时间序列法可以较为容易地建立预测模型,物理意义明确,对电价波动率低的市场电价预测结果较为理想,但不能考虑各种不确定因素对电价的影响,对波动率较高市场预测结果不尽如人意。ANN作为一种广泛应用的人工智能算法,其网络结构的选择带有经验因素,且网络的很多参数都需要估计,容易出现过拟合问题。未来短期电价预测的发展趋势主要包括以下几点:
①组合预测方法可以充分发挥各种模型的优点,博采众长,将是未来短期电价预测发展的主要趋势,但是需要指出的是并非任意两种模型结合在一起就可以取得更好的预测结果。
②除上述介绍的数学方法外,混沌理论、数据挖掘技术、盲数理论等先进理论和技术也开始引入到短期电价的预测中,研究兼顾准确性、实时性和简洁性的预测方法也是未来的研究方向。
③不同时段电价的影响因素有所不同,对各时段电价分别进行建模预测,这也是提高电价预测精度的有效方法。
参考文献:
[1] CONTRERAS J,ESPINOLA R, NOGALES F J,et al. ARIMA models to predict next-day electricity prices[J].IEEE Trans.on Power Systems,2003,18(3):1014-1020
[2] CARCISAR C,CONTRERAS J,AKKEREN M V,et al. A GARCH forecasting model to predict day-ahead electricity price[J].IEEE Trans on Power Systems,2005,20(2):867-874.
[3] 王瑞庆,王晛,李渝曾.基于时间序列ARMAX模型的短期电价预测方法[J].华东电力,2009,37(5):27-30.
[4] 牛东晓,刘达,冯义,等.考虑外生变量的广义自回归条件异方差日前电价预测模型[J].电网技术,2007,31(22):44-48.
[5] WANG A,RAMSAY B.Prediction of System Marginal Price in the UK Power Pool Using Neural Networks. Proceedtngs of International Conference on Neural Networks[C].Houston (TX, USA):1997.2116-2120.
[6] 夏吉广,张维存,尹怡欣.基于RBF 网络的电力市场清算电价预测[J].中国制造业信息化,2005,34(5):138-140.
[7] 陈建华,周浩.基于小脑模型关节控制器神经网络的短期电价预测[J].电网技术,2003,27(8):16-20.
[8] 周明,聂艳丽,李庚银,等.基于小波分析的短期电价ARIMA预测方法[J].电网技术,2005,29(9):50-55.