神经网络降维方法范文
时间:2024-03-28 16:38:48
导语:如何才能写好一篇神经网络降维方法,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:玉米种子;品种识别;人工神经网络;支持向量机
中图分类号:S513;S326 文献标识码:A 文章编号:0439-8114(2016)09-2366-04
近年来,假种子事件频发,给农业造成巨大损失,农民由于缺乏识别种子的能力和设备,往往不能有效区分各个品种,迫切需要一种快速的种子识别方法。数字图像识别作为一种快速识别技术而被广泛应用,在水稻、小麦和花生等作物种子识别上都有成功应用的报道。
现代玉米种植和水稻一样,广泛杂交育种,不能自留种,增大了不法商家贩卖假种子的空间。为了有效鉴别玉米种子的真伪和类别,郝建平等、杨锦忠等通过数十个外观特征,采用图像处理的方法识别种子:韩仲志等研究了对种子识别起关键作用的特征提取方法,如子粒的胚部特征和果穗DUS测试特征的提取方法:另外杨锦忠等针对玉米果穗形态研究了品种识别问题,对关键特征进行了选择优化。
在玉米识别相关算法和系统工程应用之前,需要对品种识别过程中的关键因素进行有效的性能与效率测试。由于人工神经网络方法广泛应用于识别问题,本研究拟针对不同的神经网络模型进行比较研究,进而考察各种模型的效能,为将来品种识别软件的开发与工程应用提供算法支持。
1 材料与方法
1,1 试验材料
供试玉米品种共11个,均是北方黄玉米品种,种质来源为青岛农业大学种质资源库,每个品种50粒种子。采用平板扫描仪采集图像(图1)。基于Matalb2010b编程,采用子粒区域标记的方法将图像中各个子粒的子图(SubImage)提取出来。然后进行特征提取。
1.2 特征提取
提取的特征包括颜色、形态和纹理3大类,见表1,相关定义参见文献。从二值图上提取形态特征,从RGB和HSV彩色图获取颜色特征,依据灰度图像获取纹理特征。
1.3 特征优化
随着统计指标的增加,统计特征的维数相应增加,因此也需要进行必要的降维和特征优化。传统的特征降维与优化是基于二阶统计量进行的主分量分析(PCA)方法。PCA是统计学中分析数据的一种有效的方法,其目的是在数据空间中找一组向量以尽可能地解释数据的方差,将数据从原来的R维空间降维投影到M维空间(R>M)。降维后保存了数据中的主要信息,从而使数据更易于处理。PCA方法是沿数据集方差最大方向寻找一些相互正交的轴,主成分分析方法是一种最小均方误差下的最优维数压缩方法,特征提取和优化后,特征维数将进一步减少。
1.4 品种识别
基于表1中的特征可实时进行品种识别。人工神经网络是模拟人的神经感知结构,寻找非线性情况下的一种最优映射,由于所提取的特征与玉米类别之间存在着非常复杂的非线性映射关系,所以特别适合采用此方法进行品种识别。由于神经网络的初始权值由系统随机给出,所以往往带来结果的不稳定,通常的做法是多次测试取最优实现。基于提取的特征数据即可进行种子检验和品种识别,本研究涉及的神经网络模型包括7种,即BP、rbf、grnn、pnn、compet、sofm,以及一个BP(backpropagation)神经网络的改进型,即极限学习机ELM。其中神经网络BP算法是最典型的神经网络分类方法。支持向量机(SVM)模型是近几年发展起来的优秀的识别模型,在农作物种子识别领域已经被证明比神经网络识别模型具有更为稳健的性能。
2 结果与分析
图2是6种神经网络识别模型的识别结果,图3是BP神经网络的改进型极限学习机(ELM)与支持向量机(SVM)模型识别结果。表2为上述8种识别模型在不同主分量及不同特征下的识别效果。
2.1 不同模型的识别性能
比较6种神经网络识别模型可以发现(图2、表2),首先从识别率上,基于60个原始统计特征,6种神经网络识别模型和1种改进型识别模型的识别性能从高到低为grnn>ELM>pnn>rbf>BP>compet>sofm,决定系数R2从大到小为grnn>rbf>ELM>BP>pnn>compet>sofm,所耗时间上从少到多为ELM
鉴于极限学习机ELM是广泛应用的BP神经网络的改进型,且其识别效果优越,将其作为神经网络模型的代表与支持向量机模型进行比较。图3列出了两种模型的识别效果,部分数据在表2中有所体现,可以看出支持向量机(SVM)模型的识别效果较好,且效果更为稳定。
2.2 特征优化对模型的影响
由于分类性能严重依赖特征的选取,这就表明某种特征的组合可能具有更优秀的分类能力,此时主分量是一个很好的选择,它不仅可以进行数据降维,还可以寻找对所有类都尽量适应的优化特征组合。表3列出了不同数目PCA情况下8种识别模型的识别性能。从表3可以看出,从识别率看,神经网络模型表现极其不稳定,识别率并不是随着PCA数目的增加而增加,但总体上还是呈增加趋势,这种不稳定性与神经网络初始权值的随机赋值有关,同时由于神经网络的隐含层神经元数目到目前为止缺乏理论指导,所以只能通过经验给出,故要得到较为稳定的结果可通过多次训练得到较为稳定的识别模型为止:但比较来看,支持向量机模型表现出更为稳定的识别效果,且随着PCA数目的增加。识别模型的总体识别率呈上升趋势。另外从模型的决定系数和识别模型的时间上来看,支持向量机模型都是较为优秀的模型。其中决定系数R2越接近于1,识别的时间越短,说明模型越优秀。在这些模型中compet表现的效果最差,不仅识别的效果最差。且识别的时间最长。
3 小结与讨论
从本研究的识别结果看。识别结果非常不稳定,这种不稳定的结果与两个因素有关,一是神经网络的不稳定,与确定神经网络初始权值时随机给出有关,二是采用的交叉验证法是随机给出,随机将训练和测试样本进行分组,每次试验选用了不同的训练集和测试集。
PCA是一种优秀的特征优化和数据降维方法,通过PCA降维可以在很大程度上提高运算速度,减少计算量,特别适合在线监测。另外从比较结果可以看出,支持向量机是一种优秀的分类模型,特别适合于对小样本进行分类,其效果要优于神经网络模型,且结果稳定。支持向量机和神经网络虽然都用来进行品种识别,但所依据的理论基础和识别机理均不相同。支持向量机普遍认为其泛化能力要比人工神经网络强:支持向量机模型理论基础是结构风险最小化理论。也涉及模型参数优化问题:另外支持向量机可以得到识别决策函数的解析表达式,而神经网络不能明确地得到一个解析解。
篇2
关键词:图像分类;深度学习;Caffe框架;卷积神经网络
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)35-0209-03
Research and Implementation of Image Classification Based on Convolution Neural Network
WANG Chao
(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)
Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.
Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network
S着计算机与互联网技术的快速发展,我们已经进入了一个以图像构建的世界。但是面临有海量图像信息却找不到所需要的数据的困境,因而图像分类技术应运而生。通过各种机器学习算法使计算机自动将各类图像进行有效管理和分类,但是由于图像内容包含着大量复杂且难以描述的信息,图像特征提取和相识度匹配技术也存在一定的难题,要使得计算机能够像人类一样进行分类还是有很大的困难。
深度学习是近十年来人工智能领域取得的重要突破,在图像识别中的应用取得了巨大的进步,传统的机器学习模型属于神经网络模型,神经网络有大量的参数,经常会出现过拟合问题,因而对目标检测准确率上比较低。本文采用卷积神经网络框架,图像特征是从大数据中自动学习得到,而且神经网络的结构深由很多层组成,通过重复利用中间层的计算单元来减少参数,在特征汇聚阶段引入图像中目标的显著信信息,增强了图像的特征表达能力。通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示,通过实验测试,效果比传统的图像分类算法预测的准确度有明显的提升。
1 基于卷积神经网络的图像分类方法
1.1 人工神经网络
人工神经网络(Artificial Neural Network, ANN)是描述生物神经网络运行机理和工作过程的抽象和简化了的数学物理模型,使用路径权值的有向图来表示模型中的人工神经元节点和神经元之间的连接关系,之后通过硬件或软件程序实现上述有向图的运行[1]。目前最典型的人工神经网络算法包括:目前最典型的人工神经网络有BP网络 [2]Hopfield网络[3]Boltzmann机[4]SOFM网络[5]以及ART网络人工神经网络[6],算法流程图如图1所示[7]。
1.2 卷积神经网络框架的架构
Caffe是Convolutional Architecture for Fast Feature Embedding的缩写[8],意为快速特征嵌入的卷积结构,包含最先进的深度学习算法以及一系列的参考模型,图2表示的是卷积神经网络结构图。Caffe深度学习框架主要依赖CUDA,IntelMKL,OpenCV,glog软件以及caffe文件。本文使用的各个软件版本说明,如表1所示。
Caffe深度学习框架提供了多个经典的卷积神经网络模型,卷积神经网络是一种多层的监督学习神经网络,利用隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能,卷积神经网络模型通过采取梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练来提高网络的精度。卷积神经网络使用权值共享,这一结构类似于生物神经网络,从而使网络的复杂程度明显降低,并且权值的数量也有大幅度的减少,本文使用这些模型直接进行训练,和传统的图像分类算法对比,性能有很大的提升,框架系统训练识别基本流程如图3表示。
1.3 图像分类特征提取
卷积神经网络的结构层次相比传统的浅层的神经网络来说,要复杂得多,每两层的神经元使用了局部连接的方式进行连接、神经元共享连接权重以及时间或空间上使用降采样充分利用数据本身的特征,因此决定了卷积神经网络与传统神经网络相比维度大幅度降低,从而降低计算时间的复杂度。卷积神经网络主要分为两个过程,分为卷积和采样,分别的对上层数据进行提取抽象和对数据进行降维的作用。
本文以Caffe深度学习框架中的 CIFAR-10数据集的猫的网络模型为例,如图4所示,对卷积神经网络模型进行训练。CIFAR-10是一个标准图像图像训练集,由六万张图像组成,共有10类(分为飞机,小汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车),每个图片都是32×32像素的RGB彩色图像。通过对数据进行提取和降维的方法来提取图像数据的特征。
2 实验分析
将猫的图像训练集放在train的文件夹下,并统一修改成256×256像素大小,并对猫的图像训练集进行标记,标签为1,运行选择cpu进行训练,每进行10次迭代进行一次测试,测试间隔为10次,初始化学习率为0.001,每20次迭代显示一次信息,最大迭代次数为200次,网络训练的动量为0.9,权重衰退为0.0005,5000次进行一次当前状态的记录,记录显示如下图5所示,预测的准度在98%以上。而相比传统的图像分类算法BP神经网络网络的收敛性慢,训练时间长的,网络的学习和记忆具有不稳定性,因而卷e神经网络框架在训练时间和预测准度上具有非常大的优势。
3 结束语
本文使用Caffe深度学习框架,以CIFAR-10数据集中猫的网络模型为例,构建小型猫的数据集,提取猫的图象特征信息,最后和目标猫图像进行预测,并和传统的图像分类算法进行对比,预测的准确率有很大的提升。
参考文献:
[1] 杨铮, 吴陈沭, 刘云浩. 位置计算: 无线网络定位与可定位性[M]. 北京: 清华大学出版社, 2014.
[2] 丁士折. 人工神经网络基础[M]. 哈尔滨: 哈尔滨工程大学出版社, 2008.
[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.
[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.
[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.
[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.
篇3
本文提出了一种基于R、G、B值的BP神经网路遥感影像分类算法,对待分类影像共选取三种样本,获取训练数据训练构建好的BP神经网络;使用训练好的BP神经网络对高分影像分类,分类结果用三种不同的颜色标识,通过目视判读各个像元类别与BP神经网络分类结果对比,实验结果表明该方法分类的精度较高,并具有一定的普遍性,为实现自动、半自动化遥感影像分类与识别提供了理论依据和技术方法途径。
【关键词】遥感 影像分类 BP神经网络 分类精度
1 引言
自20世纪70年代以来,遥感数字图像分类处理一直是遥感技术及其相关领域学者们关注的问题。遥感数字图像分类,亦称计算机自动识别,其实质在于通过计算机对遥感影像像元进行数值处理和分类,以达到自动识别地物的目的。传统的模式识别分类方法一直被认为是遥感图像分类处理的最佳方法。
在目前遥感分类中,用得较多的是传统模式识别分类方法,如最小距离法、循环集群法等监督与非监督分类法。其分类结果由于遥感图像的“同物异谱”与“异物同谱”现象存在,往往出现较多的错分、漏分现象,导致分类精度不高。随着遥感图像解释和分析的深入,统计模式识别方法的不足显现出来,如K-均值聚类分类精度依赖于初始聚类中心;最大似然法计算强度大,且要求数据服从正态分布。尤其是近年来高光谱的广泛应用,各种新理论相继出现,对传统的计算机分类方法提出了新要求。
随着人工神经网络理论的发展,人工神经网络技术日益成为遥感图像分类处理的有效手段,并逐步取代传统的模式识别方法。人工神经网络具有良好的适应能力,比之基于传统统计理论的分类方法,它无须事先估计目标的概率分布函数,故在进行以数据量多、含混度高著称的遥感影像的分类处理时,该方法能获得很好的分类精度。本文简单介绍人工神经网络分类算法,给出BP神经网络在遥感影像中分类方法。
2 基于BP神经网络的遥感影像分类方法
2.1 遥感影像分类原理
遥感影像记录了地物在观测时间内的电磁波辐射特征,在影像中,同类地物在相同条件下,应具有相同或相似的光谱、纹理、颜色等空间信息,而不同地物的光谱、纹理、颜色等空间信息特征不同,遥感影像分类正是根据地物光谱能量和空间结构的差异性,利用计算机手段对各类地物信息进行分析和处理,将影像上的各像元划分到对应的地物类别中。
2.2 BP(Back-Propagation)神经网络分类器原理
BP(反向传播)神经网络是利用非线性可微分函数进行权值训练的多层网络,包括输入层、 中间层(隐层)和输出层。当学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应。接下来,按照减少目标输出与实际误差的方向,从输出层经过各中间层逐层修正各连接权值,最后回到输入层,因此这种算法称为 “误差逆传播算法”,即 BP 算法。随着这种误差逆的传播修正不断进行,网络对输入模式响应的精度也不断上升 。在 BP 网络针对一个样本对各个联接权作一次修正后,虽然此样本还不能满足精度要求,此时也不能继续按此样本进行训练,而应考虑其他的样本,待样本集中的所有的样本都被考虑过一遍后,再重复这个过程,直到网络能同时满足各个样本的要求,即误差测度的总和满足系统的要求为止。
2.3 基于BP(Back-Propagation)神经网络的遥感图像分类器模型
BP神经网络技术应用于遥感图像分类,BP神经网络输入层神经元表征遥感影像的输入模式,每一个输入层神经元对应于一个像元R、G、B值特征,每一个输出层神经元对应于一种土地覆盖类型,每种土地类型用一种颜色标识。
3 基于BP神经网络的遥感影像分类
3.1 BP神经网络训练
首先,根据分类结果选取数据样本,由数据样本得到训练样本。训练样本是以输入、输出对的向量模式来呈现的,其输入向量是指样本在参与分类的三个特征影像中的像元值,而输出向量(期望输出)是指该样本对应的类别。
(1)给出的各个样本,逐一获取每个样本的的每一个像元R、G、B值,得到各个样本R、G、B值矩阵。
(2)对各个样本的R、G、B值矩阵进行降维处理,即将所有样本R、G、B值矩阵变成一维向量的形式。
(3)得到BP神经网络训练输入矩阵:
(4)根据实际需要确定目标向量的颜色类型,得到BP神经网络训练输出矩阵:
训练数据得到后,将训练数据逐个输入BP神经网络进行正向运算,求出BP神经网络对每个训练数据在输出层误差,然后反向传播对连接权值进行修正,完成一个样本的训练过程。在训练期间,在输出层上对每个输入向量统计均方根误差值,根据经验,当均方根降至0.01该网络已收敛,各连接的权值固定下来,可以用于高分影像分类。
3.2 分类结果的显示
(1)获取分类图片的R、G、B值矩阵R[M,N]、G[M,N]、B[M,N]。
(2)对分类图片的R、G、B值矩阵降维处理,即将R、G、B值矩阵变成一维向量的形式R[M*N]T、G[M*N]T、B[M*N]T。
(3)得到BP神经网络输入矩阵p=[R[M*N]T G[M*N]T B[M*N]T]。
(4)将BP神经网路输入矩阵输入到训练好的BP神经网络中,得到要显示图像的R、G、B值矩阵, t=[R1[M*N]T G1[M*N]T B1[M*N]T]。 (3)
(5)得到要显示图像的R、G、B值一维向量的形式R1[M*N]T、G1[M*N]T、B1[M*N]T]。
(6)由要显示图像的R、G、B值一维向量,得到要显示图像R、G、B值矩阵R1[M,N]、B1[M,N]、G1[M,N],将要显示的R、G、B值组合成影像进行显示,如图 2。
将该遥感图像分成三类,湖泊、裸地、植被分类用黄色、黑色、红色标识,分类后的结果很明显。
3.3 分类效果的评价
采用混淆矩阵及各统计参数来实现BP神经网络分类结果的精度评价。首先,对研究区域选取验证数据,其所属的真实类别信息通过考察后已知,从而反应真实类别;然后将验证数据输入到训练好的BP神经网络中进行正向传递,获得其对应的网络输出值,从而判在BP网络分类结果中所属类别;最后根据所有验证数据的真实类别和BP网络分类类别建立混淆矩阵,计算各类统计参数用以评定分类精度。
在分类图像上截取样本(16*27=432),通过目视判读,裸地119个像素,植被有个134像素,湖泊179个像素,则有表1。
通过以上计算,得到裸地、植被、湖泊的生产精度分别为79.83%、79.01%、100%,裸地、植被、湖泊的用户精度分别为82.6%、85.48%、92.74%;总体分类精度为87.96,Kappa系数为0.8155,表明BP神经网络模型能有效的对遥感影像分类。
4 结论
本文针对高分遥感影像,提出了一种基于R、G、B值的BP神经网路遥感处理算法。首先 ,获取BP神经网络训练数据;然后,构建神经BP神经网络,利用得到的训练数据BP神经网络进行自学习;最后,获取待分类影像的数据,进行分类显示。得到的分类结果,选取生产精度、用户精度、总体精度和Kappa系数作为评价指标。结果表明:所提出的方法可有效地应用于高空间分辨率遥感图像分类工作中,并具有一定的普遍性,为实现自动、半自动化遥感影像分类与识别提供了理论依据和技术方法途径。
参考文献
[1]刘书含,顾行发,余涛.高分一号多光谱遥感数据的面向对象分类[J].中国科学院遥感与数字地球研究所,2014,39(1):91-94.
[2]杨希.基于神经网络的高分辨率遥感影像分类研究[D].成都:西南交通大学,2009
[3]王金亮,李石华.基于自组织神经网络的遥感图像分类应用研究[J].云南师范大学旅游与地理科学学院,2006,85(1):6-10.
[4]陈芳杰.基于BP神经网络遥感图像特征分类研究[D].合肥:安徽大学,2012.
[5]Window B.et al.Neural Networks Application industry,Business and munication of the ACM,19994,37:993-105.
[6]Special Issueon Application of Neural Network.Proc IEEE,1996,84(10).
作者简介
高鸿斌(1964-),男,教授,硕士生导师,研究方向计算机测控和物联网。
篇4
关键词:BP神经网络;人脸识别;MATLAB
中图分类号:TP391
随着科技的发展,对人脸识别技术的发展要求越来越迫切,如(1)在企业、住宅安全和管理方面,要求实现人脸识别门禁考勤系统,人脸识别防盗门等。(2)在公安、司法和刑侦方面,利用人脸识别,在全国范围内搜捕逃犯。(3)在银行的自动提款机中,如果应用人脸识别就会避免由于用户卡片和密码被盗。(4)在电子商务交易过程中,如果使用人脸识别实现当事人在网上的数字身份和真实身份统一,便增加了电子商务的可靠性。而人脸识别的软件系统开发,是联系理论和实践的最重要的环节,因此实现人脸识别系统的开发应用越来越重要。
1 BP网络的概述
1.1 BP神经网络的定义。前馈多层神经网络广泛的应用于模式识别与分类、控制、预测、图像处理等问题,是当今社会应用最广、发展最快的人工神经网络之一。由于此神经网络的网络权值阈值的确定常采用误差反向传播算法(Back Propagation,简称作BP算法),所以通常称这种前馈网络为BP网络。典型的BP网络是三层网络,包括输入层、隐含层和输出层。各层之间实行全连接,而其中隐含层可以是一层,也可以是多层(如图1)。
图1 单隐含层的BP网络结构
BP网络的学习由四个过程组成,即:(1)输入模式:输入层经隐含层向输出层的“模式顺传播”过程;(2)网络的理论输出与网络实际输出之差的误差信号:由输出层经隐含层向输入层逐层修正连接权的“误差逆传播”过程;(3)由“模式顺传播”与“误差逆传播”的反复交替进行的网络“记忆训练”过程;(4)网络趋向收敛即网络的全局误差趋向极小值的“学习收敛”过程。简言之,就是由“模式顺传播”“误差逆传播”“记忆训练”“学习收敛”的过程。传递函数一般为(0,1)S型函数 。BP网络隐层中的神经元均采用S型交换函数,输出层则采用纯线性变换函数。
1.2 BP网络的算法。BP算法可描述为大致五步:(1)初始化各权值为较小的随机值;(2)选取训练集;(3)根据输入计算理论输出;(4)调节输出层和隐含层的连接权值;(5)返回第二步反复训练网络直至误差理想为止。
其流程图如图2:
图2 神经网络算法流程图
2 BP神经网络实现人脸识别
2.1 设计思路。本设计采用50幅图像(10个人每人5幅)作为训练图像,应用主成分分析对训练图像进行二阶相关和降维,提取训练图像的独立基成分构造人脸子空间,并将训练集中的人脸图像向独立基上投影得到的系数输入改进的BP神经网络进行训练。然后将待识别的人脸图像向独立基上投影得到投影系数,再将其输入已训练过的BP神经网络进行识别。设计结构如图3。
图3 人脸识别系统结构
2.2 BP网络的创建和初始化。因网络的输入矢量与输出矢量相差较大,为了减少网络的训练误差,在建立网络之前要对输入矢量进行归一化。这里我们利用premnmx函数把输入初始化在[-1,1]之间。程序代码如下:
p=premnmx(p')';
t=[1000;1000;1000;1000;1000;0100;0100;0100;0100;0100;
0010;0010;0010;0010;0010;0001;0001;0001;0001;0001]'
2.3 训练神经网络。本设计的方法如下:
%设计神经网路
[prow pcol]=size(p);
num=prow*pcol;%提取p中元素个数作为神经网络的输入层神经元个数
net=newff(minmax(p),[num,10,4],{'tansig','tansig','purelin'},'traingda');%隐层神经元个数为10,输出层神经元个数为4,4表示识别出人
net.trainParam.show=200;%显示速率为200
net.trainParam.lr=0.01;%学习率为0.01
net.trainParam.epochs=5000;%迭代次数不超5000
net.trainParam.goal=0.001;%训练误差为0.001
[net,tr]=train(net,p,t);
网络的训练函数有很多种,如trainlm,其中traingd学习算法是一般的剃度下降法;traingdx学习算法是剃度下降动量法,学习速率是自适应的。Trainlm的学习算法为Levenberg-Marquadt反传算法,该训练函数的优点在于收敛速度很快。本设计选用的训练函数为traingdx,在网络达到起训练误差要求时会自动停止,节省训练时间。训练过程中为了得到较小的误差,可以增加训练次数。
2.4 系统的性能评估。为了测试设计的网络模式识别系统的可靠性,这里用50幅图像输入样本,来观察其输出结果。通过程序演示,基本可以识别出不同的人脸特征。如果要提高精度,可以延长网络的训练时间,或者是将网络隐含层的神经元数目增多。为了测试系统,可提取几取几幅人脸图片数据,然后把它们输入到网络中,观察其得到的输出,并进行误差分析。
3 结束语
本设计是利用BP算法,以MATLAB软件作为工具手段,建立人脸识别的BP神经网络,且利用50副人脸图像数据训练网络,使神经网络能辨别出人脸信息。结果说明,本设计在人脸识别方面有比较好的优势。
在本设计中,使用了不人脸图像数据作为输入来训练网络,提高了整个网络容错的能力,这样更适合在实际环境中使用。
参考文献:
[1]蔺广逢,繁引娣,张媛.主成分分析与BP神经网络的人脸识别方法研究[J].现代电子技术,2007(02).
[2]MartinT.Hag,Howard B.Demuth. Neural Network Design Original[M].PSW publishing company.
[3]张威.MATLAB基础与编程入门[M].西安:西安电子科技大学出版社,2004.
[4]丛爽.面向MATLAB工具箱的神经网络理论与应用[M].合肥:中国科学技术大学出版社,2003.
篇5
关键词能源需求预测,粒子群算法,BP神经网络,主成分分析法
中图分类号F201 文献标识码A
Construction of Energy Demand Forecasting
Model and Empirical Analysis of Guangdong Province
YE Yiyong
(College of Economics & Management Wuyi University Jiangmen, Guangdong 529020,China)
AbstractIn order to make accurate forecast for energy demand of Guangdong province, this paper analyzed the various factors which impact on energy demand of Guangdong province, and constructed the predict index system. On this basis, according to the nonlinear characteristics of the energy system, combined with the advantages of particle swarm optimization algorithm and BP neural network, a prediction model was constructed based on PSOBP neural network. And the method of principal component analysis was used to reduce the dimensions of the prediction index system in order to reduce the size and complexity of the neural network. Then, this paper simulated the energy demand data of Guangdong province from 1985 to 2013, and carried on the forecast energy demand of Guangdong province during 2014 to 2018. The theoretical analysis and empirical study show that this method can reflect the characteristics of energy demand of Guangdong province, and the predicted result is more accurate and reasonable.
Key words forecasting of energy demand, PSO, BP neural network, PCA
1引言
随着社会经济的快速发展,各行业对能源的需求大幅度增加.据统计,广东省2000年的能源消耗量是7 983万吨标准煤,2013年的能源消耗量上升到25 645万吨标准煤,是2000年消耗量的3.2倍,其中一次能源消费90%依赖省外,二次能源消费中的电力消费有10%也是依赖省外,据估算,未来10年这个比例将达到30%左右.经济快速发展所带来的巨大能源需求与供给不足之间的矛盾越来越严重,能源短缺已成为制约广东省经济持续发展的关键问题,如果不采取有效的措施,将会延缓广东省产业结构的转型升级优化,乃至影响全省经济的稳步增长.系统地分析广东省能源需求的影响因素,准确地预测广东省未来能源需求的数量,进而制定科学合理的能源发展战略,确保广东省经济可持续发展,具有非常重要的现实意义.
2文献综述
能源系统是一个复杂的非线性系统,其需求量受到众多因素的影响.当前很多学者已经对能源需求问题进行了深入的研究,使用的预测方法包括趋势外推法、消费弹性法、主要消耗部门预测法、回归分析法预测等[1-3],取得了一定的效果.但在预测精度方面还存在一定的差距,一方面是由于能源系统本身的复杂性、非线性、非确定性的特征导致的,另一方面是因为预测方法本身还存在一些不足之处,不足以完全准确反映预测目标和指标体系之间的数量关系.要解决上述问题,除了需要构建科学的预测指标体系,更关键的就是要寻找更加科学有效的预测方法.
鉴于此,部分学者开始研究能源系统的非线性和不确定性等系统特征,如自组织特征、分形特征、混沌特征和模糊性等,并在此基础上引进非线性方法对能源需求进行预测,如非线性/混沌时间序列方法、遗传算法、灰色理论、人工神经网络方法等[4-8],这些方法可以弥补线性模型在预测复杂能源需求时的不足.其中具有代表性的方法是人工神经网络,它是由大量神经元通过极其丰富和完善的连接而构成的自适应、非线性动态系统,它从结构、实现机理和功能上模拟生物神经网络,通过并行分布式的处理方法,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点[9].它在解决非线性及高维模式识别问题中表现出许多特别的优势,受到学者的青睐.当前,已有众多学者将神经网络及其扩展模型应用于时间序列预测方面,并取得了很好的效果[10-15].
通过对文献的综合分析发现,神经网络及其相关的模型已经被广泛应用到金融、工业、交通等领域,但是在能源需求预测领域的应用较少.针对广东省能源需求系统具有非线性和影响因素众多等特征,建立了基于改进的PSOBP神经网络的预测模型,给出了方法的基本原理和具体实现步骤,然后通过对广东省1985―2013年能源需求历史数据的建模和仿真,验证了方法的有效性,最后对广东省未来5年的能源需求进行预测,为能源管理者提供决策参考的依据.
3广东省能源需求影响因素分析
能源需求受到多方面因素的影响,本文结合其他学者的研究成果[16-18],遵循可获得性、可比性、实际性、综合性的原则,从以下几个方面对影响能源需求的因素进行分析.
①经济增长.经济增长是影响能源需求的主要因素,随着广东省社会经济的快速发展和产业结构的持续优化,对能源的需求量将在很长一段时间内保持较高的水平.衡量经济增长的指标本文采用国内生产总值(GDP).
②产业结构调整.三大产业中,工业的发展对经济增长的贡献最大,对能源的需求也最大,第一、第三产业对能源的需求相对较少.工业的快速发展所带来的负面影响是显而易见的.近年来,广东省在产业结构优化和转型升级方面出台了一系列的政策措施,随着我省产业结构的调整,对能源需求数量的必将产生很大的影响.
③能源消费结构.该项指标反映了各种消费能源在消费总量中所占的比例关系,广东省的能源消费以煤为主,据统计,超过50%的能源来自煤炭燃烧.煤炭为不可再生能源,利用率较低,容易污染环境,政府在大力推行开发可再生能源和清洁能源,改善能源消费结构,降低能耗指数.
④技术进步.首先是通过先进技术的应用,改善生产工艺和流程,提高能源的利用率,节约能源消费;其次是将技术应用于新能源开发,从而改变能源消费结构,进而影响能源消费总量.由于技术进步难以量化,本文使用单位GDP的能耗来表示.
⑤人口和城市化.能源是人类生存和发展的物质前提,人类的衣食住行与能源息息相关,人口基数越大,对能源的需求量就越大,随着工业化、城镇化进程的加快,人民生活水平稳步提升,对能源需求的影响更加明显.
⑥居民生活消费水平.居民生活水平的提高,以及消费观念和消费行为的变化,会直接导致产业结构的变动,进而影响能源消费的数量,特别是增加对电力、液体和气体燃料等优质能源的需求.
综上所述,影响能源需求的主要因素有经济的增长(广东省GDP)、产业结构(工业在国民经济中的比重)、能源消费结构(煤炭的消费比重)、技术进步(单位GDP的能耗)、人口(广东省人口数量)、城市化(全省城镇人口所占的比重)、居民人均消费水平,预测对象为广东省每年的能源消费数量.
4PSOBP能源需求预测模型构建
4.1BP神经网络模型
BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号向前传递,误差反向传播.在前向传递中,输入信号从输入层经过隐含层逐层处理,直至输出层.每一层的神经元状态只影响下一层神经元状态.如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出[19].BP神经网络的拓扑结构如图1所示,BP算法如下.
1)各层权值及阈值的初始化.
2)输入训练样本,并利用训练样本对网络进行训练,计算各层输出.
3)求出并记录各层的反向传输误差.
4)按照权值以及阈值修正公式修正各层的权值和阈值.
5)按照新的权值重复2)和3).
6)若误差符合预设要求或者达到最大学习次数,则终止学习.
7)使用训练好的模型对预测样本进行预测.
4.2标准粒子群优化算法
粒子群优化算法(Particle Swarm Optimization)源于对鸟类捕食行为的研究,鸟类捕食时,每只鸟找到食物最简单有效的方法就是搜寻当前距离食物最近的鸟的周围区域.PSO算法就是从这种生物种群行为特征中得到启发并用于求解优化问题的.算法中每个粒子代表问题的一个潜在解,每个粒子对应一个由适应度函数决定的适应度值.粒子的速度决定了粒子移动的方向和距离,速度随自身及其他粒子的移动经验进行动态调整,从而实现个体在可解空间的寻优[19].
假设粒子群的种群规模为Z,搜索空间为Y维,第i个粒子的位置表示为
Xi={xi1,xi2,…,xiY},i=1,2,…,Z,第i个粒子的速度表示为Vi={vi1,vi2,…,viY,第i个粒子的个体极值表示为Pi={pi1,pi2,…,piY,当前的全局极值表示为Pg={pg1,pg2,…,pgY.因此,粒子的速度与位置按下式更新:
Vi(k+1)=ωVi(k)+c1r1(Pi(k)-Xi(k))+
c2r2(Pg(k)-Xi(k)),
Xi(k+1)=Xi(k)+Vi(k+1),
vij(k+1)=vmax,vij(k)>vmax,
-vmax,vij(k)
其中,ω为惯性权重,是平衡粒子的全局搜索能力和局部搜索能力的参数;c1和c2为加速因子,是调整粒子自身经验和群体经验对粒子运动轨迹的影响的参数;r1和r2是在[0,1]区间内均匀分布的两个随机数;vmax为粒子的最大速度,是用来限制粒子的速度的参数,vij为第i个粒子在第j维的速度.
4.3改进的粒子群优化算法
标准的粒子群算法虽然具有收敛速度快、通用性强等优点,但由于算法实现过程仅利用了个体最优和全局最优的信息,因此导致种群的多样性消失过快,出现早熟收敛、后期迭代效率不高、容易陷入局部最优等缺点,增加了寻找全局最优解的难度.要解决上述问题,可以从以下两方面进行改进.
4.3.1动态调整惯性权重
惯性权重ω用来控制粒子之前的速度对当前速度的影响,它将影响粒子的全局和局部搜索能力.较大的ω值有利于全局搜索,较小ω值有利于局部搜索,但在标准的PSO算法中,ω的值是固定的,在算法运行过程中,根据实际情况给ω赋予动态变化的值,使得算法能够平衡全局和局部搜索能力,这样可以以最少的迭代次数找到最优解.经验参数是将ω初始值设定为0.9,并使其随迭代次数的增加线性递减至0.3,以达到上述期望的优化目的.通过线性转换来完成上述参数值变化的过程.
ω=ωmax-ωmax-ωminnN. (2)
其中ωmax,ωmin分别是ω的最大值和最小值,n和N是当前迭代次数和最大迭代次数,在迭代开始时设ω=ωmax,ω在迭代过程中逐渐减小,直到ω=ωmin.
这样设置使PSO算法能够更好的控制探索与开发的关系,在开始优化时搜索较大的解空间,找到合适的粒子,然后在后期逐渐收缩到较小的区域进行更精细的搜索以加快收敛速度.
4.3.2增加粒子的多样性
在此借鉴遗传算法中变异的思想,对部分符合条件的粒子以一定的概率重新初始化,目的是通过变异操作来保持种群的多样性,拓展种群的搜索空间,使得粒子能够跳出当前局部最优的位置,在更大的空间继续搜索全局最优值.引入线性动态变异算子:
Fn=Fmin-nN(Fmin-Fmax).(3)
式中,Fn为当前的变异概率;n为当前的迭代次数;N为最大的迭代次数;Fmax,Fmin为最大的变异概率和最小的变异概率.
刚开始迭代时,种群以一个极小的概率发生变异,至迭代后期,变异概率迅速扩大,粒子可以迅速跳出当前的搜索区域,在更大的区域内寻找最优解.
4.4改进的PSOBP神经网络模型
BP神经网络的学习过程主要是权值和阈值的更新过程,采用的学习算法是以梯度下降为基础的,但梯度下降法的训练效果过于依赖初始权值的选择,且存在训练时间长、易陷入局部极小等问题.而粒子群算法可以避免梯度下降法中要求函数可微、对函数求导的过程,也避免了遗传算法中的选择、交叉等操作,具有收敛速度快、记忆性强和全局搜索能力较强等特点[20],可以将两种算法结合起来,利用PSO算法中粒子的位置来对应神经网络网络中的连接权值和阈值,以神经网络的输出误差作为PSO算法的适应函数,通过PSO算法的优化搜索来训练神经网络的权值和阈值,可以弥补BP网络在学习能力和收敛速度上的不足,既充分发挥了神经网络的非线性映射能力,还可以缩短神经网络的训练时间,提高预测的精度.
PSO优化BP神经网络的主要步骤如下.
1)初始化.根据BP神经网络的输入样本,建立BP神经网络的拓扑结构,输入层节点数,隐含层节点数,输出层节点数;初始化粒子的位置和速度,以及粒子数、最大迭代次数、惯性权重、学习因子等参数.
2)通过网络训练,计算粒子的适应度值,得到粒子的个体最优值与全局最优值.将粒子适应度值与个体最优值和全局最优值相比较,记录当前粒子所经历的最好位置.
3)考察每一个粒子的适应度值.若该值优于个体最优,则将当前值置为个体最优,并更新该粒子的个体最优;若粒子中的个体最优优于当前的全局最优,则将个体最优置为全局最优,并更新全局最优值.
4)将经过PSO优化的权值和阈值作为BP神经网络的初始权值和阈值代入BP网络,训练至满足网络的性能指标,即均方误差小于预先设定的误差要求或达到最大迭代次数时,停止迭代,输出结果,否则转到2,继续迭代直至算法收敛.
5)由训练和测试样本完成神经网络的训练和测试,输出预测值.如图2所示.
5.2数据预处理
为了消除各指标不同量纲的影响,需要对数据进行标准化处理,以解决指标之间的可比性.本文使用离差标准化的方法,对原始数据进行线性变换,使变换后的值映射到[0,1]之间,并保持原本的数量关系,变换公式如(4)式所示.
Yi=(Xi-min)/(max-min).(4)
其中,Yi是样本i归一化的值,Xi是样本i的值,min为样本最小值,max为样本最大值.但这个方法有个缺点,当有新的样本数据加入时,数据的最大值和最小值可能会发生变化,需要重新计算Yi值.
在预测或者评价完成后,再使用反归一化的方法对数据进行还原处理,得出其真实值,具体的数据处理过程可以直接调用Matlab工具箱里的Mapminmax函数来完成.
5.3数据降维
就神经网络的结构而言,预测指标体系越庞大,指标数量越多,模型就越复杂,预测结果的不确定性就越大,相应地,模型的泛化能力会降低,同时也会增加运算的时间.因此有必要对前面确定的影响能源需求的指标进行定量化的分析,在尽量减少信息丢失的前提下减少指标的个数,即完成样本指标的降维.
主成分分析法就是通过线性变换的方法,把原始变量组合成少数几个具有代表意义的指标,使得变换后的指标能够更加集中地反映研究对象特征的一种统计方法[21].对样本的原始数据进行主成分分析,得到各个主成分的特征值和方差贡献率,如表2所示.
从表2的数据可知,当抽取的主成分为Y1,Y2时,主成分的累计方差贡献率已达到93.22%,基本覆盖了原来7个指标所包含的信息.因此可以把Y1,Y2这2个主成分的数据作为模型的输入,这样就大幅度减少了神经网络的输入节点数,降低了模型的复杂程度,同时也有利于前期样本数据的获取.
根据主成分分析法得出前2个主成分的系数如表3所示.
从表达式(5)可以看出,第一主成分Y1与x1、x2、x5、x6、x7均保持了较强的正相关,而与x3,x4呈现出负相关,这个数量关系说明了第一主成分基本反映了上述指标的信息.由于x1、x2、x5、x6、x7是从不同的方面反映了社会经济发展的水平,而x3和x4反映了能源消费的状况,因此,第一主成分Y1是综合反映了经济发展状况和能源需求之间的密切关系.
从表达式(6)可以看出,第二主成分Y2与x1、x2、x3、x4相关性较强,其中与x3(能源结构)是高度相关的,说明第二主成分基本反映了这个指标的信息.
5.4模型参数设置
神经网络的结构一般由样本的输入和输出指标数量确定,由于使用PCA做数据降维后,样本数据的维数为2,输出数据维数为1,所以确定模型的输入节点数为2,输出节点数为1.本文选用的是三层的BP神经网络模型,关于隐含层数目的确定,目前没有一个通用的方法,只能根据经验或者多次试验来决定.由于隐含层的数量会影响到模型的学习时间、拟合效果以及泛化能力,因此必须确定一个最佳的隐含层单元数,根据相关学者的研究结论,隐含层的数量与问题的要求、输入、输出指标的个数都有关系,且其数量关系符合以下的计算公式[21]:
R=S1+S2+a.(7)
其中R为隐含层单元数,S1、S2分别为输入层和输出层的数量,a为[1,10]之间的常数.经过循环比较算法,得出R的值为4时,模型具有较好的学习效果和泛化能力,因此本文确定神经网络模型的结构为2-4-1,隐层使用sigmoid函数,输出层使用pureline函数,神经网络的学习效率取0.1,训练次数为150,输出目标值为0.001.粒子群规模为50,迭代次数为100,学习因子c1=1.7,c2=1.5,惯性权重ωmax=0.9,ωmin=0.3,粒子速度最大值为5,最小值为-5.
5.5模型训练
本文选取前24个样本数据作为训练数据,用于确定模型的相关参数,剩余5个样本作为测试数据,用于检验模型的效果.
将训练数据代入模型进行计算,得到的适应度曲线变化如图3所示,训练值与实际值比较如图4所示,可以看出PSOBP模型对历史数据的学习情况非常理想,大部分样本的训练值与实际值基本吻合,个别样本有一定的偏差,但在合理的误差范围之内,说明该模型的构建是行之有效的.
5.6模型测试
将训练后的模型对5个预测样本数据进行预测,并把预测值与实际值进行比较,结果如表4所示,预测结果如图5所示,样本误差如图6所示.可以看到,2009-2013年的预测准确度非常高,平均误差为2.3%,以2009年为例,预测偏差为2.87%,换算成实际的偏差数量就是552.95万吨标准煤,准确的预测结果将为能源规划与实施提供有力的依据.
由表5可知,PSOBP模型的预测平均误差为2.3%,BP模型的平均预测误差为4.8%,说明经过粒子群算法优化神经网络参数后,不仅使得模型的收敛速度加快,运算时间减少,同时在预测精度方面也有了很大的提升.
5.7不同方法预测结果比较
为了体现PSOBP神经网络模型的优势,本文同时使用未经优化的BP神经网络对数据进行训练和预测,并将两种预测结果进行比较,具体数据见表5所示,比较效果如图9和图10所示.
5.8未来5年能源需求预测
根据上述预测模型和流程,对广东省未来5年的能源需求进行预测,这里假设未来5年各项样本指标均保持当前的增长速度,得出的结果见表6.
从表6可知,未来5年,广东省的能源需求将持续增长,平均保持5.7%的增长率,并且增长的速度逐步加快,2018年的需求量将达到33 842.34万吨标准煤.因此,如何针对快速增长的能源需求,采取有效的措施来解决供需不平衡的矛盾,将是决策者需要考虑的问题.根据广东省发改委2013年底公布的《广东省能源发展十二五规划》,在保证全省能源供应能力的前提下,将进一步加快能源消费结构的调整,构建与科学发展要求相适应的安全、稳定、经济、清洁的现代能源供应保障体系,具体措施是进一步优化能源结构和布局,提升能源利用效率,逐步降低单位GDP能耗,并且争取在新能源的利用开发方面取得突破性进展,从而为全省经济社会发展提供强有力的能源保障.
6结论
对广东省的能源需求问题进行了深入的研究,在结合定性和定量分析的基础上,确定了影响能源需求的主要因素,构建了PSO-BP神经网络的能源需求预测模型,并对广东省2014-2018年的能源需求进行了预测.理论分析和实证研究表明,该方法能够很好的反映广东省能源需求的特征,预测结果较为准确合理.但就本文所考虑的预测指标体系而言,以定量的指标为主,如何在模型中把政策法规、环境保护等难以定量的影响因素包含进来,构建更为完善的预测指标体系,以及当样本数量较少的时候,如何保证模型的学习能力和泛化能力,这些问题需要继续完善解决.
参考文献
[1]林伯强.中国能源需求的经济计量分析[J].统计研究, 2001(10):34-39.
[2]韩君.中国能源需求的建模与实证分析[D].兰州商学院, 2007.
[3]魏一鸣等.中国能源需求报告(2006):战略与政策研究[M].北京:科学出版社, 2006.
[4]A S WEIGEND . Time series analysis and predicationusing gated experts with application to energy demandforecast[J]. Applied Articial Intelligence, 1996(6):583-624.
[5]V GEVORGIAN , M KAISER . Fuel distribution andconsumption simulation in the republic of Armenia[J]. Simulation, 1998(3):154-167.
[6]张玉春,郭宁,任剑翔.基于组合模型的甘肃省能源需求预测研究[J].生产力研究, 2012(11):31-34.
[7]冯亚娟,刘晓恺,张波.基于QGALSSVM的能源需求预测[J].科技与经济,2014(3):56-61.
[8]芦森.基于组合模型的中国能源需求预测[D].成都:成都理工大学, 2010.
[9]李琳娜.基于核主成分分析(KPCA)和神经网络的单目红外图像深度估计[D].上海:东华大学, 2013.
[10]张均东,刘澄,孙彬.基于人工神经网络算法的黄金价格预测问题研究[J].经济问题, 2010(1):45-48.
[11]熊志斌.ARIMA融合神经网络的人民币汇率预测模型研究[J].数量经济技术经济研究, 2011(6):75-81.
[12]龙文,梁昔明,龙祖强,等.基于混合进化算法的RBF神经网络时间序列预测[J].控制与决策, 2012(8):20-25.
[13]王庆荣,张秋余.基于随机灰色蚁群神经网络的近期公交客流预测[J].计算机应用研究, 2012(6):32-37.
[14]张大斌,李红燕,刘肖,等.非线性时间序列的小波-模糊神经网络集成预测方法[J].中国管理科学, 2013(2):81-86.
[15]高玉明,张仁津.基于遗传算法和BP神经网络的房价预测分析[J].计算机工程, 2014(4):187-191.
[16]伍秀君.广东省能源需求预测分析及能源发展对策研究[D].广州:暨南大学,2007.
[17]薛黎明.中国能源需求影响因素分析[D].徐州:中国矿业大学,2010.
[18]秦国真.云南能源需求影响因素分析及预测[D].昆明:云南财经大学,2012.
[19]来建波.基于神经网络的路段行程时间预测研究[D].昆明:云南大学, 2011.
篇6
(1.黑龙江八一农垦大学,黑龙江 大庆 163319;2.长春理工大学,长春 130022;
3.大庆油田有限责任公司第一采油厂,黑龙江 大庆 163162)
摘要:提出了一种基于近红外透射光谱及最速下降BP算法识别大豆油质量的方法。光谱采集范围是10 000~4 000 cm-1,将得到的近红外光谱数据作为网络的输入神经元,利用主成分分析方法得出8个变量指标数,该变量指标对样品累计贡献率达到99.9%以上;将8个主成分的特征值作为BP网络的输入向量,建立BP神经网络模型。该模型对预测样品集能正确判别,判别正确率达到100%。
关键词 :近红外透射光谱;BP神经网络;豆油质量分析
中图分类号: O657.33文献标识码:A文章编号:0439-8114(2015)01-0175-03
DOI:10.14088/j.cnki.issn0439-8114.2015.01.045
Quality Analysis of Soybean Oil based on Near Infrared Transmission Spectra and Artificial Neural Network Model
CAI Li-jing1,CAI Li-juan2,LI Wen-yong3,ZHAO Xiao-yu1,SHANG Ting-yi1
(1. Heilongjiang Bayi Agricultural University,Daqing 163319,Heilongjiang,China;2. Changchun University of Sciences and Technology,Changchun 130022,China;3. The Fist Oil Production Company, Daqing oilfield,Daqing 163162,Heilongjiang,China)
Abstract: A method based on near infrared transmission spectra and gradient descent BP algorithm was used to analyzed the quality of soybean oil. The range of 10 000 to 4 000 cm-1 spectral was acquired, then the near infrared spectrum data was input to BP network. Eight variable indexes were obtained with principal component analysis. The cumulative contribution rate of the 8 variable indexes was more than 99.9%. Using the 8 index as input vectors of BP neural networks model, it can discriminate the quality of samples with the accuracy of 100%.
Key words:near infrared transmission spectroscopy;BP neural network;soybean oil quality analysis
收稿日期:2014-03-20
基金项目:黑龙江省教育厅科学技术研究项目(12521378)
作者简介:蔡立晶(1977-),女,吉林前郭人,讲师,硕士,主要从事电磁场微波技术及光电检测技术的教学与研究工作,(电话)13845942988(电子信箱)threeminimoons@126.com。
近红外光谱技术具有快速、高效、无污染、无需前处理、无损分析及多组分同时测定等优点,在快速检测领域有较大的潜力和发展空间。近红外光谱分析技术用于食用油品质分析检测目前也有一些研究报道,主要用于油脂的品质检测[1]。西方国家最早利用近红外技术进行油脂品质分析。近红外技术结合判别分析方法等,在橄榄油[2,3]、坚果油[4]及其他植物油[5]的检测中已得到成功应用。刘福莉等[6]以8种食用油纯油的43个样品为对象,研究了近红外透射光谱结合聚类分析法快速鉴别食用油种类的可行性,判别模型对预测集样品的准确率达到100%。范璐等[7]利用气相色谱和傅里叶变换红外吸收光谱,对21种花生油、20种棕榈油及两者的4种调和油进行分析,对花生油和棕榈油做了识别分析。近红外光谱技术在掺伪检测中有着很多的应用[8],翁欣欣等[9]研究了橄榄油中掺伪情况研究,采用BP神经网络对掺伪橄榄油和未掺伪橄榄油进行了鉴别,对52个样品进行了预测,预测准确率为100%。随着营养学的研究发展,评估食用植物油的营养价值,研究分析常用食用植物油中的脂肪酸的组成是有意义的,吴静珠等[10,11]对食用油脂肪酸的定量分析进行了研究,人们对植物油中脂肪酸的认识不断增加。
人工神经网络方法是一种具有很强函数逼近能力的非线性建模方法,在人工神经网络的实际应用中,BP网络广泛应用于函数逼近、模式识别/分类、数据压缩等。陈建等[12]提出了一种采用近红外光谱技术结合人工神经网络对玉米品种进行鉴别的方法,试验结果说明该方法能快速无损地鉴别玉米品种,为玉米的品种鉴别提供了一种新方法。罗一帆等[13]进行了近红外光谱测定茶叶中茶多酚和茶多糖的人工神经网络模型研究,建立近红外光谱测定茶叶中茶多酚和茶多糖的模型,由此说明建立的近红外光谱-人工神经网络模型可用于预测茶叶中茶多酚和茶多糖的含量。赵肖宇等[14]研究应用近红外透射光谱和人工神经网络的豆油脂良莠鉴别,建立3层BP神经网络模型,模型能够有效辨识未知豆油脂的良莠以及不合格具体种类,类别预测正确率为100%。
本研究采用基于近红外透射光谱及神经网络中的最速下降BP算法的方法,对纯大豆油和掺杂大豆油进行真伪鉴别研究。
1 材料与方法
1.1 仪器
采用北京瑞利分析仪器公司WQF-510型傅里叶变换红外光谱仪。室温介于15~30 ℃,相对湿度的允许范围小于60%。仪器预热,系统通过自检且已获得本底光谱时,开始扫描样品。采集光谱范围10 000~4 000 cm-1,采样分辨率为4 cm-1,扫描次数32次,液体池6 mL玻璃器皿。
1.2 材料
样品包括两种,纯大豆油和掺杂大豆油,全部样品未经任何化学处理。所使用的纯大豆油是超市购买的九三大豆油,掺杂大豆油是指纯大豆油中掺入一定比例的猪油。为了使配置的掺杂大豆油得以充分混合,在制备样品前,先把猪油放在恒温箱中加热使其成液体状态,取一定量的猪油混合到纯大豆油中进行充分搅拌使其充分混合。将带有样品的器皿放入傅里叶变换红外光谱仪中进行光谱采集。每种样品光谱采集为30个样品,共收集60个样品的光谱信号。
2 结果与分析
2.1 光谱采集
纯大豆油和掺杂大豆油的近红外透射光谱见图1。由图1可见,掺杂大豆油与纯大豆油图谱之间的差异不明显。近红外光谱图之间的差异很小,很难通过直观的分析对两种油进行鉴别。
2.2 主成分数据处理
将asf文件转换为ASC码文件,每条谱图数据量为1 556个,共计得到60×1 556个全波段数据点,试验训练样品集数为50个,而且直接把光谱矩阵X50x1 556作为神经网络的输入,则输入元为1 556个,BP网络的规模较为复杂。将原始光谱矩阵进行主成分分解,主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。以减少神经网络输入的神经元。
采用Matlab的矩阵计算功能来编程实现主成分分析。主成分分析计算步骤为计算相关系数矩阵和计算特征值与特征向量,以及计算主成分贡献率及累计贡献率。特征根数量为8,即得到8个主成分,即val1,val2,val3,val4,val5,val6,val7,val8其累积贡献率分别为70.17%,90.42%,97.13%,98.78%,99.56%,99.88%,99.96%,99.99%。采用8个变量指标数,对样品计算累计贡献率均达到99.9%以上,基本可以涵盖样品光谱图的所有信息,因此红外透射光谱数据得到了最大程度不失真简化。将分解得到的矩阵T50x8作为BP网络的输入神经元。此时,BP网络的输入元从1 556降为8个,也就是8个主成分的特征值作为BP网络的输入向量。
2.3 神经网络建模与分析
BP网络的设计主要包括输入层、隐层、输出层及各层之间的传递函数等[15,16]。通用的神经网络需要预先确定网络的层数,而BP网络可以包含不同的隐层。理论上已经证明,在不限制隐层节点数的情况下,两层(只有一个隐层)的BP网络可以实现任意非线性映射。在模式样本相对较少的情况下,较少的隐层节点可以实现模式样本空间的超平面划分,此时选择两层BP网络就可以了,当模式样本数很多时,减少网络规模,增加一个隐层是必要的,但BP网络隐层数一般不超过两层。
试验采集光谱样品数为60个,随机抽取50个作为训练集,10个作为验证集。在BP网络设计中,数据主要分为两类模式,用1个输出元素即可表示,采用两层BP网络来实现分类。因为BP网络的输出为logig函数,所以目标向量的取值为0.2和0.8,分别对应两类模式。在程序设计时,通过判决门限0.5区分两类模式,输出元素分别为0和1。采用最速下降BP算法训练该网络。训练曲线训练经过了5 000次仍未达到要求的目标误差0.001,虽然训练的误差性能未达到要求的目标误差,但这并不妨碍用测试样本对网络进行仿真。
利用建立的BP网络模型对剩下的10个预测集样品进行鉴别,掺杂大豆油样品预测样本数为5个,纯大豆油预测样本数为5个。预测结果见表1。预测样品集可以做到正确的判别,判别正确率达到100%。
3 结论
采用大豆油为研究对象,利用傅里叶变换近红外光谱仪采集大豆油的近红外透射光谱,通过主成分分析及神经网络技术对光谱数据进行分类识别。结果表明,近红外透射光谱的网络建立及仿真可完成两类模式的分类。采用纯大豆油与掺杂大豆油两种的透射光谱,对光谱预处理,抽出8个主成分作为神经网络的输入神经元,建立最速下降BP网络模型,对预测集大豆油预测结果正确率为100%。试验表明将近红外透射光谱与神经网络技术相结合能够快速检测大豆油是否掺杂,从而为检测大豆油的品质提供一种简单有效的方法。
参考文献:
[1] 于燕波,臧 鹏,付元华,等.近红外光谱法快速测定植物油中脂肪酸含量[J].光谱学与光谱分析,2008,28(7):1554-1558.
[2] 张 欣,于瑞祥,方晓明,等.橄榄油掺假检测技术的研究进展[J].中国油脂,2013,38(3):67-71.
[3] 林远辉,高 蓓,李玉玉,等.橄榄油掺假鉴别技术研究进展[J].食品科学,2013,34(5):279-283.
[4] 魏长宾,刘胜辉,臧小平,等.澳洲坚果油脂肪酸组成分析[J].中国油脂,2008,33(9):75-76.
[5] 李宗朋,王 健,张晓磊,等.基于近红外光谱技术的沙棘籽油鉴伪方法研究[J].中国油脂,2014,39(2):57-62.
[6] 刘福莉,陈华才,姜礼义,等.近红外透射光谱聚类分析快速鉴别食用油种类[J].中国计量学院学报,2008,3(19):278-282.
[7] 范 璐,吴娜娜,霍权恭,等.气相色谱分析和傅里叶变换红外吸收光谱识别花生油中棕榈油[J].河南工业大学学报(自然科学版),2008,29(1):12-16.
[8] 吴静珠,刘翠玲,李 慧,等.基于近红外光谱的纯花生油惨伪快速鉴别方法研究[J].北京工商大学学报(自然科学版),2011,29(1):75-78.
[9] 翁欣欣,陆 峰,王传现,等.近红外光谱-BP神经网络-PLS法用于橄榄油缠在分析[J].光谱学与光谱分析,2009,29(12):3283-3287.
[10] 吴静珠,刘翠玲,李 慧,等.近红外光谱技术在食用油种类鉴别及脂肪酸含量检测中的应用[J].北京工商大学学报(自然科学版),2010.09,25(5):56-59.
[11] 吴静珠,徐 云.基于CARS-PLS的食用油脂肪酸近红外定量分析模型的优化[J].农业机械学报,2011,42(10):162-166.
[12] 陈 建,陈 晓,李 伟,等.基于近红外光谱技术和人工神经网络的玉米品种鉴别方法研究[J].光谱学与光谱分析,2008, 28(8).1806-1808.
[13] 罗一帆,郭振飞,朱振宇,等.近红外光谱测定茶叶中茶多酚和茶多糖的人工神经网络模型研究[J].光谱学与光谱分析,2005, 25(8).1230-1233.
[14] 赵肖宇,关 勇,尚廷义,等.应用近红外透射光谱和人工神经网络的豆油脂良莠鉴别[J].浙江农业学报,2011,23(4):825-828.
[15] 杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001.
篇7
(一)样本的选择
本文选取房地产上市公司作为样本以保证研究的真实性。鉴于我国上市公司鲜有破产的情况发生,本文采用证监会的界定原则,将ST或者*ST(specialtreatment)公司定义为处于财务危机状态的公司,将非ST公司界定为财务状况正常的公司。
1.财务危机状态样本的界定
样本来自于2005—2013年首次被ST或者*ST的34家房地产上市公司。选取的样本研究期是上市公司被特殊处理时首次发生亏损的前一年(T-3年)。房地产企业投资回收期较长,亏损时有发生,在这一年以后接连发生亏损以至被特殊处理,因此这一年是上市公司发生财务危机的重要转折点。
2.财务正常状态样本的选取原则
本研究针对的是房地产上市公司,界定未被特殊处理的房地产上市公司为财务状况正常的样本。为了排除政策等其他因素对研究的影响,选取的正常样本研究期应与发生财务危机的公司相同,据此本文最终选取了2005—2013年间34家房地产上市公司为财务状况正常的样本。
(二)预警指标的选择
由于财务危机的发生难以用几个简单的指标来描述,同时又缺乏相关经济理论的指导,造成了指标选择较为困难,本文采用试错法对指标进行筛选。基于全面性和可量化的原则,结合我国房地产行业的特征,从企业的短期偿债能力、现金流量能力、长期偿债能力、营运能力、盈利能力、股东获利能力、风险水平和发展能力8个方面。过多的指标存在着大量无用的信息,不仅会导致分析困难,而且会降低预测的准确性。因此在进行分析之前,必须对备选指标进行筛选,剔除对财务危机表现不显著的指标。
二、模型构建与分析
(一)财务数据的预处理
在采集到的数据中,部分财务指标缺乏,需要对这部分缺失的数据作一个预处理,保持数据的完整性,才能进行下一步的分析。对数据的预处理主要包括两种情况:一是对于报表中未披露的数据。用该企业近期的数据作大致估计,尽量能代表公司的实际情况。二是对于不存在的指标数据。比率型指标当分母为零时,该指标不存在,为了保持数据的连续性,当期指标数据以其前后两期的均值来代替。
(二)显著性检验为了使分析更具有针对性
需要对上述备选指标进行显著性检验,选出有差异的指标。对于分布不同的指标,采用不同的方法进行显著性检验。
1.服从正态分布指标的显著性
检验利用SPSS软件对上述备选指标进行正态分布检验。检验结果显示营运资金对资产总额比率、负债与权益市价比率、流动资金比率、营业成本率、账面市值比5个指标呈正态分布,其余指标不符合正态分布。变量呈正态分布,对两类样本的相关指标进行T检验,根据检验的结果判断两类样本的预警指标是否具有显著性差异。本次T检验显著性水平取值为0.05,在此显著性水平下,营运资金对总资产比率和营业成本率通过显著性检验,即这两个指标在两类样本中存在显著差异。
2.不服从正态分布指标的显著性
检验其余57个指标不服从正态分布,不能直接使用参数检验。非参数检验适用范围广,对数据要求也不严,但是容易造成信息的损失,检验效能低。为了保证信息的准确性,先将数据进行转化,利用转化后的数据进行参数检验。转化后的数据参数检验结果表明,流动比率、营运资金比率、长期资产适合率等25个指标通过了显著性水平为0.05的参数检验,在两组样本中差异显著。
3.显著性检验结果综合以上两种显著性检验结果。
(三)因子分析较多的指标会导致模型过度拟合
使得预测准确度降低。对上述27个指标进行因子分析,进一步减少指标的数量。对剩下的指标进行KMO测度和Bartlett球形检验。由上述检验结果可知KMO测度值为0.557,球形检验P值为0小于0.05,适合作因子分析。采用正交旋转法进行转换。结果显示,特征值大于1的主成分有10个,累计贡献率达84%,由正交旋转成分矩阵可得:因子一主要代表盈利能力,因子二、因子八、因子十主要代表股东获利能力,因子三和因子七主要代表长期偿债能力,因子四和因子六主要代表短期偿债能力,因子五主要代表营运能力,因子九主要代表风险水平。
(四)模型构建、预测结果及检验
1.BP神经网络模型的构建、预测结果及检验
BP神经网络模型主要由一个输入层、一个输出层、一个或多个隐含层构成,每层节点的权值通过BP神经网络自我学习来调整,关于隐含层节点数的确定尚无相关理论,目前主要通过试错法来确定。本次建模采用隐含层为一层的BP神经网络结构,隐含层节点数由试错法确定为4,从而得出BP神经网络结构为10-4-1。从每类样本中随机抽取20个作为建模组,剩余28个样本作为验证组,检验模型的预测效果。将建模组40个样本的10个因子作为BP神经网络模型的输入层作自我学习。模型自我学习完成之后,将剩余的28个测试样本输入经学习样本调适完成后的BP神经网络模型,得到的预测结果与实际结果比较。通过上述对比分析可知,BP人工神经网络模型预测上市公司的财务状况准确率为85.7%,具有较高的准确率。模型对于验证组中两类公司的预测准确率相同。
2.Logistic模型构建、预测结果及检验
将因子分析得到的10个因子用于Logistic回归分析,令Y=0表示公司处于财务危机状态,Y=1表示公司处于正常状态,运行SPSS软件,得到Logistic模型对40个建模样本的判定分类。模型总体判定正确率为87.5%,其中对正常状态公司的判定准确率高达90%,由此判定模型的拟合度较好。Logistic模型的相关参数。模型参数中各参数的Sig值均大于0.05,对结果的影响均不显著,建立的模型理论意义不大。求证其在实际预警中是否具有实用意义,将验证组的24个样本带入模型得到的结果。对于验证组的判定中虽然模型的理论意义不大,但在预测房地产上市公司是否处于财务危机状态仍然有一定的实用意义,预测准确率达到了67.86%,相较于神经网络模型准确率较低,但是比神经网络模型更加容易理解,便于操作。
3.模型结果说明
上述两种模型分别对验证组进行了预测,对于一个房地产公司,两种模型可能会给予不同的判定,因此对比了两种模型对于验证组的预测结果。验证组中,有9家公司的BP神经网络模型和Logistic模型给出了互相矛盾的判断,导致无法准确判定这9家房地产上市公司的财务状况。然而,当BP神经网络模型和Logistic模型对同一房地产上市公司财务状况的预测结果一致时,在验证组中取得了89.47%的预测准确率,有效提高了预测结果的准确性。
三、结论
通过上文对房地产上市公司财务预警指标体系的构建及实证研究后发现:
1.企业财务指标选取越多,包含的财务信息也就越全面,降维处理时得出的因子会较多,几个因子才能代表公司某一方面的能力。
2.对公司T-3年的财务状况进行分析,两类公司现金流量能力方面的指标没有显著性区别,从现金流指标无法判断公司未来是否会处于财务危机状况。
3.Logistic模型的参数对预测结果的影响都不显著,证实财务危机是由多种因素共同作用所造成的,难以使用一种或几种指标来表明房地产上市公司发生了财务危机。
篇8
随着科学技术的发展,现代设备的结构日趋复杂,其故障类型越来越多,反映故障的状态、特征也相应增加。在实际故障诊断过程中,为了使诊断准确可靠,总要采集尽可能多的样本,以获得足够的故障信息。但样本太多,会占用大量的存储空间和计算时间,太多的特征输入也会引起训练过程耗时费工,甚至妨碍训练网络的收敛,最终影响分类精度。因此要从样本中提取对诊断故障贡献大的有用信息。这一工作就是特征提取。
特征提取就是利用已有特征参数构造一个较低维数的特征空间,将原始特征中蕴含的有用信息映射到少数几个特征上,忽略多余的不相干信息。从数学意义上讲,就是对一个n维向量X=[x1,x2,…,xn]T进行降维,变换为低维向量Y=[y1,y2,…,ym]T,m<n。其中Y确实含有向量X的主要特性。
特征提取的方法有很多,常用的方法主要有欧式距离法、概率距离法、统计直方图法、散度准则法等。本文针对现有方法的局限性,研究基于BP神经网络的特征提取方法和基于互信息熵的特征提取方法。
1 基于BP神经网络的特征提取方法
要从N个特征中挑选出对诊断贡献较大的n个特征参数(n<N),通常以特征参数X对状态Y变化的灵敏度ε作为评价特征参数的度量:
εij=|(аYi)/(аXj)|
采用三层BP网络,输入层n个单元对应n个特征参数,输出层m个单元对应m种模式分类,取中间隐层单元数为q,用W B iq表示输入层单元i与隐层单元q之间的连接权;用w O qj表示隐层单元q与输出层单元j之间的连接权,则隐层第q单元的输出Oq,为:
输出层第j个单元输出yj为:
式中j=1,2,…,m;εj为阈值。
则特征参数xi对模式类别yj的灵敏度为:
代入(1)式,则特征参数Xi的灵敏度εij和特征参数Xk的灵敏度εkj之差可整理为:
大量的试验和研究表明,当网络收敛后有:a1≈a2≈…≈aq。
从上式可以看出,如果:
则必有:εij>εki
即特征参数Xi对第j类故障的分类能力比特征参数Xk强。
将特征参数X和分类模式分类结果y组成的样本集作为BP网络的学习样本,对网络进行训练。设Wiq和Wkq分别为与特征参数Xi和Xk对应输入单元与隐层单元q之间的连接权系数,记:
│Wεi│=│Wi1│+|Wi2|+…+|Wiq|
│Wεk│=│Wk1│+|Wk2|+…+|Wkq|
如果│Wεi│>│Wεk│,则可以认为Xi的特征灵敏度εi比特征参数Xk的灵敏度εk大。这样可知特征参数Xi的分类能力比特征参数Xk的分类能力强。
2 基于互信息熵的特征提取方法
由信息特征可知,当某特征获得最大互信息熵,该特征就可获得最大识别熵增量和最小误识别概率,因而具有最优特性。特征提取过程就是在由给定的n个特征集X二{XI~X2,…,zn)所构成的初始特征集合情况下,寻找一个具有最大互信息熵的集合:X={X1,X2,…,Xk},k<n。由于最大互信息熵由系统熵和后验熵决定,而系统熵是一定的,后验熵越小,则互信息熵越大,分类效果越好。因此有效的特征提取就是在X给定后,寻找一个具有最大互信息熵或后验熵的集合Y。即已知该域R上的初始特征集合X=[x1,x2,…,xn]T,寻找一个新的集合Y=[y1,y2,…,yk]T,k<n,使互信息熵最大,i=1,2,…,k。
在一定的初始特征集合下,识别样本的后验熵是一定的。在实现特征优化过程中,随着特征的删除,会有信息的损失,使得后验熵趋于增加。因此后验熵增值大小反应了删除特征向量引起的信息损失的情况。当删除不同特征及删除特征数逐步递增时,会对应有不同的后验熵。按后验熵由小到大排列,可获得对应的特征删除序列。其过程可描述为:
(1)初始化:设原始特征集合F={N个特征},令初始优化特征集合S=[K个特征,K=N];
(2)计算后验熵;
(3)实现递减:S=[K-1个特征],并计算相应的后验熵;
(4)选择优化特征集合:以多个递减特征集合所对应的后验熵为依据,选择具有最小后验熵增的特征向量集合为优化特征集合S[N-1个优化特征];
(5)返回(3),重新计算,直到满足分类要求,选择具有最小后验熵的优化特征集合;
(6)输出优化特征集合。
3 特征提取实例
在热电厂的发电机组工作中,发电机组主轴经常遇到如喘振、流体激励等故障。这些故障不仅会引起生产效率下降,而且会对机器造成严重危害,影响机组的安全运行。传统的诊断方法是在主轴轴承处加传感器进行振动测试,得到其频谱图;然后在频域内分析,根据基于能量分布的故障诊断理论将振动信号功率谱密度按一定的规则进行量化,利用神经网络等工具进行故障诊断。但是喘振、流体激励等故障在频域内通常表现为连续分布的有色噪声带,在频域内分析难以区分,难以进行频谱特征提取,全息谱分析方法也不甚有效。传统方法增加了系统的开销,诊断效果不理想。如果在时域内采用信息优化方法做预处理,再用传统的诊断方法进行诊断,可以收到很好的效果。
本文采用时域内故障振动信号的方差、峭度、偏斜度等参数,分别利用BP神经网络和后验熵分析对其进行特征提取,研究如何从中找出最能反映故障的特征。
表1为主轴喘振、流体激励故障时振动信号在垂直和水平方向的方差、峭度、偏斜度等6个参数的数据。
表1 主轴故障的特征参数
序号喘振流体激励 均方差峭度偏斜度均方差峭度偏斜度 垂直水平垂直水平垂直水平垂直水平垂直水平垂直水平17.509.21-0.02-0.00-0.22-0.1040.244.10.22-0.42-0.11-0.08226.115.2-0.75-0.92-0.31-0.2170.120.53.821.780.000.16313.89.21-0.81-0.72-0.290.1912.414.2-0.38-0.620.030.0146.28.5-0.01-0.04-0.22-0.238.1533.50.15-0.140.070.10536.111.2-0.61-0.01-0.230.077.2115.2-0.41-0.510.010.01611.59.71-0.81-0.93-0.31-0.1825.730.2-0.370.19-0.11-0.06733.128.2-0.79-0.85-0.07-0.4571.225.33.811.850.010.16837.226.8-0.81-0.87-0.06-0.418.1135.2-0.81-0.130.010.11设原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分别为垂直、水平方向的均方差,x3、x4分别为垂直和水平方向的峭度,x5、x6,分别为垂直和水平方向的偏斜度。
① 基于BP神经网络的特征提取方法:采用表1中的数据作为BP神经网络的输入,编制程序对神经网络进行训练,训练算法采用标准BP算法和Levenberg-Mar-quardt法两种方法来训练BP网络,从而计算特征参数的特征灵敏度,确定出对结果影响最大的特征参数。
喘振:
│W1│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
流体激励:
│W2│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
从结果可以看出:偏斜度对这两种故障最为敏感,反映了低频自激故障的主要特征。
② 基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5,x6}对应表1中的特征参数。在特征参数优化过程中,随着特征的删除,后验熵变化较大。当删除的特征中包含有x5、x6时,后验熵明显降低;如仅保留x5、x6时,后验熵最小。说明偏斜度对这两种故障最为敏感。
篇9
关键词: 供应链绩效评价;模糊综合评估;粗糙集;BP神经网络
中图分类号:C93 文献标识码: A文章编号:1003-7217(2011)05-0119-06
一、引 言
在供应链条件下,各节点企业运作行为往往具有随机性和不确定性。动态供应链绩效评价是一个包含多个指标和输入输出的复杂评估系统,各绩效指标具有模糊性、不确定性,彼此之间存在非线性关联性。软计算[1-7]理论与方法是处理动态供应链绩效这样复杂的、具有大量不确定性和模糊性的评估系统的重要技术。在相当多的领域(自然科学、社会科学与工程技术)中,都涉及到对不完备信息和不确定因素的处理。从实际系统中采集到的数据常常包含着噪声、不精确甚至不完整,如果我们采用纯数学上的假设来消除或回避这种不确定性,效果往往不理想。但如果对这种信息使用恰当的方式进行处理,常常有助于实际系统问题的解决。
二、相关研究评述
多年来,研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径,实践证明,1965年Zadeh[8]创立的模糊集理论与1982年Pawlak[9]倡导的粗糙集理论是处理不确定性的两种很好的方法。事实上,除了上述两种方法外,基于概率统计方法的证据理论也是处理不确定性的一种有效方法。以上众多的方法都属于软计算[10-15](Soft Computing)的范畴。Zadeh教授提出了软计算的概念,软计算的主要工具包括粗糙集、模糊逻辑(Fuzzy Logic)、神经网络、概率推理(Probability Reasoning)、信任度网络(Belief Network)、遗传算法(Genetic Arithmetic)、混沌理论(Chaos)等。传统的计算方法,即所谓的硬计算(Hard Computing),使用精确、固定和不变的算法来表达和解决问题,软计算利用所允许的不精确性、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调。因此,软计算作为知识获取和智能信息处理的重要手段,在许多研究领域有着广泛而深入的应用。
(一)基于模糊综合评估的供应链绩效评价
模糊集理论是经典理论的推广,它认为元素总是以一定的程度属于某个集合, 也可能以不同的程度属于几个集合。经典理论中集合的边界是清晰的,而模糊集理论中集合的边界是不清晰的,对人们显示生活中大量使用的一些含义确定但不准确的语言表述,模糊数学可以较好地表达,因而可以自然地用于事物的评价。
在动态供应链绩效评价体系中,各绩效指标之间往往存在着复杂的因果关系,这些指标中既有定性指标也有定量指标,具有模糊和不确定的特点,模糊综合评估方法为处理这种不确定性提供了有力的工具,它能够尽可能地减少个人主观臆断所带来的危害,为合理评价决策提供科学的依据。作者在文献[16]中详细讨论了基于模糊综合分析的供应链绩效评价方法,并结合Markov链预测理论给出了供应链绩效未来的发展趋势。
(二)基于粗糙集约简的供应链绩效评价
Rough集理论是一种刻画含噪声、不完整、不精确、不相容的数学工具,它能有效分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律,是一种重要的软计算技术。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类原则。Rough 集理论是基于不可分辨的思想和知识简化的方法,从数据中推理逻辑规则作为知识系统模型。
如前所述,在供应链条件下,各节点企业运作策略具有动态可调节性,其运作行为具有随机性和不确定性,这就要求在对供应链绩效进行评价必须采用动态评价方法,同时对供应链在未来某一时刻的整体绩效进行预测。粗糙集及其约简理论是处理这种不确定性的重要技术。作者在文献[17]中基于粗糙集理论的绩效评价模型,建立了动态供应链绩效评价决策表,利用粗糙集约简方法得到了预测绩效评价结果的决策规则集,并把粗糙集约简和模糊综合评估技术相结合进行动态供应链绩效评价,显然地缩小了数据处理的规模,降低了模型的计算复杂度。
(三)基于神经网络的供应链绩效评价
神经网络可大规模地并行处理和分布式地存储信息,具有良好的自适应、自组织性以及很强的学习功能、联想功能和容错功能。与当今的冯诺依曼式计算机相比,更加接近人脑的信息处理模式,主要表现为能够处理连续的模拟信号。神经网络并行分布工作,各组成部分同时参与运算,单个神经元的动作速度不高,但总体的处理速度很快。神经网络信息存储分布于全网络各个权重变换之中,某些单元障碍并不影响信息的完整。传统计算机要求有准确的输入条件, 才能给出精确解。神经网络只要求部分条件,甚至对于包含有部分错误的输入,也能得出较好的解答,因此具有较好的容错性。
动态供应链绩效评价是一个包含多个指标输入输出的复杂评估系统,各绩效指标具有模糊性,彼此之间存在非线性关联性。针对这样一个复杂的评估系统,作者曾利用BP神经网络技术来找出供应链绩效评价系统输入-输出之间的非线性映射关系,从而对动态供应链绩效评价结果进行学习和预测。通过与粗糙集约简理论相结合,简化了BP神经网络的结构设计,减小了运算量。
(四)几种软计算方法的优缺点
软计算是一个方法的集合体,目前主要包括粗糙集、模糊逻辑、神经网络、概率推理、信任度网络、遗传算法以及混沌理论等。软计算方法已广泛应用于包括模式识别、数据挖掘、系统评价、故障诊断、专家系统等在内的诸多领域的不精确、不确定问题。软计算方法按照其特点各有优势。例如,模糊集可以通过对人类思维建模来给不确定性问题提供自然的解决机制;粗糙集在属性约简和规则抽取方面性能优良;神经网络对噪声具有强鲁棒性,分类精度高;遗传算法广泛用于优化搜索问题。 同时,以上软计算方法依照算法的不同有各自的局限性:模糊集过度依赖专家知识,遗传算法收敛速度慢、稳定性差,神经网络训练时间过长、知识解释性差,而粗糙集对数据中的噪声较敏感。本文为了克服单一方法的局限,试图通过集成两种或两种以上的软计算方法的软计算融合系统来解决供应链绩效评价的实际问题[6, 7]。
财经理论与实践(双月刊)2011年第5期2011年第5期(总第173期)郑 培,万 炜:基于智能信息处理的供应链绩效评价方法
(五)软计算融合技术在动态供应链绩效评价中的应用
作者详细研究了模糊综合分析、粗糙集理论、神经网络等软计算技术在动态供应链绩效评价中的应用方法。从文献[16-17]实验结果可以初步看出,通过把几种软计算技术融合起来应用于供应链绩效评价,就能够克服单一智能信息处理方法的缺陷,取得更好的效果。本文使用的几种软计算技术能在多个方面进行融合[6, 7]。
粗糙集和神经网络的融合。通过粗糙集的属性约简可以显著减少原始数据量,使神经网络训练时间缩短,从训练后的神经网络中抽取规则也可显著提高神经网络中知识可理解性;神经网络的强鲁棒性也可解决粗糙集处理数据中的噪声问题。
粗糙集理论和模糊集理论的融合。粗糙集理论和模糊集理论都是研究信息系统中知识不完善、不精确问题的方法,但粗糙集理论解决问题的出发点是信息系统中知识的不可分辨性,而模糊集理论则关注信息系统中知识的模糊性,两者在处理方法上各有特色。两者的结合可以更好地解决信息系统中不完善、不精确性知识的问题。
模糊集和神经网络的融合。模糊集和神经网络的融合主要有模糊神经网络和神经模糊系统。神经模糊系统以神经网络为主,结合模糊集理论,将神经网络作为实现模糊模型的工具,即在神经网络的框架下实现模糊系统或其一部分功能。从结构上看,一般是四层或五层的前向神经网络。模糊神经网络是神经网络的模糊化,即以模糊集、模糊逻辑为主,结合神经网络方法,利用神经网络的自组织性,达到柔性信息处理的目的。
三、基于智能信息处理的供应链绩效评价方法比较
(一)基本思路
在作者以前的研究里,曾应用模糊综合分析、粗糙集理论和BP神经网络等智能信息处理方法建立了多个供应链绩效评价模型,本文对这些评价模型的效果和优缺点进行了分析和总结。我们的基本思路是以某动态供应链为例,选取合适的绩效指标集,对得到的绩效指标按照评价模型的数据要求进行预处理,然后输入到不同的动态绩效评价模型中进行处理,对各个绩效评价模型进行解算。通过对模型输出的结果的比较和分析来归纳各个绩效评价模型的主要特点,并对评价模型的实际效果进行总结。
(二)数据预处理
如前所述,本文已经根据文献[15]提出的供应链五维平衡计分卡,选择了15个关键绩效指标作为动态供应链的绩效评价指标集C,C={F1, F2, F3, C1, C2, C3, P1, P2, P3, P4, L1, L2, L3, S1, S2}。在15个绩效指标中,既有定性指标,也有定量指标。由于BP神经网络只能处理数值向量,因此在这些绩效指标输入BP网络训练之前必须对它们进行预处理。在基于粗糙集理论的供应链绩效评价模型里,根据决策表信息约简的要求,需要对所有属性的取值进行离散化处理。这里对某动态联盟供应链绩效决策表条件属性采用表1的方法进行离散化处理。
假设根据历史经验或供应链行规,把供应链的绩效评价结果划分为G1、G2、G3、G4四个等级,分别对应供应链绩效评价为优、良、中、差的状态,其划分的依据如表1所示。
在基于模糊综合评估的供应链绩效评价模型里,表1将作为构造各绩效指标属于各类的隶属度函数的依据。
(三)实验结果比较与分析
实验的数据源仍采用文献[15]某供应链相关指标的调查结果,经调查得到该供应链在2007年1~12个月的绩效指标取值和绩效综合评价结果。本文已经详细讨论了对该供应链绩效采用基于BP网络训练和学习的过程,并结合粗糙集约简给出两者相结合的混合绩效评价方法及结果。
BP网络学习完毕后,就可以用来对下一评估时刻的供应链绩效进行预测。针对上述供应链,经调查得到该供应链在2008年前4个月的绩效指标取值结果,如表2所示。
将上述各绩效指标规一化后输入训练好的BP网络,得到相应的输出向量分别为(0.0023, 0.998, -0.002, 0.007)、(-0.008, 0.003, 0.988, -0.005)、(-0.008, 0.958, -0.008, -0.002)和(0.987, -0.010, -0.005, 0.005)。据此可判断该供应链在2008年1~4月的绩效综合评价结果分别为G2、G3、G2、G1。
进一步,针对表1所示的供应链绩效分级标准,可以通过Rough约简得到供应链绩效分级决策表的最佳约简,即供应链绩效评价的关键绩效指标集。通过约简得到供应链绩效评价的关键指标集为{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},这样这12个关键绩效指标就构成了BP网络的输入层节点。把表2所示的供应链在2008年1~4月的关键绩效指标量化结果输入训练好的BP网络,可求出其相应的绩效评价结果分别为G2、G3、G2、G1,与供应链绩效实际调查结果一致。
下面,针对同一供应链,分别采用基于粗糙集理论的动态供应链绩效评价模型、基于模糊综合评估的供应链绩效评价模型及两者的结合来得出供应链绩效评价结果,并进行方法间的比较。
在基于粗糙集理论的供应链绩效评价模型里,先对各绩效指标进行离散化处理,离散化后的该动态供应链绩效决策表如下。
对于表3所示的绩效评价决策表,利用约简算法对决策表进行属性约简,以便去掉决策表的冗余条件属性。进一步,利用归纳值约简算法对绩效决策表进行值约简,可以得到一系列用于供应链绩效评价的决策规则集。由于决策属性值被离散化为四个等级,亦即信息系统具有四个概念。针对这四个概念的最一般规则分别为:
根据上述关于决策属性取值的最一般规则,就可以对某一考察周期动态联盟的综合绩效评价结果作出判断。当条件属性集不完全满足规则前件时,可以选取关于各个概念的次一般(或可信度较高)的生成式规则对绩效作出综合评估。
把表2所示的该供应链在2008年前4个月的绩效指标离散化,然后针对上述供应链绩效评价决策规则进行匹配,可得这4个月供应链绩效综合评价结果分别为G3、G3、G2、G1。
接着,采用模糊综合评估方法来对同一供应链的绩效评价结果进行分析。首先建立模糊关系矩阵,单因素评价矩阵取各因素在评价集上的隶属度,各隶属度函数均取为二次函数。根据供应链绩效分类标准表1,建立F1属于各类的隶属度函数为:
同理,可分别建立其它绩效指标属于各类的隶属度函数,对应绩效评价指标集C的权向量取为:
W=(0.17,0.06,0.02,0.08,0.13,0.02,0.05,0.04,0.10,0.01,0.10,0.04,0.05,0.11,0.02)
于是,由模糊综合评估法可求出该供应链在2008年前4个月的绩效分别为G3、G3、G2、G1。
最后,采用结合了粗糙集约简和模糊综合评估的动态供应链绩效评价方法来得到该供应链绩效评价结果。首先借助于动态供应链绩效评价决策表对绩效评价指标进行约简和降维,通过Rough约简得到供应链绩效评价的关键绩效指标集为{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},根据供应链绩效分类标准表2分别建立上述关键绩效指标属于各类的隶属度函数,然后利用模糊评估方法对供应链绩效进行综合评价。根据该混合供应链绩效评价方法求出该供应链在2008年前4个月的绩效分别为G2、G3、G3、G1。
我们给出了采用上述五种基于智能信息处理的绩效评价方法得到的该供应链在2007年1月~2008年4月间绩效评价结果的变化趋势,如图1所示。其中,如图例所示圆圈、方块实线、下三角实线、粗标圆卷实线和带星虚线分别代表了对应月份由五种评估方法得到的供应链绩效评价结果。
图1 某供应链采用五种绩效综合评估方法得到的评价结果
从图1可以看出,采用五种不同的供应链绩效评价方法得到的结果略有差异。这一差异由多种原因引起,首先基于BP神经网络的绩效评价方法和基于粗糙集理论的绩效评价方法都是有监督的智能学习算法,即在对动态供应链绩效评价结果作出预测之前,都有个训练的过程,这需要大量的历史数据。而基于模糊综合评估的供应链绩效评价方法隶属度函数主要由绩效分级标准确定,并不“显式”地需要历史绩效结果。其次,许多基于智能信息处理的绩效评价模型都需要事先确定一些参数,如BP网络需要确定网络结构、学习速率、冲量因子;模糊综合评估需要确定指标权值和隶属度函数表示方法等。另外,不同的绩效评价模型对输入数据的要求各不相同,BP神经网络和模糊综合评估处理的是连续数据,粗糙集约简处理的是离散数据,而实际获得的绩效指标中既有定性指标,也有定量指标,这就需要在绩效指标输入模型之前进行预处理,预处理方法的不同导致模型输出有很大的差异。上述几种不同的基于智能信息处理的供应链绩效评价方法输出结果与供应链实际绩效基本相符,在实际使用时要根据情况灵活选择。
此外,实验结果也表明通过几种智能信息处理方法融合在动态供应链绩效评价中能取得更好的效果。通过粗糙集约简和模糊综合评估的融合,显然缩小了数据处理的规模,降低了评估模型的计算复杂度,同时克服了模糊评估过度依赖专家知识(领域知识)的缺点。通过粗糙集约简和BP神经网络的融合,降低BP网络的设计复杂度,克服了神经网络训练时间长、知识解释性较差的缺点。两种融合方法都保持了较高的准确度,在动态供应链绩效评价中更为有效。
本文的研究结果弥补了目前国内外动态供应链绩效评价中智能信息处理方法的融合理论研究少、应用不够深入的缺点,对实际供应链运作与管理中基于软计算的动态绩效评价模型和方法的选择与应用具有理论指导意义。
四、结 论
软计算作为知识获取和智能信息处理的重要手段,在供应链绩效评价领域有着良好的应用前景。越来越多的学者开始集成两种或两种以上的软计算方法的智能信息融合算法来克服单一方法的局限性。本文针对之前使用的模糊综合评估、粗糙集约简及BP神经网络等软计算方法在动态供应链绩效评价中的主要特点和效果进行了简要的比较和分析,指出了每种方法的优缺点。然而,由于每种智能信息处理方法存在着本质上的差异,对这些方法间的效果差异进行严格的比较存在理论上的困难。某种智能信息处理方法可能适用于某种供应链,而另一种智能信息处理方法则可能更适用于另一种供应链。因此,在实际使用时,要根据供应链具体情况灵活选择或融合多种智能信息处理方法以取得更好的效果。
参考文献:
[1]Anna, M. R. and Etienne, E. K. A comparative study of fuzzy rough sets[J]. Fuzzy Sets and System, 2002 ,126(2): 137-155.
[2]Nagatanit, Helbingd. Stability analysis and stabilization strategies for linear supply chains.[J].Physica A., 2004, 35 (3-4): 644-660.
[3]Mohamed. Q. A-RST: a generation of rough set theory[J]. Information Science, 2000 ,124(1-4): 301-316.
[4]Roman, W. S., Larry, H. Rough sets as a front end of neuraln-etworks texture classifiers[J]. Neurocomputing, 2001, 36: 85-102.
[5]Yahia, M. E., Mahmod R. and N. Sulaiman, et al. Rough neural expert systems[J]. Expert Systems with Applications. 2002, 18: 87-99.
[6]McKee, T. E., Terje, L. Genetic programming and rough sets: a hybrid approach to bankruptcy classification[J]. European Journal of Operational Research, 2002 ,138: 436-451.
[7]Bolch G., Greine, S., H. D. Meer, etc. Queuing networks and markov chains-modeling and performance evaluation with computer science applications (2nd edition)[M]. A John Wiley & Sons, Inc., publication, 2006.
[8]Zadeh L. A. Fuzzy sets[J]. Information and Control. 1965, 8 (3): 338-353.
[9]Pawlak, Z. Rough set-theoretical aspects of reasoning about data [M]. Boston: MA: Kluwer Academic Publishers, 1991.
[10]曹庆奎,阮俊虎.基于粗糙集-未确知测度的矿井通风系统合理性评价[J].科学决策,2009.5:89-94.
[11]刘敬学,陈曦. 基于神经网络的专家预测方法研究[J].科学决策,2009,11:78-81.
[12]Bhagwat and Sharma.Management of information system in SMEs: an exploratory study. [J].International Journal of Enterprise and Network Management. 2006,1(1): 99-125.
[13]Bititici et al..Implementation of performance measurement systems:private and public sectors[J]. Editorial, Production Planning and Control. 2005,16(2):99-100.
[14]郑培,黎建强. 基于BP神经网络的供应链绩效评价方法[J].运筹与管理,2010,19(2):26-32.
[15]宋莎莎,戴锋,卫保璐.基于模糊层次分析法和聚类分析的突发事件分级研究[J].科学决策,2010,10:68-72.
[16]郑培,黎建强. 基于模糊评估和马尔可夫预测的供应链动态平衡记分卡研究 [J]. 系统工程理论与实践,2008,4(4): 57-64.
[17]郑培,黎建强. 基于粗糙集理论的供应链动态绩效评估方法研究 [J]. 运筹与管理,2008,10(5):6-11.
[18]王俊峰,刘立东.基于博弈论的闭环供应链中三方协调研究[J].科学决策,2009,(3):33-37.
Supply Chain Performance Measurement Methods based on Intelligent Information Processing
ZHENG Pei 1, WAN Wei2
(College of Business Administration, Hunan University, Changsha Hunan 410082, China)
篇10
关键词: 电力系统; 短期负荷; 野草算法; 相空间重构
中图分类号: TN915?34; TP391 文献标识码: A 文章编号: 1004?373X(2016)19?0099?03
Abstract: The short?term load has the chaos characteristic due to the comprehensive influence of weather and seasons. In order to describe the change trend of short?load accurately and improve the prediction accuracy, a short?term load forecasting model fusing weed algorithm with support vector machine (WA?SVM) is proposed. A large number of short?term load historical data is collected, and performed with the chaotic analysis and processing to establish the training and testing data sets of support vector machine. And then the support vector machine is used to establish the short?term load forecasting model, and the weed algorithm is used to find out the optimal parameters of support vector machine. The performance of the short?term load forecasting was tested with simulation contrast experiment. The results show that the short?term load forecasting accuracy of WA?SVM model is higher than that of other models, and this model provides a new research method for short term load modeling and forecasting.
Keywords: electric power system; short?term load; weed algorithm; phase space reconstruction
0 引 言
随着经济不断发展,电力系统在许多领域越来越重要,为了准确、有效地管理电力系统,电力负荷是其中一种重要手段。负荷预测是对历史数据进行分析,找到负荷变化趋势,以便于对电力系统进行相应的管理,短期负荷预测的实际应用性强,因此提高短期负荷预测的精度已成为电力系统研究中的一个热点问题[1]。
当前短期负荷预测模型划分为线性模型和非线性模型[2]。线性模型假设短期负荷呈线性趋势变化,主要采用时间序列方法[3?4],其易实现、结果解释性好。但负荷受到多种因素影响,变化十分复杂,具有时变性、非线性,时间序列方法无法捕捉到负荷数据隐含的变化趋势,预测结果不理想[5]。非线性模型有神经网络、支持向量机(Support Vector Machine,SVM)等,相对于线性模型,它们可以更好地拟合短期负荷变化特征,获得更高的短期负荷预测精度[6?7]。但在短期负荷的建模与预测中,非线性模型同样有不足,如神经网络存在收敛速度慢、过拟合[8];SVM参数直接影响到短期负荷预测精度[9],为了获得更优的SVM参数,当前采用网格搜索法、遗传算法等进行SVM参数寻优,但在实际应用过程中,网格搜索法执行时间长、遗传算法寻优结果不稳定[10]。同时短期负荷具有一定的混沌性,建模时需要对数据进行混沌分析和处理[11]。
为了准确描述短期负荷变化趋势,以提高预测精度,提出一种野草算法和支持向量机相融合的短期负荷预测模型(WA?SVM)。首先对短期负荷历史数据进行混沌分析和处理,然后采用野草算法和支持向量机建立短期负荷预测模型,最后进行短期负荷预测仿真实验,对模型预测性能进行验证。
1 支持向量机和野草算法
4 结 语
短期负荷具有不确定性与复杂性,为了获得更高精度的短期负荷预测结果,提出一种WA?SVM的短期负荷预测模型,并与其他模型进行了对比分析,测试了WA?SVM进行短期电力负荷预测的有效性和优越性,结果表明,WA?SVM准确地描述了短期负荷变化趋势,获得了比对比模型更优的短期负荷预测的结果,而且训练时间更少,在电力管理领域中具有广泛的应用前景。
参考文献
[1] 魏伟,牛东晓,.负荷预测技术的新进展[J].华北电力大学学报,2002,29(1):10?15.
[2] KELO S M, DUDUL S V. Short?term Maharashtra state electrical power load prediction with special emphasis on seasonal changes using a novel focused time lagged recurrent neural network based on time delay neural network model [J]. Expert systems with applications, 2011, 38(3): 1554?1564.
[3] 刘晶,朱锋峰,林辉,等.基于相似日负荷修正算法的短期负荷预测[J].计算机工程与设计,2010,31(6):1279?1282.
[4] 王继选,刘小贞,韩中合.基于多约束条件的电力负荷预测模型的研究[J].华东电力,2013,41(3):643?645.
[5] 王勇,黄国兴,彭道刚.带反馈的多元线性回归法在电力负荷预测中的应用[J].计算机应用与软件,2008,25(1):83?84.
[6] 郭新辰,王雪峰,冯英浚.采用神经网络进行电力系统短期负荷预测的一种降维方法[J].华北电力学院学报,2002,22(2):24?28.
[7] 程玉桂,黎明,林明玉.基于遗传算法和BP神经网络的城区中长期电力负荷预测与分析[J].计算机应用,2010,30(1):224?226.
[8] 翟永杰,周倩,韩璞.EMD?ISMO算法在电力负荷预测中的应用[J].系统仿真学报,2010,22(12):2858?2861.
[9] 杨延西,刘丁.基于小波变换和最小二乘支持向量机的短期电力负荷预测闭[J].电网技术,2005,29(13):60?64.
[10] 姜惠兰,刘晓津,关颖,等.基于硬C均值聚类算法和支持向量机的电力系统短期负荷预测[J].电网技术,2006,30(8):81?85.
[11] 权先珍,蒋传文,张勇传.电力负荷的混沌预测方法[J].华中理工大学学报,2000,28(7):92?94.