神经网络的优缺点范文
时间:2024-03-28 18:12:32
导语:如何才能写好一篇神经网络的优缺点,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:油液光谱;神经网络;遗传算法;预测
磨损金属颗粒浓度可直接反映了设备的运行状况,所以在设备状态监控领域金属颗粒浓度预测是油分析的最重要内容之一。文章通过研究磨损金属颗粒浓度数据序列构成的一般规律,根据神经网络与遗传算法在时间序列预测中的优缺点,提出以GA优化BP神经网络的初始权、阈值,构建GA-BP模型。实例预测结果表明,GA-BP模型的精度与速度都比较理想,优于单一的BP模型。
1神经网络和遗传算法
BP神经网络在时间序列分析中不是一个十分完善的网络,这是因为一方面学习算法的收敛速度较慢,另―方面在优化过程中易陷入局部极小点。
而遗传算法具备优秀的全局搜索能力,所以可利用遗传算法对BP网络从三个方面进行优化:(1)优化神经网络的初始权值和阈值;(2)优化神经网络的拓扑结构进化;(3)神经网络学习规则的进化。
通过得出具有最佳隐层节点的网络结构,合理的初始权值和阈值,及最佳学习进化规则,保证网络不陷入局部最小值,同时又具备合理的收敛速度。
2遗传算法优化BP神经网络预测模型
文章GA-BP算法的假设是网络拓扑结构固定。算法的基本思想是:(1)给定网络拓扑结构以及网络的输入、输出样本;(2)构建待寻优参数与GA染色串的映射函数;(3)确定GA算法的目标函数、适应度函数和优化参数,产生初始种群;(4)计算目标函数的值,个体的适应度,判断是否进行优化计算,并进行遗传操作(复制、交叉和变异),产生新一代群体;(5)重复上述过程,直至进化满足停止准则。
step5:新个体插入到种群中,计算评价函数;
step6:如果找到了满意的个体,则结束,否则转step3。最终群体中的最优个体解码即可得到优化后的网络连接权值;
step7:以GA算法获得的连接权值作为初始权值,用BP算法训练网络,直到指定精度。
3GA-BP模型预测油液光谱参数
3.1光谱数据的处理
在机械装备状态监测中,一般不直接对采集到的油液光谱参数进行建模,这是因为,一方面直接建模容易忽视参数的摩擦学特征,另一方面,设备的元素含量之间本身有一定线性比例关系,所以,设备的检修、补换油等因素的影响效果从某种程度上来说是一致的。在文章的研究中,通过将元素间比例关系的数据作为系统的输入与输出,即以元素间浓度比值的形式对原始数据进行处理,使其能够比较客观地表征被监测系统的状态。一定设备的油样中,各种不同元素的浓度差异较大,Fe、Cu、Pb、及A1等元素的变化具有一定的规律。文章数据是引用的SGM冲压机油系统与液压系统的油箱中的采样监测结果为例进行讨论。监测过程中,根据元素光谱分析的结果,选取与设备磨损密切相关的五种元素,并计算各种元素浓度值的比例,如表1所示。
3.2实验分析
将表1的Fe元素百分比数列前6组作为训练样本,后2组作为实验样本,如表2所示。
构建4×9×1的BP神经网络,第一层、第二层采用tansig传递函数,第三层采用purelin传递函数。最大循环次数10000,收敛误差0.002,学习率0.01。设置种群规模为80,遗传代数为800,染色体长度为55,交叉概率为0.98,变异概率0.01。
用Matlab2010编程,主要包括4个程序:主程序gabpfault.m;网络初始化nninit.m;适应值计算函数gabpEval.m;编码解码函数gadecod.m。经过大约700代的搜索后染色体的平均适应度趋于稳定,误差平方和曲线和适应度曲线,如图l所示,将遗传算法的结果分配BP网络所对应的权值、阈值,训练神经网络。如图2所示,给出了GA-BP算法的训练目标曲线。用GAS训练BP网络的权值可以得到满意的结果。GA-BPfflBP都用前6组进行训练,后2组进行仿真,如表3所示,列出了GA-BP和BP的预测结果。
篇2
关键词:BP网络 旋转触探仪 神经网络预测 训练函数
中图分类号:TP751 文献标识码:A 文章编号:1674-098X(2014)12(c)-0004-02
随着计算机技术的快速发展,人工神经网络在数学p物理p工程p岩土等行业得到广泛应用。Matlab软件提供了神经网络的工具箱,提供了多种神经网络库函数,为数值计算提供了计算平台。岩土工程问题的复杂多变性,在运用神经网络分析和预测时,其结果往往受各种因素的影响,关键还是网络结构的构建和训练函数的选取。因此,应该对网络的训练函数的选取进行深入研究。
该文在大量的旋转触探试验的基础上,结合土的物理性质指标含水量、干密度,土的强度参数粘聚力和内摩擦角,以及埋深情况,建立土的旋转触探模型,建立BP神经网络,采用不同的训练函数对网络进行训练。
1 BP神经网络
BP网络是一种单向传播的多层前向网络,具有三层或三层以上的神经网络,包括输入层、中间层(隐层)和输出层。在人工神经网络的实际应用中,BP网络广泛应用于函数逼近、模式识别/分类、数据压缩等,人工神经网络模型采用BP网络或它的变化形式,它是前馈网络的核心部分,体现了人工神经网络最精华的部分。BP算法的基本思想[1]是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的。权值不断调整的过程,也是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可以接受的程度,或进行到预先设定的学习次数为止。
2 BP神经网络的训练函数
BP神经网络中的训练算法函数是根据BP网络格式的输入、期望输出,由函数newff 建立网络对象,对生成的BP 网络进行计算,修正权值和阈值,最终达到BP网络的设计性能,从而完成网络的训练和预测。BP 神经网络几种主要的训练函数及其特点分述如下[2]。
(1)traingda、trainrp函数和trainlm函数。
traingda函数是最基本的自适应学习步长函数,其最大优点可以根据误差容限的性能要求调节函数,弥补标准BP算法中的步长选择不当问题。trainrp函数可以消除偏导数的大小权值带来的影响,只考虑导数符号引来的权更新方向,忽略导数大小带来的影响。trainlm函数。该函数学习速度较快,但占用内存很大,从理论上来说适用于中等规模的网络。
(2)共轭梯度算法:traincgf函数、traincgp函数、traincgb 函数、trainscg函数。
共轭梯度算法是介于最速下降法与牛顿法之间的一个方法,其利用一阶导数信息,但克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点。上述四种共轭梯度算法前三种收敛速度比梯度下降快很多,其需要线性搜索,对于不同的问题会产生不同的收敛速度。而第四种不需要线性搜索,其需要较多的迭代次数,但是每次迭代所需计算量很小。
(3)Newton算法:trainbfg函数、trainoss函数。
trainbfg 算法的迭代次数较少,由于每步迭代都要Hessian矩阵,其每次迭代计算量和存储量都很大,适合小型网络。Trainoss为一步割线算法。它是介于共轭梯度法和拟牛顿算法的方法,其需要的存储和计算量都比trainbfg要小,比共轭梯度法略大。
上述各算法由于采用的训练函数不同,其计算速度、收敛速度及其迭代次数不尽相同,并且对内存要求依研究对象的复杂程度、训练集大小、网络的大小及误差容限的要求等存在差异。在运用BP网络解决相关工程性问题时,需要选择合理的训练函数。
3 网络训练函数的选取
该文着重研究BP神经网络的训练函数的选择,所用数据样本均来自于实践中用新型微机控制旋转触探仪采集到的数据,经过归一化处理建立了网络的样本数据库,根据训练函数的特点选择其隐含层数为2。文选择非线性函数为Sigmoid,输出层的传递函数为Purelin,可以用来模拟任何的函数(必须连续有界)。
采用不同的训练函数对网络的性能也有影响,比如收敛速度等等,下面采用不同的训练函数(trainbr、traingd、traingdm、traingdx、traincgf、trainlm、trainb)对网络进行训练,并观察其结果,如表1所示。
对比可知,trainlm训练函数的收敛效果较好,trainbr、trainlm训练函数得到的绝对误差相对较小,其它训练函数的收敛性能较差。trainbr训练样本的绝对误差比trainlm训练函数的绝对误差小,且分布比较均匀,但是trainbr训练函数的收敛精度却相对较差,这可能是出现局部最优化的问题,通过测试样本的进一步分析如表2所示,trainbr训练以后的网络对于预测样本的预测精度较低,偏差较大,进一步验证了该训练函数在训练过程中训练收敛精度相对较差,并出现局部最优化[3]。
综合考虑,可以看到trainlm训练函数具有训练速度快且预测精度高的特点,所以本文中选用trainlm作为训练函数。
4 结论
该文以Matlab神经网络的作为工具,基于触探模型作为研究对象,对不同的训练函数进行了仿真比较,结果表明采用不同的训练函数其存在明显的差异。综合考虑干密度误差,含水量误差,干密度误差(样本顺序),含水量误差(样本顺序)以及迭代次数和性能误差等因素,选用trainlm作为训练函数,trainlm函数由于其训练速度较快且计算精度较高而显现出一定的优势。
参考文献
[1] 葛哲学,孙志强.神经网络理论与MATLAB R2007实现[M].电子工业出版社,2007.
篇3
[关键词] 信用评分 判别分析模型 决策树分析 回归分析法 神经网络法
一、信用评分概况
信用评分模型作为信用风险管理的基础和核心,无论是对于建立社会征信体系还是对于金融机构的信贷资产管理,都有着不可替代的作用。其主要目的,在于尽量将能够预测借款人未来行为的指标加以整合,并统一成可以比较的单一指标,以显示借款人在未来特定时间内违约的可能性,所有的信用评分模型,无论采用什么理论或方法,其最终目的都是将贷款申请者的信用级别分类。为达到分类目的。当前,对个人信用评分模型的定义有多种,较为权威的种观点认为:“信用评分是预测贷款申请人或现有借款人违约可能性的一种统计方法。”这一观点指出了信用评分的作用和目的,不过随着信用评分模型的不断发展,信用评分已不仅是一种统计方法,也包含了运筹学,如数学规划法、非线性模糊数学(如神经网络方法)等。此外,信用评分的实际操作应用也与决策原则紧密相关,决策原则事实上决定了信用评分模型实现其目的和作用的程度。因此,对个人信用评分模型这一数学工具在金融和银行业中的应用来说,较为全面和恰当的定义应是,“信用评分是运用数学优化理论(包括统计方法、运筹方法等),依照即定原则或策略(损失最小原则或风险溢价原则),在数据分析决策阶段区分不同违约率水平客户的方法。
二、各类信用评分模型概述
1.判别分析模型
判别分析法是对研究对象所属类别进行判别的一种统计分析方法。进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值。判别分析就是要从中筛选出能提供较多信息变量并建立判别函数,使推导出的判别函数对观测样本分类时的错判率最小。这种方法的理论基础是样本由两个分布有显著差异的子样本组成,并且它们拥有共同的属性。它起源于1936年Fisher引进的线性判别函数,这个函数的目的是寻找一个变量的组合,把两个拥有一些共同特征的组区分开来。
判别分析方法的优点:适用于二元或多元性目标变量,能够判断,区分个体应该属于多个不同小组中的哪一组。自身也存在不可避免的缺点:该模型假设前提是自变量的分布都是正态分布的,而实践中的数据往往不是完全的正态分布,从而导致统计结果的不可靠性。
2.决策树方法
决策树模型是对总体进行连续的分割,以预测一定目标变量的结果的统计技术。决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵二叉或多叉树。构造决策树的方法是采用自上而下的递归构造。在实际中,为进行个人信用分析,选取个人信用作为目标属性,其他属性作为独立变量。所有客户被划分为两类,即好客户的和坏客户,将客户信用状况转换为“是否好客户”(值为1或0),而后利用数据集合来生成一个完整的决策树。在生成的决策树中可以建立一个规则基。一个规则基包含一组规则,每一条规则对应决策树的一条不同路径,这条路径代表它经过节点所表示的条件的一条链接。通过创立一个对原始祥本进行最佳分类判别的决策树,采用递归分割方法使期望误判损失达到最小。
决策树模型的优点:浅层的决策树视觉上非常直观,容易解释;对数据的结构和分布不需做任何假设;可以容易地转化成商业规则。它的缺点在于:深层的决策树视觉上和解释上都比较困难;决策树对样本量的需求比较大;决策树容易过分微调于样本数据而失去稳定性和抗震荡性。
3.回归分析法
回归分析法是目前为止应用最为广泛的一种信用评分模型, 这其中以著名的logistic回归为代表。除此之外, 线性回归分析、probit回归等方法亦属于此类。最早使用回归分析的Orgler,他采用线性回归模型制定了一个类似于信用卡的评分卡, 他的研究表明消费者行为特征比申请表资料更能够预测未来违约可能性的大小。同数学规划方法中一样, 假设已经通过一定的方法从样本变量中提取出了若干指标作为特征向量, 回归分析的思想就是将这些指标变量拟合成为一个可以预测申请者违约率的被解释变量, 自然就是违约率p,回归分析中应用最广泛的模型当属线性回归模型,它是对大量的数据点中表现出来的数量关系模拟出一条直线,回归分析的目标就是使目标变量值和实际的目标变量值之间的误差最小。因此最早将回归方法应用于信用评分研究的模型,就是简单的线性回归模型,目前基于logistic回归的信用评分系统应用最为普遍。
回归模型的优点:容易解释和使用;自变量可以是连续性的,也可以是类别性的;许多直观的统计指标来衡量模型的拟合度。缺点:不能有效处理缺失值,必须通过一定的数据加工和信息转换才能处理;模型往往呈线形关系,比较难把握数据中的非线形关系和变量间的互动关系,而且模型假定变量呈正态分布;模型受样本极端值的影响往往比较大。
4.人工神经网络法
近些年来, 随着信用评分领域的研究深入, 有学者将人工智能领域的一些模型算法引入到了信用评分研究中, 人工神经网络模型为典型代表。人工神经网络是由大量简单的基本元件――神经元相互连接而成的自适应非线性动态系统,是一种把各种投入要素通过复杂的网络转换成产出的信息加工结构。神经网络模型本质上所解决的问题仍是分类或者说模式识别问题, 但其原理却与其做方法迥然相异。人工神经网络有多种模型, 比如BP神经网络、RBF神经网络、Hopfield网络等。BP神经网络为目前研究最为成熟、算法最为稳定同时应用也最为广泛的一种神经网络模型。
神经网络模型的优点:有效地捕捉数据中非线性,非可加性的数量关系;适用于二元性,多元性和连续性的目标变量;能处理连续性和类别性的预测变量。缺点:基本上是一个黑箱方案,难以理解;如果不经过仔细控制,容易微调于样本数据,从而不具备充分的抗震荡性和稳定性。
三、结语
信用评分作为一种严谨的基于统计学等理论的决策手段, 正在逐渐被我国商业银行重视。信用评分系统的建设在我国属于起步阶段,应逐步建设适合我国特色的、高水平的信贷决策支持制度不但需要借鉴国外已有的理论研究成果和实践方案, 更需要我国学界的创新或结合我国本土数据的实证研究。
参考文献:
[1]陈 建:信用评分模型技术与应用.中国财政经济出版社,2005
篇4
关键词 河流,人工神经网络,水质,Gauss Newton算法
1.前言
河流水体作为淡水资源的重要组成部分,在灌溉、人类生活用水的供应、生活污水和工业废水的接纳等密切相关。水质的评价是一个复杂的问题,目前主要的评价方法主要有两大类,一类是以水质的物理化学参数的实测值为依据的评价方法;另一类是以水生物种群与水质的关系为依据的生物学评价方法。较多采用的是物理化学参数评价方法,其中又分单因子法和多项参数综合评价法。前者即用某一参数的实测浓度代表值与水质标准对比,判断水质的优劣或适用程度。多项参数综合评价法即把选用的若干参数综合成一个概括的指数来评价水质。多因子指数评价法用两种指数即参数权重评分叠加型指数和参数相对质量叠加型指数两种。参数权重评分叠加型指数的计算方法是,选定若干评价参数,按各项参数对水质影响的程度定出权系数,然后将各参数分成若干等级,按质量优劣评分,最后将各参数的评分相加,求出综合水质指数。数值大表示水质好,数值小表示水质差。用这种指数表示水质,方法简明,计算方便。参数相对质量叠加型指数的计算方法是,选定若干评价参数,把各参数的实际浓度与其相应的评价标准浓度相比,求出各参数的相对质量指数,然后求总和值。根据生物与环境条件相适应的原理建立起来的生物学评价方法,通过观测水生物的受害症状或种群组成,可以反映出水环境质量的综合状况,因而既可对水环境质量作回顾评价,又可对拟建工程的生态效应作影响评价,是物理化学参数评价方法的补充。缺点是难确定水污染物的性质和含量。随着计算机计算的发展,神经网络也被越来越多用在水质评价工程中。神经网络是一种非常适合解决复杂的非线性响应关系的数学模型。它可以用在分类、聚类、预测等方面,通过历史数据对神经网络进行训练,网络可以学习到数据中隐含的非线性映射关系。本文试图应用人工神经网络,来评价河流的水质,并对训练方法进行探讨,采用MATLAB语言编写相应的评价程序进行实例评价,试图找出此种算法和传统BP算法在水质综合评价中的优缺点。
2.网络结构和数据预处理
采用BP ANN网络,网络分一层输入层、一层输出层和几层隐含层组成。同一层之间的神经元之间没有联系,相邻两层的神经元之间通过连接权值和激活函数进行连接。在训练的过程中,通过不断调节连接权值来使网络的仿真结果逐渐接近期望值。本文采用4层的网络结构,两层隐含层都是4个神经元节点,输出层只有一个节点,代表评价结果,输入层5个节点,代表5个评价参数。
评价标准选《国家地表水环境标准》(GB3838-2002),训练样本直接由该标准生成。输出层和输入层进行线性归一化处理。
3.Gauss Newton算法
针对传统BP ANN算法的收敛速度慢,鲁棒性弱,容易陷入局部极小值的缺点,采用了改进的算法Gauss- ANN算法。激活函数采用sigmoid函数,层与层之间的连接权值和阈值随着每次的训练修正出新值。每次训练用Gauss- ANN方法计算出权值和阈值的修正值。
4.结果
为了验证Gauss-Newton算法的性能,将它与传统BP算法进行比较。使用生成的训练样本进行训练,两种算法各训练10次,每次训练最多迭代200000次,网络误差函数为所有训练样本误差的平方和。误差为3.0的时候认为网络收敛。表1为训练过程对比,表2为水质的评价结果。从结果看,水质都在地表水环境质量标准里面的1类水水平。
表1 两种算法训练和评价结果比较
传统BP算法 RPROP算法
迭代次数 200000 22700
误差 12.25 6.0
收敛次数 1 3
训练样本准确率(%) 75.1 92.5
验证样本准确率(%) 74.2 91.2
表2 评价结果
NH3-N TP COD BOD 评价结果
断面I 0.002 0.034 3 1.0 1.22
断面II 0.002 0.020 4 1.0 1.17
断面III 0.002 0.012 2 1.0 1.13
5.建议
(1)使用的训练算法,使神经网络的收敛速度加快,鲁棒性加强,适合用在水质评价工作。
篇5
关键词: 计算机网络安全; 安全评价; 神经网络; 遗传神经网络
中图分类号: TN915.08?34 文献标识码: A 文章编号: 1004?373X(2017)03?0089?03
Computer network security evaluation simulation model based on neural network
WEN Siqin1, WANG Biao2
(1. Department of Computer Science and Technology, Hohhot Minzu College, Hohhot 010051, China;
2. College of Computer Information Management, Inner Mongolia University of Finance and Economics, Hohhot 010051, China)
Abstract: The applications of the complex network algorithm, neural network algorithm and genetic algorithm in computer network security evaluation are introduced. On the basis of the BP neural network algorithm, the genetic algorithm is used to improve the computer network security evaluation simulation model. The application of GABP neural network algorithm in computer network security evaluation is studied deeply. The simulation model has high theoretical significance and far?reaching application value for the computer network security evaluation.
Keywords: computer network security; security evaluation; neural network; genetic neural network
0 引 言
随着科学技术的不断进步,Internet和计算机网络技术越来越深入到了政治、经济、军事等各个层面。网络技术发展的越快,网络安全问题越突出。目前,信息系统存在着很大安全风险,受到严重的威胁,许多网络入侵者针对计算机网络结构的复杂性和规模庞大性,利用网络系统漏洞或安全缺陷进行攻击[1?2]。
目前,国内存在不少的计算机网络安全评估系统,但是仅有少部分在使用,其主要任务是检测网络安全存在的漏洞,对于网络安全的风险评估涉及不多或只是简单的分析,并且基本上没有涉及计算机网络安全态势评估和预测[3]。由于网络安全评估系统没有能够将评估技术和检测技术相结合,所以没有形成一个框架和一个有力支撑平台的网络信息安全测试评估体系,用于指导各行业网络安全风险评估和检测[4]。因此,需要建立一个包括多种检测方法和风险评估手段的全面网络安全评估系统。本文在BP神经网络和遗传算法的基础上,研究并制定了一个简单、有效、实用的计算机网络安全评估仿真模型。
1 基于GABP神经网络的计算机网络安全评价
仿真模型
1.1 染色串与权系值的编码映射
以下为BP神经网络的训练结果,分为4个矩阵。在设定时,输入节点、隐含节点和输出节点分别设置为[i,][j,][k。]
(1) 输入层到隐含层之间的权值矩阵为:
(2) 隐含层阈值矩阵:
[γ=γ1γ2?γj] (2)
(3) 隐含层到输出层的权值矩阵:
(4) 输出层的阈值矩阵:
[h=h1h2?hj] (4)
为利用GA进行BP神经网络的权值优化,对上述四个矩阵进行优化,形成染色体串,并进行编码,如图1所示。
1.2 自适应函数
使用GA算法的具体目的是为了优化权值,首先要设定一个函数,这个函数基于输出层误差并且是一个能够评价染色体具有自适应功能的函数,具体定义为:
[ft=1E,t=1,2,3,…] (5)
其中[minE=12i=1r(yak-yi)2,][yak]和[yi]分别表示期望输出和实际输出。
1.3 GABP算法
GABP算法的具w实现步骤如下:
1.4 BP算法实现
BP算法如下:
[Wij(K+1)=Wij(K)-lr-w??Ek?Wij, i=1,2,…,r;j=1,2,…,m] (6)
式中:[?Ek?Wij=?Ek?netijOjk=δjkOjk,]其中[Ojk]表示前一层第[j]个单元输出,[Ojk=fnetjk]。
1.5 GA算法实现
(1) 权系编码
本系统对神经网络权值系数进行码时采用的是实数编码,因为系统内包含96个变量,但是若是一般的情况,遗传算法基本采用二进制编码。
[w1,1,w2,1,…,w17,1φ1w1,2…w17,5φ2…φ17b1b2φ18]
其中,[φi](i=1,2,…,17)是指单元数目。
(2) 初始化及自适应函数
GA算法搜索最优函数参数[θc=cij,bij,]使得[minE=12i=1r(yak-yi)2,][yak]和[yi]分别表示期望输出和实际输出,从而求得每个染色体的适应度值[ft=1E(t=1,2,3,…)。]
(3) 比率选择
比率选择是基于“赌轮法”进行概率分布的选择过程:
计算单个染色体的适应值eval(θi);
计算群体的总适应值:[f=i=1popsizeeval(θ);]
计算每一个染色体的被选择概率:[Pt=eval(θt)F;]
计算每个染色体的累积概率:[qt=j=1tPj 。]
罗盘转动popsize次,按照相应的方法选择一个单个染色体。
(4) 杂交
杂交的两种方式分别是按照遗传算法进行的杂交,属于简单杂交,与二进制杂交类似,就是在浮点数之间进行具体的划分;另一种叫做算数杂交,就是将不同的两个向量进行组合。
(5) 变异
本系统采用均匀变异,也就是被变异个体必须要有较好的适应值,才能够被接受为新的成员,替代变异前的群体,否则变异体被消去,群体保持不变。
2 仿真模型性能分析
计算机的网络安全等级按照网络安全评价的特点划分为四级,A级对应安全程度为很高,B级对应安全程度为较高,C级对应安全程度为一般,D级对应安全程度为较低。在本系统中,作为输入值的是计算机17项网络安全指标的具体分值,而将安全综合评价分值作为网络期望的惟一一项输出项。BP神经网络的输入数值有一定的要求,需要一定量的样本且具有一致性的特点,并对其进行训练,同时在对其评价时也采用训练好的网络,但是就现在来看符合要求的数据相对来说较少,如表1所示,本系统评价数据时采用12组典型的网络安全单项指标。在进行综合评价时采用层次分析的方法,并作为训练样本训练BP神经网络,以检验该仿真模型的安全评价效果。
本模型用Matlab语言实现,神经网络的隐藏节点为5,表2为对最后样本进行评价,阈值调整系数[β]的值为0.1,权值调整参数[α]为0.1,经过1 000次的训练,1‰的学习精度,所得结果收敛于之前所要求的误差范围内。可知该仿真模型是有效且可靠的,实际输出的数值与期望值的相对误差低于3.7%,其安全等级为B级与期望值相同。
3 结 论
通过分析BP神经网络系统和遗传算法的优缺点,针对BP神经网络收敛速率低和搜索能力弱等问题,采用GA算法进行补偿,并设计了GABP计算机网络安全评价仿真模型,并对评价结果进行相应的分析,认为该评价仿真模型性能比较优良,具有较高的理论价值和广阔的应用前景。
参考文献
[1] RAYNUS J. Software process improvement with CMM [M]. Norwood: Manning Publications, 2009.
[2] 司奇杰.基于图论的网络安全风险评估方法的研究[D].青岛:青岛大学,2006.
[3] 张天舟.GABP算法的复杂计算机网络安全评价中的应用[D].成都:电子科技大学,2015.
[4] KUCHANA P.Java软件结构设计模式标准指南[M].北京:电子工业出版社,2006:358.
[5] 占俊.基于自适应BP神经网络的计算机网络安全评价[J].现代电子技术,2015,38(23):85?88.
[6] 于群,冯玲.基于BP神经网络的网络安全评价方法研究[J].计算机工程与设计,2008(8):1118?1125.
[7] SUR S, BOTHRA A K, SEN A. Bond rating: a non?conservative application of neural networks [C]// Proceedings of 1988 IEEE International Conference on Neural Networks. San Diego: IEEE, 1988: 443?450.
篇6
关键词:脱机手写藏文识别;GABP神经网络;特征提取
中图分类号:TP317.2 文献标识码:A 文章编号:16727800(2013)009007902
基金项目:青海省普通高等学校研究生创新项目
作者简介:梁会方(1987-),女,青海师范大学计算机学院硕士研究生,研究方向为藏文信息处理。
0引言
模式识别在各个领域中的应用非常多,从这些应用中可以看到它们的共性,即一个模式识别系统通常包括原始数据的获取和预处理、特征提取与选择、分类或聚类、后处理4个主要部分。其中藏文识别需要解决的关键问题是模式分类,其理论基础是模式识别技术,其中最常用的方法是统计模式识别方法和结构模式识别方法。近年来也有很多人将隐马尔科夫模型用于手写识别领域,取得了良好的效果。本文主要介绍统计模式识别、结构模式识别以及使用较多的隐马尔科夫模型和人工神经网络模型。
1模式识别
1.1统计模式识别
统计模式识别是依据统计的原理来建立分类器,其分类器设计方法主要有贝叶斯决策理论和判别函数。贝叶斯决策理论基本思想为:在类条件概率密度和先验概率已知或者可以估计的条件下,利用贝叶斯公式比较样本属于两类的后验概率,然后将类别决策为后验概率大的一类,从而使总体错误率最小。常见的一种贝叶斯决策为最小错误率贝叶斯决策[1],其决策规律如下:
如果P(w\-1|x)>P(w\-2|x),则x∈w\-1;反之,则x∈w\-2。
通过贝叶斯公式 ,后验概率的比较可以转化为类条件概率密度的比较,离散情况下也是类条件概率的比较,而这种条件概率或条件密度则反映了在各类模型下观察到当前样本的可能性或似然度,因此可以定义两类之间的似然比或对数似然比进行决策。
该方法的主要优点是抗干扰能力强,且易于实现,但是应用中的主要缺点是细分能力较弱,区分相似字的能力较差。
1.2结构模式识别
藏文文字结构复杂,但同时具有相当的规律性,这种文字都含有丰富的结构信息,因此可以获取这些组字的规律以及藏文字符信息的结构特征作为识别的依据。结构模式识别[2]的主要思想就是文字图像划分为很多基本组合,然后利用一些相似性度量准则确定出这些组合之间的关系,以及这些字符图像模式和一些典型模式之间利用一些相似性度量准则确定的相似程度。
1.3隐马尔科夫模型
HMM模型[3]是将特征值和一个状态转移模型联系起来,它是一个双重随机过程,其中状态转移过程是不可观察即隐藏的马尔科夫模型,而可观察事件的随机过程是隐藏状态转换过程的随机函数。HMM有3个基本问题及常用算法:①评估问题:前后向递推算法;②解码问题:Viterbi算法;③学习问题:BaumWelch算法。
HMM模型可以用一种特定的神经网络模型来模拟[4],该模型收敛性较差,易陷入局部极值。
1.4人工神经网络模型
神经系统是由大量神经细胞构成的复杂网络,是一个由大量简单的处理单元组成的高度复杂的大规模非线性自适应系统。神经网络是一个高度并行的分布处理结构,它是非线性的,具有自组织和自学习的能力。神经网络与传统的模式识别不同,能够直接输入数据并进行学习,用样本训练网络并实现识别。它是非参数的识别方法,不需要传统方法中的建模、参数估计以及参数校验、重新建模等复杂过程。
在字符识别领域常用的网络模型有:BP网络、RBF网络、自组织网络、Hopfield网络、SVM网络等。
BP网络是一种多层前馈网络[5],是一种依靠反馈值来不断调整节点之间的连接权值而构建的一种网络模型。它由输入层、隐藏层、输出层相互连接构成,其结构如图1所示。
网络的学习训练过程由信号的正向传播与误差的反向传播组成,其中正向传播是把输入样本从输入层输入,经各隐层处理后传向输出层,若输出层的实际输出和期望输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。各层权值调整过程是周而复始地进行,直到网络输出的误差减少到可以接受的程度。
2遗传算法改进的BP网络
藏文字符识别是中国多文种信息处理系统的重要组成部分,脱机手写藏文识别在很多领域有广阔的使用前景。在现有汉字以及数字识别方法的基础上,提出了很多预处理和模式识别的方法,大大提高了手写藏文的识别精度。为了提高脱机手写藏文识别精度,本文将GABP神经网络应用于脱机手写藏文识别分析中,识别过程分为两步:训练阶段、识别阶段。在训练阶段,提取训练样本集的特征,建立网络模型,以输入为目标,保存网络的连接权值和阈值以及字符特征;在识别阶段,将待识别的藏文特征送入网络运行,待网络运行到平衡状态,将输出结果与数字特征库的值进行比较,识别出藏文字符。
BP网络是目前应用最多的神经网络,这主要是因为BP算法[6]有较强的非线性映射能力、泛化能力以及容错能力。但是它本身存在大量的问题,突出表现在:BP算法的学习速度很慢,需要较长的训练时间;网络训练失败的可能性较大,易陷入局部极小点,逼近局部极小值[5]。为了改善这些缺点,通常会改变隐层数量,隐藏层一般根据具体情况制定,但是增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能力。而遗传算法的基本作用对象是多个可行解的集合,而非单个可行解。它同时处理多个个体,同时对搜索空间中的多个解进行评估,使得遗传算法具有较好的全局搜索性能,减少了陷于局部最优解的可能性,同时,它本身具有良好的并行性。所以用遗传算法学习神经网络的权重及拓扑结构[6],对神经网络进行改进,提高了神经网络的精度,同时也提高了遗传算法的局部搜索能力。在模式分类应用中进行数据预处理,利用遗传算法进行特征提取,其后用神经网络进行分类。GABP混合学习算法结构如图2所示,采用GA优化BP网络权值。
①BP网络参数初始化;
②按BP网络的权值和阈值连接随机产生染色体;
③计算染色体的适应值以及迭代次数,如果达到要求,则结束GA算法,产生最佳个体,如果没有达到,进行下一步;
④按适应度进行选择、交叉和变异操作,产生新的染色体,重复上一步;
⑤将产生的最好个体依次映射到BP网络中对应的权值和阈值,并将此作为BP网络的初始值;
⑥利用BP网络,判断误差是否达到预定要求,达到就结束,如果没有,则BP网络反向传播,返回上一步。
3结语
本文分析了文字识别的常用方法及其优缺点,着重分析了手写藏文识别征提取和分类器设计两个关键技术,并对藏文识别研究领域今后的研究方向和发展前景提出了一些看法。在原BP网络的基础上改进GABP神经网络,可以提高其学习速度,加快收敛速度,相比而言识别精度较高、训练时间较短,且具有较强的鲁棒性。由于神经网络和遗传算法已经发展得比较成熟,将两者结合的方法用于藏文识别,具有很大的实用价值,同时将GABP神经网络用于藏文识别,有助于神经网络用于藏文识别的可能性和有效性。
参考文献:
[1]张学工.模式识别[M].北京:清华大学出版社,2010.
[2]吴刚,德熙嘉措,黄鹤鸣.印刷体藏文识别技术[C].第十届全国少数民族语言文字信息处理学术研讨会论文集,2005.
[3]刘卫,李和成.基于局部保持投影与隐马尔可夫模型的维文字符识别[J].计算机应用,2012,32(8).
[4]梁弼,王维兰,钱建军.基于HMM的分类器在联机手写藏文识别中的应用[J].微电子学与计算机,2009,26(4).
篇7
【关键词】模糊神经网络;模糊控制;模糊辨识;规则抽取;学习算法
1 问题的提出
模糊逻辑和神经网络都适于处理那些被控对象模型难以建立或存在大的不确定性和强非线性的系统. 由于神经网络在分布式处理,学习能力,鲁棒性,泛化能力方面具有明显的优势,而模糊系统的优势在于良好的可读性和可分析性,因此,将神经网络的思想融合到模糊辨识和模糊控制模型中就可以实现两者的优势互补.模糊神经网络控制针对双方的特点相互借鉴和利用,比单独的神经网络控制或单独的模糊控制具有更好的控制性能. 随着智能控制理论的发展,模糊神经网络控,难以实现系统的实时控制制受到控制界的广泛关注,相继提出了许多控制和辨识的方法.
本文总结了近期我国学者提出的几种新的基于模糊神经网络的系统辨识与控制方法,并通过仿真进行了各自特点的比较,希望可以通过这些比较,对这些研究加以改进和应用.
2 模糊神经网络
2.1 仿射非线性系统
为了实现非线性系统的实时控制,基于径向基函数网络与TSK 型模糊推理系统的函数等价的特点,有学者提出了一种动态模糊神经网络的在线自组织线性算法,从而实现了系统的结构和参数的同时在线自适应. 学习速度快是这种模糊神经网络的突出特点.在此基础上,针对未知仿射非线性SISO 系统提出了一种在线自适应模糊神经网络辨识与控制方法. 该方法首先采用G2FNN 学习算法实时建模系统的逆动态,实现模糊神经网络的结构和参数的同时在线学习. 然后,设计一个鲁棒补偿器与辨识好的模糊神经网络组成复合控制器,并基于Lyapunov 稳定性理论设计自适应控制律进一步在线调整网络的权值,实现系统的跟踪控制.
控制目标是设计一个由G2FNN 控制器和鲁棒控制器构成的模糊神经网络自适应鲁棒控制器, 使得系统的输出y 跟踪给定的参考输入信号ym ,对于一个给定的干扰衰减水平常数ρ>0 ,获得良好的H ∞跟踪性能指标.
广义模糊神经网络G2FNN 由四层网络结构组成,分别实现模糊逻辑的模糊化、模糊推理和解模糊化过程. 图1 所示为单个输出结点G2FNN 的结构.
图1 G2FNN 的结构
G2FNN 中有两类学习算法,即结构学习和参数学习. 结构学习是通过对每个新的训练数据计算出G2FNN 的输出与期望输出之间的偏差来决定是否产生新的模糊规则或删除多余的规则; 参数学习有两个方面,一是当系统产生第N r+1条新的模糊规则时确定新规则前提参数ci ( N r+1) ,σi(N r+1),另一个是当不需要进行结构学习时对第三层与第四层网络之间的权值向量W 的调节.
第一层直接将输入语言变量xi(i =1,2,…Ni) 传递到下一层.
第二层计算输入分量隶属于各语言变量值模糊集合的隶属度,隶属度函数为高斯函数:
式中: cij ,σij (i =1 ,2 , …, N r) 分别是第i 个输入语言变量xi的第j 条隶属度函数的中心和宽度;N r 为系统产生的规则数.
第三层是规则层, 这一层的每个结点代表一条模糊规则,它的作用是用来匹配模糊规则的前提,每个结点的输出可以表示为:
第四层是结点定义语言变量的输出, 它的作用是用来匹配模糊规则的结论,实现TSK型模糊推理系统的解模糊化过程. 其输出为:
这里, Wj 为第三层与第四层之间的权值.
使用倒立摆系统方程进行仿真研究, 倒立摆的动态方程为:
系统仿真结果如图(图2):
图2 自适应模糊神经网络控制系统跟踪轨迹
由图可知,所设计的控制器实现了模糊神经网络的结构和参数的在线自适应,输出跟踪参考输入信号,系统的误差收敛速度快,鲁棒性好.
由仿真可见,该方法不仅实现了模糊控制规则的自动产生和删除,还保证了闭环系统的全局稳定,并使外部干扰和模糊神经网络逼近误差对系统跟踪误差的影响衰减到一个指定的水平.本方法不需要知道系统的控制增益,设计了一个鲁棒补偿器来抑制模糊神经网络逼近误差和外部干扰的影响. 系统鲁棒性好,抗干扰能力强,所设计的控制器可用于系统的实时控制.
2.2 网络参数自学习模糊控制
在模糊系统的许多应用中, 如模糊推理、模糊逻辑控制器、模糊分类器等, 提取模糊规则是一个重要步骤。在新兴的研究领域――数据挖掘中, 提取模糊规则也起着重要作用。然而模糊控制规则的获得通过由专家经验给出, 这就存在诸如控制规则不够客观、专家经验难以获得等问题。因此研究模糊规则的自动生成有着重要的理论和应用价值。在许多问题中, 希望提取出来的模糊规则能够用语言变量表示, 以便揭示模糊系统内部的规律, 同时这也是模糊系统的一个特色。为了提高抽取复杂系统模糊if- then 规则的质量, 将具有极好学习能力的神经网络与模糊推理系统相结合, 产生了神经- 模糊建模方法, 这种方法综合了两种形式的特点, 提供了一种从数值数据集抽取模糊规则的有效框架。有关领域的研究者们提出了多种模糊逻辑与神经网络结合的方法, 给出了各种用于提取模糊if- then 规则的神经网络结构框架。
由于径向基函数网络(RBFN)以其结构简单、良好的逼近能力、独特点可分解性以及和模糊推理系统的函数等价性, 因此可应用于模糊系统。然而, 当一个模糊系统使用学习算法被训练之后可能会影响其可解释性, 也就是使得模糊系统的可理解性下降, 而可解释性是模糊系统的一个突出特点。为了让模糊系统在具有自学习和自组织性的同时也具有可解释性这一突出特点, 以下提出了一种能够有效表达模糊系统可解释性RBF 网络结构, 并进行了仿真实验, 取得较好的仿真结果。
根据测量数据采用各种神经网络自动提取模糊规则的方法, 在输入输出空间划分部分运用的是聚类的思想, 而大多数其输入输出空间划分数( 聚类数) 是预先给定, 这不免带有一定的盲目性, 直接影响规则的提取质量。为此, 本文关于初始聚类中心及聚类中心个数的确定方法采用文献7 提出的一种聚类神经网络初始聚类中心的确定方法。利用这种基于密度和基于网格的聚类方法, 能自动地进行样本空间的划分, 针对样本空间划分过程中不同阶段的特点, 采用了不同的处理手段, 使得该方法在样本空间划分数、聚类学习时间等方面都具有比较明显的优越性(图3)。
图3 仿真实验结果
下面针对每个仿真曲面分别给出一组训练样本点为500 个, 评价样本点为100 个的仿真结果图, 如图4所示:
图4
从图中, 可见各样本数据的预测值与实际值吻合的比较好, 只有个别的点误差较大, 这与训练样本点的选取有关。另外, 在系统模型建立好后, 为了检验模型的效果, 笔者另外又抽取几组数据样本作为评价样本, 结果发现预测值与实际值相比, 误差也在允许范围内, 效果比较令人满意。
本方法的创新点是提出了一种能够有效表达模糊系统可解释性RBF 网络结构, 并给出了一种有效的提取模糊规则的算法, 这就使模糊系统在具有自学习和自组织性的同时也具有可解释性这一突出特点。利用这种网络结构和算法进行控制器设计, 至少有以下的优点:
(1)模糊系统具有很好的可解释性。
(2)该算法克服了RBF 中心个数选择的随机性,较好地解决了样本聚类。
(3)提出的增量数据处理方法保证了网络结构能适应不断扩大的数据集。
综上所述, 这种RBF 模糊神经网络控制算法,对于研究非线性, 时变的多变量系统, 提供了一种新的思路, 具有一定的理论意义和工程应用价值。
2.3 其他一些方法
其他的一些最近被提出的,如基于神经模糊网络的方法,基于模糊推理网络的方法(见图5), 基于非线性自回归滑动平均模型等,都取得了很好的控制和辨识效果,具有有良好的发展和应用前景.
图5 6层神经模糊推理网络
3 总结
本文系统地叙述了目前研究比较热门的近期我国学者提出的几种新的基于模糊神经网络的系统辨识与控制方法的研究成果,并简要分析了各种方法的优缺点. 限于篇幅,除本文介绍的几种方法外, 还有一些研究成果没有列出. 本文的目的是为在这方面进行研究的学者提供一个系统的参考和建议.
【参考文献】
[1]李佳宁,易建强,等.一种新的基于神经模糊推理网络的复杂系统模糊辨识方法[J].自动化学报,2006,Vol.32,No.5.
[2]王锴,王占林,付永领,祁晓野. 基于PNN与FNN模型神经网络控制器设计与分析[J].北京航空航天大学学报,Vol.32, No.9,2006.
[3]李晓秀,刘国荣,沈细群.仿射非线性系统的在线自适应模糊神经网络辨识与控制[J].湖南大学学报(自然科学版),2006,8,33(4).
[4]李延新,李光宇,孙辉,李文.基于RBF 网络的参数自学习模糊控制的研究[J].微计算机信息,2006,8,22(8).
篇8
关键词:电网规划;交流线路;线路长度;多元回归;神经网络 文献标识码:A
中图分类号:TP273 文章编号:1009-2374(2016)22-0062-03 DOI:10.13535/ki.11-4406/n.2016.22.030
1 概述
电网规划是电网安全稳定运行的基石,电网规划数据的准确性尤其是数据中交流架空线路参数的准确性对规划结果的合理性具有重要影响。
对于输电线路的参数辨识方法较多,例如增广状态估计法、偏移向量法、卡尔曼滤波法等传统数值方法,这些方法能较好地逼滑目标函数的极值点,但其迭代过程都依赖量测方程的增广雅可比矩阵,苛刻地要求量测系统必须同时满足状态可观测和参数可估计条件,并且可能遭受数值问题的干扰。参考文献[4]中提出一种线路参数估计启发式方法,将目标函数从增广解空间垂直投影到参数空间,以启发式方法搜索参数空间,寻找投影下表面的下确解,较好地解决了数值问题的干扰。参考文献[5]在基于双端PMU数据的线路线性数学模型和相应的最小二乘辨识的基础上,引入基于IGG法的抗差准则。
2 BP人工神经网络
2.1 BP神经网络模型
BP神经网络由输入层、隐含层和输出层三层网络组成。BP神经网络的核心在于其误差反向传播,反向传播的学习规则是基于梯度下降法,由输出端的实际输出值与期望输出值的误差平方和进行链式求导,从而各层之间的连接权值。
2.2 BP神经网络模型算法优缺点分析
神经网络可以充分逼近任意复杂的非线性关系;采用并行分布处理方法;可学习和自适应不确定的系统等。
BP神经网络算法的极小化代价函数易产生收敛慢或者振荡的现象;代价函数不是二次的,而是非凸的,存在许多局部极小点的超曲面。这也导致神经网络算法对初值的要求较高,给定较好的初值,BP神经网络的收敛速度会大大加快,而且不易陷入局部极小值。
3 线路参数辨识中多元回归模型与神经网络的结合
3.1 线路长度回归计算模型
实际工程中,线路长度与阻抗导纳值之间的关系是确定的,对于架空线路,当长度小于300km时,其阻抗导纳参数等于该型号架空线路单位长度的阻抗导纳值与线路长度的乘积,此时阻抗导纳参数与线路长度为简单的线性关系;而当长度大于300km时,其阻抗导纳参数的值就需要考虑长距离输电线路分布参数的情况,此时并不能用简单的线性关系来描述。
在建立线路长度回归计算模型时,首先忽略线路的分布参数特性,建立回归模型如下:
式中:L表示线路长度;lX表示通过电抗参数除以单位长度的电抗值得到的线路长度;lR表示通过电阻参数得到的线路长度;lG表示通过电导参数得到的线路长度;lB表示通过电纳参数得到的线路长度;K1、K2、K3、K4、K5分别为各自的系数值。
回归方程的求解采用最小二乘法,目标是使长度的计算值与长度的实际值差值的平方和达到最小,目标函数为:
J=∑Ni=1(Li~-Li)2
式中:J为线路长度计算值与实际值差值平方和;N为样本线路的条数;Li~为线路长度的实际值;Li为线路长度通过回归模型的计算值。
3.2 BP神经网络模型的建立
当考虑线路长度的分布参数情况时,线路参数之间就不仅是简单的线性关系,本文建立了神经网络模型,输入层为线路的电阻、电抗、电导和电纳参数值;隐含层包含5个神经元;输出层为线路的长度值。
如图1所示,神经网络模型的输入层为线路的阻抗导纳值;输出层结果为线路长度,其中隐含层到输出层的连接权值采用3.1中回归模型的5个系数值作为初始值,然后输入样本值对神经网络进行训练,直到输出实际值与理想值满足误差要求时停止。
4 回归分析与神经网络结合模型在线路参数辨识中的应用
4.1 线路参数辨识流程
根据以下步骤建立线路参数辨识模型,完成对BPA中交流架空线路的电阻、电抗、电导和电纳参数的辨识。
第一步:提取BPA中所有交流架空线路的完整参数信息。
第二步:训练回归模型和神经网络模型,直至满足收敛标准。
第三步:判断线路长度参数是否填写。如果已填写线路长度则进入步骤四,若没有填写线路长度进入步骤五。
第四步:根据已训练完成的神经网络模型反推线路的长度值,并比较线路长度的训练值与长度填写值之间的差距,如果两者差距在合理范围之内,进入步骤六,如果两者差距过大,则采用长度训练值进行后续的参数辨识过程。
第五步:根据已训练完成的神经网络模型反推线路的长度值。
第六步:根据单位标准参数值与线路长度计算得到线路参数的标准值,将标准值与线路参数的实际填写值进行比对,如果计算得到的标准值与实际填写值之差没有超过阈度值,则进入步骤七;反之进入步骤八。
第七步:线路参数填写合理,进入第十步。
第八步:线路参数填写存在问题并按照计算得到的标准值作为推荐的修改值,并标识修改后的线路。
第九步:输出标识的不合理数据,由规划人员审核是否接受建议的修改值。
第十步:结束参数辨识。
4.2 辨识结果分析
4.2.1 线路长度训练结果分析。如图2所示,采用100条线路测试样例,长度值由小到大进行排序,折线表示线路长度的实际值,折线表示的是通过本论文所建立的神经网络模型得到的线路长度计算值。
对模型的训练误差做进一步分析可得:
训练长度的平均误差为1.35;训练长度误差最大值为8.9;训练长度误差最小值为0;训练长度误差均方差为1.68。
由以上数据可以看出,本论文所提的线路长度训练算法准确度较高,能够满足参数辨识工作的需要。
4.2.2 线路参数辨识结果。算例采用数据为某电网某年的实际BPA规划数据,辨识结果如表1所示:
由表1和表2的对比可以看出,上述交流线路的电纳参数的填写的确存在问题,由表2可以看出线路电阻和电抗的填写值与标准值的差距很小,这说明线路填写的电阻和电抗值是合理的,而电纳的填写值与标准值差距较大,由此可以说明线路电纳值的填写有误;将表1中的辨识电纳结果值与表2中的标准电纳值做比较可以发现两者之间差距不大,如表3所示,这说明采用该算法进行线路参数的辨识是有效合理的,辨识的结果值具有很大的参考价值。以上结果证明了算法的有效性,可以对参数填写存在问题的交流线路进行辨识,并给出准确性较高的辨识结果值作为建议修正值。
5 结语
本文提出了电网规划数据中输电线路参数辨识算法。算法的创新点是根据线路阻抗导纳参数与长度之间的潜在关系,首先建立线性回归模型得到回归系数作为BP神经网络模型隐含层到输出层的初始连接权值,然后建立神经网络模型,训练线路参数与线路长度之间的非线性关系。采用电网规划中的实际BPA数据进行了算法有效性的验证,结果表明本文提出的解决思路和算法对规划工作具有很大的实际应用价值。
参考文献
[1] 于尔铿.电力系统状态估计[M].北京:水利电力出
版社,1985.
[2] Liu W H E,Wu F F,Lun S M.Estimation of parameter
errors from measurement residuals in stateestimation[J].
IEEE Transactions on Power Systems,1992,7(1).
[3] Slutsker I W,Clements K A.Real time recursive
parameter estimation in energy management systems[J].
IEEE Transactions on Power Systems,1996,11(3).
[4] 赵红嘎,薛禹胜,汪德星,等.计及PMU支路电流
相量的状态估计模型[J].电力系统自动化,2004,28
(17).
[5] 戴长春,王正风,张兆阳,等.基于IGG准则的抗差
最小二乘输电线路参数辨识[J].现代电力,2014,31
(2).
[6] 陈珩.电力系统稳态分析[M].北京:中国电力出版
社,2007.
[7] 曾明,魏衍.一种BP神经网络改进算法的研究及应用
[J].微计算机信息,2009,(18).
[8] 孟栋,樊重俊,王家桢.混沌遗传算法对BP神经网络
的改进研究[J].数学理论与应用,2014,34(1).
[9] 吴俊利,张步涵,王魁.基于Adaboost的BP神经网
络改进算法在短期风速预测中的应用[J].电网技术,
2012,36(9).
[10] 杨耿煌,温渤婴.基于量子行为粒子群优化――人
工神经网络的电能质量扰动识别[J].中国电机工程学
报,2008,28(10).
[11] 王越,卫志农,吴佳佳.人工神经网络预测技术
在微网运行中的应用[J].电力系统及其自动化学报,
2012,24(2).
[12] 庞清乐.基于粗糙集理论的神经网络预测算法及
其在短期负荷预测中的应用[J].电网技术,2010,34
(12).
[13] 师彪,李郁侠,于新花,等.基于改进粒子群-径向
基神经网络模型的短期电力负荷预测[J].电网技术,
2009,33(17).
[14] 王旭东,刘金凤,张雷.蚁群神经网络算法在电动
车用直流电机起动过程中的应用[J].中国电机工程学
篇9
【关键词】智能控制 火电厂 热工自动化
1 智能控制的发展
随着社会经济的发展和科学技术的进步,尤其是信息技术的发展,在新时期,人们又将信息论的因素融入到智能控制中、因此发展为例成熟的四元交集,近年来,在计算机技术高速发展的作用下,智能控制技术得到了快速的发展,在火电厂等行业中得到了广泛的应用。
2 智能控制技术分类
2.1 专家控制
专家系统可以按照其在整个控制系统中的使用繁杂度进行分类,一般分为专家式控制器与专家控制系统两种,前者适用于数据库较小、推理较易的控制,常见的就是工业专家控制器,它强调的是逻辑与实算;后者则必须建立在复杂的数据库和推理上,它具有较为完善的系统结构及处理能力。
2.2 模糊控制
模糊控制建立在模糊推理与模拟思考的基础上,它可以用于无法创建有效数学模型目标的控制,对于推理及控制系统中的不确定及不精确问题,它能进行有效的管理和控制。模糊数学、模糊逻辑推理以及模糊言语表达是模糊控制技术的建立基础,它在计算机系统的作用下实现了反馈和闭环的自动控制。模糊控制的控制是通过系统设计人员的控制能力以及控制数据来完成的,它无需进行数学建模;模糊控制有很好的鲁棒性,能够很好地克服一些时变、时滞、非线性以及不确定控制问题;模糊控制使用单纯的语言变量,因此很容易建立相应的专家系统。
2.3 复合智能控制
不同智能控制系统具有不同的优缺点,复合智能系统就是将各种不同种类的控制系统进行综合使用,这样可以在克服各个控制系统缺点的同时,实现各个系统优点的综合。目前常用的复合系统是主要有模糊滑模控制、模糊专家控制以及神经网络模糊控制。
模糊专家系统。该系统的特点就是,即使初始信息获取的不够完整或者准确,但该系统还是可以较为有效的人类专家思维模拟,在既有的不完整的信息下提出最优化的解决方案。模糊专家系统是模拟人类有关专家进行有关问题解决的思路,因此是一种较容易开发应用的复合系统。神经网络模糊系统。神经网络模糊系统是两种系统的有效结合,它在实现模糊逻辑利用少量信息进行知识表达的同时,也可通过联想进行有关知识的应用,这使得该控制方法实现了表达和学习能力的综合提升。模糊滑模控制。滑模控制最大的优点就是不受系统不确定性的影响,鲁棒性较佳;其缺点主要体现在未建模动态及补偿干扰的高控制增益,此外在高频转换时易产生一定的抖振。综合模糊系统以后的模糊滑模控制就很好的克服了这些问题,它将二者不依赖性及鲁棒性好的优点进行了一定的结合,因而可以有效实现控制对象的转换。该控制方法具有很好的应用前途。
2.4 神经网络控制
基于对人类大脑神经元的模拟,神经网络控制可以通过神经元的权值分布和联结来进行有关信息的表达。它可以实现有效的神经万罗模拟,通过权值的调整和学习,经过神经网络预测、直接或者间接的矫正等实现智能控制,这一过程具有非线性特点,从理论上来说,它可以实现各种非线性图像。神经网络控制不仅在并行能力和并行结构上实现有效的控制,而且还有较好的经济性。
3 智能控制在火电厂热工自动化的应用
3.1 对中储式制粉系统的控制
磨负荷信号较难测量、数学建型复杂以及被控参数耦合,是中储式制粉系统主要的问题所在,此时就可以利用模糊语言规则克服其延迟与非线性的问题,具体内容包括,将操作人员的经验以数据的形式存入计算机并进行计算,然后通过预测和分级两种模糊控制的进行控制。
3.2 对给水加药的控制
给水加药工作主要涉及的是氨与联胺的加入,前者可以使给水与高凝结水处于较高的碱性,避免酸性水腐蚀高低压给水设备;而后者是通过联胺的化学作用控制水内氧和二氧化碳的含量,从而避免相关设备出现腐蚀、生垢等问题。在给水加药系统中使用模糊控制系统以后,专家有关经验的信息就会融入到控制系统中,这样系统控制的质量就会实现大大的提升。在变频器输出频率的控制中使用模糊控制,能够有效的进行加药泵机的转速调整,这种融入模糊控制的给水加药系统乐意避免人工加药引起的各种不良后果,从而提高了给水加药的工作质量。
3.3 对锅炉燃烧过程的控制
锅炉燃烧易受到煤种煤质、变量耦合、时滞等多种因素的干扰,且其燃烧率很难实行颈椎的测区。将专家控制应用到锅炉燃烧过程的控制中以后,专家系统通过逐次的判断、分析和推理以后,可实现前进式的系统,具体包括对紧急事故、工况判断子集、送风调节子集、执行机构诊断子集、煤厚调节子集等多内容的判断。
3.4 对单元机组负荷的控制
非线性、不确定、时变以及耦合等是单元机组负荷控制的难题所在,对此,可以设计出建立在机跟炉与炉跟机上的具有自适应性的两种神经元模拟负荷控制系统。试验发现该系统下各权系数学习收敛明显提速,且效果自适应性及控制性均较理想。
3.5 对过热汽温的控制
改变减温水是实施锅炉过热汽温控制的常用方法,大惯性、时滞性,以及动态特性的随便是该系统主要面对的问题。随着智能控制技术的发展,人们逐渐将神经网络控制技术引入到过热汽温系统中来,这使得系统的运行状况、控制质量及适应性都有了明显的提升。
4 结语
随着对智能控制技术的创新和发展,智能控制技术已经取得了巨大的进步和完善,并且在各行各业已经得到了广泛的应用。通过上述分析发现,在火电厂热工程自动化使用智能控制技术,能够解决在原系统中出现的各种问题,极大提高了火电厂自动化控制的质量,为电厂的发展做出了贡献。
参考文献:
[1] 曾友和.构建火电厂热工自动化安全系统的分析和探讨[J].投资与创业,2012(8).
[2] 王家金.火电厂热工自动化现状及新发展浅议[J].城市建设,2013(24).
篇10
【关键词】 数据挖掘 信用风险 决策树 支持向量机
一、引言
我国上市公司是整个国民经济整体的一个有机组成部分,甚至可以说是整个国民经济的核心所在。至2008年底,沪深两市的股票总市值在缩水62.9%的情况下仍达到12.13万亿,占GDP的48.6%。从这些数据可以看出,上市公司在我国经济中占有主体地位,因此,上市公司的优劣存亡将关系到整个国民经济的发展。然而,我国上市公司所积累的信用风险已经非常巨大,在深交所的诚信档案里仅主板市场就列出了20页的违规通报批评和处分决定。就国有企业而言,信用危机依然存在,突出的表现就是恶意拖欠逃债现象。企业信用风险状况直接关系到我国金融市场的健康发展和国民经济的持续稳定。可见,对上市公司信用风险的管理是非常必要和迫在眉睫的,而上市公司信用风险评估模型的建立是防范信用风险的重要手段。因此,研究上市公司信用风险评估这一课题,已经成为我国目前经济生活中亟待解决的一个重要问题。
目前许多定量技术和支持工具、软件已付诸商业应用,继传统的比例分析之后,统计方法得到了广泛的应用,如判别分析和Logistic回归等。信用等级评估是通过对企业或个人的某些单一财务指标进行加权平均确定的,该方法最大的缺陷在于指标和加权值的确定带有很大的主观性,使得评估结果和实际状况有很大的出入。因此,需要引入科学方法来确定有效评估指标,并建立准确的定量模型来解决信用等级评估的问题。近年来,信息技术得到了迅速发展,如数据挖掘技术等能从海量数据中智能发现有用的规则和知识,再加上我国上市公司信息披露制度的不断完善,使得我们的研究能够得到的数据资料也不断的增多,这些有利条件的出现使得我们对基于数据挖掘的上市公司信用风险评估模型的研究有了数据基础和技术基础。
二、基于数据挖掘的信用风险评估模型比较综述
1、决策树
决策树方法于20世纪60年代起源于对概念学习建模;20世纪70年代后期Quinlan发明用信息增益作为启发策略的ID3算法,从样本中学习构造专家系统;1993年Quinlan在ID3算法基础上研究出了改进的决策树归纳包(C4.5),这是目前被普遍采用的数据分类方法。其思想是一个类似于流程图的树结构,其中每个内部结点表示在一个属性熵的测试,每个分支代表一个测试输出,而每个树叶节点代表类或类分布。决策树通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类,树上每个节点说明了对实例的某个属性的测试,节点的每个后继分支对应于该属性的一个可能值。决策树分类模型之所以被广泛应用于信用风险评估,主要是因为决策树具有以下优点:(1)与神经网络或贝叶斯分类等其他分类模型相比,决策树的分类原理简单易懂,很容易被使用人员理解和接受。在决策树分类过程中,一般不需要人为设定参数,更适合于知识发现的要求;(2)决策树的学习算法具有建立速度快、计算量相对不是很大、可以处理连续值和离散值属性;(3)决策树能使用信息原理对大量样本的属性进行信息量分析,计算各属性的信息量,找出反映类别的重要属性(可以清晰的显示哪些属性对分类比较重要);(4)决策树分类方法与其他分类模型相比,易于生成可理解的规则。决策树方法对记录数越大的数据库,它的效果越明显,这就是它显著的优点。
研究表明,一般情况下,树越小则树的预测能力越强。要构造尽可能小的决策树,关键在于选择恰当属性。而属性选择依赖于各种对例子子集的不纯度度量方法。其中,基于数据挖掘中决策树C4.5算法的分析框架建立的上市公司信用风险评估模型,对数据分布无任何要求,应用于上市公司信用风险评估的效果比较好,因此具有良好的发展前景,值得我们深入研究。
2、神经网络
BP网是面向映射变换的神经网络中应用最广泛的一种,其结构如图1所示。典型的BP网有三个层次:输入层、隐含层和输出层,相邻层次神经元间采用全互连形式,同层神经元间则不相连。其思路是:当给网络提供一个输入模式时,该模式由输入层传到隐含,经隐含层神经元作用函数处理后传送到输出层,再经由输出层神经元作用函数处理后产生一个输出模式。如果输出模式与期望的输出模式有误差,就从输出层反向将误差逐层传送到输入层,把误差“分摊”给各神经元并修改连接权,使网络实现从输入模式到输出模式的正确映射。对于一组训练模式,可以逐个用训练模式作为输入,反复进行误差检测和反向传播过程,直到不出现误差为止。这时,BP网完成了学习阶段,具备所需的模式分类(识别)能力。
20世纪80年代末,西方发达国家将人工智能引入银行业,协助银行进行贷款决策,这其中,尤其以人工神经网络最为突出,其在企业财务分析中显示了巨大的优势和潜力。而在我国,无论是用统计方法还是用神经网络技术来研究信用风险,目前都尚处于起步阶段。王春峰等(1999)用神经网络技术进行商业银行信用风险评估;郝丽萍等(2001)研究了商业银行信贷风险分析的人工神经网络模型;柳炳祥、盛昭翰(2003)利用粗神经网络对企业财务危机进行了分析;庞素琳等(2003)利用BP算法对我国某商业银行2001年120家贷款企业进行3类模式(“信用好”、“信用一般”、“信用差”)分类,分类准确率达到83.34%;张德栋、张强(2004)建立了基于BP神经网络的企业信用3层神经网络评估模型,实验结果证明,该模型用于企业信用评估,减少了企业信用评估传统的定性方法中权重确定的人为因素,评估正确率达到了92.12%;王凯、黄世祥(2007)建立起基于BP神经网络的行业间信用评估模型,并代入2003年度全国农业和工业的部分行业数据进行实证。
神经网络由于其自身优势已经在各个领域得到了广泛的应用,近几年来,经济学和管理学方面的学者将其运用到经济领域,特别是在信用风险评估方面取得了很好的成效。尤其BP神经网络在商业银行信用风险评估上应用的可行性,其优点主要体现在:(1)BP神经网络模型具有高速信息处理能力。信用风险评价是一个非常复杂的系统,简单的信用风险打分模型不能很好地表述这种关系,同时结果与实际也有较大的差别。而神经网络是由大量的神经元广泛互连而成的系统,并行处理能力很强,得到的模型能对实际作出很好的预测。(2)BP神经网络模型具有很强的不确定性信息处理能力。由于神经网络中神经元个数众多以及整个网络存储信息容量巨大,使得它具有很强的对不确定性信息的处理能力。而信用风险本身就有一种不确定性,信用风险评价指标体系涉及指标众多,这些变量本身就具有一种动态性和不稳定性。运用BP神经网络模型进行预测可以很好地解决这种不确定性。(3)BP神经网络模型是一个具有高度非线性的系统。神经网络同现行的计算机不同,它是一种非线性的处理单元,因此神经网络是一种具有高度非线性的系统。在信用风险评估运用上,它突破了传统信用风险评估方法以线性处理为基础的局限性,能更有效、更精确地处理复杂信息。但是,神经网络也存在明显的不足。首先,当神经网络的输入维数高时,隐含规则呈几何级数增加,致使网络结构庞大,同时神经网络学习速率固定,存在局部最小点问题,因此网络收敛速度慢,需要很长的训练时间,甚至可能发生网络瘫痪;其次,网络结构复杂,导致网络的输入节点单元数、隐含层数的确定缺乏理论依据。尽管存在一些遗憾,神经网络方法作为一门崭新的信息处理科学方法仍然吸引着众多领域的研究者。
3、支持向量机
支持向量机(Support Vector Machine,SVM)是根据统计学习理论得出的一种新的机器学习算法,它用结构风险最小化原则替代经验风险最小化原则,较好地解决了小样本学习问题,是一种通用的前馈网络类型。支持向量机的实现是通过某种事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,在这个空间中构造最优分类超平面。使用SVM进行数据集分类工作的过程首先是通过预先选定的一些非线性映射将输入空间映射到高维特征空间,它使得在高维属性空间中有可能对训练数据实现超平面的分割,避免了在原输入空间中进行非线性曲面分割计算。SVM数据集形成的分类函数具有这样的性质:它是一组以支持向量为参数的非线性函数的线性组合,因此分类函数的表达式仅和支持向量的数量有关,而独立于空间的维度。
随着机器学习理论的不断发展,支持向量机作为一种专门针对小样本学习的算法被引入到了信用风险评估中。在我国,张秋水、罗林开等(2006)通过SVM与传统的多元线性回归(Multi Linear Regression,MLR)和Logit分析(Logit Analysis,LA)的实证对比和模型分析,得出SVM在20组测试样本集上的平均误判率是最低的,显著优于MLR,也优于LA。吴冲等(2009)建立了基于模糊积分的支持向量机集成方法,该方法综合考虑了子支持向量机的输出重要性并与单个支持向量机和最多投票原则的支持向量机集成进行比较,实证结果表明,该方法具有更高的分类精度。与BP神经网络相比,SVM方法的优缺点是:(1)模型的准确率。SVM是通过解一个凸二次规划来得出结果的,因此找到的解是全局最优解,且精度高,利用支持向量机进行上市公司信用风险评估,根据有限的训练样本,建立了非线性映射关系,解决了维数问题,这种算法具有简单、准确率高的优点,很适合推广。(2)泛化能力。SVM通过结构风险最小化原则实现了经验风险和置信范围的良好折衷,避免了过拟合现象,而人工神经网络是基于经验风险最小化原理。(3)模型的适用性。SVM方法通过对不同的核函数和参数的选择,可以优化评估结果,不同的核函数可以满足不同的需求,模型的适用范围更广。(4)对数据要求。SVM可以避免小样本和“维数灾难”问题,对有限数量和维数较高的样本评估精度较高;而BP神经网络模型由于数据较少,易产生过拟合现象,因而使用范围受限制。(5)核函数也需要人为的确定,尚未有理论证明决定应选择的核函数。
三、结束语
随着信息技术的发展,数据挖掘方法被广泛应用于金融、经济领域,在信用风险方面也受到越来越多的重视。在我国,对上市企业的信用风险评估还是一个很具有挑战性的领域,不仅体现在其信用风险变化的复杂性,还在于评估所面临的巨大工作量。上市企业的信用状况是构成整个社会体系不可缺少的重要部分,因此,解决其信用风险评估问题的首要任务是要建立简单可操作的模型,并充分发挥计算机处理信息等的优势作用。
(注:本文系华东交通大学校立科研基金资助课题《基于数据挖掘的上市公司信用风险评估模型研究》的部分研究成果,课题编号:09GD02。)
【参考文献】
[1] Qualian JR,C4.5: Programs for Machine Learning [J],San Mateo, CA:Morgan Kaufmann Publishers,1993.
[2] Virongrong Tesprasit,Paisarn Charoenpornsawat ,Virach Sornlertlamvanich,A Context-Sensitive Homograph Disambiguation in Thai Text-to-Speech Synthesis,Proceedings ofHuman Language Technology Conference,2003.
[3] 周松林、吴铭:沪深两市总市值全年缩水62.9%[J].金融界,2009(1).
[4] 王春峰、万海晖、张维:基于神经网络技术的商业银行信用风险评估[J].系统工程理论与实践,1999(9).
[5] 郝丽萍、胡欣悦、李丽:商业银行信贷风险分析的人工神经网络模型研究[J].系统工程理论与实践,2001(5).
[6] 柳炳祥、盛昭翰:基于粗神经网络的企业危机预警系统设计[J].信息与控制,2003(1).
[7] 庞素琳、王燕鸣、黎荣舟:基于BP算法的信用风险评价模型研究[J].数学的实践与认识,2003(8).
[8] 张德栋、张强,基于神经网络的企业信用评估模型[J].北京理工大学学报,2004(11).
[9] 王凯、黄世祥:基于BP神经网络的行业间中小企业信用评估模型及应用[J].数学的实践与认识,2007(24).