神经网络基本原理范文
时间:2023-06-01 10:42:32
导语:如何才能写好一篇神经网络基本原理,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
【关键词】BP神经网络;预测;误差
1.引言
许多金融学家和计量学家对发达国家成熟市场的波动性进行了广泛的研究,但是在对股市的预测上,由于人们在知识、能力、经验上存在着较大的差异,加之问题本身又具有很大的随机性和高度的非线性,即使是一些金融专家、炒股高手对出现的同一复杂行情进行分析,往往也会得出不同的结论。此外,传统方法还要事先知道各种参数,以及这些参数在什么情况下应作怎样的修正。这都给预测股市带来一定的困难。
基于以上股市预测的困难性,本文提出了人工神经网络的预测方法。随着计算机、人工智能尤其是专家系统的发展,人工神经网络技术逐渐成熟并开始应用于各个领域。人工神经网络(ANN,简称神经网络)作为一种由大量简单神经元广泛相互联接而成的非线性映射或自适应动力系统,恰好能有效解决股市预测处理中常见的困难,因此它很快在股市预测分析与处理领域得到了广泛的应用。
2.BP神经网络介绍
2.1 BP 网络算法的基本原理
2.1.1 标准的BP 网络算法的基本原理
BP(Back Propagation)网络是反向传播的多层前馈式网络,是目前使用最为广泛的一种人工神经网络。它的核心是BP算法,一种对于多基本子系统构成的大系统进行微商计算的严格而有效的方法,采用最小均方差学习方式。BP 神经网络的原理说到底就是给它一些输入变量,然后就有一个输出,输出值的情况与实际的情况进行比较,差多少,然后再进行网络的内部调整,属于有导师的学习规则,使得网络输出与实际逼近。
神经网络能学习和存贮大量的输入―输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。人工神经网络由非线性函数组成,而由一系列不同权重的线性过滤器组合而成:
2.1.2 BP网络算法的优化
由于常用的BP算法主要缺点为收敛速度慢,局部极值,难以确定隐含层和隐含层的个数,使得在实际应用中BP算法很难应用,因此,出现了许多改进算法。BP算法的改进主要有两种途径,一种是采用启发式学习方法;另一种则是采用更有效的优化算法,本文采用了动量法和学习率自适应调整的策略,从而提高了学习速度并增加了算法的可靠性。动量法降低了网络对于误差曲面局部极值的敏感性,有效地抑制了网络陷于局部极小。
2.2 BP神经网络的模型识别及步骤
模式通常指对事物的一种定量描述或结构描述,“识别”是指对客观事物按其物理特征进行分类。模式识别的基本原理就是从待识别对象和理想标本之间若干特征的相似性推断它们之间总体的相似性。BP神经网络模式识别过程分为训练阶段和模式分类阶段,分为初始化、数据与处理、网络训练以及模式分类四个步骤。以下利用实证分析来进行着四个步骤。
3.实例分析
下面以上证的某股600个交易日的股票价格收盘指数作为原始样本数据,对上述神经网络模型进行求解,预测20天的收盘价,与实际收盘价进行比较,并求出其误差:
式中,表示第日的实际收盘指数,表示第日的预测值,表示误差。主要按照如下几部分来处理:(1)准备600个数据的时间序列,进行归一化。BP神经网络中每个神经元的输出值由传递函数Sigmoid函数来计算,其输出值的范围是(0,1);(2)留出最后20个数据,作为预测检验使用;(3)绘制图像,包括实际值和预测值,能量函数;(4)分析实际和预测两曲线的趋势。
采用I-J-K学习模型,该模型是输入层I个神经元,隐层J 个神经元,输出层K个神经元。利用BP神经网络模型训练500次、800次、1000次的输出值和期望值以及能量函数(或者叫误差函数)E,结果见图1到图3。
通过上面的图示,可以看到用BP神经网络预测的效果比较明显,这说明该模型适用于短期预测吗,股市的波动在很多地区都是非常剧烈的,各种因素的综合作用也使得长期股指的变动具有极大的不确定性,使得预测变得很困难。而BP网络的算法原理和自学习的特点使其能够充分挖掘出隐含在样本数据中的规律性,实现从输入空间到输出空间的非线性映射,对样本数据进行精确的拟合。从而BP神经网络的方法对于股市上的一些很难看出规律的数据列的预测而言,无疑是一个比较精确的预测方法。
4.结论
本文介绍了股市的特点以及股市预测的困难性,提出了利用BP神经网络的方法来解决股市预测问题。文章介绍了BP神经网络算法的基本原理,BP神经网络算法的优化,BP神经网络模型识别及步骤,最后后以上海证券交易所每日股票价格收盘指数为分析对象,把原理应用于实际,利用BP神经网络对股票价格收盘指数进行了短期预测,并计算出预测值和实际值的误差。通过实验发现该模型收敛速度快,预测精度非常高,对预测短周期内股指波动具有较强的适用性。
参考文献
[1]高琴.人工神经网络在股市预测模型中的应用[J].微电子学与计算机,2007年第24卷第11期.
[2]周翠红,路迈西.线性回归与人工神经网络预测煤炭发热量[J].煤炭科学技术,第37卷第12期.
[3]尹庆双,奉莹.人工神经网络在第三产业就业分析中的应用[J].人口与经济,2009年第6期.
[4]邹文安,刘宝,姜波,杨春生.基于Excel 技术平台人工神经网络BP模型及应用[J].水文,第30卷第1期.
[5]康进,刘敬伟.非参数回归估计与人工神经网络方法的预测效果比较[J].统计与决策,2009年第23 期.
[6]杨本昭,田耕.基于人工神经网络的客户价值分类研究[J].科技管理研究,2007年第12期.
篇2
【关键词】故障诊断;基本原理;神经网络;实际应用
引言
电梯在实际生活中出现不正常运行、停运等故障是在所难免的,而作为高层建筑中主要的垂直交通工具如果不能及时准确的查明故障原因并维修往往会给乘客带来巨大的生命威胁。只有保证电梯的安全运行,及时的发现故障并解决故障,才能够为乘坐电梯的乘客提供合格的安全保证。目前,国内在用的电梯缺乏完善的故障诊断系统,仅仅依靠维修技术人员的经验以及简单的诊断仪器已经不能够及时的解决复杂的电梯故障问题。神经网络技术可以应用于复杂多模式的故障诊断并且既可以用于实时监测也可以进行离线诊断,在系统模式非常复杂或者根本不知道系统模式的情况都可以应用,这些特点恰恰解决了传统方法中最最难以解决的问题。因此必须加快神经网络技术应用于诊断电梯故障的步伐,形成完善的故障诊断系统,才能更及时准确的查明故障原因进一步及时的解决问题,保证乘客的人身安全。
一、电梯的运行原理和电梯故障的特点
只有清楚地了解电梯控制系统的运行原理才能够及时准确的诊断出电梯故障原因,因此清楚的了解电梯运行原理,每一个电梯维修人员必须要做到。电梯运行过程总体上可分为以下几个阶段:第一、登记层外召唤信号和登记内选指令阶段;第二、电梯门关闭或者电梯按照系统指令停运阶段;第三、启动阶段;第四、在到达信号记录的楼层前进行减速制动;第五、平层开门阶段。在整个过程中电梯需要从外界接收信号并处理,然后完成相应的指令或者输出信号,由此可以将电梯看作是一个完整的独立的系统,只需要外界给予相应的信号就可以自动的做出动作。电梯系统内部复杂的构件紧密的结合在一起,正是如此才使得电梯系统故障具有了复杂性、层次性、相关性以及不确定性的特点。
二、神经网络技术基本原理
生物学上的神经是由一个个简单的神经元相互连接进而形成了复杂的庞大的神经系统,同理,神经网络就是由大量简单的处理单元相互连接形成的复杂的智能系统。单独的处理单元类似于一个神经元,是一个可以接受不同信息但是只输出一种信息的结构单位。神经网络系统与生物学神经系统相似的是具有自我修改能力,它可以同时接收大量的数据并进行统一的分析处理,进而输出相应的处理结果。这就使得神经网络系统具有了高度容错性、高度并行性、自我修改性、学习性以及高度复杂性,也正是由于这些特性才使的利用神经网络技术能够及时准确的查明电梯故障原因并得出故障解决方案。电梯故障诊断中应用的神经网络模型分为三个层次:输入层、接收外部信号或者是电梯自我检测信息(如载重信息);隐含层、对接收到了大量数据进行相应的分析处理;输出层、将记录着动作命令的数据传送出来。在电梯出现故障时,首先可以通过神经网络模型快速确定故障发生在哪一层达到节约时间的目的。但是神经网络也会因为收敛速度过于慢、训练强度太大或者是选择的网络模型不好等问题导致诊断结果受到影响。
三、神经网络模型在电梯故障诊断中的应用分类
神经网络模型已经成为了如今电梯故障诊断中应用最广泛的技术模型,相比于传统方式它具有诊断速度快、故障原因命中率高的优点,因此引起了各方面专业人士的强烈关注,并在他们的不懈努力下得到了发展与创新。它跨越多个专业领域、通过对各种复杂的高难度工作的不断的发展与改进出现了越来越多的应用模型,下面主要介绍了当前应用最普遍的BP网络模型,并且简单的引入并介绍了近年来新兴的模糊神经网络模型和遗传小波神经网络模型。
(一)BP网络模型
BP神经网络作为神经网络应用最广泛的一种,它多应用的误差反向传播算法使其在模式识别、诊断故障、图像识别以及管理系统方面具有相对先进性。基于BP网络的电梯故障诊断技术就是通过学习故障信息、诊断经验并不断训练,并将所学到的知识利用各层次之间节点上的权值从而表达出来。BP网络系统的主要诊断步骤主要可以分为三步。第一步:对输入输出的数据进行归一化处理,将数据映射到特定的区间。第二步:建立BP网络模型,训练BP网络模型。第三:通过已经训练好的网络模型对原来的样本进行全面的检测。算法步骤:a、在一定的取值范围内对数据进行初始化;b、确定输入值数值大小,计算出预期输出量;c、用实际输出的值减去上一步得到的数值;d、将上一步得到的误差分配到隐含层,从而计算出隐含层的误差;e、修正输出层的权值和阈值,修正隐含层的权值;f、修正隐含层的阈值,修正隐含层和输入层的权值。
(二)遗传小波神经网络模型
遗传算法运用了生物界的优胜劣汰、适者生存的思想对复杂问题进行优化,适用于复杂的故障,起到了优化简化问题的作用。对局部数据进行详细的分析是小波法最大的特点,所以它被誉为“数字显微镜”。遗传算法小波神经网络就是运用小波进行分解的方法分解模拟故障信号,将得到的数据进行归一化,将归一化后的数值输入到神经网络模型中。它融合了神经网络、小波分析和遗传算法三者所有的优点。基于遗传小波神经网络的电梯故障诊断的一般步骤为:测试节点信号采样、小波分解、故障特征量提取、归一化得到训练样本集、遗传算法优化、得到故障类型。遗传小波神经网络模型在故障原因复杂、数据信息量巨大的电梯系统的应用中能够发挥更大的作用。
(三)模糊神经网络模型
模糊神经网络模型就是创新性的将神经网络与模糊理论结合到一起。它采用了广义的方向推理和广义的前向推理两种推理方式。与其它两种模型不同的是,它的语言逻辑、判断依据和结论都是模糊的。但是它的数据处理能力还有自我学习能力并没有因此而变差,反而更加丰富了它的定性知识的内容。在处理实际问题的过程中,首先要建立所有可能发生的故障的完整集合,其次将所有的故障发生原因归入到同一个集合中去,最后就是建立故障和原因的关系矩阵。分别叫做模糊故障集、模糊原因集、模糊关系矩阵。相较于BP网络模型,这种模型更加的简单易行,充分发挥了神经网络和模糊逻辑的优点,不会因为故障原因过于复杂而失去诊断的准确性,在原本丰富定性知识和强大数据处理能力的基础上具有了很大的自我训练能力。
结语
综上所述,神经网络技术可以应用于复杂多模式的故障诊断并且既可以用于实时监测也可以进行离线诊断,在系统模式非常复杂或者根本不知道系统模式的情况都可以应用,这些特点恰恰解决了传统方法中最最难以解决的问题,它的应用提高了电梯故障的诊断速度和准确度,保证了电梯运行的安全性。虽然神经网络技术的优点很多,但是在实际生活中的应用还很少,因此还需要不断的进行改进完善。同时还要注意将集中诊断方法融合到一起,例如稳重提到的模糊神经网络模型和遗传小波神经网络模型都是集成应用的典型代表。
篇3
关键词:城区土壤;重金属污染;遗传算法;BP神经网络
中图分类号:X53 文献标识码:A 文章编号:0439-8114(2013)03-0685-03
重金属污染是全球环境污染的突出问题,随着社会和经济的发展,重金属污染危害日益加重。研究重金属污染的分布,并根据分布情况实现对污染源的定位对于有关部门进行及时的环境预防与整治具有重要意义[1]。
近年来兴起的人工神经网络能通过学习实例集自动提取“合理的”求解规则,且具有容错和容差能力以及一定的推广能力。本研究建立基于并行遗传算法的BP神经网络系统,该模型可以实现对污染源位置的定位,从而为相关部门及时进行环境整治提供了理论依据。
1 构建基于遗传算法的BP神经网络模型
1.1 BP神经网络基本原理
BP神经网络是在对复杂的生物BP神经网络研究和理解的基础上发展起来的,因此具有较强的信息处理能力,对复杂的问题具有适应和自学的能力,可以很好地协调多种输入信息的关系[2]。BP神经网络通常由输入层、若干隐含层和输出层组成,每层都包含若干神经元,通过神经元之间的相互作用来完成整个网络的信息处理。其网络拓扑结构如图1。同一层各神经元相互没有连接,相邻层的神经元通过权实现全连接。
1.2 BPANN算法改进
普通的BP神经网络有自身的缺陷,包括易陷入局部最小点、收敛速度慢、学习过程容易出现震荡等。为了改进普通的BP神经网络,引入遗传算法(Genetic algorithm,GA)。遗传算法是一种基于自然选择和基因遗传学原理的优化搜索算法,它将“优胜劣汰,适者生存”的生物进化原理引入待优化参数形成的编码串群体中,按照一定的适配值函数及一系列的遗传操作对个体进行了筛选,从而使适配值高的个体被保留下来,组成新的群体,新群体中包含上一代的大量信息,并且引入新的优于上一代的个体。这样的周而复始,群体中的适应度不断提高,直到满足一定的条件为止,其基本原理如图2[3]。
遗传算法与神经网络算法的结合就是利用GA优化网络的拓扑结构,如网络层数和每层的节点数,以及各层节点间的连接关系。根据某些性能评价准则(如学习速度、泛化能力或结构复杂程度等)搜索结构空间中满足问题要求的最佳BP神经网络。基于遗传算法的神经网络流程如图3。
2 模型应用实例——以青岛市城区土壤重金属污染源的定位为例
青岛是中国重要的经济中心城市和港口城市,是中国重要的外贸口岸之一、国家历史文化名城和风景旅游胜地,作为体现青岛面貌的首要因素——环境,已成为青岛、中国乃至世界大众关注的问题。因此,对青岛的城市环境地球化学研究势在必行。
现以青岛市城区为例,根据从城区采样得到的土壤重金属含量数据建立神经网络模型,对污染源进行定位。对青岛市南区、市北区、四方区、李沧区、崂山区5个城区进行了广泛的土壤地质调查,将所考察的城区按照每平方公里1个采样点对表层土进行取样,共得到319个采样点,并分别检测每个采样点的8种重金属Cd、Cr、Cu、Hg、Ni、Pb、Zn和As的含量[4]。
对每种金属元素进行多次基于遗传算法的BP神经网络模拟后,在所得的数据矩阵中随机选取200个点对应的坐标进行绘图,绘图结果如图4。从图4中可以看出,每种重金属元素在城区中的空间分布,对数据中每种金属元素的空间坐标进行K-means聚类,所得的聚类中心即为污染源预测位置。
3 小结
通过建立基于遗传算法的BP神经网络模型,并将该模型运用于青岛市城区内各种重金属污染源的定位。使得环境管理部门可以在目标地区的土壤进行采样分析的基础上,利用该算法得出目标地区内重金属元素的分布图,根据极大值点可以定位污染源,并由此采取相应的管理措施。该算法的优越性在于可利用部分测量数据估计整体地区的分布情况,但同时也存在不足之处,一是数据获取困难,一般需要依靠卫星测量获取样本数据,二是算法虽然有较高的收敛速度,但缺少动态性,无法进行金属元素的动态分析和分布变化预测。
参考文献:
[1] 马旺海,曹 斌,杨进峰,等.城市重金属污染特征[J]. 中央民族大学学报(自然科学版),2008,17(1):66-73.
[2] 卢文喜,杨忠平,李 平,等.基于改进BP算法的地下水动态预测模型[J].水资源保护,2007,23(3):5-8,59.
篇4
关键词:变压器;故障诊断;蚁群算法;神经网络
作者简介:彭宇(1979-),女,北京人,华北电力大学经济与管理学院硕士研究生,北京市电力公司顺义供电公司,工程师。(北京
102206)
中图分类号:TM407 文献标识码:A 文章编号:1007-0079(2013)23-0225-02
电力变压器作为电力系统中最重要和最贵重的设备,其运行的安全性与电网供电可靠性有直接关系。所以,电力变压器的故障诊断技术一直都是研究的焦点,传统的故障诊断方法主要是根据变压器油中溶解气体的组成、含量与故障类型和故障严重程度之间有密切关系的原理而得出的,俗称油中溶解气体分析法(DGA法)。基于DGA法得出的实用性算法中应用最为广泛的是三比值法。该方法通过计算C2H2/C2H4,CH4/H2,C2H4/C2H6三种比值,根据已知的编码规则和故障类别,查表确定故障类别。但此方法存在“编码盲区”问题,即有时会出现“无编码”问题的情况。由于上述缺陷,有学者在此方法基础上发展出了专家系统、模糊数学、人工神经网络等方法来判别变压器故障,取得了一些成效,但都有或多或少的不足之处。专家系统在辨别变压器故障时往往具有复杂性、不完全性、模糊性;模糊数学在处理故障诊断时隶属函数确定困难,容易过多引入人的主观臆断;人工神经网络在学习过程中收敛慢,对初始设置较敏感且容易陷入局部最优。
本文基于DGA法知识,提出蚁群神经网络作为诊断变压器故障的新方法。该方法利用了人工神经网络映射非线性能力和泛化能力强等优点,同时利用蚁群优化(ACO)算法来改善其存在的缺点,使变压器的故障诊断准确率和快速性都得到了提高,通过算例仿真验证了方法的高效性和正确性。
一、蚁群优化(ACO)算法基本原理
ACO算法是一种模拟蚂蚁群体在寻找食物时能找到距食物最短路径的仿生随机搜索算法。蚁群中每个蚂蚁个体间不直接通信,而是通过在其经过的路径上留下一种叫“信息素”的分泌物来引导其他个体的行为,某条路径上经过的蚂蚁越多,留下的信息素也越多,后来的蚂蚁被吸引到该条路径上的概率也就越大。这样,通过先行者的先验知识传递给后来者,将最终导致最优路径选择成功。
二、神经网络中ACO算法的模型
本文针对BP神经网络在训练中存在的对初值设置较敏感、收敛速度慢和容易陷入局部最优等缺点,利用ACO算法的全局优化和启发式寻优特征来寻找BP神经网络的最优权值,使得神经网络能够具有更加优越的智能寻优能力。
1.基本原理
神经网络的训练过程可以看作是一个找到一组最优的权值组合的优化问题。这组最优的权值组合可使得BP神经网络的输出结果与期望结果间的误差最小。
因为TSP问题是蚁群算法成功解决了的经典问题,所以此处采用神经网络权值的寻优问题与TSP问题同比对照来说明权值组合的寻优过程。
假设网络中有n个参数,包括所有权值和阈值。首先,按一定顺序对这些参数进行排列,记为h1,h2,…hn,对于参数hi(1≤i≤n),将其设置为N个随机非零值,形成集合Shi(1≤i≤n)。此时,让蚁群从蚁巢出发去寻找食物,也就是每只蚂蚁在集合Shi中选择一个权值,在全部集合中选择一组神经网络权值。这里的一个权值就相当于TSP问题中的一座城市(下文称其为“虚拟城市”)。当蚂蚁对所有虚拟城市完成了一次拜访,就是在全部集合中选择了一组权值,就算找到了食物。由各只蚂蚁找到的这组权值作为神经网络的计算用权值得到的结果与真实值相比较,得出计算误差,这个误差值就相当于TSP问题中路径的路程。路径的选择目标是要求得的路径路程为所有路径之中的最小值,神经网络权值的选择目标也就是要求得到的误差值是所有神经网络权值组合中使计算误差为最小的一组。用得到的误差值对蚂蚁在选择虚拟城市(权值)时的信息素进行反馈调整。将这个过程反复进行,直至全部蚂蚁收敛到同一组权值,或达到给定的迭代数上限时停止搜索。
2.算法基本步骤
对于一个有n个参数的神经网络训练问题,设定蚂蚁数量为m。基本步骤如下:
(1)初始化。
确定备选权值:将神经网络所有权值的取值区间 [Wmin,Wmax]均匀地划分为μ个子区域,将每个子区域边界上的点作为一个备选权值。
令时间t=0、循环次数NC=0,设每个点都具有相同的信息素量τ0和信息素挥发系数ρ,设置最大循环次数NCmax。
(2)启动所有m只蚂蚁,让每只蚂蚁从集合Shi(1≤i≤n)中选择一个元素,按下式计算蚂蚁选择其他虚拟城市(权值)的概率:
(1)
式中: pj(k)为蚂蚁k选择权值j的概率;τj(t)为t时刻权值j上的信息素浓度;ηj(t)为t时刻权值j的启发信息;α和β为常数。T(k)为第k只蚂蚁的禁忌表,用于存放蚂蚁k所选择候选权值的集合。蚂蚁k从概率最大的权值中随机选择一个权值i存入T(k)。当蚂蚁为所有的权值参数选择了值之后,就完成了一次遍历,它选择的所有值构成该神经网络的参数。
启发信息ηj(t)的计算公式。启发信息是ACO中一个与问题相关的用来引导蚂蚁搜索的量,它与信息素一起确定优化选择。基于启发信息是使蚂蚁在选择城市时,尽量选取当前候选集中路程短路径的基本思想,这里采用如下公式来计算启发信息:
(2)
式中:Aj(t)表示前面所有迭代中第k只蚂蚁选择备选集中权值j的次数和;Bj(t)表示前面所有迭代中所有蚂蚁选择备选集中权值j的次数和。
(3)重复步骤(2),直至蚂蚁全部完成一次遍历,即全部到达食物源为止。
(4)令t=t+n;NC=NC+1;利用各只蚂蚁选择的权值参数组计算出神经网络的计算输出结果,并以此获取误差E。记录误差较小的ω组权值和最优解Emin,比较Emin与给定的误差最小E0的大小,若Emin≤E0则转到步骤(8),否则进行步骤(5)。
(5)调节信息素。为防止信息素的聚集,要对先前留下的信息素随时间进行挥发处理。信息素挥发系数ρ表示信息素的持久性。经过时间n,蚂蚁从蚁巢到达食物源,各个路径上的信息素要按下式进行挥发调整:
(3)
(4)
式中:Δτjk(Shi)表示第k只蚂蚁在本次循环中留在集合Shi第j个元素上的信息素,可用下式计算:
(5)
式中:Q为常数,表示蚂蚁完成一次遍历后所释放的信息素总量,用于调节信息素的调整速度;ek是用第k只蚂蚁选出的一组权值作为神经网络计算权值的输出误差,定义为ek=|os-oq|。其中os和oq分别是神经网络的实际输出和期望输出。显然,误差越小相应的信息素的增量就越大。这即是蚁群算法正反馈机制的体现。
(6)重复步骤(2)到步骤(4),直至满足最大迭代次数。
(7)采用BP算法进一步训练神经网络。
(8)采用验证样本对训练好的神经网络进行泛化能力检验,若验证误差满足要求就退出程序;否则转到步骤(1)重新开始训练。
三、基于蚁群算法的故障诊断
由于人工神经网络具有强大的自适应功能、联想记忆和分布式存储功能和复杂的非线性映射能力等优点,已广泛应用于自动控制、组合优化、模式识别和图像处理等领域。BP网络是目前应用最广泛的神经网络模型之一,已在电力变压器的故障诊断中成功得到应用。但由于BP网络采用的是误差反向传播算法,是按误差函数梯度下降的方向进行收敛,所以就不可避免地出现了学习收敛速度慢和容易陷入局部最优点的问题。利用蚁群算法具有全局优化和启发式寻优的特点,将其运用到BP网络的权值和阈值组合寻优上,进行变压器的故障诊断,可大大提高诊断特性。
1.BP网络建立
由于油浸式电力变压器内部发生潜伏性绝缘故障后,反映故障信息的特征很多,因此,选取具有代表性的特征就成为故障识别的关键。大量相关文献显示,采用H2、CH4、C2H6、C2H4、C2H2这五种特征气体的体积含量作为变压器绝缘故障的诊断特征量效果良好。
(1)输入特征量的归一化处理。经过归一化处理的数据对于神经网络的训练和学习会更容易,所以这里对五种气体的体积含量在进入网络训练前进行计算体积含量相对比例的归一化处理,使其变换到0~1之间。设故障特征量为A,A的元素ai(i=1,2,…,5)分别表示H2、CH4、C2H6、C2H4、C2H2五种特征气体占气体总体积含量的相对比例,计算式如下:
(6)
式中:
(2)网络结构设计。理论分析证明,具有单隐含层的前馈网可以映射所有的连续函数。增加隐含层数目可以提高BP网络的非线性映射能力,但隐含层的数目超过了一定值,反而会使网络性能下降。本文采用含一个隐含层的三层BP网络。隐含层节点数使用经验公式:
(7)
式中:m为隐含层节点数,n为输入层节点数,l为输出节点数,α为1~10之间的整数。本实验中输入节点数为5,输出节点数为4,故隐含层节点数应在4~13之间。用MATLAB软件设计了隐含层数目可变的BP网络,通过对比确定最佳隐含层数目为7。
最终设计出的BP网络结构为三层:输入层节点数为5,分别对应五种特征气体占气体总体积含量的相对比例;隐含层节点数为7;输出层节点数为4,分别对应变压器绝缘故障的4种故障类型。
2.算例仿真比较
为了对该网络模型进行验证,收集290条经过剔除、筛选的变压器油中气体浓度数据,选取其中150条为训练样本,另外的140条为测试样本。这两类数据中都包含了正常状况和4类不同绝缘故障运行工况下的量。设置最大迭代次数NCmax为1000次,误差收敛因子为0.0001,隐含层和输出层的激励函数采用非线性Sigmoid函数;权值区间取[-2,2],将区间分成50份,即μ=50,蚂蚁群数目m=40,蚂蚁选择概率中启发信息的α=0.7、β=2.3。残余信息量ρ=0.6,信息素总量Q=100。
由表1实验结果可知,本文给出的基于ACO算法的三层BP网络与单纯的BP网络相比具有更快的收敛速度,能够达到更小的均方差值。因此,此算法收敛过程具有明显的优势。
由表2中的诊断结果表明,本文提出的基于ACO-BP神经网络算法在变压器绝缘故障诊断上具有比单纯的BP网络更高的诊断准确度。
四、结论
本文利用ACO算法在解决离散问题时优良的启发式学习和全局寻优能力,试图将其运用到BP神经网络的训练中来弥补BP神经网络学习、收敛慢的缺点,充分发挥了两种方法的优点。实验结果表明,将该方法运用到电力变压器绝缘故障诊断中,与单纯的BP神经网络法相比,其在提高收敛速度和降低误判率方面有更优良的特性。
参考文献:
[1]杨海马,刘瑾,等.BP神经网络在变压器故障诊断中的应用[J].变压器,2009,46(1):67-70.
[2]丁晓群,林钟云.神经网络应用于电力变压器故障诊断[J].电力系统自动化,1996,20(2):32-35.
[3]基于蚁群算法的最短路径问题的研究和应用[J].计算机工程与应用,2007,43(13):233-235.
篇5
(天津理工大学管理学院,天津 300384)
(School of Management,Tianjin University of Technology,Tianjin 300384,China)
摘要: 本文采用了一种将证据理论与BP神经网络相结合的信息融合算法,该方法集中了两种算法的优势使得计算结果更加准确,为众多商业银行带来切实的利益。
Abstract: This paper uses the information fusion algorithm by the combination of evidence theory and BP neural network, this approach focuses the advantages of the two algorithms to make the results more accurate and bring tangible benefits for many commercial banks.
关键词 : 物流金融;信用风险;BP网络;证据理论
Key words: logistic finance;credit risk;BP network;evidence theory
中图分类号:F252 文献标识码:A
文章编号:1006-4311(2015)06-0016-02
0 引言
中小企业作为中国经济快速发展的生力军,贷款难一直是制约其快速进步的最主要的因素。近年来物流业大发展也使得以运输、仓储为主的传统经营不再能满足其对利益的追逐。另外,物流金融作为商业银行的重要创新,成为其在激烈的同行业竞争中取胜的必然选择。综上,物流金融势必成为中小企业、物流企业、商业银行多方关注,谋求共赢的一种发展趋势。
最早的物流金融概念是由浙江大学的邹小芃和唐元琦于2004年提出。他们认为物流金融就是面向物流运营的全过程,应用各种金融产品,实施物流、资金流、信息流的有效整合,有效地组织和调剂供应链运作过程中的货币资金的运动[1]。作为一种委托关系,信用是其健康运作的基础,信用风险则成为商业银行所面临的首要风险。由于物流金融业务的特殊性,其表现出与传统信贷相比更为复杂的信用风险,传统意义的信用风险评价指标体系和评价模型将会失灵,建立一整套科学进步、基于物流金融融资模式的信用风险评价体系就显得尤为重要。
本文通过将信用风险的输入数据按物流金融业务特征进行重新开发分类,建立BP网络组。根据网络组的输出,得出对于各类信用度的基本概率分配函数,最后利用DS证据理论融合。将其应用于商业银行对物流金融的信用评估中,从而实现风险的最终决策,提高了风险度量的准确度,使得商业银行在新兴的物流金融业务下的操作风险有效监控得到提升。
1 商业银行物流金融信用风险体系指标
根据物流金融的运作特点,可将其风险来源归纳为来自融资企业、抵押物以及第三方物流企业三大方面。借鉴Altman,Haldeman和Narayanan(1977)提出的第二代“ZETA计分模型”中企业信用评价指标体系[3],将来自融资企业的风险细化为中小企业营运能力w1、盈利能力w2、偿债能力w3、及信用记录w4四大方面的十个具体指标,分别为w11持续经营、w12资产回报率、w13存货周转率、w21连续盈利、w22税后利润率、w23销售利润率、w31稳定存货、w32资产负债率、w33速冻比率、w41履约率。我国现阶段的物流金融业务主要集中于基于权利质押以及基于存货质押两种,因此质押物本身的质量也直接关系其风险大小。指标包括:所有权w51、市场性质w61、保险率w71三方面。作为重要参与方的物流企业为实现其对质押物的有效监管,企业规模w81及企业信誉w91也即成为影响物流金融风险的重要指标。
2 基于BP神经网络和证据理论的评价方法
2.1 BP 神经网络的基本原理
BP神经网络,是由Rumelhart 和 McCelland 等人(1986)提出的。其基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层通过隐含层传向输出层。若输出层的实际输出与期望输出不符,则转入误差的反向传播阶段,并将误差分摊给各层的所有单元。正向传播与误差反向传播周而复始,一直到网络输出的误差减少到可接受的程度,或预先设定的次数为止。
2.2 证据理论的基本原理
2.3 信用风险评估算法
为了保证神经网络的收敛和稳定性,本论文中将15个指标分为四组,建立4个神经网络NN1,NN2,NN3和NN4。神经网络的输出设计为(0.1,0.1,0.9)T、(0.1,0.9,0.1)T、(0.9,0.1,0.1)T,表示的信用风险级别分别为高风险、中度风险、低风险,记为A1,A2,A3。将输出归一化,得到向量(a′i1,a′i2,a′i3)T,记作V′i。令mi(Ai)=a′il,i∈{1,2,3,4},l∈{1,2,3},表示由NNi 得到的对信用风险级别Ai的基本信任度,即针对事件Ai的证据。之后,再将4个证据利用DS证据理论融合。就可以对信用风险进行评估,最初最终决策。
3 应用实例
本次数据采集共发出问卷200份,收回135份,有效问卷92份。将前91组数据分别训练神经网络。再将余下1个样本输入训练好的神经网络,归一化处理输出结果即得该证据对该命题的基本概率分配,而后利用DS证据理论将其融合得到最终优化结果。
由表2可知,中度风险类型O2的概率随着融合次数增多逐渐趋向于1,而其余两种风险类型则趋近于0,与表1中结果相比大大地提高了结果的准确性。
4 结论
本文所提出的基于神经网络和DS证据理论的物流金融信用风险评价模型,其优势表现为:此两种算法的结合,不仅克服了单一神经网络达到高精度需要迭代次数过多而造成实时性差的缺点,而且通过大量标准样本对神经网络的训练,使得DS证据理论对系统的决策更加准确。
参考文献:
[1]邹小芃,唐元琦.物流金融浅析[J].浙江金融,2004(5):80-83.
篇6
关键词:BP神经网络;Adaboost算法;遗传算法
中图分类号:F832.332文献标识码:A文章编号:1008-2670(2012)02-0012-08
收稿日期:2011-12-11
基金项目:国家社科基金资助项目“企业金融衍生业务风险测度及管控研究”(10BGJ054)。
作者简介:宿玉海(1964-),男,山东潍坊人,经济学博士,山东财经大学金融学院教授,研究方向:国际金融;彭雷(1986-),男,山东潍坊人,山东财经大学金融学院硕士研究生,研究方向:国际金融;郭胜川(1990-),男,山东安丘人,山东大学数学学院学生。
一、引言
商业银行的信用风险管理一直是人们关注的焦点,在引入工程方法进行信用风险的度量后,BP神经网络信用风险模型以其较强的逼近非线性函数的优势从众多方法中脱颖而出,其对于历史数据的模拟仿真和预测能力也显示出了独特的优势。但是,BP神经网络信用模型在处理较为复杂的财务数据时,对于数据指标在模型中获得的权值没有一个明确的标准,而是特别依赖于对于历史数据指标的选择,使得模型对于新样本的考察缺乏一个有效的动态权值变动,这就造成了模型在使用过程中的困难。
随着BP神经网络信用风险管理模型应用的增多,许多学者逐渐认识到BP神经网络信用风险模型在处理财务数据时存在的问题,采取一系列的措施对BP神经网络信用风险模型进行了改进,特别是对于权值设定的改进做了大量的工作。Back等[1]建议将遗传算法与神经网络结合起来协同工作,但没有实际讨论引入遗传算法后带来的实际效果;Piramuthu等[2]采用符号特征样本的技术处理输入数据取得了较为明显的效果,但是符号特征样本技术则存在较为主观的人为因素影响。国内学者在引进神经网络以后,也为神经网络模型的优化进行了卓有成效的努力。如许佳娜、西宝[3]采用层次分析法对神经网络模型的改进,以及郭英见、吴冲[4]采用DS证据理论将神经网络和SVM的输出结果进行的融合,都在一定程度上增强了神经网络模型的判别准确率,但他们在神经网络的权值修改上仍然没有找到很好的设定规则。
可以看出,许多学者在神经网络良好的泛化能力和模式识别能力上达成了共识,但对于神经网络中占有重要地位的连接权值的修正,没有给出一个较为恰当的标准。本文在探讨改进这一问题时,将遗传算法与Adaboost算法分别引入到BP神经网络信用风险模型中,通过两种模型对于相同的训练样本和预测样本的考察分析,比较两种方法的优劣,从而为BP神经网络信用风险模型的改进提供一定的参考。
本文结构安排如下:第一部分为引言;第二部分介绍BP神经网络信用风险模型并评价其缺陷;第三部分使用Adaboost算法以及遗传算法对BP神经网络信用风险模型进行算法寻优;第四部分则通过Matlab的模拟进行实证分析并比较实证结果;第五部分根据实证分析的结果得出相应的结论并探讨商业银行在应用过程中应注意的问题。
二、现有BP神经网络信用风险模型介绍
篇7
引言
分子蒸馏是一种新型的在高真空条件下进行的液-液分离技术,具有蒸馏温度低(低于物质沸点温度)真空度高,物料受热时间短,分离程度高等特点;且分离过程不可逆,没有沸腾鼓泡现象[1]。特别适用于分离高沸点、热敏性、高粘度和易被氧化的物质。但是分子蒸馏过程是一个极其复杂的过程,实际生产中除了发挥其优点外,还要要兼顾生产效率及产品质量,因此,分子蒸馏生产工程的工艺参数优化是一个多目标组合优化问题[2]。生产中根据生产目标选择相应的工艺指标,这就需要进行反复实验来获取目标下的最佳工艺参数值。由于分子蒸馏过程的复杂性,导致其工艺参数比较多,难以用数学方法来解决。而人工神经网络具有人体脑神经系统的信息处理机制,可以映射任何较为复杂的非线性关系,具有自学习能力。本文采用应用较为广泛的BP神经网络和遗传算法相结合,将其运用到分子蒸馏过程中的工业参数优化中,通过给定分子蒸馏的工艺参数及生产指标,经过大量样本的学习训练使网络达到允许的误差范围,映射工艺参数与生产指标之间的复杂非线性关系[3-4]。以该模型的预测性能输出作为目标函数,对工艺参数进一步优化,从而实现预定的工艺指标下的分子蒸馏工艺参数的优化。
1分子蒸馏参数测试实验
1.1分子蒸馏过程模型气体分子从液体表面溢出,由于其自由程的不同,与其他分子碰撞前的飞行距离各不相同。分子蒸馏技术就是利用不同种类分子逸出液面后平均自由程不同的性质实现分离的。Langmuir[5]根据理想气体的动力学理论提出了分子自由程的数学模型:式中,p为分子所处环境压强;λm为分子运动平均自由程;d为分子有效直径;T为分子所处环境温度;k为玻尔兹曼常数。由式(1)分子平均自由程公式可知,气体分子平均自由程与温度成正比,与压强反比。当加热板上的物料达到一定温度时,分子平均自由程大于板间距离的轻组分脱离加热板飞向冷凝板,在冷凝板上捕获,而平均自由程小于板间距的重组分到达不了冷凝板,从而实现了物质的分离。其分离过程如图1所示。
1.2实验设备本文在DCH-300三级分子蒸馏装置的基础上进行参数测试实验研究。实验装置的刮膜式短程蒸发器分子蒸馏过程为:液料放入原料罐被计量泵抽取。泵用稳定流量输送物料,经过管道被送入降膜器内的旋转分配器,在离心力的作用下,被甩向夹套加热室内壁,这时物料液体受重力的作用,沿着内壁向下流动,与此同时装在转轴上的刮板,把料液刮成簿膜,这样料液受加热而蒸发,由于在重力及离心力的作用下,不断地更新液膜。根据分子运动理论知道,液体混合物的分子受热后运动会加剧,当接受到足够的能量时,轻组分首先就会从液面溢出而成为气体分子,当气体分子逸出碰到内冷凝列管时,瞬即从气体变为液体并被柱下气相罐收集,重组分因达不到逸出温度,而仍然以液体状态流出蒸馏柱,由液相罐收集。图2为蒸馏装置的工艺原理图,其中,H1、H2、H3为三级的蒸发器,蒸发器面积分别为0.02m2,0.26m2,1.1m2。L1、L2、L3为三级的冷凝器,并且每一级的蒸发器都配有各自的刮膜电机,可以控制刮膜转速,提高蒸发速率,每一级的冷凝系统都与冷机相连,保证具有合适的冷凝温度。第二级包括一个水环真空泵、2个罗茨真空泵,1个增压真空泵构成的泵组,第三级包括旋片真空泵和增压泵,三级真空度越来越高,蒸馏的温度就可以逐级降低,达到负压低温蒸发的降低能耗的目的。
1.3实验方案及结果本实验采用了3次蒸馏,第一级蒸馏为预脱气、脱水处理阶段,即薄膜蒸发阶段,为确保后续蒸馏时具有足够高的真空,而除去物料的空气和溶剂等组份。物料进蒸馏器之前,经一级除气装置进行脱气处理,然后以一定的速率进入二级、三级分子蒸馏刮膜器中,在高真空和适宜的蒸馏温度下进行,分离出残余物和馏出物。实验安排采用在改变一个因素的单因素实验设计下,固定其他参数,对得到的实验结果进行比较,以便对这一因素的影响作出结论。实验水平如表1所示。本次实验共采用9组进行试验,通过改变蒸馏温度、进料速率和真空度等参数,对实验所得精油含量与得率的影响。实验结果如表2所示通过上述试验结果可以看出,并不是工艺参数(即蒸馏温度、进料速率和真空度的值)越大越好,且没有规律可循。也有采用正交试验进行工艺参数优化的方法,但对于分子蒸馏采取该种方法不可行,因为正交实验法是当真空度不变时,通过多次实验得到最佳温度,在此温度下再通过多次蒸馏实验摸索最佳真空度,而分子蒸馏的蒸发器的温度与真空度是具有耦合关系的量,当真空度改变,物质的沸点发生改变,即真空度变化,最佳蒸馏温度随之改变,因此为了提高生产效率及产品指标,进行高效、高质地分离提取,本文采用了基于BP网络和遗传算法的分子蒸馏工艺参数优化方法。
2BP神经网络及遗传算法优化模型的建立
2.1基本原理人工神经网络信息处理、鲁棒性、自学习及非映射能力较强,遗传算法具有并行、随机和自适应搜索等优点[6]。本文采用神经网络与遗传算法相结合的优化设计方法,充分利用二者优点。基本原理是:首先通过试验获得目标函数与工艺参数之间的离散试验数据关系。将试验数据作为网络的样本,对网络进行训练,当网络达到误差要求时,存储权值阈值,利用网络的记忆功能,建立起工艺参数与指标之间的非线性映射关系。再利用遗传算法对这一黑匣型的函数求解。上述优化问题的数学表达形式为:其中,xi表示神经网络的输入,yi表示神经网络的输出,f是评价函数。算法的实现过程为:运用试验获得的大量样本对网络进行训练,建立稳定的BP网络预测模型,对训练好的模型在一定范围内随机产生多组输入向量,通过BP预测出相应的输出量,再通过评价函数,计算个体适应度值,再利用遗传算子通过适应度值调整输入向量,产生具有更好适应性的新的种群。通过遗传算子的计算得到优化目标,相应输入即为目标的优化结果。
2.2BP神经网络预测模型BP神经网络是目前应用最广、最为成熟的1种采用误差反向传播的前馈型多层神经网络。包括输入层、中间层和输出层。选取1组训练样本提供给神经网络,经过隐含层激活函数后向输出层传播,隐含层的输出作为输出层的输入,最后获得网络的输入响应。接下来进行的误差的反向传播阶段,即按照网络输出与目标值之间的误差减小方向传播,从输出层到隐含层再到输入层,逐层修正各层之间的连接权值[7-8]。含有一个隐层的3层BP神经网络可以任意精度逼近任何有理函数。本文采用单隐含层的BP神经网络作为预测模型,其模型结构如图3所示。大量学习样本对BP神经网络进行训练后,分子蒸馏工艺参数与产品指标之间就会通过神经网络建立起1种能映射二者之间内在关系的连接关系,即获得产品指标预测的BP神经网络模型。本文在Matlab7.0神经网络工具箱的基础上[8-9],安排了18组试验样本,选择9组作为训练样本,其余9组作为测试样本,网络结构为3×6×2,输入层节点为3,分别为蒸馏温度,真空度及进料速率;隐层节点为6,输出层为2,分别为产品的含量和得率。数据归一化处理,训练时,不同的训练函数的训练速度和精度不同,这里采用梯度下降法,训练误差曲线如图4所示。经过42次的网络训练,网络的训练误差值就收敛到预定的目标误差0.001。训练后的神经网络用于产品指标预测,由预测结果与试验结果进行比较可知,训练后的神经网络具有较高的预测精度。
2.3优化模型的建立遗传算法是1种通过模拟自然进化过程,根据自然选择和遗传算法,进行随机、自适应搜索最优解的方法。遗传算法将自然界适者生存、劣者淘汰的生物进化原理引入到待优化参数问题中,将待优化变量进行编码,组成初始种群,将其按一定的适应度函数及遗传算子的操作,即选择、交叉和变异,选择适应度值较大的个体,形成高适应值的新群体,经过反复进行,最终找到适应度最大的个体[10],此时的个体即为优化结果。本文以遗传算法作为蒸馏工艺参数的优化方法。式中,W1和W2分别为工艺权值,T1,T2分别为含量与得率的目标值。可见目标函数越小预测值越接近目标值,当目标函数最小时对应的工艺参数值为最优值。遗传算法在进化搜索中基本不利用外部信息,仅以适应度函数为依据,个体的适应度越大,表明其适应能力越强[12-15]。建立的目标函数需符合适应度函数要求,本文采用的适应度函数就是目标函数的倒数。工艺参数优化流程如图5所示。经过遗传算子作用后的工艺参数作为神经网络的输入,通过训练好的神经网络模型输出目标函数值,再计算个体适应度函数值,再进行选择,交叉概率为0.8,变异概率为0.01等遗传操作获得新一代种群。通过反复进化计算,直至适应度函数值趋于稳定,此时的输入值为最优解,优化结果如图6所示。此时W1=W2=0.5,达到稳定后的适应度值为38.97。此时蒸馏温度为120℃,进料速率295r/min,进料速率60L/h。
篇8
【关键词】拦渣坝; BP神经网络;小波神经网络
0 前言
为了确保各种大型工程在施工和生产运行中会产生大量的弃土、弃石等废弃固体物质的安全放置,必须建立合适的拦渣坝。但是,随着拦渣坝运行时间的推移,拦渣坝运行的各种条件(如结构、基础、环境等)逐渐发生变化,使得坝体材料老化变质、坝体结构性能衰减甚至恶化等影响其安全运行,这样有可能严重的威胁着周边人民的生命和财产安全,这在在国内外均有着深刻教训。因此,必须对拦渣坝进行安全监测,建立正确有效的变形预测模型,科学地分析和预测拦渣坝的变形,及时发现存在的安全隐患,制定合理的防治措施,以确保拦渣坝的安全运行。
由于各种条件和环境的复杂性,使得拦渣坝变形的影响因素存在多样性,利用单一的理论方法来对工程变形进行预测,其变形的大小是难以准确预测的。将多种理论和方法进行有机结合,建立一种方法预测工程变形的大小是一种有效的途径。本文基于这样的思想,将小波分析与神经网络有机结合的小波神经网络应用于拦渣坝工程实例,对其变形分析研究。
1 小波神经网络
小波神经网络是将小波分析与人工神经网络有机结合的产物。其基本思想是用小波元代替神经元,用已定位的小波函数代替Sigmoid函数作为激活函数,然后通过仿射变换建立起小波变换与神经网络系数之间的连接,形成的新模型具有较强的网络逼近能力和容错能力。
目前,将小波分析与人工神经网络的结合主要有下面两种方式:松散性结合,即将小波分析与人工神经网络进行辅助式结合;紧致性结合,即将小波和神经网络直接融合的一种方式, 它主要是把小波元代替神经元,将相应的输入层到隐层的权值及隐层阈值分别由小波函数的尺度与平移参数所代替。其中紧致性结合方式也是当前研究小波神经网络模型最主要的结构形式。
小波神经网络是在小波分析的基础上提出的前馈型神经网络。小波神经网络激活函数是具有良好时频局域化性质的小波基函数。设小波神经网络有m(m=1,2,…,m)个输入节点、N(N=1,2,…,N)个输出层、n(n=1,2,…,n)个隐含层节点。并设xk为输入层的第k个输入样本,yi为输入层的第i个输出值,wij为连接输出层节点i和隐含层节点j的权值,wjk为连接隐含层节点j和输入层节点k的权值。约定wi0是第j个输出层节点阈值,wj0是第j个隐含层节点阈值,aj和bj分别为第j个隐含层节点的伸缩和平移因子,则小波神经网络模型可以表示为:
2 工程实例应用
国家某重点高速公路第B4合同段内某拦渣坝,其坝体为混凝土重力坝,长约122米,高约30米,拦渣坝上面(上游)是巨大的高速路高填方路基,这在国内是比较罕见的,而下游是梅西河。本拦渣坝主要是为了防止高速路隧道挖方土回填的高填方路基滑动和垮塌发生危险,从而对高速路的运行和梅溪河的通航造成不必要的影响。通过对拦渣坝体上S5号点上的沉降监测数据分析,建立变形预测的小波神经网络模型。将从2008年9月28日到2009年11月5日共11期数据作为学习样本对拦渣坝小波神经网络进行训练和学习。对S5号从2010年2月1日到2010年12月29日共5期数据进行预测。
通过对混凝土坝的研究和本拦渣坝功能作用的分析,可知影响本拦渣坝沉降变化的因素主要有:温度、土压力、时效。其中取4个温度因子,分别为C、C5、C15、C30(Ci为自观测日起前i天的平均气温);土压力因子1个(为S5号点附近土压力盒的每期平均计算压力);时效因子2个,分别为T、InT(T为观测日到起算日的累计天数除以100)。故输入层节点数为7个。而输出层节点数为1个,即为观测点S5每次垂直方向的累计沉降量。先用经验公式确定一个初始节点数,然后进行试验训练,当隐含层节点数为13时网络训练最为合适,所以采用7-13-1的结构形式的小波神经网络模型。通过对不同小波函数的试验训练,多次计算表明,当选用Morlet小波函数时网络的总体性能较好。利用Matlab7.1语言编制相应的网络模型程序进行计算。
为了充分的分析小波神经网络的训练效果,本文中也采用相同结构的BP神经网络对拦渣坝监测数据进行训练、预测。在本实例中,设两种模型的收敛误差都取0.0001。训练结果表明,两种模型的收敛速度都比较快,BP神经网络训练了25次就低于误差限差;而小波神经网络只训练了5次就低于误差限差0.0001,总体上小波神经网络比BP网络精度高。小波神经网络训练与BP神经网络训练拟合残差系统比较结果如表1。
从预测结果对比分析表可以看出,小波神经网络和BP神经网络对拦渣坝变形预测的预测残差绝对值在一个数量级上,但是WNN网络的预测残差值总体上明显小于BP神经网络。小波神经网络的预测值与BP神经网络的预测值相比较更加接近于实际值,WNN预测结果好于BP神经网络预测结果,其预测优越性是显而易见的。
3 小结
本文通过对小波神经网络模型的研究,建立了拦渣坝变形预测的小波神经网络模型。通过对WNN网络模型和BP神经网络模型训练拟合结果与预测结果的对比分析,可以看出小波神经网络模型在拦渣坝变形预测中的收敛性和精度比BP神经网络好,对拦渣坝的变形预测研究有一定的参考应用价值。
【参考文献】
篇9
关键词:模式识别;BP神经网络;手写体字符识别;图像分析
引言
在当前MATLAB神经网络字符识别研究中,一般都是基于单个字符库样本进行学习机训练而且很少进行手写字符的识别,例如应用最多的车牌字符识别,其送人的训练样本一般很有限,因此学习样本有限,很难适用于具有广泛特性的手写字符识别,因此,对于多种不同手写样本的训练和识别有一定的研究意义。具体实现功能描述如下,首先利用不同笔迹书写的字母训练BP神经网络学习机,然后用手写的样本测试BP学习机的识别正确率,要求输入各个字母的训练样本库和测试用的手写字母库,程序给出最终的识别结果和识别正确率。
1基于Matlab的手写字符识别系统
基于Matlab的手写字符识别系统由以下模块构成,包括图像预处理、字符有效区域检测、图像分割、样本库训练和测试字符识别,如图1。
其中,原始图像:由数码相机或其它扫描装置拍摄到的图像;
图像预处理:对动态采集到的图像进行滤波、边界增强等处理以克服图像干扰;
字符分割、归一化:利用梯度检测的字符定位、分割方法得到单个的字符,并将所有字符归一化为固定大小;
样本数据库:利用前期采集的每个字母80个的手写字符为第5步的字符识别建立字符模板数据库;
BP学习机:根据样本数量和训练分类结果构建BP学习机:
字符识别:基于人工神经网络的OCR算法,通过特征对比或训练识别出相关的字符,得到最后的英文字符识别结果。
2BP神经网络的字母识别
2.1图像预处理
图像在形成、传输或变换过程中,受多种因素的影响,如:光学系统失真、系统噪声、曝光不足或过量、相对运动等,往往会与原始景物之间或图像与原始图像之间产生了某种差异,这种差异称为降质或退化。因此在图像处理之前必须进行预处理,包括去除噪音、边界增强、增加亮度等等。
以字母q的样本库图2为例,实验素材是数码相机拍摄的手写字母q的各种不同形式,但由于手写体比较自由的特点,因此有了许多形态不尽相同的字母q的类,通过观察发现,不同类型字母q由于手写速度不同造成部分字母出现部分线条断裂,另外由于字母灰度图存在部分干扰,为了消除以上缺陷,先将图像进行灰度二值化并滤除一些孤立背景噪声,其次再对图像做膨胀和腐蚀运算使得图像中断裂的线条重连使用的样本库均类似图3。
经过预处理的图像含有很少的噪声,并且图像特征得到增强,后面将会对预处理过的图像进行分割操作。
2.2字母定位
经过预处理,可以更加清晰的发现字母图像基本是按照水平和垂直的行和列分布,因此先将图像分隔成包含每8个字母的分行图像。按照以下方法来进行行分割。通过和列像素点统计相类似的办法可以得到行的像素点统计分布。统计完成绘制的像素点统计分布图如图4其中图像横坐标是图像的行列的绝对像素位置。
根据所得的结果很容易确定每行字母的其实行(列)和终止行(列),通过检测梯度刚开始上升的位置则为行开始位置,梯度下降末的位置则为图像的行(列)终止的位置。通过该算法进行行(列)位置的确定。
2.3字母分割
根据上面提供的算法已分别将上升沿、下降沿位置信息存储到了hang up和hang down数组中,下面将整个图像分隔成单行,算法思想是新建图像空间,分别搜素图像自像素行hang up(1)到hang-down(1)位置的所有行,将其复制到新的图像空间。这样便完成了图像的行分割,如图5。同理我们可采取同样的思想将分割后的行图像进行统计,然后记录上升沿和下降沿的位置信息,再扫描上升沿到下降沿的所有列并存储到新的图像空间,这样就完成了图像的列分割,从而完成字母单独分割。同样原理实现列分割的效果如图6。
2.4字母图像归一化
考虑到为避免后期进行目标识别时由于大小而引起的误差,因此应将单个字符图像进行归一化,此外为方便起见,前期分配临时存储空间时,采用了固定的图像空间大小,因此由于分配的图像的存储空间一般大于字母,所以会造成空间的浪费,所以我们还要对图像进行去空白区域操作,思想是由顶行逐行向底行搜索,统计当前行的黑色像素点,将少于一定数量黑丝点的像素所在的行删除。同样,列也逐列搜索,去掉小于一定列数的图像列。归一化图像见图7。
Y方向的紧缩策略和x方向相同,前面做膨胀和腐蚀的原因是进一步连接字母图像中断裂的像素点。
2.5建立字符模版图像数据库
根据我们获得的图像建立了9个字母的图像数据库空间,每个字母的模版空间有80个,分别是a,d,m,n,p,q,r,u,w,统一将所有的图像进行归一化整理,共得到720个库模版,分为9个类。如图7为其中的一组库,这样的库总共有80个。操作过程中不一定需要存储所得的模版库,我存储的目的是使文档更加全面,事实上也可只用一组模板库进行手写字母识别,但正确率较低,约为60%。
得到模版库后由于在前面处理中已进行归一化,且因为之后的字符识别使用神经网络算法进行字符识别,所以再将上面归一化后的模板图像的样本转化为一个模版对应一个列向量。
其次为了使主程序Recognize中程序简洁明了,设计了某个字母图像对应的80个独立的样本的产生函数,给出的结果是产生行为2500,列为80的向量P。
2.6字符识别
字符识别目前较常用的方法是基于模版匹配的OCR算法以及基于人工神经网络的OCR算法。基于模板匹配的OCR的基本过程是:首先对待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。用人工神经网络进行字符识别主要有两种方法:一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。识别效果与字符特征的提取有关,而字符特征提取往往比较耗时。因此,字符特征的提取就成为研究的关键。另一种方法则充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。本设计则是基于BP人工神经网络的字符识别,不提取特征直接送入BP神经网络学习机进行分类训练。
BP网络是前向网络的核心部分,它是一种单向传播的具有三层或三层以上的前向神经网络,包括输入层、隐层和输出层,上下层之间实现全连接,而每层神经元之间无连接。一个三层的BP网络理论上可逼近任意的非线性映射,因此在实际应用中,一般采用三层的BP网络就可以满足需要。如图8所示的就是一个三层的BP网络结构图。
BP网络由正向传播和反向传播组成,在正向传播阶段,每一层神经元的状态只影响下一层神经元的状态,若在输出层得不到期望的输出值,则进行误差的反向传播阶段,BP网络学习规则又称8学习规则。
BP网络主要的训练函数包括BFGS准牛顿BP算法函数trainbfg、梯度下降BP算法函数traingd、梯度下降动量BP算法函数traingdm、成比例的变梯度算法SCG trainscg等等。一般的对于上百个权值的函数逼近,LM算法收敛速度最快,并且在许多情况下LM算法可以获得比其他任何一种算法更小的均方误差,但当网络的权值数量增加时trainlm优点将不再明显,其次trainlm算法对于模式识别问题处理功能较弱,而RPROPA的训练函数trainrp应用于模式识别,其速度最快。但对于函数逼近问题却不是最好。而SCG算法在网络规模较大的场合其性能都很好,该算法基本原理利用LM算法和变梯度算法相结合,SCG算法应用于函数逼近问题时几乎和LM算法一样快,而在应用于模式识别几乎和RPROPA一样快,而且其性能不会随目标误差减小而下降那么快。
程序流程图如图9。
3手写字母识别结果
测试图像如图10,最终得到结果如图11,可以发现神经网络在经过训练后识别结果已经达到了92.06%,可以说实验到此已经有比较完美的结果了,毕竟实验测试项目有限,但为了测试不同函数对于神经网络识别的正确率的影响,故有进行了不同训练函数的测试。
在训练参数里net-newff(minmax(P),{'logsig','logsig','logsig'},'trainrp')将训练函数trainrp替换为SCG算法的训练函数trainscg,效果有一定提升,识别表现出了极好的识别性,总体识别正确率达到95%以上,63个测试字母仅未识别3个,三个分别是第3行第6列,第8行第1列,第8行第2列,至于未识别的原因,目前仍不清楚。SCG算法的识别结果如图12。
观察发现,SCG训练函数识别正确率对于原识别正确率有3%左右的提升,可以说实验已经取得了较大的成功。这表面SCG算法在网络规模较大的场合性能较好,该算法基本原理是将LM算法和变梯度算法相结合,SCG算法应用于函数逼近问题时几乎和LM算法一样快,而在应用于模式识别几乎和RPROPA一样快,而且其性能不会随目标误差减小而下降那么快。
4总结
在手写体字符识别的整个过程中,查找了很多资料,综合了各方面的信息。字符识别实现的每一步都有许多的方法,各种方法都有其优劣,但是对于具体的图像处理,并不是每一种理论在实践中都可以实现,即使实现了也很难说哪一种方法最合适,还得在具体的实验中比较选择。测试结果表明,本设计有以下优点:
(1)实现了单类多个样本的整体训练,有一定实用价值。
篇10
Abstract: Neural network is widely applied for character recognition. Through the analysis of the problems, this paper recognizes character by the application of improved BP neural network, so as to improve recognition rate. This method has high recognition rate, fast speed, strong practicability, and can be applied to various high noise environment.
关键词: 神经网络;图像预处理;特征提取;字符识别
Key words: neural network;image preprocessing;feature extraction;character recognition
中图分类号:TP301.6 文献标识码:A 文章编号:1006-4311(2014)10-0206-02
0 引言
字符识别是指采用扫描仪、数码相机等输入设备,把英文字母、数字、条形码等特殊字符的图形文件输入计算机,由识别软件对图片信息上的字符信息进行识别并变换成可编辑文档的识别技术。主要有光学字符识别(Optical
Character Recognition,OCR)、图像字符识别(Image Character Recognition,ICR)和智能字符识别(Intelligent Character Recognition,ICR),实际上这三种自动识别技术的基本原理大致相同。
1 常用字符识别方法
字符识别方法基本上都是为了区分结构识别、统计识别以及两者相结合的三大类方法,这三大类方法都包含具体的识别方法。
1.1 结构识别 结构识别是早期字符识别的研究的主要方法,我们也可以称之为句法结构识别。其思想是提取含有一定规律的结构信息,作为识别的依据。识别过程类似一个逻辑推理过程。结构识别的优点在于对字符变化的适应性强,区分相似字符能力强。但是在实际获取字符图像的过程中,由于存在着很多扭曲、倾斜等因素,就导致不能够准确地提取结构特征,后面的识别过程就成了无源之水。此外,结构识别的算法描述也较为复杂,匹配过程的复杂度也很高,因此,我们原有的句法识别就受到新的挑战。
1.2 统计识别 统计决策论的发展相对较早而且成熟,是为了提取待识别字符的一组统计特征,然后按照一定的准则进行决策函数的分类判决的。而统计识别是将字符点阵看作是一个能够经过大量统计数据得到的整体,是以后所用的特征都需要经过的。统计特征主要是以抗干扰能力强为主要特点,以实现匹配与分类的算法简单,且容易实现的。不足之处在于细分能力较弱,区分相似字的能力差一些。
1.3 结构识别与统计识别相结合 上述方法各有优缺点,而随着研究的深入,这些方法逐渐得到融合。网格化特征就是结合的产物。特征的统计以网格为单位,即使个别点的统计有误差也不会造成大的影响,增强了特征的抗干扰性。这种方法正得到日益广泛的应用。
字符的结构特征直接反映了字符的特有属性,而用字符的统计特征进行字符识别则是利用了计算机软件善于处理数字的特点。虽然近几年流行的神经网络方法主要采用的是局部特征,但其分类机理也与传统的统计识别方法相类似,优点是灵活性强。
2 字符识别流程
字符识别技术在当今社会的许多领域都有着广泛的商业应用前景。常见应用有条码识别、车牌识别、盲人的辅助阅读设备和邮包自动分检等。本文以车牌识别为例说明字符识别的应用以及识别流程。车牌识别系统的工作流程如图1所示。
经过字符分割后,得到可以进行字符识别的图像。本文采用神经网络方法进行字符识别,识别的具体过程如图2所示。
3 基于改进型BP神经网络的字符识别算法
3.1 BP神经网络简介 神经网络最早的研究是20世纪40年代,由心理学家Mcculloch和数学家Pitts合作提出的,由此拉开了神经网络研究的序幕。人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。人工神经网络可以应用于字符识别、人脸识别等领域。
随着神经网络的威力逐渐显现以及付诸应用的现实性,大量的学者对此进行了深入研究,出现了多种神经网络,如径向基神经网络和Hopfield网络等。1986年科学家Rumelhart和McCelland提出了BP(Back Propagation)神经网络,是一种按误差逆传播算法训练的多层前馈网络,是目前在字符识别中应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络的结构如图3所示。从左至右分别是输入层、隐含层和输出层。
从图3可以看出,某一层的输出就是下一层的输入,即:am+1=fm+1(Wm+1am+bm+1),m=0,1,…M-1……
这里,M为神经网络的层数。第一层的神经元的输入为a0=p,最后一层神经元的输出是a=aM,即为整个神经网络的输出。BP神经网络虽然在字符识别领域有着重要的应用价值,但其存在如下问题:①进行字符识别时存在局部极小值问题;②算法通常需要迭代几千步甚至更多,收敛速度慢;③隐含层和隐含层节点的数量难以确定。要解决上述问题,就需对BP神经网络算法进行改进。
3.2 基于改进型BP神经网络的字符识别
3.2.1 图像预处理 在字符图像采集、输入的过程中由于受到多种噪声的干扰,会使图像质量下降,为字符识别工作带来困难,因此需要对初始图像进行必要的预处理。图像预处理的具体步骤如下:①选取合适的阈值进行图像二值化;②灰度变换增强对比度,改善视觉效果;③选取合适的方法去除噪声,常用的有中值滤波、均值滤波、高通滤波等方法;④图像分割,即将图像中的字符独立的分割出来。
3.2.2 字符特征值的提取 如果直接采用分割后的字符进行对比,那么需要对比的信息量很大,程序运行的时间也会大大增加。所以需要对分割后的字符进行特征提取,本文使用了类似九宫格的方法进行特征提取,即在字符图像的水平方向上将图像均匀分成三部分,在每一部分用一条水平方向的扫描线从左至右穿过字符,进行查找;垂直方向上原理相同,扫描线从上到下穿过字符,进行查找。取这六条线上的特征作为字符图像的特征,这样就得到了每个字符的六个特征值。
3.2.3 改进型BP神经网络 针对BP神经网络的局限性,为了避免落入局部极小值点,提高网络训练的精度和速度,对其算法进行了改进,常用的方法有:①优化初始权重。由于BP网络的误差曲面存在多个局部最小点和算法采用误差梯度下降的方法调整网络权重,因此导致了网络的训练结果极容易落入局部极小点。所以,网络的初始权重对网络的最终训练结果影响非常大,它是影响网络最终能否达到需求精度的重要因素之一。②调整自适应学习率。学习率η也称步长,在标准的算法中为常数。BP算法的收敛特性和收敛速度很大程度上取决于学习率,对于不同的问题,其取值范围也会不同。η取值过大可以加快学习速度,但会导致学习过程不收敛;η取值过小,则迭代次数明显增加,导致学习速度过慢。为了加速收敛的过程,可以自适应改变学习速率。③附加动量法。动量法是指在反向传播的基础上,在每个权值调整值上加上一项正比于前次权值变化的值,并根据反向传播法来产生新的权值变化。
本文为了简单起见,采用附加动量法只对数字和英文字母进行字符识别,利用梯度下降法,使权值沿函数的负梯度方向改变。提高了学习速度,增加了算法的可靠性。
带有附加动量项的权值调节公式为:
Wij(k+1)=Wij(k)+η[(1-α)D(k)+αD(k-1)]
其中,α是附加的动量项,取值范围为0
3.2.4 设计改进型BP神经网络进行字符识别 本系统采用了两个BP网络来进行数字和字母的识别。BP神经网络的建立主要是三个层的神经元数目的确定。①输入层节点数。此节点个数即为图像预处理后所输出的特征的维数。本系统输入层节点数为24×48。②隐含层节点数。确定隐含层节点数的基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐含层节点数。本系统的两个神经网络,可以根据输出层神经元的多少来确定其个数,即输出层神经元越多,其隐含层神经元个数也越多。③输出层节点数。用于识别数字的BP网络,由于只有10个数字,所以采用了8421码进行编码,输出层的神经元数目为4。而识别26个字母的BP网络,其输出层的神经元数目为5。待识别的字符图像和训练好网络后识别的结果分别如图4和图5所示。
4 结束语
在字符识别的过程中,每一步都会有不同程度的误差,本文神经网络经验证后识别率可达95.1%,平均识别时间为0.6s。影响识别成功率的主要因素是训练样本的数量和训练次数,要保证一定数量以上的训练样本和训练次数,以保证识别率。另外,神经网络的层数和各层神经元的个数,对神经网络算法的运行速度和识别率也有着直接的影响,其数量越多,识别率越高,但也制约着识别速度,因此,如何处理好两者关系很重要。
参考文献:
[1]关学忠,刘勇智.基于数字图像处理的车牌定位及字符分割方法[J].装备制造,2010(01).
[2]武桐.基于图像匹配的汉字识别系统研究与实现[D].上海:上海交通大学,2010.