人工神经网络范文

时间:2023-04-03 08:11:51

导语:如何才能写好一篇人工神经网络,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

人工神经网络

篇1

人工神经网络是近年来迅猛发展的前沿课题,它对突破现有科学技术的瓶颈起到重大的作用。本文剖析了人工神经网络的特征、模型结构以及未来的发展趋势。

【关键词】人工神经网络 神经元 矩阵

1 人工神经网络概述

人工神经网络(ANN)是一种用计算机网络系统模拟生物神经网络的智能神经系统,它是在现代神经生物学研究成果的基础上发展起来的,模拟人脑信息处理机制的一种网络系统,它不但具有处理数值数据的计算能力,而且还具有处理知识的学习、联想和记忆能力。

人工神经网络模拟了大脑神经元的组织方式,反映了人脑的一些基本功能,为研究人工智能开辟了新的途径。它具有以下基本特征:

1.1 并行分布性

因为人工神经网络中的神经元排列并不是杂乱无章的,往往是以一种有规律的序列排列,这种结构非常适合并行计算。同时如果将每一个神经元看作是一个基本的处理单元,则整个系统可以是一个分布式处理系统,使得计算快速。

1.2 可学习性和自适应性

一个相对很小的人工神经网络可存储大量的专家知识,并能根据学习算法,或利用指导系统模拟现实环境(称为有教师学习),或对输入进行自适应学习(称为无教师学习),可以处理不确定或不知道的事情,不断主动学习,不断完善知识的存储。

(3)鲁棒性和容错性

由于采用大量的神经元及其相互连接,具有联想映射与联想记忆能力,容错性保证网络将不完整的、畸变的输入样本恢复成完整的原型,鲁棒性使得网络中的神经元或突触遭到破坏时网络仍然具有学习和记忆能力,不会对整体系统带来严重的影响。

1.3 泛化能力

人工神经网络是大规模的非线性系统,提供了系统协同和自组织的潜力,它能充分逼近任意复杂的非线性关系。如果输入发生较小变化,则输出能够保持相当小的差距。

1.4 信息综合能力

任何知识规则都可以通过对范例的学习存储于同一个神经网络的各连接权值中,能同时处理定量和定性的信息,适用于处理复杂非线性和不确定对象。

2 人工神经网络模型

神经网络是在对人脑思维方式研究的基础上,将其抽象模拟反映人脑基本功能的一种并行处理连接网络。神经元是神经网络的基本处理单元。

在神经网络的发展过程中,从不同角度对神经网络进行了不同层次的描述和模拟,提出了各种各样的神经网络模型,其中最具有代表性的神经网络模型有:感知器、线性神经网络、BP网络、自组织网络、径向基函数网络、反馈神经网络等等。

3 神经元矩阵

神经元矩阵是神经网络模型的一种新构想,是专门为神经网络打造的一个矩阵,它符合神经元的一切特征。

神经元矩阵采用矩阵形式,它可为n维向量组成。引入向量触头和信使粒的概念,向量触头可生长,即长度可变,方向可变,信使粒可“游荡”在矩阵中,建立各种联系。如图1即是神经元矩阵模型

(1)容器可产生一种无形的约束力,使系统得以形成,容器不是全封闭的,从而保证系统与外界的沟通和交互;各向量间可用相互作用的力来联系,而各个信使粒则受控于容器、中空向量以及其它的信使粒。各神经元之间自主交互,神经元矩阵是一种多层次的管理,即一层管理一层。系统具有明显的层级制和分块制,每层每块均独立且协同工作,即每层每块均含组织和自组织因素。

(2)向量触头是中空的,信使粒可以通过向量或存储于向量中,所以又称为中空向量。向量存储了信使粒后,可以吸引更多的信使粒在附近,或使邻近向量转向、伸长,进而形成相对稳定的信息通路。

(3)当两条或更多的信息通路汇集时,可能伴随着通路的增强、合并,以及信使粒的聚集、交换,这是神经元矩阵运算的一种主要形式。通路的形成过程,也就是是神经元矩阵分块、分层、形成联接的过程,也为矩阵系统宏观管理、层级控制的实现奠定了基础。

神经元矩阵亦是一种具有生物网络特征的数学模型,综合了数学上矩阵和向量等重要概念,是一种立体的矩阵结构。尤其是将矩阵的分块特性和向量的指向特征结合起来,更好的体现了神经网络的整体性和单元独立性,系统的组织和自组织特征也更为凸显。信使粒以“点”的数学概念,增强了系统的信息特征,尤其是增强了矩阵的存储和运算功能。

4 人工神经网络的发展趋势

人工神经网络是边缘叉科学,它涉及计算机、人工智能、自动化、生理学等多个学科领域,研究它的发展具有非常重要意义。针对神经网络的社会需求以及存在的问题,今后神经网络的研究趋势主要侧重以下几个方面。

4.1 增强对智能和机器关系问题的认识

人脑是一个结构异常复杂的信息系统,我们所知道的唯一智能系统,随着信息论、控制论、计算机科学、生命科学的发展,人们越来越惊异于大脑的奇妙。对人脑智能化实现的研究,是神经网络研究今后的需要增强的地发展方向。

4.2 发展神经计算和进化计算的理论及应用

利用神经科学理论的研究成果,用数理方法探索智能水平更高的人工神经网络模型,深入研究网络的算法和性能,使离散符号计算、神经计算和进化计算相互促进,开发新的网络数理理论。

4.3 扩大神经元芯片和神经网络结构的作用

神经网络结构体现了结构和算法的统一,是硬件和软件的混合体,神经元矩阵即是如此。人工神经网络既可以用传统计算机来模拟,也可以用集成电路芯片组成神经计算机,甚至还可以生物芯片方式实现,因此研制电子神经网络计算机潜力巨大。如何让传统的计算机、人工智能技术和神经网络计算机相融合也是前沿课题,具有十分诱人的前景。

4.4 促进信息科学和生命科学的相互融合

信息科学与生命科学的相互交叉、相互促进、相互渗透是现代科学的一个显著特点。神经网络与各种智能处理方法有机结合具有很大的发展前景,如与专家系统、模糊逻辑、遗传算法、小波分析等相结合,取长补短,可以获得更好的应用效果。

参考文献

[1]钟珞.饶文碧.邹承明著.人工神经网络及其融合应用技术.科学出版社.

篇2

随着计算机网络、信息技术、自动化技术的进步,极大的改变了我们的生活。人工神经网络技术是一种全新的控制技术,通过互联网进行动态模拟,从而建立一种新的控制互联网的系统。经过十几年的发展,人工神经网络技术研究取得了巨大的进步,已经广泛应用在社会各个领域,使现代计算机中的难题得到了解决。本文主要从人工神经网络技术的概念出发,探讨了它在现代社会领域的具体应用。

【关键词】人工神经网络 信息技术 发展趋势

人工神经网络技术在处理实际问题主要包括两个过程,一个是学习训练过程,另外一个是记忆联想过程。近年来随着人工网络技术的发展,人工神经网络技术在信号处理、图像处理、智能识别等领域已经取得了巨大的改变,为人们研究各类科学问题提供了一种新的方法和手段,使人们在交通运输、人工智能、军事、信息领域的工作更加便捷,近年来随着AI的l展,人工神经网络技术得到了快速的发展阶段。

1 人工神经网络技术

人工神经网络技术也称ANN,是随着上个世纪八十年代人工智能发展兴起的一个研究热点,它的主要工作原理对人脑神经网络进行抽象处理,并仿造人脑神经网络建立简单的模型,按照不同的连接方式组成一个完整的网络,因此学术界也直接将它成为神经网络。神经网络其实就是一种运算模型,它是通过大量的节点――神经元连接起来的,其中不同的节点所代表的输出函数也不同,也就是所谓的激励函数;当有两个节点连接起来时称之为通过该连接信号的加权值,也称为权重,这就相当人脑神经网络记忆。人工神经网络技术是采用并行分布式系统,这种工作机理与传统的信息处理技术和人工智能技术完全不同,是一种全新的技术,它克服了传统基于逻辑符号的人工智能处理非结构信息化和直觉方面的缺陷,具有实时学习、自适应性和自组织性等特点。

2 人工神经网络技术应用分析

随着人工神经网络技术的发展,它在模式识别、知识工程、信号处理、专家系统、机器人控制等方面的应用较广。

2.1 生物信号的检测分析

目前大部分医学检测设备都是通过连续波形得到相关数据,从而根据所得数据对病情进行诊断。人工神经网络技术就是应用了这样的方式将多个神经元组合起来构成,解决了生物医学信号检测方面的难题,其适应性和独立性强,分布贮藏功能多。在生物医学领域该技术主要应用于对心电信号、听觉诱发电位信号、医学图像、肌电荷胃肠等信号的处理、识别和分析。

2.2 医学专家系统

传统的医院专家系统是直接将专家的经验、学历、临床诊断方面取得的成绩等存储在计算机中,构建独立的医学知识库,通过逻辑推理进行诊断的一种方式。进入到二十一世纪,医院需要存储的医学知识越来越多,每天产生新的病况和知识,过去的一些专家系统显然已经无法适应医院的发展需求,因此医院的效率很低。而人工神经网络技术的出现为医院专家系统的构建提出了新的发展方向,通过人工神经网络技术,系统能够自主学习、自己组织、自行推理。因此在医学专家系统中该网络技术应用面较广。麻醉医学、重症医学中生理变量分析和评估较多,目前临床上一些还没有确切证据或者尚未发现的关系与现象,通过人工神经网络便能有效地解决。

2.3 市场价格预测

在经济活动中,传统统计方法受到一些因素的制约,无法对价格变动做出准确的预测,因此难免在预测的时候出现失误的现象。人工神经网络技术能够处理那些不完整的、规律不明显、模糊不确定的数据,并作出有效地预测,因此人工神经网络技术具有传统统计方法无法比拟的优势。例如人工神经网络技术可以通过分析居民人均收入、贷款利率和城市化发展水平,从而组建一个完整的预测模型,准确预测出商品的价格变动情况。

2.4 风险评价

在从事某一项特定的活动时,由于社会上一些不确定因素,可能造成当事人经济上或者其他方面的损失。因此在进行某一项活动时,对活动进行有效的预测和评估,避免风险。人工神经网络技术可以根据风险的实际来源,构筑一套信用风险模型结构和风险评估系数,从而提出有效地解决方案。通过信用风险模型分析弥补主观预测方面的不足,从而达到避免风险的目的。

3 人工神经网络技术未来发展

人工神经网络克服了传统人工智能对语言识别、模式、非结构化信息处理的缺陷,因此在模式识别、神经专家系统、智能控制、信息处理和天气预测等领域广泛应用。随着科学技术的进步,AI的快速发展,AI与遗传算法、模糊系统等方面结合,形成了计算智能,很多企业和国家开始大规模研发AI,人工神经网络正在模拟人类认知的方向发展,目前市场已经有很多不少人工智能产品面世。

4 结语

通过上述研究分析,人工神经网络技术已经取得了相应的发展,但还存在很多不足:应用范围狭窄、预测精度低、通用模型缺乏创新等,因此需要我们在此基础上不断寻找新的突破点,加强对生物神经元系统的研究和探索,进一步挖掘其潜在的价值,将人工神经网络技术应用在更多领域中,为社会创造更大的财富。

参考文献

[1]周文婷,孟琪.运动员赛前心理调控的新策略――基于人工神经网络技术的比赛场地声景预测(综述)[J].哈尔滨体育学院学报,2015,33(03):15-21.

[2]张红兰.人工神经网络技术的应用现状分析[J].中国新通信,2014(02):76-76.

[3]张广军.人工神经网络技术在光电检测中的应用[J].北京航空航天大学学报,2001,27(05):564-568.

篇3

【关键词】人工神经网络;故障诊断;模式识别;Matlab软件

一、人工神经网络综述

BP神经网络是目前应用最为广泛和成功的神经网络之一,它是由一个输入层,一个或多个隐层以及一个输出层组成,上下层之间实现全连接,而每层神经元之间没有连接。网络的学习过程包括信号正向传播和误差反向传播。在正向传播进程中,输入信息从输入层经隐层加权处理传向输出层,经功能函数运算后得到的输出值与期望值进行比较,若有误差,则误差反向传播,沿原先的连接通道返回,通过逐层修改各层的权重系数,减小误差。随着这种误差逆向传播修正的不断进行,网络对输入模式响应的正确率也不断上升。

二、人工神经网络的识别、诊断过程

滚动轴承在设备中是比较典型的,本文以滚动轴承的故障识别、诊断为例。进行模式识别的大体步骤为:首先对经过零均值化后的振动信号数据进行时域、频域分析,将筛选后的有效时域、频域特征值作为人工神经网络输入层的输入,经Matlab软件进行神经网络的训练,最后可得出一个可以识别轴承工作状态的神经网络,进而可以对滚动轴承进行模式识别。可见采用振动信号检测法对机器设备进行故障诊断的过程包含信号采集、特征提取、状态识别、故障分析和决策干预等五个基本环节,在滚动轴承故障诊断中,振动信号的采集是关键,保证信号采集的准确性、合理性和实时性是正确实现故障诊断的前提。(1)信号采集。每台机器设备都有自身的固有频率,若设备发生故障,其频率变化,其振动信号也会发生变化。因此,振动信号可以作为故障诊断的一个重要标准。在信号采集中主要用到加速度传感器、电荷放大器、带滤波的A/D转换器。先通过压电式加速度传感器对振动信号进行拾取,然后经过电荷放大器及通过带滤波的A/D转换电路得到微机可以识别的数字信号,从而实现振动信号的采集。(2)特征值提取。为了便于观察,要把采样点的值分布在0附近,故先对采集的采样点值进行零均值化。用matlab对零均值化后的的采样点进行时域、频域分析。时域分析是计算振动信号的在时域范围内的特征参数,包括:平均值、方差、均方根、峰值峰值因子、峭度系数等参数。频域分析是对零均值化后数据进行傅里叶变换,绘制频谱图,对不同样本故障轴承和正常轴承的频谱图进行对比,找出幅值差别比较明显的几组,作为频域分析的特征值。由于各个特征值的幅值大小不一致,不便于比较同一特征值在不同样本之间的差异,所以对所有有效特征值进行归一化,归一化后的结果可以作为神经网络的输入值。(3)模式识别和故障分析。在状态检测过程中,样本数据来源于实验数据分析后提取的有效特征值,这些有效的特征值作为神经网络的输入。神经网络的输出为轴承状态,分为正常轴承和故障轴承(也可以把故障具体分,比如内圈、外圈、滚动体故障等),可以用(0 1)表示正常轴承,(1 1)表示故障轴承,因此网络中设计2个输出神经元表示这2个状态。对轴承的不同状态进行识别,建立神经网络对它进行训练,可以用公式(其中是输入层神经元数,是隐层神经元数)大体的计算出隐层神经元层数。我们设计一个隐层可以随意改变的BP神经网络,通过误差对比确定隐层数目。设定神经网络的隐含层神经元的传递函数为tansig,输出层神经元的传递函数为logsig,目标误差为0.001,最大训练步数为1000。由以上设计写出网络训练代码,经Matlab运行,找出网络误差最小所对应层数,该层数作为神经网络的隐层。

确定神经网络的隐层后便可确定神经网络的最终结构,下一步就要对网络进行训练,使人工神经网络所产生的网络误差小于目标误差,对神经网络训练好以后,接下来就是对轴承的测试,神经网络测试代码为:y=sim(net,测试数据)。把正常轴承和故障轴承的测试数据导入Matlab程序中,结果整理后可得(以实验室中的一组实验数据为例):

用均值表示结果为:

把预先设定好的状态值和测试后的结果进行比较,很清楚的可以辨别出正常轴承和故障轴承。可见,对机器设备或者系统的故障诊断实质是一个模式识别过程。利用神经网络的模式识别能力,直接识别系统的当前模式,实现正常模式和故障模式之间、以及不同故障模式或不同故障程度之间的区分。

参 考 文 献

篇4

关键词:人工神经网络;前馈神经网络;递归神经网络

中图分类号: TP183 文献标识码: A 文章编号: 1673-1069(2017)06-165-2

1 绪论

人工神经网络(Artificial Neural Network, ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。ANN通过模仿人类大脑的结构和功能,并借鉴生物神经科学的研究成果,实现对信息的处理,是一种新兴的交叉学科,不但推动了智能化计算的应用和发展,同时也为信息科学和神经生物学的研究方法带来革命性的变化,现已成功应用于脑科学,认知科学,模式识别,智能控制,计算机科学等多个领域。

在实际应用中,人工神经网络的选取通常包括适当的神经网络模型,合理的网络结构及快速有效的网络参数训练算法[1]。而针对某一特定网络模型,ANN的研究主要集中在结构的调整和训练算法的改进两个方面。所谓神经网络训练,也就是网络参数的学习和调整,是一个反复调节节点之间权值和阈值的过程,其学习可以分成三类,即有监督学习(Supervised learning),无监督学习(Unsupervised learning)和强化学习(Reinforcement learning),本文基于有监督和无监督学习进行分类,分别分析了前馈神经网络的特点及研究现状、递归神经网络的特点及研究现状。

2 前馈神经网络

2.1 前馈神经网络的特点

前馈神经网络的主要种类包括:感知器,线性神经网络,BP网络,径向基网络(RBF)等。其训练算法主要采用梯度下降法(Gradient descent),包括:误差反向传播算法(Back Propagation, BP),改进的BP算法,Levenberg-Marquardt法(LM)等。前馈神经网络具有学习简单,收敛较快等优点,因此在实际应用中,一般选取三层或以上的网络结构,神经网络的任意逼近定理指出,训练合适的多层前馈神经网络能够以任意精度逼近任意连续函数[2]。当网络结构已知的情况下,训练前馈神经网络的本质就是确定最优权值和阈值的方法,前馈神经网络的训练方式一般采用网络理想输出和实际输出的误差作为权值调整信号,解空间一般是多峰函数,由于训练过程中很容易陷入局部极小,因此网络的训练目标就是求解一组最优的权值,使误差达到最小。

传统的误差反向传播算法由于为网络的训练提供了简单而有效的实现途径,目前已成为研究和应用最广泛的有监督学习算法。但BP算法存在许多问题,例如在多层网络中收敛较慢且容易陷入局部极小,而且不能对多个网络进行同时训练[3]。改进的BP算法有多种形式,主要有通过附加动量和学习率的引入改进BP网络的自适应能力等方法,附加动量方法虽然在一定程度上改善了易陷入局部极小的问题,仍然存在收敛速度较慢的问题。调整学习率方法通过将学习率限制在一定范围内自动调整,虽然能够提高网络收敛速率,但对权值的改变和影响并不大,仍然导致误差较大问题。LM法具有训练时间段,收敛速度快的优点,但由于LM法需要计算误差的Jacobian矩阵,这是一个复杂的高维运算问题,需要占用大量系统存储空间,同时,LM也存在易陷入局部极小的问题[4、5]。

2.2 前馈神经网络的研究现状

在传统的神经网络训练过程中,预估校正法或者经验选择是最常被使用的网络结构选取方式[6]。在训练和优化网络权值和阈值过程中,训练算法在上述分析中已知,存在着容易陷入局部最优并且难以跳出的缺点,因此误差函数要求必须是连续可求导的函怠R虼耍这些权值训练方法常和进化算法等全局搜索算法相结合。使用全局搜索算法的全局搜索能力帮助网络跳出局部极小。在编码时采用实数编码,克服二进制编码受到编码串长度和精度的限制。例如,Sexton等人用一种改进的遗传算法优化前馈神经网路权值,结果表明改进的算法使网路训练精度得到显著提高[3]。Abbass通过将传统BP算法和差分进化算法相结合,提出了一种的新的权值训练方法并用于乳腺癌的预测实验,取得较好结果[7]。Iionen等人使用差分进化算法对前馈网络的权值进行训练和优化,将优化结果与其他几种基于梯度下降的网络训练方法比较,结果表明该方法具有较好的精度[8]。更多研究成果表明,将DE、PSO应用于网络权值在线训练和优化具有明显优势,这些改进方法也成功应用在了医学和工程技术等领域[9、10]。

此外,多种优化算法相结合也被证明是有效的。例如,在文献[11]中,作者提出了一种DE和LM相结合的神经网络快速训练方法。Liu等人提出一种粒子群算法(Particle Swarm Optimization, PSO)和共轭梯度算法相结合的混合算法,并将其应用于神经网络的权值优化[12]。在优化过程中,首先确定网络结构,然后使用PSO的全局搜索能力获得最后权值组合,最后使用传统方法进行权值微调,取得较好结果。在文献[13]中,作者采用相反方式将基本PSO和传统BP算法相结合使用,首先用BP算法对网络权值进行计算,然后使用PSO对网络结构固定的权值进行优化和改进。有学者提出一种具有控制参数自适应选择能力的差分进化算法,用于训练前馈网络,并将该方法用于奇偶分类实验中,将实验结果与几种其他方法进行比较得知,提出的方法具有更好的准确性。Epitropakis等人在训练离散Pi-Sigma神经网络实验中,采用一种分布式离散差分进化算法和分布式离散PSO算法相结合的方式。该离散网络仍然是一种多层前馈网络,在输出层,通过将神经元求积的方式获得输出,作者认为这种整数权值的离散方式更适合用于硬件实现[14]。在离散化权值方面,Bao等人的工作表明,通过采用一种可重建的动态差分进化算法,可以有效用于训练固定结构的网络权值。

在不同领域中,任务往往各不相同,因此针对不同的动态系统,不同类型的递归网络的也相继被提出并得到研究,使之成为人工智能界的研究热点之一。因其具有独特的优化能力,联想记忆功能,递归神经网络已引起AI界极大的研究和关注,并成功应用于多种模式识别问题,例如图像处理,声音辨识,信号处理等。

4 结论

本章分析和研究了神经网络的两种主要类型,前馈型和递归型,并对其特点进行了分析。前馈网络的主要特点是计算简单,运算方便,缺点是耗时较长,容易陷入局部极小;递归网络的特点是具有动力学特性和联想记忆特性,但使用时需要注意稳定性和收敛性,且对初始状态具有高度敏感特性。针对两类神经网络的特点,可通过多种优化相结合的方法解决收敛较慢且容易陷入局部极小问题,应用参数学习训练算法和网络结构优化算法对递归网络进行适当的调整,以应用于具体问题。

参 考 文 献

[1] N. Garcia-Pedrajas, C. Hervas-Martinez, J. Munoz-Perez. COVNET: a cooperative coevolutionary model for evolving artificial neural networks [J]. IEEE Transaction on Neural Networks, 2003, 14(3): 575-596.

[2] K. Hornick, M. Stinchcombe, H. White. Multilayer feedforward networks are universal approximators [J]. Neural Networks, 1989, 2: 359-366.

[3] R.S. Sexton, R.S. Sriram, H. Etheridge. Improving decision effectiveness of artificial neural networks: a modified genetic algorithm approach [J]. Decis Sci, 2003, 34(3):421-442.

[4] 商琳, 王金根, 姚望舒,等. 一N基于多进化神经网络的分类方法[J]. 软件学报, 2005, 16(9): 1577-1583.

[5] S.U. Ahmed, M. Shahjahan, K. Murase. Injecting chaos in feedforward neural networks [J]. Neural Process Lett, 2011, 34(1): 87-100.

[6] Serkan Kiranyaz, Turker Ince, Alper Yildirim, et al. Evolutionary artificial neural networks by multi-dimensional particle swarm optimization [J]. Neural Networks, 2009, 22: 1448-1462.

[7] H.A. Abbass. An evolutionary artificial neural networks approach for breast cancer diagnosis [J]. Artificial Intelligence in Medicine, 2002 , 25 (3) : 265-281.

[8] J. Iionen, J.K. Kamarainen, J. Lampinen. Differential Evolution Training Algorithm for Feed-forward Neural Networks [J]. Neural Processing Letters, 2003, 17(1) : 93-105.

[9] D.M. George, P.P. Vassilis, N.V. Michael. Neural network-based colonoscopic diagnosis using on-line learning and differential evolution [J]. Applied Soft Computing, 2004, (4) : 369-379.

[10] B. Liu, L. Wang, Y.H. Jin, et al. Designing neural networks using hybrid particle swarm optimization [C]. Lecture Notes in Computer Science. Berlin : Springer , 2005 : 391-397.

[11] 王刚, 高阳, 夏洁. 基于差异进化算法的人工神经网络快速训练研究 [J]. 管理学报, 2005, 2 (4) : 450-454.

[12] L. B. Liu, Y. J. Wang, D. Huang. Designing neural networks using PSO-based memetic algorithm [C]. in: Proceedings of the Fourth International Symposium on Neural Networks (ISNN’07), 2007, pp. 219-224.

篇5

关键词:神经网络;非线性回归网络;ARIMA模型

中图分类号:TP393 文献标识码:A 文章编号;1009-3044(2017)07-0162-03

1介绍

预测股市指数及其趋势已被认为是时间序列预测中最具挑战性的应用之一。根据现有提出的有效市场理论,股价遵循随机路径,实际上不可能根据历史数据制定特定的长期预测模型。ARIMA和ANN技术已经成功地用于建模和预测金融时间序列。与作为复杂预测系统的ANN模型相比,ARIMA模型被认为是更容易的训练和预测技术。神经网络的一个重要特征是能够从他们的环境中学习,并通过学习在某种意义上提高性能。其中一个新的趋势是专门的神经结构与学习算法的发展,提供替代工具用来解决特征提取,信号处理和数据预测等问题。近年来,在使用ARIMA模型进行金融时间序列预测的金融数据分析领域中进行了一系列研究。Meyler等人使用ARIMA模型来预测爱尔兰通货膨胀。Contreras等人使用ARIMA方法预测第二天的电价。FxJiger等人用于ARIMA模型来预测在土耳其通过燃料一次能源的需求。Datta使用相同的Box和Jenkins方法预测孟加拉国的通货膨胀率。A1-Zeaud已经使用ARIMA模型来建模和预测银行部门的波动率。

本文的结构如下。在本文的第二部分,我们简要介绍ARIMA模型进行预测。接下来,给出了旨在预测特定股票收盘价的外部输入的非线性自回归网络。应用于数据预测的基于ANN的策略是针对ARIMA模型进行分析的,并且在文章的第四部分中描述了这些模型的比较分析。关于报告的研究的结论在本文的最后部分提出。

2RIM模型

自回归积分移动平均(ARIMA)模型和Box-Jenkins方法是一种统计分析模型。它主要用于时间序列分析的计量经济学和统计学。ARIMA模型使用时间序列数据来预测系列中的未来点。非季节性ARIMA模型由ARIMA(p,d,q)表示,其中p,d,q是非负整数,它们分别是自回归(AR),集成(I)和移动平均(MA)的参数。

(1)

(2)

(3)

可以使用ARMA过程开发的预测技术的扩展来解决预测ARIMA过程的问题。预测ARMA(p,q)过程中最常用的方法之一是用于计算最佳线性预测变量(Durbin-Levison算法,创新算法等)的递归技术类。在下面我们描述使用创新算法的递归预测方法。

3用于预测股票收盘价的基于ANN的模型

具有旨在预测特定股票的收盘价的外部输入的非线性自回归网络的过程如下所示;

我们假设Yt是时间z时刻的股票收盘价。对于每个时刻t,我们用Xt=(Xt(1),Xt(2),…,Xt(n)表示与Yt显著相关的指标的值的向量,即在Xt(i)和Yt之间的相关系数大于某一阈值。

我们研究中使用的神经模型是一个动态网络。直接法用于建立股票平仓值的预测模型,具体描述如下。

(4)

(5)

(6)

所考虑的延迟对训练集和预测过程具有显著影响。我们使用相关图为我们的神经网络选择适当的窗口大小。我们需要消除部分自相关函数(PACF)在统计上不相关的滞后。

具有外部输入的非线性自回归网络(NARX)是一个递归动态网络,反馈连接包含网络的多个层。NARX网络的输出可以被认为是某个非线性动态系统的输出估计。由于在网络训练期间实际输出是可用的,所以产生串并联架构,其中估计输出被实际输出替代。这个模型的优点有两个方面;一方面,在训练阶段中使用的输入更精确,另一方面,由于所得到的网络具有前馈结构,因此可以使用静态反向传播类型的学习。

NARX网络在这里用作预测器,预测公式如下:

(7)

在图1中描述了该串并联神经网络的示例,其中d=2,n=10并且隐层中的神经元的数量是24。

隐藏层和输出层中的神经元的激活函数可以以多种方式定义。在我们的测试中,我们采用逻辑函数(8)来模拟属于隐藏层的神经元的激活函数,并且单位函数对属于输出层的神经元的输出进行建模。

(8)

在训练步骤之后,串并联架构被转换为并行配置,以便执行多级提前预测任务。相应的神经网络架构如图2所示。我们使用标准性能函数,由网络误差的平均和确定。取消数据分割过程以避免提前停止。

用于更新权重和偏差参数的网络训练函数对应于具有反向传播算法的自适应学习速率变体的梯度下降。在下面,我们考虑基于梯度的学习算法的类,其一般更新规则由下式所以:

(9)

在本文中我们用E来表示误差函数,该误差函数根据训练集合上的平方差误差函数的和来定义。具有自适应学习速率的基于反向传播梯度的算法通过使误差函数最小化而产生。

为了提供基于准牛顿法的正割方程的两点近似,在每个时期定义的学习速率为;

(10)

在这种情况下,基于梯度的学习方法可能超过最佳点或者甚至发散。

4实验结果

我们用样本数据集测试了模型。样本是在2009和2014之间的每周观察量的一组变量S。集合S包含来自证券交易所的SNP股票的开盘价,收盘价,最高价和最低价,以及从股票市场的技术和基础分析获得的七个指标。

相关图显示,对于所有变量,PACF函数在第二滞后之后立即下降。这意味着所有变量的窗口大小可以设置为2。在我们的测试中,我们使用200个样本用于训练目的和100个样本用于数据预测。

神经网络参数基于以下过程确定:

1.初始化NN的参数。

2.使用6000个时期中的训练样本集训练NN。

对于已经训练的数据,根据MSE测量计算的总体预测误差小于某个阈值。

在我们的测试中,阈值设置为0J 001。如果我们用T=(T(1),T(2),…,T(nr)表示目标值的向量,并用(P(1),P(2),…,P(nr))表示其条目对应于预测值的向量,则MSE误差测量由:

(11)

使用上述技术获得的结果报告如下。对已经训练的数据预测计算的总体预测误差为0.000 35。在已训练的数据上计算的回归系数和数据拟合在图3中示出。在已经训练样本的情况下的网络预测与实际数据在图4中示出。在新数据预测上计算的总预测误差为0.001 2。在图5中示出了在新颖镜那榭鱿碌耐络预测与实际数据。

我们用基于神经网络的方法和ARIMA预测方法进行比较分析。首先,我们使用自相关函数(ACF)和部分自相关函数(PACF)来确定时间序列是否稳定。在平稳时间序列的情况下,ACF迅速衰减。由于ACF的计算值表明函数衰减非常缓慢,我们认为考虑的时间序列是非稳定的。为了调整ARIMA模型的差分参数,分别计算了一阶和二阶差分序列。由于在使用一阶差分系列的情况下,ACF的值非常小,我们得出结论,ARIMA模型的差分参数应设置为1。

基于以下标准调整与AR(p)和MA(g)过程相关的ARIMA模型的参数:BIC(贝叶斯信息准则)的相对小的值,调整的R2(确定系数)的相对高的值和相对小回归标准误差(SER)。根据这些结果,从上述标准的角度来看,最佳模型是ARIMA(1,1,1)模型。我们得出结论,最佳拟合模型是ARIMA(1,1,0)和ARMA(1,1,1)。

在使用ARIMA(1,1,0)模型的情况下,对新数据预测计算的总体预测误差为0.007 7,而在使用ARIMA(1,1,1)模型的情况下为0.009 6。预测的结果如图6所示。

篇6

【关键词】人工神经网络 BP神经网络 图像识别 识别技术

通常而言,所谓图像处理与识别,便是对实际图像进行转换与变换,进而达到识别的目的。图像往往具有相当庞大的信息量,在进行处理图像的时候要进行降维、 数字化、滤波等程序,以往人们进行图像识别时采用投影法、不变矩法等方法,随着计算机技术的飞速发展,人工神经网络的图像识别技术将逐渐取代传统的图像识别方法,获得愈来愈广泛的应用。

1 人工神经网络图像识别技术概述

近年来,人工智能理论方面相关的理论越来越丰富,基于人工神经网络的图像识别技术也获得了非常广泛的应用,将图像识别技术与人工神经网络技术结合起来的优点是非常显著的,比如说:

(1)由于神经网络具有自学习功能,可以使得系统能够适应识别图像信息的不确定性以及识别环境的不断变化。

(2)在一般情况下,神经网络的信息都是存储在网络的连接结构以及连接权值之上,从而使图像信息表示是统一的形式,如此便使得知识库的建立与管理变得简便起来。

(3)由于神经网络所具有的并行处理机制,在处理图像时可以达到比较快的速度,如此便可以使图像识别的实时处理要求得以满足。

(4)由于神经网络可增加图像信息处理的容错性,识别系统在图像遭到干扰的时候仍然能正常工作,输出较准确的信息。

2 图像识别技术探析

2.1 简介

广义来讲,图像技术是各种与图像有关的技术的总称。根据研究方法以及抽象程度的不同可以将图像技术分为三个层次,分为:图像处理、图像分析以及图像理解,该技术与计算机视觉、模式识别以及计算机图形学等学科互相交叉,与生物学、数学、物理学、电子学计算机科学等学科互相借鉴。此外,随着计算机技术的发展,对图像技术的进一步研究离不开神经网络、人工智能等理论。

2.2 图像处理、图像识别与图像理解的关系

图像处理包括图像压缩、图像编码以及图像分割等等,对图像进行处理的目的是判断图像里是否具有所需的信息并滤出噪声,并对这些信息进行确定。常用方法有灰度,二值化,锐化,去噪等;图像识别则是将经过处理的图像予以匹配,并且对类别名称进行确定,图像识别可以在分割的基础之上对所需提取的特征进行筛选,然后再对这些特征进行提取,最终根据测量结果进行识别;所谓图像理解,指的是在图像处理与图像识别的基础上,根据分类作结构句法分析,对图像进行描述与解释。所以,图像理解包括图像处理、图像识别和结构分析。就图像理解部分而言,输入是图像,输出是对图像的描述解释 。

3 人工神经网络结构和算法

在上个世纪八十年代,McClelland与Rumelhant提出了一种人工神经网络,截止现在,BP神经网络已经发展成为应用最为广泛的神经网络之一,它是一种多层前馈神经网络,包括输入层、输出层和输入层输出层之间隐藏层,如图1所示,便是一种典型的BP神经网络结构。

BP神经网络是通过不断迭代更新权值使实际输入与输出关系达到期望,由输出向输入层反向计算误差,从而通过梯度下降方法不断修正各层权值的网络。

BP神经网络结构算法如下所述:

(1)对权值矩阵,学习速率,最大学习次数,阈值等变量和参数进行初始化设置;

(2)在黑色节点处对样本进行输入;

(3)对输入样本,前向计算人工神经网络隐层及输出层各层神经元的输出;

(4)使用梯度下降方法不断修正各层权值及阀值,由梯度算子得到的权值为

(6)判断,判断是否大于最大迭代次数或者是否误差已经达到要求。如果大于最大迭代次数或误差达到要求,那么便直接转到第(7)步,否则,转到第(4)步对各个矩阵的权值继续修正,反复训练;

(7)看是否遍历所有样本,是则结束,否则跳回第(3)步继续。

BP神经网络操作简单而有效,可通过Opencv的CvANN_MLP类, Matlab的模式识别工具箱Nprtool等实现,经验得出在如下情况中人工神经网络尤为适用:

(1)大量数据可用,却不知道与输出之间关系;

(2)问题的解决方案随时间变化而变化;

(3)输出是模糊的函数关系,而非精确数字。

4 人工神经网络图像识别

传感器或摄像仪输入图像识别系统以后,其目标图像不能够与系统全部的参考图像完全一样, 这是由于对应噪声干扰,光线不足和放缩旋转等问题。 基于人工神经网络对畸变图像识别进行深层分析,并且利用 CCD 摄像头对图像信息进行采集,在此过程之中通过对摄像头方位进行更改对易出现畸变的图像进行采集,从而使得畸变图像所带信息组成样本库。在电脑里面输入样本库中的图像信息,并且进行模数的转化,变成数字图像,利用数字滤波来对数字图像信息进行处理。在神经网络之中输入样本图像数字信息来进行训练,一方面可以基于数字图像的像素点集合组成输入矩阵,用高维数据作为训练样本,通过主成分分析(PCA)的方法进行降维,大大简化计算量;一方面可以基于数字图像的特征空间进行聚类分割,提取几何特征或者统计特征,输入到SOFM神经网络或者Hopfield神经网络,从而使其生成图像识别神经网络系统。在进行图像识别的时候使用CCD 摄像头来采集识别图像,并且把其模型转化为数字图像,预处理后,将其输入到训练好的神经网络识别系统里面,就其可以开展快速的计算,并进行识别。把图像识别技术与人工神经网络理论有机结合起来,可以非常有效地实现神经网络信息系统的一致性, 此外,还可以将其对网络连接结果与权值进行存储,促进管理效率的提高,并对于知识库的构建也具有积极的作用。

5 结论

本文就基于人工神经网络的图像识别技术进行了详细地阐述,由综上研究可以基于人工神经网络的图像识别技术具有比较多的优点以及比较高的可行性,然而,我们对该技术存在的网络规模及复杂图像识别准确度上还应继续进行深入研究,以求技术突破。在将来,图像识别技术随着科技的不断发展将会获得更多的应用,其势必会发展为一门独立且具备强大生命力的学科

参考文献

[1]王强,张小溪,韩一红.基于神经网络的图像识别[J].电子设计工程,2012.

[2]雷建锋,孙俊逸.基于人工神经网络下的图像识别的研究[J].现代电子技术,2008.

篇7

关键词:项目管理 风险分析 BP 神经网络 模型

中图分类号:F282 文献标识码:A 文章编号:1674-098X(2015)10(c)-0062-02

1 工程项目中的风险

风险在任何工程项目中都存在,按照风险种类分类有自然风险、政治风险、经济风险、技术风险、责任风险和决策风险等。工程项目实施过程中,可能遇到暴雨、洪水、泥石流、不良的地质条件等自然风险;工程所在国政局动荡等政治风险;通货膨胀、资金筹措困难等经济风险;设计不完善、施工工艺很落后等技术风险;合约方违约等责任风险;信息失真和经验缺失等带来的决策风险。诸如此类风险都会造成工程项目的不确定性,如工期延长、成本超支、工程质量未达要求等,导致工程项目无法正常交付使用。

2 传统风险分析的方法

传统的风险分析方法可分为定性和定量两种。

2.1 定性风险分析方法

定性风险分析的方法一般是凭经验界定风险源,如列举法、专家经验法(Delphi法)及决策树方法等。以专家经验法为例,风险分析的过程为专家凭借在工程项目中的大量经验识别出工程项目可能存在的风险源,并给出对每一类风险源的综合印象,判明各种风险源可能对工程项目造成的破坏,是一种定性对风险的严重程度进行分析的方法。

2.2 定量风险分析方法

传统的定量的风险分析方法是在定性分析的基础上进行数学处理而实现的。如PRA(概率风险评估),DPRA(动态风险概率评估)及仿真通用软件VERT(风险评审技术)等。在定性分析的基础上,定量风险分析对工程项目中各个风险源发生的概率,给出各个风险源的风险量化指标,通过进行数学处理,得到工程项目中各类风险的量化值。

3 BP神经网络模型

3.1 人工神经网络模型

神经网络的研究始于20世纪40年代,人工神经网络,是指模拟人类神经细胞群学习特性的结构和功能而构成的一种信息处理系统或计算机系统,由于人工神经网络模型适用于复杂环境,可实现多目标控制要求,并具有以任意精度逼近任意非线性连续数的特性,已应用于许多复杂控制系统的领域。

3.2 BP神经网络

1986年D.E.Runelhart和J.L.McCelland及其研究小组提出PDP(Parallel Dis2t ributed Processing)网络思想,他们还提出了一种网络学习算法――BP算法(误差反向传播算法),至今在人工神经网络中,影响最大、使用最广泛的一类就是BP神经网络。BP网络在结构上分为输入层、隐层和输出层,是典型的多层网络结构,层与层之间多采用全互连方式,同一层单元之间不存在相互连接。3层的BP神经网络结构见图1。

除输入层单元外,BP神经网络的其他基本处理单元均为非线性输入输出关系,层与层之间的的连接权值也是可以调节的,一般选用以下函数计算公式。

4 基于BP神经网络的风险分析模型

在BP神经网络的基础上,我们建立模型对工程项目中的风险进行分析,可分为3个阶段:风险辨识、BP神经网络处理和风险评估。

4.1 风险辨识

辨识工程项目所面临的风险为工程项目风险分析的第一阶段,我们将工程项目所面临的风险进行分类,分为6种:自然风险、政治风险、经济风险、技术风险、责任风险和决策风险,也可根据具体工程项目实际情况确定风险分类;然后,根据已做出的工程项目风险分类,列出每一类风险可能会造成工程项目的无法正常完成的不确定因素。

4.2 BP神经网络处理

根据风险辨识得到的工程项目风险因素清单,我们首先要对各种风险因素的历史数据进行格式化处理,以便完成输入层信息的输入。还需提供历史的项目风险系数,然后进行BP神经网络中连接权值的训练,得到输入层、隐层及输出层的之间权值。完成训练后,在具体的某一工程项目中,即可根据现有的专家风险评估数据作为输入,得到风险评价系数。

项目风险系数是一种评价项目的风险程度的指标,工期、费用和效益投入比是用于评价工程项目的3个客观指标,工程项目的风险系数可以用下式表述。

式中:r为风险系数;

、分别为实际工期和计划工期;

、分别为实际费用和计划费用;

、分别为实际效能和预计效能;

分别是时间、费用和效能的加权系数,结合工程项目对各种资源的要求确定3个指标的值,且满足=1的条件。

4.3 风险评估

风险评价系数的取值越小,说明风险越小,取值越大,说明风险越大,风险状况的分区需要根据工程项目的具体情况进行划分。以下列出了5个区间的划分方法。

(1)r<0.2,工程项目的风险很低,即使损失发生,对工期、费用和效益投入比的影响很小;

(2)0.2r<0.4,工程项目的风险较低,如果损失发生,对工期、费用和效益投入比有一定的影响;

(3)0.4r<0.6,工程项目的风险处于中等水平,如果损失发生,有出现重大损失的可能;

(4)0.6r<0.8,工程项目的风险较大,必须采取避险措施,杜绝损失发生;

(5)0.8r<1,工程项目的风险极大,建议重新进行对该工程项目决策论证。

5 结语

将人工神经网络方法应用于工程项目风险分析之中,在大量的历史数据的基础上,采用BP神经网络模型对风险进行定量分析,大大提高了对风险评价系数预测的准确性,为工程项目的投资决策提供可信度较高的风险评价方案,特别适用于有着丰富的同类项目实施经验和资料的企业。

参考文献

[1] 成虎.工程项目管理[M].北京:中国建筑工业出版社,2001.

[2] 雷胜强.国际工程风险管理与保险[M].北京:中国建筑工业出版社,1996.

[3] 闻新.Matlab神经网络应用设计[M].北京:科学出版社,2001.

[4] 焦李成.神经网络系统理论[M].西安:西安电子科技大学出版社,1991.

篇8

关键词:新疆;棉花产量;神经网络;预测

中图分类号:F32 文献标识码:A

收录日期:2012年9月5日

我国是纺织服装业大国,棉花的稳定供给对我国棉纺业意义重大。2011年新疆棉花种植面积2,393.9万亩,产量289.8万吨,连续19年保持面积、单产、总产、调出量全国第一。棉花产业发展的稳定与否,不仅关系到国家棉花安全和棉纺工业稳定发展,也关系到新疆农村经济发展和社会的稳定。而棉花产业的稳定发展,离不开棉花产量的预测。分析与预测新疆棉花产量,不仅可以了解新疆棉花产量的走势,而且有助于统筹安排新疆棉花的种植、消费、出口等相关事宜,从而稳定棉花市场的供求,同时兼顾棉农的利益。

棉花属于纯经济作物,受市场价格变化影响很大,因此棉花种植面积具有很大波动性,同时气候变化对于棉花产量的影响至关重要。因此,相比粮食作物来说,棉花产量的预测具有较大难度。

时间序列预测和灰色系统GM(1,1) 等模型均是假设所有的影响因素都蕴含在单一历史序列中,主要依靠总产量数据建立预测模型,需要的数据较少,比较容易操作;适合于具有长期趋势的序列,对于波动比较剧烈的序列预测效果较差。目前,对新疆棉花产量预测的研究大部分都是此类。

回归分析预测和神经网络预测属于因果关系预测,假定一个因素的变动是由另一个或几个变量引起的,通过掌握自变量的变动可以知道因变量的变动趋势。要求占有尽可能多的资料,而对数列的波动趋势没有特别要求。回归分析需要假设关系的数量模型形式,然后用最小二乘法拟合,而神经网络则不需要假设数量关系的形式,通过反复多次的学习和训练达到模拟变量关系的目的。本文拟选用BP神经网络对棉花总产量进行预测。

一、建立人工神经网络模型的方法

篇9

关键词:BP神经网络、图像分割、特征提取

Abstract: the image recognition process including the image preprocessing, feature extraction, image understanding and analysis. Which BP artificial neural network in the image segmentation using better; In the feature extraction phase BP neural network is also very good find application, and obtain the better feature extraction results; In the image understanding and the analysis phase using neural network classifier design, can get accurate classification results.

Keywords: BP neural network, image segmentation, feature extraction

中图分类号:TP183 文献标识码:A文章编号:

引言

BP人工神经网络算法是现今应用较为广泛的多层前向反馈式神经网络算法,BP人工神经网络有较好的容错能力、鲁棒性、并行协同处理能力和自适应能力,受到了国内外众多领域学者的关注。由于神经网络高效率的集体计算能力和较强的鲁棒性,它在图像分割方面的应用已经很广泛,Jain和Karu采用了多通道滤波与前向神经网络相结合的方法实现图像纹理分割算法。神经网络算法在特征提取阶段,压缩特征数量,以提高分类速度和精度。在图像识别领域中神经网络作为分类器的研究也得到了很大的进展,尤其是其学习能力和容错性对于模式识别是非常有利的,在一定程度上提高了训练速度和识别率。Le Cun等人提出了多层特征选择(Multilayer Selection Procedure)方法用于字符识别,每一层神经网络处理较低层次的特征,获取该层特征信息并传给上一层。

BP神经网络的基本原理

人工神经网络的研究起源于对生物神经系统的研究,它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制可以模仿人的神经系统的动作过程,以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络的学习过程实际上就是不断地调整权值和阈值的过程。根据有无训练样本的指导可以将神经网络的学习方式分为两种:监督学习方式和非监督学习方式,也称为有导师指导学习方式和无导师指导学习方式。监督学习方式,是在给定固定的输入输出样本集的情况下,由网络根据一定的学习规则进行训练学习,每一次学习完成后,通过对比实际的输出和期望的输出,以此决定网络是否需要再学习,如果还没有达到期望的误差,则将实际误差反馈到网络,进行权值和阈值的调整,使实际的误差随着学习的反复进行而逐步减小,直至达到所要求的性能指标为止。非监督学习方式,是在没有外界的指导下进行的学习方式,在学习过程中,调整网络的权重不受外来教师的影响,但在网络内部会对其性能进行自适应调节。

BP神经网络分类器的设计

BP神经网络是基于误差反向传播算法(Back Propagation Algorithm,BPA)的多层前向神经网络,由输入层、输出层、一个或多个隐含层所组成。BP神经网络结构确定之后,通过对输出和输入样本集进行训练,反复修正网络的权值和阈值,达到学习训练的期望误差,以使网络能够实现给定的输入输出映射关系。BP人工神经网络的学习过程分为两个阶段,第一阶段是输入己知的学习样本数据,给定网络的结构和初始连接权值和阈值,从输入层逐层向后计算各神经元的输出;第二阶段是对权值和阈值进行修改,即根据网络误差从最后一层向前反馈计算各层权值和阈值的增减量,来逐层修正各层权值和阈值。以上正反两个阶段反复交替,直到网络收敛。具体实现步骤如下:

(1) 网络的初始化:首先对输入的学习训练样本进行归一化处理,对权值矩阵W和阈值向量赋初值,将网络计数器和训练次数计数器置为1,网络误差置为0。

(2) 输入训练样本,计算输入层,隐含层以及输出层的实际输出。

(3) 计算网络输出误差。将实际的输出和期望的输出值进行对比,采用均方根误差指标作为网络的误差性能函数。

(4) 若误差还没达到期望标准,则根据误差信号,逐层调整权值矩阵和阈值向量。

(5) 若最终调整之后的网络输出达到了误差范围之内,则进行下一组训练样本继续训练网络。

(6) 若全部的训练样本训练完毕,并且达到了期望的误差,则训练结束,输出最终的网络联接权值和阈值。

BP神经网络可以逼近任意连续函数,具有很强的非线性映射能力,而且BP神经网络中间层数、各层神经元数及网络学习速率等参数均可以根据具体情况设定,灵活性较强,所以BP神经网络在许多领域中广泛应用。一般来说,神经网络方法应同传统的人工智能方法相联系的。神经网络本身结构及性能上的特点使其对问题的处理更富有弹性,更加稳健。神经网络的基本特点是采用自下而上的设计思路,使其容易确定具体的目标分割或识别算法,在增加了不确定因素的同时也产生了网络最优化的问题,这就是所谓的伪状态(pseudo-trap)。尽管在实践中并非所有的伪状态对应完全失败的结果,但是毕竟这不符合对之完美的或者说合理的期望。人工智能则一般采用自上而下的方法,偏重于逻辑推理建立系统模型。因此将神经网络同人工智能结合起来,相当于赋予神经网络高层指导的知识及逻辑推理的能力,具有潜在的优势。

输入层中间层 输出层

图1 BP人工神经网络结构

BP神经网络的训练

4.1 BP神经网络的设计

BP神经网络的设计主要包括两方面内容:一是神经网络结构的确定,特别是隐含层层数及隐含层单元数目的确定;二是高精度收敛问题,隐含层和隐含层单元数过多,将导致训练时间过长并出现过度拟和的问题,隐含层单元数过少又导致网络收敛速度慢甚至不收敛,达不到误差精度要求。在确定隐含层层数以及隐含层单元数目时,没有一个严格的理论依据指导,需要根据特定的问题,结合经验公式确定大致范围来进行逐步试算比较得到。

4.2 数据预处理

为了加快网络的训练速度,通常在网络训练前进行神经网络输入和输出数据预处理,即将每组数据都归一化变为[-1,1]之间的数值的处理过程。

4.3 神经网络的训练

%当前输入层权值和阈值

inputWeights=net.IW{1,1}

inputbias=net.b{1}

%当前网络层权值和阈值

layerWeights=net.LW{2,1}

layerbias=net.b{2}

%设置训练参数

net.trainParam.show = 1000;%限时训练迭代过程

net.trainParam.lr = 0.1; %学习率,缺省为0.01

net.trainParam.epochs = 100000; %最大训练次数,缺省为100

net.trainParam.goal = 0.001; %训练要求精度,缺省为0

[net,tr]=train(net,P,T);%调用 TRAINGDM 算法训练 BP 网络

A = sim(net,P) %对 BP 网络进行仿真

E = T - A;%计算仿真误差

MSE=mse(E)

结束语

BP网络因为具有较强的学习性、自适应型和容错性,在很多领域均已经大量运用。本文将BP人工神经网络运用于图像的识别,探索人工神经网络在图像识别领域中的重要的现实意义。研究表明,BP人工神经网络应用于图像识别在一定程度上提高了识别的效率和准确率。但是,BP神经网络算法还存在以下几点不足之处:(1)权的调整方法存在局限性,容易陷入局部最优;(2)网络的结构需要提前指定或者在训练过程中不断的修正;(3)过分依赖学习样本,由于学习样本是有限的或者学习样本质量不高,那么会导致训练达不到效果;(4)对于规模较大的模式映射问题,存在收敛速度慢、容易陷入局部极小点、判断不准确等缺陷。总之,如何解决以上问题,如何进一步提高识别精度,扩大识别范围,使之更具有更好的工程实用性,是有待进一步研究的内容。

参考文献:

[1] WE Blanz,S L Gish.A Connectionist Classifier Architecture Applied to Image Segmentation.Proc.10th ICPR,1990,272-277.

[2] Y Le Cun,L D Jackel,B Boser,J S Denker,H P Graf,I Guyon,D Henderson,R E Howard,and W Hubbard,Handwriten Digit Recognition:Applications of Neural Network Chips and Automatic Learning,IEEE Comm.Magazine.Nov.1989.

[3] A K Jain and K Karu,Automatic Filter Design for Texture Discrimination,Proc.12th Int’l Conf.NeuralNetworks,Orlando,Oct.1994,454-458.

[4] 边肇其,张学工.模式识别(第二版)[M].清华大学出版社,北京.1999,12.

[5] 陈书海,傅录祥.实用数字图像处理[M].科学出版社,北京.2005.

[6] 万来毅,陈建勋.基于BP神经网络的图像识别研究[J].武汉科技大学学报(自然科学版).2006,6.

[7] 丛爽.面向MATLAB工具箱的神经网络理论与应用(第2版)[M].北京:中国科学技术出版社,2003.

[8] 王娟,慈林林等.特征方法综述[J].计算机工程与科学.2005.27(12).68-71.

[9] 贾花萍.基于神经网络的特征选择与提取方法研究[J].网络安全.2008,7.33-35.

[10] 龚声荣,刘纯平等编著.数字图像处理与分析[M].清华大学出版社,北京.2006.7.

篇10

关键词:人工神经网络;电力变压器;故障诊断

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)32-0174-03

1引言

电力变压器在长期的运行中,故障是不可避免的。变压器一旦损坏会造成大面积停电且故障修复耗时长,因此变压器故障的及早发现和处理具有非常重要的意义。

电力变压器的故障一般有机械故障、热性故障和电性故障,由于机械故障一般都以热性故障和电性故障的形式体现,因此主要以热性故障和电性故障为主。热性故障一般为中低温过热和高温过热,电性故障一般为低能放电和高能放电。传统的变压器故障诊断方法存在着效率偏低以及诊断准确率不高的问题,因此我们可以利用人工神经网络的方法对电力变压器的故障进行自动诊断。

2人工神经网络

2.1 人工神经网络概述

人工神经网络(ANNs)是对人脑或生物神经网络若干基本特性的抽象和模拟。

依靠系统的复杂程度,ANNs可通过调整内部大量节点之间相互连接的关系,进而对有效信息进行可靠处理。而BP神经网络通常是指基于误差反向传播(Back Propagation)算法的多层前向神经网络, 不仅能对输入-输出模式映射关系进行学习和存储,而且对描述此种映射关系的数学方程不需要事前揭示。最速下降法为BP神经网络的学习规则,通过反向传播来持续调整网络的权值和阈值,使其误差平方和最小。

本文采用BP神经网络的三层前馈结构,分别为(input)、隐含层(hide layer)和输出层(output layer)。输入层的节点数为5(对应电力变压器油中气体H2、CH4、C2H4、C2H2、C2H6),输出层则有5个节点(对应无故障,中低温过热,高温过热,低能放电,高能放电),隐含层的节点数根据经验公式确定:

其中,r为隐层的节点数,n为输入的节点数,m为输出的节点数,a则为1~10之间的常数。经试验,本文r取13。各层间神经元相互连接,且各层内没有连接。如图1所示:

BP神经网络的训练首先对每一层的权值和偏差进行初始化(用小的随机数),以免被大的加权输入饱和,并且需对一些参数进行设定及初始化(期望的误差最小值、最大循环次数、修正权值的学习效率);第二步需要对网络各层输出矢量及网络误差进行计算;第三步需要对各层反向传播的误差变化、各层权层的修正值及新的权值进行计算,最后需要对权值修正后的误差平方和进行计算,若符合要求则训练完成,若不符合要求则继续。

2.2电力变压器故障诊断的BP神经网络设计

2.2.1样本数据的定义

电力变压器的故障主要体现为中低温过热、高温过热、低能放电和高能放电。电力变压器的故障数据一共为70组,其中样本集数据为50组,测试集数据为20组,且分别定义样本数据如下:

无故障,记为10000;

中低温过热,记为01000;

高温过热,记为00100;

低能放电,记为00010;

高能放电,记为00001。

2.2.2样本数据的预处理

为提高神经网络的训练效率,本论文对数据进行了标准化处理,使其落入[-1,1]区间;并且对输入样本集数据进行了主元分析,以减小各样本矢量的相关性,从而达到降维的目的。

2.2.3 BP神经网络设计参数设置

MATLAB中,BP神经网络设计需要定义有关参数:训练步数、显示训练结果的间隔步数、训练目标误差、训练允许时间和训练中最小允许梯度值等,最终可返回训练后的权值、循环训练的总数和最终误差。神经网络对象的一些主要训练参数及含义如表1所示。

2.2.4 BP神经网络验证

表2列出了20组测试集数据,最后一列为网络期望输出,对应变压器的实际故障类型。

由电力变压器故障诊断的误差变化曲线可知:在使用BP神经网络法对网络进行训练时,网络只训练了112步,速度非常的快。网络的训练均方误差此时已经达到目标误差0.01的数量级,因此该网络可用。对样本集数据进行训练后,我们可得到一个相关的BP神经网络模型,再用测试集数据对改模型进行验证,验证结果如表3所示。(注:图中*号表示该BP神经网络模型诊断错误的数据组)

由以上BP神经网络自动诊断结果可以得知:电力变压器故障诊断正确的个数为18个,故诊断正确率为90%左右。

3 结论

本文应用人工神经网络的方法对电力变压器的故障进行了自动诊断,诊断正确率可达90%。随着计算机技术和人工智能技术的发展,利用人工神经网络进行变压器的故障诊断有利于有效地实现对故障的综合诊断,从而提高故障诊断的准确性,可靠性和诊断效率,为变压器故障诊断技术的发展拓展新的途径。

参考文献:

[1] 张铮,徐超,任淑霞,等.数字图像处理与机器视觉――Visual C++与Matlab实现[M].北京:人民邮电出版社,2014.

[2] 马锐.人工神经网络原理[M].北京:机械工业出版社,2010.

[3] 郭磊,董秀成.BP神经网络在变压器故障诊断中的应用[J] .西华大学学报,2008(5):10-13.

[4] 殷跃.基于BP神经网络的电力变压器故障诊断的研究[D].吉林:吉林大学通信工程学院,2007.

[5] 王连成.基于神经网络的DGA法在变压器故障诊断中的应用研究[D].黑龙江:哈尔滨工业大学电气工程及自动化学院,2009.

[6] 李霖.基于BP神经网络的变压器故障诊断方法研究[D].湖南:长沙理工大学电气与信息工程学院,2013.

[7] 曾成碧,蒲维,曾先锋.BP神经网络在油浸式变压器过热性故障诊断中的应用[J]. 四川电力技术,2012(4):60-63.

[8] 陈小玉.改进的神经网络在变压器故障诊断中的应用[J].计算机仿真,2012(8):318-321.

[9] 宋彩利, 吴宏岐.神经网络在变压器故障诊断中的应用研究[J].微计算机信息,2008(34):155-157.