人工神经网络的意义范文
时间:2024-03-28 16:38:39
导语:如何才能写好一篇人工神经网络的意义,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
【关键词】 人工神经网络;中医证候;非线性建模
建模就是建立一个数学模型,使之能最好地拟合通过系统的输入输出数据体现出的实际系统的动态或静态特性。证候学研究的目的就是通过对四诊信息的综合分析,找出证候的特征,做出证型的分类诊断。因此,可以通过数理分析方法总结证型与指标之间的规律,建立证候诊断数学模型。常用的证候建模方法分为线性建模法和非线性建模法两种。
1 线性证候建模方法及其存在的问题
目前,常用的线性证候建模方法有多元线性回归分析、因子分析、判别分析等多元统计方法。多元线性回归分析可以根据各指标的常数项和偏回归系数建立证候的多元线性回归方程;因子分析可以通过将公因子表示为指标的线性组合,从指标的观测值估计各个公因子的值,从而建立证候的因子得分模型;判别分析可以对证候诊断明确的一组资料建立证候的判别函数。上述3种方法均可以建立证候的线性模型,并可实现对证候的诊断和预测。
多元统计方法很多都是对复杂问题的线性简化。如判别分析和回归分析都是不加区别地、均衡地看待每个症状变量对线性关系的影响,同时还基于各变量的作用与其他变量的值无关,且各变量的作用可以叠加这一不甚合理的假定而建立的症状和证候关系的一种简单的线性描述[1];因子分析也是建立每一个公因子(证候)和变量之间的线性函数。然而,中医证候系统具有非线性复杂性特征,且症状之间存在大量的多重共线性关系和协同关系,线性建模方法虽然有利于对复杂问题的数学描述,但却很难准确地模拟症状和证候之间的复杂关系,更难以逼近中医证候的真实面貌。
2 非线性证候建模方法
非线性建模法又称黑箱建模法,即在不了解黑箱内部机理和结构的情况下,通过提取隐含在系统的输入输出数据中的特性,建立一个能充分逼近系统实际结构的等价模型。目前,人工神经网络技术具有强大的非线性映射能力,能够任意精度逼近非线性函数,成为非线性系统辨识的主要建模方法。
中医证候的诊断过程,实质上是由收集到的各种症状,通过分析获得证型诊断的过程,可以把这个过程看作是一个非线性映射过程,因此,我们将改进的BP神经网络用于中医证候的非线性建模研究,探讨了基于人工神经网络模型的非线性证候建模方法。
3 基于人工神经网络的证候非线性建模方法
3.1 人工神经网络简介
人工神经网络(artificial neural network,ANN)是在对人脑神经网络结构认识理解的基础上,人工构造的新型信息处理系统。ANN具有大规模的并行处理方式、良好的鲁棒容错性、独特的信息存储方式以及强大的自学习、自组织和自适应能力,这使得它在模式识别、控制优化、信息处理、故障诊断以及预测等方面应用广泛,其理论与技术方法在工程、医疗卫生、农业、交通、财经、军事、环境、气象等领域显示出巨大的吸引力,并具有广阔的应用前景[2]。
ANN的一个显著特征是它通过自动学习来解决问题,对样本的学习过程,即为对网络中的神经元间的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别自变量与应变量间的复杂的非线性关系。经过充分学习后的ANN获取了样本的特征规则,并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模型。这样的ANN模型不仅能够对其学习过的样本准确识别,而且对未经学习的样本也可以准确识别,它甚至可以充分逼近任意复杂的非线性映射关系。可见,ANN不需要精确的数学模型,而是通过模拟人的联想推理和抽象思维能力,来解决传统自动化技术无法解决的许多复杂的、不确定性的、非线性的自动化问题。
BP神经网络[3]是指基于误差反向传播算法(back propagation,简称BP算法)的多层前向神经网络。BP网络的神经元通常采用Sigmoid型可微函数,可以实现输入到输出间的任意非线性映射,这使得它在函数逼近、模式识别、数据压缩等领域有着广泛的应用,也使得它能够应用于中医证候的非线性建模。
3.2 非线性建模方法
证候具有典型的非线性特征,证候的诊断过程可以看作是一个从诊断指标到证候的非线性映射过程,这个过程用非线性数学模型可以充分模拟,而ANN是典型的非线性数学模型,其中的BP网络更具有强大的非线性拟合能力。因此,我们选择ANN中最常用的BP神经网络技术,并进行适当的改进后,建立中医证候的非线性模型,然后对建立的证候模型的诊断性能进行测试。具体步骤如下。
3.2.1 数据预处理
在建模之前,首先对试验数据进行预处理。包括对输入数据的归一化处理和对数据的主成分分析以及资料的分组处理等。
先对所有数据进行归一化处理,使变换后的输入输出信息在(0,1)区间,以防止小数值信息被大数值信息所淹没;然后对归一化处理后的数据进行主成分分析,主成分的选择标准定为95%。数据经过主成分分析,可对大量的输入信息进行降维处理;最后根据验证方法进行病例分组,我们采用3倍交叉验证法,因此,将样本随机分为3组。
3.2.2 确定BP网络的结构
在MATLAB7.0环境下,采用改进的共轭梯度学习算法(trainscg学习算法),建立证候的三层前向BP网络模型。该网络包括输入层、隐层和输出层,其中输入层包含的输入神经元数即是证候的诊断指标数;隐层的层数及每层包含的神经元数根据具体情况而定;输出层包含的输出神经元数即研究资料包含的基本证型数。两个隐层之间通过双曲线正切S型传递函数(tansig)连接,隐层与输出层之间用对数S型传递函数(logsig)连接。设定网络的系统误差为小于0.01,最大迭代次数为500次,最小下降梯度为10-10。
其中,网络的输出节点用来表示共几种证型,表示方法是一个输出节点对应一种证型。我们将包含n个证型的输出采用(0,1,…,0)的方式,括号内共有n个数值,每一个数值代表一种证型,其中0表示诊断不成立,1表示诊断成立,这样可以诊断兼夹证的情况。另外,预测输出值分原始输出值和整合输出值两组,原始输出值为0到1之间的连续值;整合输出值既可整理成(0,1)的形式(规定≥0.5为1),又可整理成0-1之间的分段数值,比如(0,0.2,0.4,0.6,0.8,1)等6个数值,这样根据数值大小既可诊断兼夹证,又可判断证型的主、次情况。
3.2.3 证候网络模型的训练
先取样本的两组作为训练集,另一组作为测试集,再交换其中的一组,如此循环,分别共做3次训练与测试,从中得出平均预测效果值。
网络参数的初始值取为[-0.5,+0.5]上均匀分布的随机数。经重置几次网络权值的学习率和动态训练集后,不断改善权值。到权值趋稳,即认为网络训练完成。
3.2.4 证候网络模型的测试
神经网络训练的期望目标是以尽可能简单的网络结构达到尽可能高的学习精度和尽可能好的泛化能力,因此考察神经网络的性能就要看网络的泛化能力。所谓泛化,就是网络对尚未学习过的数据的正确识别能力,是否具有良好的泛化能力是网络能否投入实际使用及使用效果如何的重要因素。它可以通过测试样本集网络诊断结果的特异性和准确率来衡量。
证候网络模型的权值趋稳,训练结束后,即可以采用三倍交叉验证的方法,分3次分别对1/3测试样本做检验。此时只有输入矢量(即只有症状得分),无输出期望值(即没有相应证型的判断)。经网络运算后,得出预测输出值,与期望输出进行比较,分别统计各种证型预测值的特异性和准确率,以判断该证候神经网络模型的诊断性能。
4 实现基于人工神经网络的非线性证候建模研究
我们采用上述非线性证候建模方法,在MATLAB7.0环境下,对一组765例类风湿性关节炎(rheumatoid arthritis,RA)临床证候资料和一组449例糖尿病肾病(diabetic nephropathy,DN)临床证候资料,分别建立了RA证候BP网络模型和DN证候BP网络模型,并均采用三倍交叉验证的方法,检验了证候神经网络模型的诊断性能(具体内容另文详述)。测试结果显示:两种模型的平均单证特异性分别为81.31%、81.32%;平均单证准确率分别为95.70%、96.25%;平均诊断准确率分别为90.72%、92.21%。说明基于改进的BP神经网络的证候模型具有较高的诊断、预测能力。
5 讨论
“线性”和“非线性”是区别事物复杂性程度的标尺,在数学中,当两个变量(自变量和应变量)的关系成正比时就称为线性关系,否则就是非线性关系[4]。在生命科学中,由上述概念推广而来的线性和非线性逻辑则更具实用意义,非线性逻辑表征事物各组分之间是相互作用的,而不是相互独立的、正则的、无限可微的和平滑的,即总体不等于部分之和,它是复杂系统的典型特征之一。证候是机体各层级结构的整体涌现现象,中医四诊信息所表达的就是人体各层级结构的功能失调逐级涌现的结果[5]。显然,证候具有非线性特征。
对非线性证候系统建模应当用非线性建模法更能反映证候的实质。基于黑箱结构的ANN具有强大的非线性建模能力。因此,我们将其用于证候的非线性建模。
我们在基于共轭梯度下降算法的BP神经网络的基础上,对RA临床证候资料和DN临床证候资料均建立了非线性神经网络证候模型,经过三倍交叉验证,两种证候神经网络模型均有良好的诊断、预测能力。可以得出结论,ANN在不必知道内部结构的情况下能够充分模拟症状与证候的非线性映射关系。神经网络利用网络的自动学习能力,在充分辨识证候表征信息的基础上,可以自动抽提出这些信息蕴含的内在规律,并将其分布在网络的联接权中,从而建立了症状与证候的非线性映射函数。
在这里,样本(证候)被概括为一对输入与输出的抽象的数学映射关系,各种物理表征信息为输入单元,证型诊断为最终的输出结果。证候诊断的过程被看作了一个映射问题,通过症状找出对应的证型诊断,神经网络把症状与证型的对应关系通过输入与输出的映射转化成了一个非线性优化问题。虽然不清楚网络模型的内部结构,但我们的研究证实这种模型却能够充分逼近症状与证型诊断的非线性映射关系,近似真实地反映证候的全貌,这是在不打开黑箱的前提下,建立非线性证候模型、反映证候的内在规律和特征的有效方法。
BP神经网络虽然是一个标准的非线性数学模型,但它的收敛速度非常慢,为此,我们采用trainscg函数改进train函数,trainscg函数是共轭梯度算法的一种变形,具有采用尺度化共轭梯度反向传播算法对网络进行训练的功能。该算法结合了Levenberg-Marquardt算法中的模型置信区间方法和共轭梯度算法,避免了耗时巨大的线搜索过程,从而大大提高了网络的训练速度。我们建立的两种证候网络最后一次训练的迭代次数分别为58、33,说明建立的证候网络模型有很好的收敛性能。
总之,中医证候的诊断规律蕴含在足够多的样本集合中,利用神经网络的自主学习能力从大量的样本中进行证候特征的规则提取,能够抽提出比较全面的内在规律;同时,网络的自组织、自适应能力又能加强对边缘相似病例的辨识能力,这样的证候诊断模型更能充分逼近证候真实面貌。基于改进的BP神经网络的证候非线性数学模型具有良好的诊断、预测能力,能够充分逼近证候的真实面貌,是证候非线性建模的可行性方法。
当然,用ANN建立的证候模型是否有强大的推广能力,取决于样本的含量以及样本所含信息的全面程度。因此,必须保证样本的含量足够大、样本所蕴含的证候诊断信息足够全面,这样才能尽量真实地展示证候全貌。同时,ANN的知识处理能力还需进一步提高,还需围绕如何提高神经网络的学习能力、收敛速度、可塑性以及普化能力等方面展开深入研究。但目前采用神经网络技术建立证候数学模型,从而实现对证候的非线性建模,对中医证候的规范化研究不啻是一种可行的方法。
【参考文献】
[1] 袁世宏,王天芳.多元统计方法在建立证候诊断模型研究中存在问题的思考[J].北京中医药大学学报,2004,27(4):9-11.
[2] 白云静,申洪波,孟庆刚,等.中医证候研究的人工神经网络方法探析[J].中医药学刊,2004,22(12):2221-2223.
[3] 许 东,吴 铮.基于MATLAB6.X的系统分析与设计——神经网络[M].第2版.西安:西安电子科技大学出版社,2002.19-24.
[4] 包含飞.初议中医学是复杂性科学[J].上海中医药大学学报,2003,17 (2):3-6.
篇2
Abstract: Perturbation model by building privacy preserving data clustering using hidden logarithmic spiral perturbations of the original data, maintaining stable raw data neighborhood relationship, the effective maintenance of data availability clustering; further mention BP neural networkthe convergence speed. Data privacy, while maintaining the availability of the output results and can be effectively avoided.
关键词: BP神经网络;对数螺旋线;数据扰动;收敛速度
Key words: BP neural network;logarithmic spiral;data perturbation;convergence rate
中图分类号:TP392 文献标识码:A 文章编号:1006-4311(2013)02-0181-02
0 引言
人工神经网络的输入数据若能预先进行有效的数据处理,那么对隐藏层的数据处理可提供高效的数据,使得网络收敛速度得到较快改进,数据扰动不仅是解决了该问题,而且可以对原始数据中的隐私信息得到有效的保护。
1 对数螺线方程
对数螺旋线上的动点的与极坐标的极径始终保持定角β的轨迹,称为对数螺旋线(如图1所示),它的极坐标方程为:r=r0ekθ。
期中:r0、k为常数,k=ctgβ,r0为起始极径,θ为极角,r为极径。
在直角坐标系中其方程为:
x=r0ekθcosθ y=r0ekθsinθ
2 对数螺线特性
对数螺旋线具有良好的几何特性,主要表现在以下几方面:①在一条对数螺旋线上,每个点的螺旋角每处都相等,运动点的运动方向与极径之间的夹角β始终固定值,称该角度为对数螺旋线的螺旋角,即螺旋线上每点的螺旋角都相等。②螺旋线与它的等距曲线全等始终保持螺旋线的螺旋角都不会不变,改变它的起始极径r0,那么就会形成一系列的等距螺旋线族,它们是全等的螺旋线。③针对多维数据,若进行对数螺线扰动,始终不会改变数据集的数据附近之间的关系。④对数据集进行多重对数螺线扰动,不会改变数据集的数据邻域关系。⑤多重对数螺线扰动可以增强隐私保护的安全性。
综上所述,通过对数螺旋线对数据进行扰动,不会改变原始数据的基本特性。
3 对数螺旋线数据扰动方法
考虑将对数螺线的几何性质应用于微数据隐藏,借助对数螺线对数据点进行扰动,隐藏原始数据。具体思路如下:通过对数螺线的旋转和缩放使数据点落于对数螺线上,再使数据点沿螺线方向在螺线上移动,从而对原数据进行扰动保护,将这种扰动方法称之为对数螺线扰动。
设原始数据点为A,对数螺线扰动函数为F,扰动后数据点为A′,F×A表示运用函数F对数据点A进行扰动,则对数螺线扰动可以表示为F×AA′。
在二维平面上,给定一条对数螺线,对于平面上任意一点,若该点落在对数螺线上,则使该点顺着螺线的方向在螺线上移动;若该点不在螺线上,则使螺线绕其螺心旋转直至使该点落于螺线上,再使该点在螺线上沿螺线方向移动,将这种扰动方法称之为二维对数螺线扰动,如图2所示。
设点A(Ai,Aj)为二维平面上的任意一点,设对数螺心为O(x,y),对数螺线方程为r=aekθ,旋转扰动角度为Δθ,如图2所示,二维对数螺旋线扰动可分解为旋转和缩放两部分,点A先缩放至点A″,再围绕螺心旋转至点A′。
设θA为点A相对于对数螺线的极角,缩放参数k为扰动后的点A′与螺心的距离|A′|与扰动前的点A与螺心的距离|OA|的比,则
k=■=■=■=e■
其中r■、r■分别为点A、A′的极径。则扰动后点A′(A■■,A■■)的坐标为
A■■=k·rA·cosθ■+Δθ+x A■■=k·r■·cosθ■+Δθ+y
根据给定的参数,设二维螺旋线扰动函数为F(k,Δθ,O(x,y)),则二维对数螺旋线扰动可以表示为:
F(k,Δθ,O(x,y))×A(Ai,Aj)A′(A■■,A■■)
将多维数据集D中的多维属性随机划分成一组不相交的二维、三维投影子集,给定缩放参数k。对于二维投影子集,给定螺心O(x,y)和扰动角度Δθ,进行二维对数螺线扰动;对于三维投影子集,给定螺心O(x,y,z)、螺轴向量V(a,b,c)和扰动角度Δθ,进行三维对数螺线扰动,最后将原数据集替换为扰动后的数据集D′。对数据集D进行t次这样的对数螺线扰动,最终得到t重对数螺线扰动后的数据集D(T)。
4 人工神经网络样本质量对网络的影响
BP神经网络能够较好地解决I/O之间的映射关系的不明确问题,大部分的人工神经模式在模式识别问题中,其I/O的映射关系难于用解析的方法来求解,故神经网络很难适用来解决模式识别中的有关问题。BP神经网络的样本主要分为训练样本及测试样本,神经网络中样本的本身质量,在一定程度上影响着预网络的预测结果。首先,输入的训练样本及待预测样本平均值存在较大差异,神经网络的预测误差值,就会随着增长预测时间的训练不断增大。再次,如果训练误差会随训练样本及待预测样本均值的差异增大而逐渐增大。
所以把用于BP神经网络的训练样本和待预测样本先进行数据扰动,可以保证数据的安全性和可用性,先用对数螺旋线进行t重扰动,再进行BP神经网络的训练,最后用输入样本数据进行预测,实验证明使用扰动后的数据进行训练的网络比用原始数据归一化处理后训练的网络收敛速度快,且输出结果更加可靠。
5 实验与分析
BP人工神经网络的主要功能是能以任意精度逼近任意连续函数,几乎所有的模式识别及分类问题基本能看作从模式空间到类别空间的一个映射,故BP神经网络模式分类方法能用于解决任意复杂度的模式分类问题。BP神经网络泛化能力较强,若用少量的训练样本对网络进行训练后,那么BP神经网络对训练阶段,也能对没有遇到的新样本给出正确分类。神经网络的这种泛化性,是其它模式分类方法无法的。
使用传统的神经网络方法,可以较好的解决模式分类问题,但因为训练样本数量和分布不可能是理想的,若使用样本集训练分类器所得到的分类面始终与最优分类是存在差异,这就导致了人工神经网络的泛化能力。为了提高人工神经网络的泛化能力及收敛速度,有许多专家做了大量的工作,但由于这些研究主要是集中分析人工神经网络的参数和训练样本等对泛化能力的影响,对用新的方法提高网络的泛化能力及泛化能力的稳定性很少涉及[2]。
采用文献[1]中的例子,在MATLAB下用误差投影和局部投影算法,对RBF网络进行仿真实验,优化BP网络参数,预测某种水泥在凝固时放出的热量y(卡/克)与水泥中下列四种化学成分之间的关系,实验样本数据为表1中的数据。
其中,x1,x2,x3,x4的含意如下:x1:3CaO·Al2O3的成分(%);x2:3CaO·SiO2的成分(%);x3:4CaO·Al2O3·Fe2O3的成分(%);x4:2CaO·SiO2的成分(%)。
用对数螺旋线进行t重扰动(取整),对表1的扰动后的输入如表2所示。
对BP网络训练后,对表2中的实际值进行预测,实验结果如表3。
6 结论
采用对数螺旋线对输入样本数据进行扰动,保持了数据的原始特性不变的情况下,加快了BP人工神经网络的收敛速度,精度得到了较大的提高,而且对数据中的隐私得到了有效的保护。经过MATLAB仿真实验,仿真结果见表3,从该表可以看出,与文献[2]的结果比较仿真精度得到了较大的提高,平均误差为-0.27,标准方差为0.7732。
参考文献:
[1]Kadirkamanathan V, Niranjan M. A function estimation approach to sequential learning with neural networks. Neural Computation,1993,5(4):954-975.
[2]宋绍云等.人工神经网络中的样本对输出精度影响分析[J].河北:价值工程,2010-5-3.
[3]李江红等.RBF神经网络的一种新的学习算法[J].长沙:长沙电力学院学报(自然科学版),2000,15(1):39-42.
篇3
关键词:神经网络 网络方法 环境色谱法 多个节点 信息模型
中图分类号:X83 文献标识码:A 文章编号:1674-098X(2017)05(a)-0126-02
从近几年在国内神经网络的使用来看,在环境监测中也有着非常良好的效果。无论是从色谱法、光谱法还是整个环境的评价都带来了很多新的成果。该文主要是通过对神经网络相关分类的阐述,结合神经网络在环境监测中的应用效果,希望能给神经网络对环境监测中做一些回顾和总结[1]。
1 网络方法类别
由于着重的角度关系,网络法会有多种不同的类别,由于神经网络是多个节点的连接,有相当多复杂的算法,基于神经网络,可以总共阐述两大类的情况,包括有管理和无管理的网络方法。关于这两种的不同点就在于它们是否需要对现有的样本进行训练。有管理的网络方法是需要训练,而无管理的网络方法是无需进行训练,它需要与其他的化合物相结合使用,里面会涉及到网络与遗传法、偏最小二乘法等分析方法来进行分析比较。另外根据网络的结构不同,也可以把网络方法给分成前向和后向的网络方法,而如果是从网络活动方式的差别,也可以将其分为随机和确定两种网络方法。
2 关于环境监测的化学方面的应用
在化学方面,国内与有很多用于化合物的一些研究,比如一些有机结构分析,还有化学反应、蛋白质结构等等的分析。在进行定量的构效关系分析中,可以把酿酒的酵母菌来作为一种模型的指示物,建立相关网络模型,然后对生物的毒性进行进一步预测,当然,在分析过程中还存在着很多的问题,通过比较一些网络模型,然后计算它们之间的权值,再筛选相出相应的参数,学者们在分析的时候也会对多层前传网络进行探讨分析,尽量减低误差,通过多方向的非线性校准,并且进行数据解析,然后表明引射能力,通过建立神经网络来不断接近规律的程度,拟定相关的指标数[2]。
3 分光光度的方法应用
在化学分析进程中,通过多元校正和分辨是相对来说较好的一种方法。随着相关方法的不断普及,目前大多数是使网络和现有的紫外光谱法相互关联,利用线性网络、BP网络等来用于多个分组的报道[3]。邓勃等[4]学者在分析的时候,认为除了人工神经网络,迭代目标转换因子的分析法相比较起来也是一种不错的选择,两种方法各有优势,并且产生的网络法的误差一般都不会很大。孙益民等专家在分析时,利用现有的人工神经网络先后侧出的光度法,并且可以测定比如铜、镍,并且这个分析方式非常的简单和方便[5]。
4 神经网络对X射线中的荧光光谱法的应用
研究人员通过神经网络建立与X射线荧光谱谱法的关系,通过多个不同的神经网络来应用,可以通过他们之间的连接来测定酸溶铝,通过神经网络的设置,可以测定里面的最低的铝值,通过神经网络与BP的网络模型的设立,可以直接输入测出来的铝含量情况,然后通过铝含量来侧出酸溶出来的铝的数值。BP模型可以结合现有的神经网络系统,充分的在现有的信息模型上应用,通过利用网络神经的结构,不仅可以做一些化学分析,还可以通过神经网络来检测环境监测中涉及到的红外谱图等的分析,这为环境分析提供了非常有意义的方向,并且给环境监测提供了新的检测方法[6]。
5 环境监测中的色谱法的研究
在关于色谱法的研究中,人工神经网络也有可以应用的方向[7]。色谱法中的小波分析,与人工神经网络的结合,小波分析的主要目的是为了得到重叠的色谱峰的信息,运用神经网络分析之后,可以在其中建立相关的模型,通过两者的结合来分开重叠的色谱峰信息,众所周知,把重叠色谱分开是一个非常复杂的工程,它们之间需要运用大量的元素来分开,效率极低,极其浪费时间。因为其内里复杂的重叠组织,而现在,人工神经网络为其分离提供了一种新的尝试[8],不仅如此,通过人工神经网络的方法不仅可以分离,而且可以在分离之后得到更加精确的色谱信息。研究工作者在模拟退火神经网络的时候,会运用药物来优化整个分离的条件,这对于提高色谱精确度也非常有效。
6 环境监测中的评价
通过之前提到的BP网络,通过介绍与人工神经网络模型的结合,来阐述了整个模型应用的原理,通过综合相关的分析方法可以对环境监测中的适用性进行分析评价,这样表现出来的结果会更加客观。研究者可以从有预测模型中表现的结果,在水库里进行抽样,提取水库中的相关元素进行预测,确认是否与实际结果一致,可以通过建立人工神经网络来对水质中的污染指数进行评价,然后得出相应的成果。
7 结语
人工神经网络在整个环境监测中有着非常重要的作用,它拥有一些比较有意义特性,总共可以总结为以下3个方面:第一,人工神经网络具有自学习的特性。可以通过大量的图像来设计,进行相关的图像识别,把不同的几个图像进行整合分析,并且把与之相互对应的结果嵌入到神经网络系统中,系统会根据自己特有的自学功能,对以后相关的图像进行识别操作,它可以给人们提供一些预测结果,甚至在未来的无论是经济还是政治等方面提供一些预测,预测经济和市场,给未来的发展提供引导。第二,系统具有可存储的特性。人工神经网络里面包含了一种反馈的功能,而通过输入信息和模型整合,联系不同元素之间的关系,得出一些可能的联想信息。最后,神经网络还有一项功能便是优化得出答案的能力。
一般问题的因果关系都会涉及到多个方面,那么如何在多个元素中抽丝剥茧,不断地优化整个系统,是神经网络的一个主要的功能,它可以通过计算来得到最优化的解,即便其中的运算量牵连的比较多,但是结合神经网络中反馈联想的功能,再包括计算机强大的运算效率,那么得到答案有时候也是比较容易的。
人工神经网络在环境监测中表现的效果比较好,但是除此之外,在其他领域,运用神经系统也可以得到一些相关的数据,比如经济领域,它可以通过建立信息模型,来进行市场预测和风险评估,这些都是很好的应用方式。在未来的实践中,随着经验的积累,神经网络的应用在环境监测中会不断地深入,通过在色谱、光度等领域的剖析,为未来的环境监测效果提供了更多的可能性。
参考文献
[1] 黄胜林.遗传优化神经网络在大坝变形监测中的应用[D].辽宁工程技术大学,2012.
[2] 熊勋.人工神经网络在环境质量评价和预测中的应用研究[D].华中科技大学,2009.
[3] 王学.无线传感器网络在远程环境监测中的应用[D].山东师范大学,2011.
[4] 武艺.人工神经网络在土壤质量监测中的应用[D].浙江海洋学院,2015.
[5] 黄湘君.基于主成分分析的BP神经网络在电力系统负荷预测中的应用[J].科技信息:科学・教研,2008(16):313-314.
[6] 李春梅,周骥平,颜景平.人工神经网络在机器人视觉中的应用[J].制造业自动化,2000(9):33-36,49.
[7] 涂晔,车文刚.BP神经网络在福利彩票预测中的应用[A].中国智能计算大会[C].2009.
[8] 李岩,韩秋,郑万仁.BP神经网络在电力需求决策中的应用[J].现代经济信息,2009(22):325-326.
篇4
【摘要】 目的:应用bp人工神经网络原理,设计一种类风湿关节炎疾病诊断的方法。方法:选用对类风湿关节炎敏感的8个指标,作为bp人工神经网络的输入数据,对样本进行训练和预测。结果:bp人工神经网络经通过对150例样本的运算,训练集的113例样本,训练正确率为97.4%;预测集的37例样本,预测正确率为91.9%。结论:bp人工神经网络能为类风湿关节炎作出较准确的诊断,能提高诊断的客观性。
【关键词】 人工神经网络; 类风湿关节炎; 预测
类风湿关节炎(rheumatoid arthritis ,ra)是一种以关节滑膜发生慢性炎性病变的自身免疫性疾病,其病程多呈进行性进展,致残率高,治愈率低下[1],早期临床表现不典型,单项自身抗体检测的灵敏度和特异性均有不足,类风湿因子的检出率也偏低,容易造成误诊[2,3]。因此医务人员主要是通过敏感性互补的几个检验指标和临床表现对类风湿关节炎作出诊断[4],但在疾病的诊断中往往带有很多的主观因素。近年来发展起来的人工神经网络是种理论化的数学模型,是模仿人脑神经的网络结构及其功能而建立起来的一种信息处理系统,具有自行学习、联想记忆、错误容纳和强大的非线性处理能力[5]。因此人工神经网络常常被应用到临床医学疾病的诊断上。本研究结合类风湿关节炎诊断的8个主要指标,设计一种基于人工神经网络类风湿关节炎的诊断方法,通过对150例样本的网络运算,探讨了人工神经网络对类风湿关节炎诊断的可行性。
1 人工神经网络基本原理
人工神经网络可以通过对外界信息的学习,以特定的方式对这些信息进行处理和概括,从而具备了对这些信息的识别功能,并产生了一个相对应的结论。因此,再次给人工神经网络这样一个相似的条件时,神经网络就会根据已学到的知识,自行推理判断,得到一个我们需要的结果。
1.1 人工神经元
人工神经元是组成人工神经网络的基本处理单元,简称为神经元。如图1显示了一个具有r个输入分量的人工神经元模型[6]。
图1中p(r=1,2,…,r) 为该神经元的输入数据;wr 为该神经元分别与各输入数据间的连接强度,称为连接权重,权重值的大小代表上一级神经元对下一级神经元的影响程度。b为该神经元的阈值,f(x)为作用于神经元的激励函数,通常采用的是s 型函数,其数学表达式见式(1)[7]:
f(x)=(1+e-qx)-1(1)
a为神经元的输出数据。神经元将接收信息pi与连接权重wi 的点乘积求和构成其总输入, 在神经元阈值b的作用下经函数f(x)的作用,产生信号输出a。
图1 人工神经元模型
1.2 人工神经网络
人工神经网络是由多个不同的神经元连接而成,一般含有多个层次,每个层次又包含了多个神经元,上一层次的神经元只能对下一层的神经元产生作用,同层神经元间无相互作用[7]。根据神经元的不同连接方式,就形成了不同功能的连接网络模型。比如bp神经网络,kohonen神经网络,hopfield神经网络等等,多达数十种。在医学中应用比较广泛的是bp神经(back propagation),也就是误差逆向传递网络[8],本研究中采用的也是bp神经网络。bp神经网络一般由输入层,隐含层和输出层构成,其结构模型如图2所示。
神经网络输入层的神经元是接受外界信息的端口,不包括数据运算功能,他将外界的输入数据通过一个连接权重传递给下一隐含层的神经元。隐含层是神经网络的核心部分,数量上可以有一个或多个层次,随着层次的增多,网络结构变得更复杂,网络数据处理功能也增强。网络的最后一层是输出层,输出层接收到隐含层的各项信息,然后经过转换把信息传给外界。
输入层 隐含层 输出层
图2 bp人工神经网络模型
1.3 人工神经网络工作原理
为了解决临床上对疾病的预测或识别等问题,神经网络主要是通过学习来获取"知识"或"经验"的,这一过程总体上可分为训练和预测两个阶段。所谓训练就是形成一种病因与疾病之间的函数映射关系,即给定一个实际输出与期望输出的目标误差值,将病人的各种病因、实验室检查、影像超声检查、临床表现等作为网络的输入信息加到其输入端,输入信息经过隐含层神经元的处理后,传递给输出层。如果输出层得到的结果大于预先给定的误差目标值时,神经网络将这种误差信号沿原来的传递路线逐层返回,并调节各个层次间神经元连接的权重值,这种过程不断交替进行,直到误差达到目标值时,训练过程结束。经过训练可使疾病的各种情况分布到连接权上, 使学习后的网络权重值存储了临床症状和疾病类型等相关的知识,此时可以认为神经网络建立起了病人的各种因素与该病人是否患有某种疾病的映射关系,这种映射关系就是一个预测疾病的判别函数。预测就是检验判别函数的可靠程度,利用一些未包括在训练集中的样本构成预测集,将预测集中与疾病相关的数据输入到训练好的网络中去,在训练阶段所得到的判别函数的作用下,就可以得到一个测试结果,从网络的输出端就可以诊断病人是否为疾病患者。
2 人工神经网络诊断类风湿关节炎实例
2.1 病例选取及变量确定
实验数据来源于哈尔滨医科大学附属医院,总共有150例。其中类风湿关节炎患者83例,女71例,占85.5%;男12例,占14.5%。年龄范围为20~79岁,平均年龄为48.92岁。所有患者均符合1987年美国风湿病协会修订的类风湿关节炎诊断标准。用来作正常对照的有67例,其中女62例,占92.5%;男5例,占%7.5,年龄范围为18~79岁,平均年龄为43.63岁。病人资料主要包括临床症状与体征,相关实验室检查,相应影像学检查。
根据中华医学会风湿病学分会制定的类风湿关节炎诊断指南,典型的类风湿关节炎按照1987年美国风湿病协会修订的类风湿关节炎诊断标准来诊断并不困难,但某些不典型、早期类风湿关节炎,常常被误诊或漏诊。2008年,胡勇等[9]通过研究发现,抗ccp抗体对类风湿关节炎的敏感性和特异性分别为80.0%和93.7 %,联合抗ccp抗体和rf可以提高诊断的准确性,对类风湿关节炎的早期诊断有重要意义。因此为了提高神经网络诊断各种类型类风湿关节炎的准确率,我们选取了x1(关节晨僵)、x2(对称性关节炎)、x3(腕、掌指或者近端指间关节至少有一个关节肿)、x4(3个或者3个以上关节部位肿)、x5(关节x线改变)、x6(皮下结节)、x7(rf )和x8(抗ccp抗体)这8个指标来作为神经网络运算的输入数据。其中x1、x2、x3、x4、x5、x6和x7这几个输入数据是1987年美国风湿病协会修订的类风湿关节炎诊断标准所包含的内容,x8是为了提高对不典型、早期类风湿关节炎的诊断所采用的输入数据。上述x1、x2、x3、x4、x5、x6是定性变量(离散变量),临床上常用阳性和阴性来描述,实验中用1和0对这些变量进行赋值,当变量值为1时表示阳性,为0时表示阴性;而变量x7、x8是定量变量(连续变量),用原始数据来描述。
2.2 确定训练样本及预测样本
在以上150例样本中(83例类风湿关节炎和67例正常对照)中分别选取63例类风湿关节炎和50例正常对照的样本,用来组成训练集,并用1~113的数字对其进行顺序编号,1~63号代表是类风湿关节炎,64~113号代表的是正常对照组的样本。剩余的样本用来组成预测集,集中样本总数为37例,其中类风湿关节炎患者有20例,正常对照组有17例,也用同样的方法进行编号。训练集与预测集样本比例大约为4:1。
2.3 网络参数的设定及算法程序
首先对神经网络参数设定如下:输入神经元个数为8,输出神经元个数为1,期望目标输出值用0表示正常,用1表示类风湿关节炎,隐含层采用tansig函数。训练次数为6000次,训练目标为0.06,学习速度为0.05,网络连接权重初始值是[-1,1]之间的随机数,其次网络进行运算所采用的是批动量梯度下降算法,应用matlab6.5来编写该程序算法。
2.4 训练及预测结果
将训练集样本的8个指标输入到bp网络的算法程序中,网络经过500次的训练后,达到了训练目标的要求,训练结果如图3所示,预测输出以0.5为阈值,>0.5者为类风湿关节炎患者,<0.5者为正常对照样本。
图3 113例样本训练结果从训练得到的图形可以看出,63例类风湿关节炎患者中有54例训练结果都在目标输出值1附近,而且非常靠近1。只有9例稍微偏离了目标输出值1,由于输出结果均在0.5~1.5的范围内,可以认为训练结果与实际相吻合。类似的在50例正常对照组中,有47例输出结果都在目标值0的附近,输出值都在0~0.5之间,训练结果与实际也相吻合。而编号为64、75、92的3例样本,其输出值大于0.5,明显大于目标输出值0,样本训练结果有错误。综上所述,训练集中113例样本有110训练正确,训练正确率达到97.4%。
经过训练可以得到一个能反映类风湿关节炎疾病情况的神经网络模型。把预测集样本的数据导入到训练好的神经网络中去,进行预测,预测的结果如图4。
图4 37例样本预测结果从上图的输出结果可以看出,在20例类风湿关节炎样本的预测中,19例样本的输出结果主要集中在目标输出值1附近,没有超出0.5~1.5的范围,可以视为预测结果与实际相符合,而编号为1的样本,其输出值小于0.5,偏离了目标输出值1,预测结果错误。另外17例正常对照组中,15例预测结果与实际相符合,而编号为27、33号的样本其输出值大于0.5,明显偏离目标输出值0,预测不正确。所以对于预测的总体样本来说,34例预测正确,准确率为91.9%,灵敏度为94.7%,特异度为86.7%。
训练集和预测集的样本,经bp神经网络运算,其结果如表1所示。表1 bp神经网络测试样本的计算结果
3 讨论
由表1可知,2例预测有误的样本,它们来源于预测集的正常对照组中。同样在训练阶段,运算有误的3例样本也全都来源于训练集的正常对照组中。由此可见,运算有误的样本在训练集和预测集之间存在一种对应关系,即神经网络对样本训练的错误率越高,其预测的准确率就越低。同时,一些样本的训练和预测结果也出现了较大范围的波动,没有集中在目标值为1和0的这两条直线上。出现这种结果的原因可能是:有些样本数据偏倚,训练样本总数又不是很多,从而导致这些数据偏倚的样本所占的比例较大,在总体中表现出来的作用也就较强。因此加大训练样本的数量,选择数据偏倚较少或者更有代表性的样本来学习训练,神经网络就能更准确的反映疾病自身情况,同时网络所包含的病因与疾病间相映射的函数关系也就更具有普遍性。
对疾病诊断过程而言,人工神经网络能够模拟专家级医师诊断疾病的思维过程和获得诊断疾病的相关知识。此后对疾病进行预测时就可以避免医师对疾病诊断的主观性及思维定势,因此能提高疾病诊断的客观性。尽管临床上也存在一些疾病患者,往往因为诊断数据的缺失,给医师诊断带来了很多的困难或是误诊,然而神经网络具有的容错性质以及能根据训练得来的知识和处理问题的经验,对上述缺失的数据等这种复杂的问题,做出合理的判断与推理,从而为病人做出较正确的诊断。
在疾病诊断方面, 按照1987年美国风湿病协会修订的类风湿关节炎诊断标准,对一些不典型,早期的类风湿关节炎常常不能作出正确的诊断,特异性也低,往往造成误诊。然而基于人工神经网络类风湿关节炎的诊断方法,通过对37例样本的预测,预测结果表明:本方法对类风湿关节炎的诊断,其准确率为91.9%,灵敏度为94.7%,特异度为86.7%,可作为疾病诊断的一种新方法。当然,实验中也存在一些问题有待于进一步研究,如输入变量的选择及其数据处理,网络初始权重的计算,网络训练的最佳原则,隐含层数的设计等等。随着研究的进一步深入,人工神经网络必将得到临床工作者的认同并为疾病研究带来诸多的便利。
【参考文献】
1 顾福荣,张义东,施锦杰.抗ccp抗体、抗ra33抗体、抗sa 抗体和rf联合检测对类风湿性关节炎诊断的意义.江西医学检验,2007,25(1):24~25.
2 matsuo k,xiang y,nakamura h,et al.identification of novel eitrullinated autoantigens of synovium in rheumatoid arthritis using a proteomie approach.arthritis res ther,2006,8(6):1~3.
3 harrison mj,paget sa. anti2ccp antibody testing as a diagnostic and prognostic tool in rheumatoid arthritis.qjm,2007,100(4):193~201.
4 王青青.类风湿性关节炎的诊断与治疗.全科医学临床与教育.2008,6(2):92~94.
5 孙文恒,王炜,周文策.人工神经网络技术在胰腺癌诊断中的应用.兰州大学学报,2008,44(7):224~227.
6 宋烨,杨本付,人工神经网络及其在疾病诊断中的应用,中华医学实践杂志,2006,5(3):275~277.
7 王俊杰,陈景武.bp神经网络在疾病预测中的应用.理理医药学杂志,2005,21(3):259~262.
篇5
【关键词】神经网络 手写 识别系统 应用
随着计算机技术的快速发展,其在人们的办公学习和日常生活成了不可替代的工具。键盘已经几乎完全替代了笔在人们生活中的地位,随之而来的后果就是人们越来越少的区书写汉字,导致越来越多的中国人甚至都忘记了汉字该如何书写,这种现象在很多研究和报道中都有体现。计算机和键盘是由西方国家发明的,其符合西方国家的语言习惯,对于中国人来说,用字母、符号去完成方块汉字的输入就需要使用者非常熟悉汉语拼音或者五笔编码,对于文化程度较低的使用者来说,这些都限制着他们使用计算机。鉴于计算机键盘的这些缺陷,联机手写输入法应运而生,这为计算机的输入带来了新的发展机遇和挑战。
1 联机汉字手写识别的意义及难点
联机汉字识别是用书写板代替传统纸张,笔尖通过数字化书写板的轨迹通过采样系统按时间先后发送到计算机中,计算机则自动的完成汉字的识别和显示。
1.1 联机汉字手写识别的意义
联机手写汉字识别的诞生具有非常重要的意义。首先这种输入方法延续了几千年中华文明的写字习惯,实现用户的手写输入,对于长时间不提笔写字的用户来说能够加强其对汉字书写方面的认识,防止“提笔忘字”现象的继续恶化。其次,手写汉字输入不需要学习和记忆计算机的汉字编码规则,其完全符合中国人的写字习惯,使人机之间的交流更人性化,更方便快捷。另外,随着移动智能终端的不断普及,联机汉字手写识别的应用范围将进一步扩大,以适用于不同层次人群对信息输入的需要,具有较大的市场发展前景。
1.2 联机手写汉字识别问题的难点
手写汉字识别是光学字符读出器中最难的部分,也是其最终的目标,手写汉字识别的应用主要依赖于其正确识别率和识别速度[1]。手写汉字识别系统的问题具有其特殊性:
(1)中国汉字量大。我国目前的常用汉字大概在4000个左右,在实际应用中的汉字识别系统应该能够完全识别这些常用的字才能够满足需要,由于超大的汉字量,使得手写识别的正确率和识别速度一直不高。
(2)字体多,结构复杂。汉字的手写字体丰富多彩,且汉字的笔画繁多,以及复杂的结构,再加上汉字中的形近字颇多,这些都为汉字识别系统的发展造成了很大的困难。
(3)书写变化大。不同用户在进行手写输入时其字体的变化是很大的,这种变化因人而异,对汉字识别造成了很大的干扰,增加了汉字匹配的难度。
2 人工神经网络概述
人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,通常简称为神经网络,是一种仿生物神经的信号处理模型。在二十世纪四十年代初人们开始进行神经网络的研究,经过几十年的发展,神经网络也产生了一系列的突破,目前应用最多的是Hopfield模型和BP算法。
神经网络的一般模型一般包括十个方面:环境、处理单元、传播规则、神经网络的状态、互联模式、稳定状态、操作模式、活跃规则、活化函数和学习算法。其中,神经元、互联模式、学习算法是神经网络模型中的三个关键因素。神经网络的一个重要内容就是学习,其学习方式可以分为监督学习和无监督学习,其学习过程一般遵循Hebb规则,误差修正学习算法以及胜者为王的学习规则,其中Hebb规则是神经网络学习中最基本的规则。
人工神经网络具有独特的优越性。首先其具有主动学习的功能,在汉字识别过程中,先将汉字模板及可能的识别结果输入到神经网络中,神经网络能够通过其自身的学习过程来实现对汉字的识别,自学功能对于神经网络的预测功能具有非常重要的意义。其次,神经网络系统具有联想存储功能,其反馈功能能够实现这种联想。另外,通过计算机的高速运算能力,神经网络具有高速寻找优化解的能力。
3 人工神经网络在联机手写识别系统中的应用
汉字识别属于大类别模式识别,人工神经网络可以通过函数逼近、数据分类、数据聚类三种作用方式以及“联想”的特殊模式对汉字进行识别。Hopfield神经网络作为反馈网络的一种,其自联想记忆网络可以使系统不需要通过大量的训练即可对汉字进行识别,因此Hopfield神经网络对于汉字识别来说具有独特的优势。其中的离散型Hopfield神经网络能够通过串行异步和并行同步的工作方式,使其反馈过程具有非常好的稳定性,而网络只有通过不断的演变稳定在某一吸引子状态时,才能够实现正确的联想。
联机手写识别可以分为训练阶段和识别阶段。训练阶段流程依次为:标准书写字符图像预处理,提取特征并建立特征库,建立Hopfield网络模型,训练网络,保存权值。识别阶段的流程为:坐标序列转化为bmp图像,预处理测试样本,提取特征,送入网络运行,运行网络到平衡状态,分析结果值。根据联机手写识别的工作流程以及Hopfield网络模型的理论,基于Hopfield神经网络的联机手写识别系统在Matlab环境下得到了仿真模拟,效果非常理想。
4 总结
手写识别系统能够弥补普通键盘的不足,在提高汉字书写频率的同时,能够满足不同层次人群对计算机应用的技术需要。基于Hopfield神经网络的联机手写识别系统一起自身独特的性能,不仅能够满足手写汉字识别的正确率,而且其识别过程速度非常快。因此它对于实现联机手写识别以及图像识别具有非常重要的意义。
参考文献
[1]俞庆英.联机手写汉字识别系统的研究与实现[D].安徽大学,2005(5).
[2]郭力宾.交叉点的神经网络识别及联机手写字符的概率神经网络识别初探[D].大连理工大学,2003(03).
[3]赵蓉.基于神经网络的联机手写识别系统研究与实现[D].西安电子科技大学,2011(01).
篇6
关键词:类风湿关节炎;自身抗体;人工神经网络;ROC;循证医学
美国风湿病学学会(ACR)和欧洲抗风湿病联盟(EULAR)2009年关于类风湿关节炎(RA)分类标准将类风湿因子(RF)和抗环瓜氨酸肽抗体(CCP-AB)作为重要的血清学指标。近年的研究表明,CCP-AB等抗体具有早期诊断的意义,在类风湿关节炎典型症状出现之前干预治疗至关重要。然而对于这些血清学指标的认识仅仅从串联或并联分析是不够的, 不同的医师给出的诊断意见差异很大。有些自身抗体滴度的高低与疾病具有很强的相关性,因此弄清楚血清学指标与RA的数量关系非常必要。
1 资料与方法
1.1一般资料 回顾分析泸州医学院附属医院和泸州市第二人民医院2012年9月~2014年9月所有CCP-AB、RF、ANA和ENA自身抗体谱检验数据,共计24694例,其中住院病例13241例,门诊 11453 例。CCP-AB检测573 例,ENA抗体谱9575例,RF检测14536例。通过电子病历查阅个病例的最后诊断。
1.2类风湿关节炎诊断标准 ACR/EULAR2009年的类风湿关节炎诊断标准。
1.3方法 检测方法 CCP-AB为酶联免疫吸附试验(ELISA),RF为免疫比浊法,ANA为免疫荧光法,ENA为免疫印迹法。
1.4人工神经网络模型 输入节点:CCP-AB(S/co值)、RF(IU/ML)、ANA(0/阴性,0.5/±,1/+,2/++,3/+++)。输出节点:1/类风湿关节炎、0/非类风湿关节炎。仿真预测值:-1~2。
1.5统计学处理 SPSS19.0统计软件,ROC分析,输出ROC数据集,并扩展计算出阳性预测值、漏诊率和误诊率。
2 结果
2.1血清学实验的ROC分析 各项指标的ROC曲线和AUC见图1,表1。
2.2诊断阈值 对诊断类风湿关节炎有统计学意义的CCP-ab、RF和ANA三项血清学指标确定了漏诊率和误诊率最小的诊断阈值(CUT OFF)、灵敏度、特异性、阳性预测值见表2。
2.3人工神经网络模型 CCP-AB 、RF 和ANA三项指标联合建立人工神经网络诊断类风湿关节炎模型的ROC曲线见图2,AUC=0.993,标准误=0.007,渐进 Sig.b=0。渐近 95% 置信区间为0.98~1.00。ROC扩展数据集见表3。
2.4ANN模型验证 应用双盲法验证:将120个验证病例的CCP-AB、RF和ANA检测结果输入ANN模型运算输出ANN预测值,将预测值CUT OFF设置为0.35(≥0.35为阳性),与临床诊断的符合率为99.60%。诊断灵敏度99.10%,诊断特异性98.7%。
3 讨论
类风湿关节炎是一种自身免疫性疾病,自身抗体检测是最重要的诊断依据。回顾分析说明,其中CCP-AB、RF和ANA三项检测是很好的诊断指标,其AUC在0.75以上。所以对于类风湿关节炎的实验诊断这三项已经具有很好的诊断意义。CCP-AB的AUC达到0.9以上,而且出现在早期病例中。
关于多项实验室指标的联合分析报道很多[1],然而都采用了简单的串联分析或并联分析,只关注其单项指标的定性结果,忽略了检测物质量与疾病的关系。将CCP-AB、RF和ANA三项指标检测结果联合建立人工神经网络诊断模型,不仅提高了诊断的准确度,从AUC比任意单项指标高很多。控制误诊和漏诊有据可循。对于同一个医疗组的统一判断检验结果提供了参考。人工神经网络模型利用OFFICE插件,容易调用,计算方便,容易保存。
篇7
关键词:农村电力;BP算法;人工神经网络;回归分析
中图分类号:TM855文献标识码:A
文章编号:1009-2374 (2010)22-0138-03
0引言
农村用电具有很大的不确定性,农村电力短期负荷预测研究对农村电力系统的安全及农业安全生产有十分重要的意义。基于短期负荷预测研究理论和方法已做了大量预测研究,提出了很多方法,大致可以分为两类:一类是以时间序列法为代表的传统方法,如时间序列法等,这些方法算法简单,速度快,应用广泛,但由于其本质上都是线性模型方法,因此存在着很多缺点和局限性,无法真实地反映农村电力系统不同负荷模型的非线性特性;另一类是以人工神经网络为代表的新型人工智能方法,神经网络具有并行分布信息和自学习及任意逼近连续函数的能力,能够捕获农村电力短期负荷的各种变化趋势。BP网络需要大量历史数据进行训练,且学习及处理不确定性和人工信息的能力较差。人工逻辑系统适用于处理不确定性、不精确性及噪声引起的问题。实践证明,将BP算法和神经网络融合的人工神经网络能发挥各自的优势,克服各自的不足是一种有效的方法。
1农村电力短期负荷预测研究算法
基于负荷预测方法主要有回归分析法、时间序列法、指数平滑法、灰色模型法、专家系统法、人工神经网络法、小波分析预测技术和数据挖掘理论等。
1.1回归分析法
回归分析法是研究变量与变量之间的一种数学方法。在回归分析中,自变量是随机变量,因变量是非随机变量,由给定的多组自变量和因变量资料,研究各自变量和因变量之间的关系,形成回归方程,求解回归方程后,给定各自变量数值,即可求出因变量值。回归分析法根据历史数据和一些影响负荷变化的因素变量来推断将来时刻的负荷值。回归分析法的特点是:原理、结构简单,预测速度快,外推特性好,对于历史上未出现过的情况有较好的预测值。
1.2灰色模型法
灰色系统理论将一切随机变化量看作是在一定范围内变化的灰色量。常用累加生成(AGO)和累减生成(IAGO)的方法将杂乱无章的原始数据整理成规律性较强的生成数据列。用灰色模型(GM)的微分方程作为农村电力系统单一指标(如负荷)的预测时,求解微分方程的时间响应函数表达式即为所求的灰色预测模型,对模型的精度和可信度进行校验并修正后即可据此模型预测未来的负荷。
1.3专家系统法
专家系统是依据专门从事短期负荷预测的技术人员提供的经验,总结出一系列的规则,并建立相应的历史负荷和天气的数据库,利用if-then规则对待预测日的负荷进行估计。由于专家系统将天气条件作为一个重要因素引入预测模型,因而预测的结果更为令人满意。专家系统预测的优点在于较好的解决了天气等因素对负荷的影响,有力的克服了时间序列法不能处理数据序列中出现大扰动的情况。但是这种方法过分依赖规则,如果没有一系列成熟的规则负荷预测就无法进行,而规则本身不具有普遍适应性,预测模型不能推广到所有的系统,这正是专家系统存在的弱点。
1.4人工神经网络法
人工神经网络方法是90年代以来发展起来的新方法,用人工神经网络进行负荷预测是农村电力系统负荷预测的一个新发展方向。人工神经网络法利用人工神经网络(ANN),选取过去一段时间的负荷作为训练样本,然后构造适宜的网络结构,用某种训练算法对网络进行训练,使其满足精度要求之后,用ANN作负荷预测。一般而言,ANN应用于短期负荷预测要比应用于中长期负荷预测更为适宜,因为短期负荷变化可以认为是一个平稳随机过程,而长期负荷预测与国家或地区的政治、经济政策等因素密切相关,通常会有些大的波动,而并非是一个平稳随机过程。目前用人工神经网络进行负荷预测还存在一些问题,比如模型结构的确定,输入变量的选取,人工神经网络的学习时间较长等问题。但它仍具有许多其他方法所不能比拟的优点,例如:良好的函数逼近能力,通过对样本的学习,能够很好的反映对象的输入/输出之间复杂的非线性关系。因此人工神经网络受到许多学者的高度评价。
1.5小波分析预测技术
小波分析是Fourie分析深入发展过程中的一个新的里程碑,是本世纪数学研究成果中最杰出的代表,已成为众多学科共同关注的热点。一方面,小波分析发扬了Foufie分析的优点,克服了Fourie分析的某些缺点;另一方面,小波分析现在已经被广泛应用于信号处理、图像处理、量子场论、语言识别与合成、地震预报、机器视觉、机械故障诊断与监控、数字通信与传输等众多领域。原则上讲,凡是传统方法中采用Fourier分析的地方,基本上都可以用小波分析来取代,而且其应用结果会得到深化和发展,因此小波分析作为一种多方面运用的数学工具,具有巨大的潜力和广泛的应用前景。
农村电力系统中曰负荷曲线具有特殊的周期性,负荷以天、周、年为周期发生波动,大周期中嵌套小周期。而小波分析是一种时域或频域分析方法,它在时域和频域上同时具有良好的局部化性质,并且能根据信号频率高低自动调节采样的疏密,容易捕捉和分析微弱信号以及信号、图像精细的采样步长,从而可以聚焦到信号的任意细节,尤其是对奇异信号很敏感,能很好的处理微弱或突变的信号,其目标是将一个信号的信息转化成小波系数,可以方便的处理、存储、传递、分析或被用于重建原始信号,这些优点决定了小波分析可以有效地应用于负荷预测问题的研究。
1.6模糊预测法(FUZZY)
FUZZY预测,是近几年来在农村电力系统负荷预测中不断出现的一种预测方法,将FUZZY方法引入的原因是,农村电力系统中存在着大量的模糊信息,如负荷预测中的关键因素气象状况的评判、负荷的日期类型的划分等信息,都是模糊的。常规方法就是采用统计和经验相结合的方法予以处理,这给负荷预测引入了不科学因素,并且与自动化要求相矛盾,而FUZZY方法正是破解这些模糊信息的钥匙。从实际应用来看,单纯的FUZZY方法对于负荷预测的精度往往是不尽人意的,主要因为FUZZY预测没有学习能力,这一点对于不断变化的农村电力系统而言,是极为不利的。
2农村电力短期负荷预测研究与实现
2.1人工神经网络原理
人工神经网络是一种“采用物理可实现的系统来模仿人脑神经细胞的结构和功能的系统。”人工神经网络是最近发展起来的十分热门的交叉学科,它涉及生物、电子、计算机、数学和物理学科,有着非常广泛的应用背景,这门学科的发展对日前和末来的科学技术的发展有重要的影响。二维的简单人工神经网络按网络拓扑结构可分为两类:前馈型网络和反馈型网络。反馈型网络模型是一种反馈动力学系统,它具有极复杂的动力学特性。反馈神经网络模型可以用完备的无向图表示,代表性的模型包括;Hopfield网络模型和Hamming网络模型。反馈神经网络模型有很强的计算能力。前馈神经网络模型是指那些在网络中各处理单元之间的连接都是单向的,而且总是指向网络输出方向的网络模型。
2.2BP人工神经网络算法
基于BP网络学习规则的指导思想:对网络权值和阈值的修正要沿着表现函数下降最快的方向――负梯度方向。
xk+1=xk-akgk (1)
其中xk是当前的权值和阈值矩阵,gk是当前表现函数的梯度,ak是学习速度。假设三层BP网络,输入节点,隐层节点,输出节点。输入节点与隐层节点间的网络权值为,隐层节点与输出节点间的网络权值为。当输出节点的期望值为时,模型的计算公式如下:
隐层节点的输出:
yj=f(wjixi-θj )=f (netj) (2)
其中netj=wjixi-θj (3)
输出节点的计算输出:
zl=f(vljyj-θl)=f (netl) (4)
其中netl=vlj yj-θl (5)
输出节点的误差:
E=(tl-zl)2=(tl-f(vljyj-θl))2
=(tl-f(vljf(wjixi-θj)-θl))2 (6)
E=(tI-zi)2=(tI-zi)
2.3误差函数对输出节点求导
=・=・ (7)
E是多个zk的函数。但有一个zk与vlj有关,各zk间相互独立,其中:
=[-2(tk-zk)・]=-(tl-zl) (8)
=・=f '(netl)・yj (9)
则=-(tl-zl)・f '(netl)・yj (10)
设输入节点误差为δl=(tl-zl)・f '(netl) (11)
则=-δl・yj (12)
2.4误差函数对隐层节点求导
=・・ (13)
E是多个zl的函数,针对某一个wji,对应一个yj,它与所有zl有关,其中:
=[-2(tk-zk)・]=-(tl-zl) (14)
=・=f '(netl)・(-1)=f '(netl)・vlj (15)
=・=f '(netl)・xi (16)
则=-(tl-zl)・f '(netl)・vlj・f '(netj)・xi=δlvlj・f '(netj)・xi(17)
设隐层节点误差为δj'=f '(netj)・δlvlj (18)
则:=-δj'xi (19)
由于权值的修正Δvlj,Δwji正比于误差函数沿梯度下降,则有:
Δwji=-η'=η'δj'xi (20)
vlj(k+1)=vlj(k)+Δvlj=vlj(k)+ηδlyj (21)
δl=-(tl-zl)・f '(netl) (22)
Δθl=η=ηδl (23)
wji(k+1)=wji(k)+Δwji=wji(k)+η'δj'xi (24)
δj′=f '(netj)・δlvlj (25)
其中隐层节点误差δj′中的δlvlj表示输出节点的zl的误差δl通过权值vlj向节点yj反向传播成为隐层节点的误差。
2.5 阈值θ也是变化值,在修正权值的同时也需要修正,原理同权值修正一样误差函数对输出节点阈值求导
=・ (26)
其中=-(tl-zl) (27)
=・=f '(netl)・(-1)=-f '(netl) (28)
则=(tl-zl)・f '(netl)=δl (29)
阈值修正Δθl=η=ηδl (30)
θl(k+1)=θl(k)+ηδl (31)
误差函数对隐层节点阈值求导=・・(32)
其中=-(tl-zl) (33)
=f '(netl)・vlj (34)
=・=f '(netj)・(-1)=-f '(netj) (35)
则=(tl-zl)・f '(netl)・vlj・f '(netj)=δlvlj・f '(netj)=δj' (36)
阈值修正Δθj=η' =η'δj' (37)
θj(k+1)=θj(k)+η'δ'j (38)
2.6传递函数f(x)的导数S型函数
f (x)=,则f ' (x)=f (x)・(1-f (x)) (39)
f ' (netk)=f (netk)・(1-f (netk)) (40)
对输出节点zl=f (netj) (41)
f ' (netj)=zl・(1-zl) (42)
对输出节点yj= f (netj) (43)
f ' (netj)=yj・(1-yj) (44)
3结语
基于一种新的基于人工神经网络在农村电力短期负荷预测研究。针对BP算法中存在的收敛速度慢、易陷入局部最小值的问题,可采用附加动量法和自适应学习速率法在一定程度上解决这些问题。附加动量法是在BP算法的基础上,在每个权值变化上加上一项正比于上一次权值变化量的值,并根据BP算法来产生新的权值变化,利用附加动量法可能会避开某些局部最小值。自适应学习速率法是在学习过程中不断修正学习速率,有利于提高学习效率,缩短学习时间。
参考文献
[1] 刘光中,颜科琦.组合神经网络模型对电力需求的预测[J].数量经济技术经济研究,2003,(1)
篇8
摘要:旅游需求的预测预报研究一直是旅游学研究的一个重要课题。本文在对到访澳门地区中国内地游客量分析的基础上,运用人工神经网络(ANN)的理论和方法,构建了ANN模型分析中的3层BP模型,以澳门近10年(1996-20__)入境来访的中国内地旅游人数为例进行模型验证,模拟结果表明,BP神经网络预测的结果能够高程度的吻合原始数据,在旅游市场预测中,BP神经网络预测是一种有效的预测方法。一.问题的提出与分析近年来,对澳门地区的旅游业来说,中国内地旅客是旅游收入的主要来源。目前旅游业已成为澳门地区经济发展特别是第二产业发展的支柱。建立科学的可操作的旅游预测模型是实现澳门地区旅游业持续健康稳定发展的理论基石和前提。由于影响某地旅游人数的因素各异,还不存在普遍适用的神经网络模型。基于此,本文拟用3层BP神经网络模型来仿真模拟分析和预测澳门地区旅游需求,以此为旅游需求预测提供一种新的方法。二.模型的假设与符号说明1.基本假设1)交通在旅游中通常不是重要的,为了研究的方便(主要是无法获得交通数据),把交通这个影响忽略。2)假设澳门的接待能力都满足需求。3)在本例旅游需求预测模型中,我们考虑的主要因素有:客源地的人口,客源地的总收入,客源地的消费水平,旅游目的地的生活水平。4)为了研究的方便,假定以上四因子之间相互独立,本例旅游需求即为上述四因子的函数,即y=f(GDI,POP,GDE,M-GP)。就用这四个因素作为人工神经网络模型输入层的神经元。2.符号说明T澳门内地游客量GDI中国内地国民总收入POP中国内地人口总数GDE中国内地国民消费水平M-GP澳门生产总值三.模型的建立与求解1.人工神经网络模型理论原理
人工神经网络(ArtificialNeuralNetwork)是由大量的、简单元件(神经元)广泛相互联结而成的非线性的、动态的复杂网络信息处理系统,它是在现代神经学研究成果基础上提出的,能模拟人脑的若干基本功能[1]。它具有并行分布的信息处理结构,可以通过“自学习”或“训练”的方式完成某一特定的工作。它可以从积累的工作案例中学习知识,尽可能多地把各种定性或定量的因素作为变量加以输入,从而建立各种影响因素与结论之间的高度非线性映射,采用自适应模式识别方法来完成预测工作[2]。人工神经网络模型尤其是对处理内部规律不甚了解、不能用一组规则或方程进行描述的复杂的、开放的非线性系统显得较为优越。人工神经网络模型一般由处理单元、激活状态、单元输出、连接模式、激活规则、学习规则等6个部分组成。一个多层神经网络中包含有很多个信息处理单元,分布于不同的层次中。根据每项输入和相应的权重获取一个综合信号,当信号超过阈值则激活神经元而产生输出。各类影响因素和最终输出结果之间可以假定存在一种映射,即输出结果=F(影响因素)。为了寻求最佳的映射关系F,将训练样本集合和输入、输出转化为一种非线性关系,通过对简单非线性函数的复合,从而建立一个高度的非线性映射关系F,最终实现输出值的最优逼近[3]。在人工神经网络的实际应用中,80~90的人工神经网络是采用前馈反向传播网络(back-propagation-network,简称BP网络)或它的变化形式。BP神经网络(如图一)是一种单项传播的多层前向神经网络,分为输入层、隐含层和输出层,层与层之间采用全连接方式,同一层单元之间不存在相互连接。它是前向网络的核心部分,体现了人工神经网络最精华的部分[4]。标准的BP网络是根据W-H学习规则,采用梯度下降算法,对非线性可微函数进行权值训练的多层网络。图一:BP神经网络的每一层的权值通过学习来调节,其基本处理单元为非线性输入-输出关系,选用S型作用函数:其中:xj为该神经元第i个输入;wij为前一层第i个神经元至该神经元j的连接权值,i=0时的权值为阈值。其计算步骤如下:(1)给定一组随机的权值和阈值初始值及步长系数η与势态因子α;(2)取学习样本数据,根据学习样本、权值及阀值计算输出,并与学习期望输出比较,当误差满足要求时结束训练,否则将误差向后逐层传播,并修正各层连接权值,调整公式为:其中:k取j结点所在层的前一层所有结点。5)澳门内地旅客人数神经网络模型的建立(一)BP网络设计网络设计是一个综合性问题,它应满足多种不同要求,例如,希望所涉及的网络有较好的推理能力,易于硬件实现,训练速度快等,其中有较好的推理能力是最主要的。一般来说,推广能力决定于3个主要因素,即问题本身的复杂程度、网络结构以及样本量大小。在一般情况下,旅游需求预测研究中样本的数量是一定的,因此可归结为在样本量一定的情况下,如何选择网络规模的问题。在进行BP网络预测模型设计中,我们主要考虑以下因素:网络的层数、每层中的神经元个数、初始值的选择、学习速率和期望误差。i)网络的层数已证明:具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数。所以,本文选择一个3层的BP网络。ii)每层中神经元的个数输入层和输出层神经元的个数根据解决具体问题的复杂程度而定。为了提高网络训练的精度,可以通过采用一个隐含层,再加上1到2个神经元以加快误差的下降速度即可。因此,本文输入层神经元个数选择为4个,隐含层神经元个数分别选择了9、12、15个,输出层神经元个数选择为1个。iii)初始值的选择由于人工神经网络是一个非线性系统,初始值的选择对于网络学习是否达到局部最小、是否能够收敛以及训练时间的长短都有较大影响。在初始值的选择上一般是使经过初始值加权后的每个神经元的输出值都接近零,这样可以保证每一个神经元的连接权值都能够在它们的S型激活函数变化最大处进行调解。所以,初始值一般选择在(-1,1)之间的随机数。本文的初始值为默认值。iv)学习速率对于任何一个网络都对应一个合适的学习速率。学习速率决定每一次循环训练中所产生的权值的变化量。大的学习速率可以导致网络的不稳定,但是小的学习速率又会导致训练时间延长,收敛速度较慢,不能保证网络的误差能最终趋于最小。综合上述考虑,在学习速率的选择上倾向于选择较小的学习速率以保证网络的稳定性,本文选择的学习速率为0.01。v)期望误差值期望误差值的确定也是通过网络对不同误差值分别进行训练比较后确定的最适合值。所谓的最适合值是相对于所需要的隐含层的节点数来确定的,一个较小的误差值的获得需要增加隐含层的节点以及训练时间。本文经过不断测试,选择0.0001为期望误差值。(二)1.网络训练模式的选择训练网络有两类模式:逐变模式和批变模式。在逐变模式中,每一个输入被作用于网络后,权重和偏置量被更新一次。在批变模式中,所有的输入被应用于网络后,权重和偏置量才被更新 一次。使用批变模式不需要为每一层的权重和偏置量设定训练函数,而只需为整个网络制定一个训练函数,使用起来相对方便,因此,本文在进行网络训练时采用批变模式。表格一:年度
澳门的内地游客量(T)(千人)中国内地国民总收入(GDI)(亿元)中国内地人口数(POP)(万人)中国内地居民消费水平(GDE)(元)澳门生产总值(M-GP)(亿美元)1996604.270142.5122389278966.31997529.877653.1123626300266.71998816.883024.3124761315961.919991645.288189.0125786334659.220__2274.798000.5126743363261.020__3005.7108068.2127627386961.920__4240.4119095.7128453410668.220__5742.0135174.0129227441179.220__9529.7159586.71299884925103.320__10463183956.11307565439115.62.数据和模型的建立神经网络模型要求数据具有:A、易获得性B、可靠性C、可测度性。本项研究采用很可靠的官方发表的数据作为分析的数据源(见表1),主要来自于中国统计局网。用3层BP网络模型对本例旅游需求进行模拟,根据BP网络的映射原理,对于样本集合X和输出Y,可以假设存在一映射F。为了寻求F的最佳映射值,BP网络模型将样本集合的输入、输出转化为非线性优化,通过对简单的非线性函数的复合,建立一个高度的非线性映射关系,实现F值的最优逼近。对于本例旅游需求模型的模拟:其输入层结点数(4个神经元):中国内地国民总收入(GDI)、中国内地人口总数(POP)、中国内地国民消费水平(GDE)、澳门生产总值(M-GP)。把澳门内地游客量(T)作为输出结点。从而得出3层前馈反向传播神经网络模型。四.模型结果及分析1网络训练性能的检查。不同个数的隐层单元组成的BP网络训练曲线如图1,2,3所示。通过比较发现,中间层神经元个数为9和12时,网络的收敛速度比较快。2网络预测性能的考查。在数据列表中选取1996年到20__年的数据作为网络的测试数据。20__、20__年的(文秘站:)游客量检验误差曲线如图4。其仿真结果令人满意,达到预期的效果。图1图2图3图4五.模型的应用与评价(优缺点与改进)从上面的分析可以看出,3层BP神经网络模型的仿真模拟效果是邻人满意的。可以看出,人工神经网络的拟合精度比较高,主要是基于人工神经网络抗干扰能力强,稳定性好,能自动准确地找出各种输入和输出之间的线性或非线性关系,具有较强的模拟适应能力等特点。在本例对于澳门的内地游客量的旅游预测中BP神经网络模型是一种有效的预测方法。这一研究方法为旅游学的定量预测研究提供了一种新的思路,也为工程实践问题中的一些研究工作提供了一种非常好的指导方法。虽然BP网络得到了广泛应用,但其自身也存在一些缺陷和不足,主要包括几个方面的问题。首先,由于学习速率是固定的,因此,网络的收敛速度慢,需要较强的训练时间。再次,网络隐含层的层数和单元数的选择尚无理论上的指导,一般是根据应验或者通过反复试验确定的。因此,网络往往存在很大的冗余性,在一定上也增加了网络学习的负担。六.原题附带问题简析通过对本例旅游需求模型的分析,我们认为在利用数学建模的方法对旅游需求进行预测预报时,对于数据的采集和整理工作需要认真做好。对于数据的分析有助于我们寻求变量间的关系,以形成初步的想法。如何获得数据以及如何获得准确的数据对于我们研究实际问题具有相当重大的意义。收集数据并非多多益善,而是要弄清究竟需要哪些数据,剔除不必要的数据,从而减少冗余的工作。同时,需要什么形式的数据也是我们应该思考的一个问题,这与建立模型的目的和所选择的模型的特点有关。[参考文献][1]王士同,等.问题求解的人工智能:神经网络方法[M].北京:气象出版社,1995.[2]HillT,MarquezO’connorM,RemusW.ArtificialNeuralNetworkMedelsfor
ForecastingandDecisionMaking[J].InternationalJournalofForecasting,1993,
篇9
关键词:BP神经网络;农用地定级;评价
0 引言
农用地定级作为农用地分等与估价的中间环节,是在分等对农用地质量区域性差异评价的基础上,考虑影响土地质量的自然因素和社会经济因素,根据土地管理,尤其是耕地保护管理的需要,在一定行政区内进行的农用地质量综合评定[1]。根据《农用地定级规程》(TD/T1005-2003),农用地定级推荐采用因素法、修正法或样地法,在加权求和模型、几何平均模型或复合模型求取土地评价单元总分值的基础上,通过等间距法、数轴法或总分频率曲线法进行土地级别的划分。
传统的定级方法容易受人为主观因素影响,导致评价结果的不准确性,而人工神经网络的评价方法具有自学习、自组织、自适应性的特点,正好可以解决此问题。人工神经网络(Artifical Neural Network,ANN)的评价与优化功能在近几年的地学研究中得到充分体现[2],其中BP(Back Propagatin)人工神经网络是目前应用最广泛的一类,该网络在具有人工神经网络各特点的同时,还具有构建简单、训练算法丰富、映射能力强等优点。本文尝试运用 BP人工神经网络进行农用地定级,利用这种非线性定量分析的方法不仅可以减少人为确定权重的主观性和模糊性,同时还可以精简评价过程。
1 研究区概况
嘉鱼县位于湖北东南部,长江中游南岸。地跨东经113°39′-114°22′,北纬29°48′-30°19′,县境地形狭长,全境长85km,宽5.7-17.9km。地属长江冲积平原,地面高程都在18-26m之间。属亚热带湿润型季风气候,具有四季分明、气候温和、湿度较大、日照充足、雨热同季、无霜期长等特点。境内平原与丘岗气候亦无明显区别。
嘉鱼县国土面积为101842.36hm2。其构成是:农用地面积74,885hm2,占总面积73.53%,其中耕地面积为32,944.26hm2,占总面积32.35%;建设用地面积10,462.7hm2,占总面积的10.27%,其中居民点及工矿用地5,254.72hm2,占总面积5.16%,未利用地16,494.66hm2,占总面积16.20%。
2 研究方法与模型
2.1 BP人工神经网络
BP(Back Propagatin)人工神经网络是目前世界上研究最深入、应用最广泛的人工神经网络模型。该网络一般由输入层、隐含层(或称中间层)和输出层三层构成;层内的单元不发生联系,层间的单元间通过输入数据及其对应的权重值相互连接。信息由输入层进入网络后,传到隐含层单元,经过响应传递函数(一般取Sigmoid 函数),再传到输出层并计算输出值。之后网络将应有的输出与实际输出进行比较,通过反向传播误差,修正与基本单元相连接的各输入量的权重,并重新计算输出、进行比较。通过信息传递、输出、比较、反馈的连续反复训练,使模拟误差逐步降低直至低于规定要求[4]。
2.2 建立定级模型
根据对BP人工神经网络的分析,农用地定级评价的BP神经网络模型结构如图1所示:
由模型结构图可以看出,模型由三层神经元组成:输入层、隐含层和输出层。其中输入层神经元是经过标准化处理后的农用地定级评价基础指标;输出层神经元是农用地定级评价的结果,即农用地定级级别;而隐含层的神经元数目的多少则是对整个网络能否正常工作具有重要意义,所以科学地、自动地确定隐含层节点数目是极其重要的。
2.2.1 确定隐含层节点数
从原理上说, 一个在输入层上具有m个神经元,隐含层具有(2m+1)个神经元,输出层具有n个神经元的三层网络,可以精确地实现任意给定的连续的映射。因此,每当创建一个新的人工神经网络模型时,可以从这(2m+1)个隐层节点入手进行筛选,根据前人经验[6~9]可以依据以下公式进行设计:
(1)
(2)
式中:m为隐层节点数;n为输入层节点数;w为输出层节点数;R(10)为1~10之间的常数。
2.2.2 模型建立步骤
根据图1所示BP网络,可按以下步骤建立模型:
(1)确定影响因素因子并进行数据量化处理,作为网络输入。收集研究区内样点资料,并进行必要的分析与检验,剔除不合格的样点数据,确保样本数据可靠。
(2)确定网络结构,即根据评估对象特性确定隐含层节点数及各层的节点数。
(3)初始化网络及学习参数,即将隐含层和输出层各节点的连接权值、神经元阈值赋予某一区间的一个随机数。
(4)提供训练样本。即从样本数据中,选取一部分样本,作为网络学习样本。
(5)训练样本经过隐含层、依权值和激活函数的作用在输出节点算得网络输出值,并计算网络输出与样点期望输出间的均方差,如果均方差大于给定限差,则执行下一步(6);如小于,则返回本步,进行下一个训练样本训练,直到训练样本集合中的每个样本满足输出要求为止,即BP网络学习完毕。
(6)从输出层反向计算到第一隐含层,首先计算同一层节点的的误差δ,然后按梯度法修正权值,再用修正后的各节点连接权值转到第(5)步重新计算。
3 嘉鱼县农用地定级评价
3.1 嘉鱼县农用地定级指标体系构建
3.1.1 农用地定级影响因素分析
影响农用地定级的因素主要指对农用地质量差异有显著影响的自然因素、区位因素和社会经济因素[3]。
(1)自然因素:指对农用地质量有显著影响的局部气候差异、地形、土壤条件、水资源状况等,主要包括温度、降水量、蒸发量、地形部位、坡度坡向、土壤质地、土壤pH值、土壤污染状况、地下水埋深、水源水质等。
(2)区位因素:指土地利用状况、耕作便利条件和基础设施条件等,主要包括灌溉保证率、排水条件、田间道路、耕作距离、田块平整度、利用集约度、人均耕地、利用现状等。
(3)社会经济因素:指对农用地质量有影响的区位条件和交通条件,主要包括中心城市影响度、农贸市场影响度、道路通达度等。
不同地区,影响农用地质量的因素存在差异,在具体评估过程中,选择定级因素应遵循以主导因素为主的原则,选择那些对农用地质量有显著影响的、有较大变化范围的主要因素,尽可能舍弃那些影响弱、或与主导因素存在相关关系的因素。为了便于应用数学模型对农用地定级评价,还必须根据各因素对农用地质量的影响程度大小进行量化及相应的处理。
3.1.2 嘉鱼县农用地定级指标体系
根据以上分析,结合《农用地定级规程》(TD/T 1005-2003)中提供的农用地定级备选因素因子、统计资料与影响因素的相关性和资料收集的难易性、以及以往土地评估经验和专家的建议,利用特尔菲法,最终确定选择了自然因素、社会经济因素和区位因素3个方面共10个因子指标,建立了嘉鱼县农用地定级评价指标体系,如表1:
3.2 属性数据的标准化处理
为了统一数据量纲、提高数据可比性,并满足BP模型对数据的要求,需要对所有因子指标进行量化,并根据需要对数据进行极差标准化处理,从而把所有数据转化到0~1范围内[5]。经极差标准化后的数据如表2:
3.3 定级评价过程BP网络模拟
在嘉鱼县农用地定级评价过程中,采集的样本数总数为163,其中训练集样本63个,占总数的38.7%,测试集样本100个。利用MATLAB软件将经过标准化处理后的10个定级因子作为样本的输入值,利用63个训练样本进行网络学习训练,并进行网络隐含层神经元数的调整,最终确定隐含层神经元数为6,即网络结构为10-6-1,程序代码如下:
%p为样本输入数据;%t为目标数据
net=newff([0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1],[6 1],{'tansig' 'purelin'},'traingdx');
net.trainParam.goal=0.001;
net.trainParam.epochs=10000;
net=init(net);net=train(net,p,t);save net10 net;
网络训练成功,并保存网络。将测试样本输入训练好的网络中,输出定级结果。神经网络输出的结果是定级评估的量化值,而不仅是级别,级别内部差别也可得到体现。如表3:
3.4 试验结果与分析
根据神经网络计算出的评价值,可将嘉鱼县农用地分为5级。一、二级地分别占总面积的16%和15%,分布在全县的东南部地势较平缓的平原地区;三级和四级地分别占总面积的31%、35%,主要分布在全县的西北岗地区;五级地占总面积的3%,主要为自然条件和灌溉条件差、利用率低的地区。评价结果与嘉鱼县实际情况基本相符,该结果反映出嘉鱼县农用地低等级别地较多,占农用地总面积的六成以上。也间接反映出近年来,耕地质量下降的问题。
4 结论
尽管BP神经网络有其自身的弱点,还有待进一步的完善。但由于神经网络具有自身适应能力,排除了很多人为的干扰因素,从而能对农用地定级给出一个客观的评价。并且,人工神经网络还可以精简评价过程,为评价工作减少不必要的冗余。通过BP网络在嘉鱼县农用地定级评价中的应用,与嘉鱼县实际情况是基本相符合的,证明了该方法还是具有很强的实际应用价值的。
参考文献:
[1] 金晓斌,张鸿辉.基于模糊ISODATA聚类方法的农用地定级研究[J].农业工程学报,2008,24(7):82-85.
[2] 朱红梅,周子英.BP人工神经网络在城市土地集约利用评价中的应用――以长沙市为例[J].经济地理,2009,29(5):836-839.
[3] TD/T1005-2003.农用地定级规程[S].
[4] 张蓬涛,杨红.基于神经网络的基准地价预测模型研究--以河北省主要城市为例[J].中国土地科学,2000,14(5):32-35.
[5] 刘耀林,焦利民.土地评价理论、方法与系统开发[M].北京: 科学出版社,2008:213-223.
[6] 赵霈生,陈百明.在土地评价中应用人工神经网络专家系统的理论与实践[J].中国土地科学,1998,12(2):28-34.
[7] 周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社,2005:89-100.
篇10
关键词:戒备率评估;数据库技术;人工神经网络;混合编程
中图分类号:TP311文献标识码:B
文章编号:1004-373X(2010)04-141-04
Design and Implementation of Readiness Rate Evaluation System for Missile Weapon System
LU He,WANG Hongli,YIN Dejin
(The Second Artillery Engineering College,Xi′an,710025,China)
Abstract:The readiness rate is an important index to tactics and technology of missile weapon system,evaluation and analysis can provide an important decision-making criterion to research and operation of missile weapon system.To get the readiness rate quickly and accurately,the readiness rate evaluation system for missile weapon system is developed based on C#.NET,database technique which has high security and efficiency is used to manage the information that is needed in evaluation,evaluation method of artificial neural network is used in this system,the technology of combination programming is used to do the evaluation of readiness rate.This system realizes the rapid evaluation of readiness rate of missile weapon system and it can also analye the effect of different factor on readiness rate quantitatively,it has important practical significance to the study of evaluation technology of readiness rate.
Keywords:evaluation of readiness rate;database;artificial neural network;combination programming
0 引 言
导弹武器系统的戒备率指处于戒备状态下导弹数与该导弹总数的比值[1]。通过分析评估导弹武器系统的戒备率,能够完整地掌握武器系统戒备作战的能力,从而为导弹武器系统的研制和作战使用提供重要决策和依据。
导弹武器系统作为一个复杂系统,其戒备率受到可靠性、维修性、保障性、战场环境、人为因素、生存能力等因素的综合影响,所以导弹武器系统戒备率的评估难度大,时间长。现代战争的各种因素的变化很快,如何快速准确地得到导弹武器系统的戒备率,为导弹武器系统的作战使用提供决策依据,是戒备率评估发展研究的方向。在此,利用发展成熟的数据库技术,结合人工神经网络的评估方法,开发出了导弹武器戒备率评估系统,降低了评估的难度,缩短了评估的时间,能够根据战场形势的变化快速准确地完成戒备率的评估,对戒备率评估技术的研究有十分重要的现实意义。
1 系统的总体设计
1.1 任务需求
根据影响导弹武器系统戒备率各项要素的物理特性以及它们之间的关系,以作战想定、任务剖面和评估条件为基础,快速准确地得到导弹武器系统技术阵地、待机阵地、发射阵地、导弹和导弹武器系统的戒备率评估值;进行导弹武器系统全寿命周期内不同任务剖面下的戒备率评估;通过数据库实现数据的规范化管理,方便地进行信息查询。
1.2 系统结构
导弹武器戒备率评估系统的设计目的是完成导弹武器系统戒备率评估任务及其评估数据的管理,整个系统的框架采用模块化设计,主要分为系统管理模块、戒备率评估模块、数据库模块、接口模块、帮助模块。系统结构如图1所示。
图1 系统结构框图
1.3 系统功能
系统中五个模块的具体功能如下:
系统管理模块 完成用户登陆的身份验证。将操作人员分为管理员,评估人员,查询人员。管理员可以完成添加删除用户、设定用户权限、查询和修改导弹数据库等操作;评估人员能够查询相关型号数据库,进行戒备率的评估,将数据写入数据库;查询人员可以查询相关的导弹参数。
戒备率评估模块 它是系统的主要组成部分。完成评估参数的输入;对不同量纲的指标采用归一化的方法将其标准化,将评估参数处理为神经网络的训练样本;调节神经网络的参数使之达到评估目标;对评估结果进行分析、存贮、打印等。
数据库管理模块 主要完成数据的管理。“导弹武器资料”用于管理所要评估导弹系统的各项指标数据,允许管理员用户建立新的导弹型号数据库;“评估结果”用于管理评估结果,可以将本次的评估数据写入导弹武器资料库作为训练样本,并可以记录达到评估目标所采用的神经网络参数,作为以后评估的参考。
接口模块 完成不同模块之间的数据交换。“数据库接口”完成对数据库的操作;“Matlab接口”完成对Matlab引擎的调用。
帮助模块 为用户提供系统帮助及使用说明。
2 关键技术
导弹武器戒备率评估系统涉及多种型号的导弹武器系统评估,在准确性、安全性、快速性、可操作性上有较高的要求。因此在开发的过程中涉及的关键技术主要有:人工神经网络评估方法、数据库技术、混合编程技术。
2.1 人工神经网络评估方法
导弹武器的戒备率评估涉及到大量不确定的因素,为了进行评估,从系统分析着手,采用层次分析法分析了影响导弹武器系统进入戒备状态的主要因素,并广泛征求专家意见,得到戒备率评估的指标体系,即戒备率的评估模型。
评估的模型与方法之间呈现相互支持、相互依赖的关系[2]。一方面,评估中得到的数据要由评估模型来处理;另一方面,评估模型的评估方法在运用中得到体现。常用的评估方法主要有[3]:层次分析法(AHP)、模糊综合评判法、ADC法、SEA 法、指数法、人工神经网络评估法等。
依据导弹武器系统的复杂性,要求评估方法必须具备强大的处理非线性运算的能力;指标体系中某些参数获取的困难性,要求评估方法能够并行地处理模糊数据和精确数据;执行任务的条件具有多变性,要求评估方法有自适应性。由于戒备率评估的如上特点,系统选用了人工神经网络的评估方法。因为人工神经网络是一个非线性自适应系统,从理论上讲,能够以任意精度逼近任意复杂的非线性函数[4],自身具有一定的“学习”和“进化”能力,可以克服系统环境和各项指标的不断变化,使戒备率评估的知识库不断的完备更新,获得最佳的评估效果。
人工神经网络评估的原理如下:首先将评估的指标进行归一化处理,将其处理成可供神经网络训练的输入样本,在部队进行战备等级转换时得到相应条件下导弹武器系统实际戒备率作为神经网络的输出,用足够多的样本训练网络,使网络获取各项指标对戒备率的影响程度以及专家的知识经验。训练好的神经网络可以根据评估对象的各项指标属性值,再现出专家的知识经验及不同指标对戒备率的影响程度,实现定性与定量的有效结合。
训练样本的获取是人工神经网络评估方法实现的关键,在戒备率的底层评价指标中,有的可以用确定的表达式描述(如可靠性),通过数值计算得到精确的数值结果;而有些指标只能通过定性的评估(如人员反应能力),这些数据采用德尔菲法获得。对于定量指标,其性质和量纲也不相同,可以将定量指标分为三种类型[5],即越大越好型、越小越好型和具有最佳值型。由于各种指标的量纲和性质不同,造成各指标的不可共度性,指标需进行合理的归一化处理,首先必须建立诸因素与戒备率的隶属函数,以不同因素的隶属作为神经网络的输入值,将各输入单元归一化到(0,1)的区间内[6] 。
2.2 数据库技术
导弹武器系统是一个复杂系统,对其进行戒备率评估所需要的训练样本数据以及在评估过程中产生的中间数据量较大,并且要求数据处理的安全性很高。为了提高数据处理的效率,保证数据的安全,选用了数据库技术。数据库技术是针对数据组织和管理的技术,数据库方式数据处理的整体化、信息化、隐藏化、安全化等特点使数据的分析和评估简单易行。
应用程序对数据库的访问采用接口。可以有效地从数据库的操作中将数据的访问分解为多个单独使用或串联使用的连续组件[7],通过可以方便地完成对数据库的复杂操作。
由于部队实际条件的限制,系统可能无法远程访问数据库,所以在数据库的访问上采用两种方案。
第一种方案是客户端可以远程访问服务器,其连接字符串为:
"Provider=SQLOLEDB;Persist Security Info=True;Data Source=SQLName;Initial Catalog=DbaseName;User Id=ID;Password =PWD;"
第二种方案是客户端不能远程访问服务器,其连接字符串为:
"Data Source=.\\SQLName;AttachDbFilename =|DataDirectory|\\DbaseName.mdf;Integrated Security=True;User Instance=True"
其中:Data Source为SQL服务器名称;Initial Catalog为数据库名称;AttachDbFilename为数据库的相对路径。当客户端不能远程访问服务器时,需要在安装文件中添加数据库。
2.3 混合编程技术
系统的用户界面是采用.NET平台下C#开发的,.NET平台是微软公司推出的一种面向网络,支持各种终端的开发环境平台。利用该平台开发的系统具有界面友好,执行速度快,易于维护等特点,可以生成可执行文件,保护算法和数据,具有较好的安全性。但是它对数学计算的支持不够,文中所采用的人工神经网络的算法用其实现较为复杂,而Matlab是一套高性能的数值计算和可视化软件,具有专门的神经网络工具箱,内含大量可以设计神经网络模型[8],通过C#.NET设计用户界面,Matlab实现后台算法,提高了编程的效率。C#.NET与Matlab的接口主要有以下几种[9],即利用Matlab自身的编译器Matlab Complier,利用COM或NET技术,利用C-MEX、利用Mideva的平台、利用Matlab的引擎技术。其中,只有Matlab引擎技术支持调用神经网络工具箱,所谓Matlab引擎技术指Matlab提供的接口函数。通过这些接口函数,C#.NET可以完成对Matlab通过引擎方式的调用。戒备率评估系统会打开一个新的Matlab进程,可以控制它调用神经网络工具箱,完成戒备率的评估。C#.NET调用Matlab引擎技术实现神经网络的过程如图2所示[10]。
在C#.NET编程环境中,使用Matlab引擎,首先需要安装Matlab软件;然后添加COM,引用“Matlab Application Type Library”;之后就可以实例化引擎对象。因为.NET语言与Matlab语言的数据类型不同,为了完成两种数据的自动交换,还需要添加对MWArray类库的引用。数据的交换主要采用Matlab引擎提供的三个接口:Execute,PutFullMatrix,GetFullMatrix;分别实现运行脚本,向Matlab Server中添加矩阵,从Matlab Server中读取矩阵的功能,通过上述三个接口函数就可以完成.NET对Matlab引擎的调用。
图2 C#.NET调用Matlab引擎技术实现神经网络
由于神经网络的初始参数是由经验推断的,很难满足精度的要求,需要根据训练的效果进一步调整。为了能够辅助评估人员快速找到最佳参数,系统采用如下的解决方案:在诸多参数调解中,隐层神经元个数和学习步长这两个参数对评估的效果影响最大,首先由评估人员根据经验给定两个参数的区间,以及迭代的步长,由系统逐次迭代选择相对最优值,而后在其附近减小迭代的步长,进行进一步优化,如果误差较大,调整参数直至达到评估要求。
2.4 系统实现
为了实现这些功能,系统编程语言选用C#.NET,数据库采用Microsoft SQL Sever 2005,利用对数据库进行访问,通过Matlab引擎技术完成对神经网络工具箱的调用,程序流程如图3所示。
图3 程序流程图
达到神经网络的评估目标后,将网络结构参数保存到数据库,得到不同时间节点戒备率的评估值。为了更直观地显示戒备率的变化情况,系统采用图形设备接口(GDI+)绘制出戒备率的实时变化图,系统运行效果如图4所示。
图4 运行效果图
3 结 语
戒备率评估系统的开发主要考虑几个方面的问题,易用性、快速性与准确性。该系统采用C#.NET开发的用户交互界面,界面友好,操作简单方便;采用数据库技术保证了数据管理的效率和安全性;利用人工神经网络的评估方法,可以最大程度地适应评估环境的变化,得到准确的评估值;调用Matlab神经网络工具箱,提高了编程的效率,简化了评估的程序,缩短了评估的时间。该系统不仅可以为指挥员的作战决策,导弹的作战使用提供参考依据,还可以作为新型导弹研制的辅助工具。
参考文献
[1]朱坤岭,汪维勋.导弹百科辞典[M].北京:宇航出版社,2001.
[2]李志猛.基于SEA的效能评价方法研究[D].长沙:国防科学技术大学,2003.
[3]牛作成,伟,雷磊.军事装备的评估方法探究[J].电光与控制,2006,13(5):98-101.
[4]朱大奇,史慧.人工神经网络原理及应用[M].北京:科学出版社,2006.
[5]高彬,郭庆丰.BP神经网络在电子战效能评估中的应用[J].电光与控制,2007,14(1):69-71.
[6]王杰贵,崔宗国.雷达干扰决策的模糊综合评估[J].电子对抗,1997(1):22-28.
[7]缪勇,李新峰,付志涛.Visual C#学习笔记[M].北京:电子工业出版社,2008.
[8]董长虹.Matlab神经网络工具箱与应用[M].北京:国防工业出版社,2005.
- 上一篇:建筑劳务公司财务制度
- 下一篇:口腔保健措施