模糊神经网络的优点范文
时间:2024-04-01 18:17:16
导语:如何才能写好一篇模糊神经网络的优点,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:自主导航;人工智能;模糊神经网络;避障;BP神经网络
中图分类号:TP79文献标识码:A文章编号:1005-3824(2014)03-0083-03
0引言
2013年12月14日21时11分,嫦娥三号探测器在月球表面预选着陆区域成功着陆,装着红外成像光谱仪、避障相机、机械臂和激光点阵器等设备的月球车“玉兔”驱动着6个轮子在月球表面留下了历史的痕迹。这标志着我国已成为世界上第3个实现地外天体软着陆的国家,也展现出了智能控制系统[1]在航天事业上的卓越应用。在如今的社会生活中,随处体现着智能技术的存在,人们已经离不开智能技术,智能机器人的发展也飞速前进,从儿童的玩具机器人到太空探索的机器人,可以预见智能机器人的应用将更加广泛。近年来,非线性动态系统的自适应控制在我国引起了广泛的研究,模糊神经网络控制是一个重要的自适应方法,因此得到了很多专家学者的青睐。
模糊逻辑控制在宏观上模仿人的思维,处理语言和思维中的模糊性概念,它是以模糊集合论、模糊语言变量和模糊逻辑推理为基础的一种计算机数字控制技术;神经网络是从微观上模仿人的智能行为,进行分布式并行信息处理算法的数学模型,它是根据人脑的生理结构和信息处理过程创造的[2]。模糊控制与神经网络各自都有一定的应用局限,因此,人们早在20世纪80―90年代就把它们相结合,组成更为完善的控制方法。模糊控制与神经网络的结合有多种方式,根据研究角度和应用领域的变化而不同。1模糊控制与神经网络的介绍
1.1模糊逻辑控制系统
模糊逻辑控制系统主要包含输入变量、模糊控制器、被控对象和偏差。模糊逻辑控制系统结构如图1所示。
知识库:是模糊控制器的核心。由数据库和规则库组成,数据库中存着有关模糊化、模糊推理、解模糊的一切知识,规则库是由若干模糊规则组成的。
模糊推理机:根据模糊逻辑法则把逻辑规则库中的模糊“if-then”转换成某种映射。
反模糊化:反模糊化的方法一般有最大隶属度平均法、最大中点法、面积等分法、重心法和加权平均法等。
模糊控制的优点:可以在预先不知道被控对象的精确数学模型;规则一般是由有经验的操作人员或者专家的经验总结出来并且以条件语句表示的,便于学习和理解;控制是由人的语言形式表示,有利于人机对话和系统知识的处理等。不足之处:精度不够高;自适应能力有限;模糊规则库非常庞大,难以进行更改优化[3]。
1.2人工神经网络
人工神经网络(ANN)是一种模拟人脑神经系统的结构和功能的运算模型,由大量的节点,即神经元及相互之间连接构成的,它是人工方式构造的一种网络系统。神经元结构模型如图3所示。
传递函数f又称转移函数或激活函数,是单调上升的有界函数,常用的转移函数有线性函数、斜坡函数、阶跃函数及单双极S型函数等。但是最常用的还是单极S型函数:
神经网络的结构形式也有几种,例如,全互连型结构、层次型结构和网孔型结构等[4]。前馈型网络是一类单方向层次型网络模块,其最基本的单层神经元网络如图4所示。
图4单层神经元网络3层BP神经网络是比较常用的结构,图5是它的基本结构。
图5BP神经网络的基本结构BP神经网络至少有3层,图5中,第Ⅰ层是输入层,第Ⅱ层为隐藏层,第Ⅲ层为输出层。由于3层的BP神经网络就具有了模糊系统中万能逼近的能力[5],为了不使系统变得更复杂,本文就只用了3层的BP神经网络,当然,也可以根据自身的实际应用情况增加隐层的层数,但并不是层数越多,精度就越高,相对的系统的反应时间就会增加,时延也会增长。
神经网络的优点:能够通过学习和训练获取用数据表达的知识,不仅可以记忆一直获得的信息,还具有较强的概括及联想记忆能力,它的应用已经延伸到各个领域,在各方面取得很好的进展等。不足之处:缺乏统一的方法处理非线性系统;网络的权值是随机选取的;学习的时间长;无法利用系统信息和专家经验等语言信息;难以理解建立的模型等[6]。
所以,综合以上模糊逻辑系统与神经网络各自的优缺点,就提出了一种它们的结合方法,即模糊神经网络控制方法。
2模糊神经网络的结合方式
模糊神经网络大致分为3种形式:逻辑模糊神经网络、算术模糊神经网络和混合模糊神经网络。
在这3种形式的系统中,模糊神经混合系统是根据模糊控制系统和神经网络各自不同的功能、用途集成在一个系统里面的[7]。在这类系统中,我们可以将神经网络用于输入信号处理,模糊逻辑系统用于行为决策[8](如图6),或者把模糊逻辑系统作为输入信号处理,神经网络系统作为输出行为决策,再或者是将神经网络去代替模糊控制器的一部分,还可以将基于神经元网络的模糊系统或者神经元网络用在模糊神经混合系统中。
在本文的应用中,使用的是轮式智能小车,它一共安装了3个超声波传感器、3个红外传感器和1个角度传感器,红外传感器除了应用在小车循迹外,还用来增加控制系统测量的精确性和弥补超声波测距的盲区。例如,在某一路或者几路超声波受到了外界的干扰时,红外线就可以测量出系统所需要的数量值。超声波与红外线用来测量小车到左、前、右障碍物的距离Ll,Lf,Lr;模糊神经系统中控制器的输入包括: Ll,Lf,Lr,小车与障碍物的夹角tg;输出为小车的转角sa和小车的加速度va。将Ll,Lf,Lr的模糊变量设为{near ,far},论域为(0―2 m);tg的模糊变量为{LB,LM,ZO,RM,RB}表示{左大,左小,零,右小,右大},论域为(-1800,1800);距离和夹角的隶属度函数如图7和图8所示。输出变量的隶属度函数在这里就不再赘述了。
在系统解模糊化时,是将一个模糊量转换成确定量,常用的解模糊化的方法有最大隶属度函数法、重心法、加权平均法。在本文中用的是重心法。
智能小车避障的控制系统如图9所示。
篇2
【关键词】 T-S型模糊神经网络 储粮害虫 分类识别 Visual C++6.0
粮食的安全储藏问题是个世界性难题。据联合国粮农组织的调查统计,全世界每年粮食霉变及虫害等损失为粮食产量的8%[1]。因此,搞好粮食储藏是一项关系到国计民生的重大课题,进行储粮害虫的治理任务重大而迫切。准确地给出害虫的种类信息可为害虫的综合防治提供科学的决策依据。
模糊神经网络是模糊理论同神经网络相结合的产物,它的特点是将神经网络较强的自学习和联想能力与模糊逻辑的推理过程易理解、对样本要求较低的特点融合在一起,模糊理论和模糊系统理论上比通常意义下的模糊逻辑和神经网络更有优越性,但是很难实现自适应学习的功能。如果把神经网络引入到模糊理论中,将两者有机结合,模糊系统能够成为一种具有较强自学习能力的自适应模糊系统,采用已有神经网络的有效学习算法,并吸收模糊系统的优点,起到互补的效果。
1 T-S型模糊神经网络
1985年,T-S型模糊逻辑系统由日本的高木(Takagi)和关野(Sugeno)提出,旨在开发从给定的输入-输出数据集产生模糊规则的系统化方法,这种基于语言规则描述的模型第i条规则可写为:
(1-1)
式(1-1)中,A是前件中的模糊集合,z是后件中的精确函数。通常是输入变量x和y的多项式。当是一阶多项式时,所产生的模糊推理系统被称为一阶Sugeno模糊模型,当为常数时,即得到了零阶Sugeno模糊模型[2,3]。
专家知识被Sugeno模糊模型通过语言和数据整合到if-then规则中,基于T-S型的模糊神经网络综合了模糊系统和神经网络的特点,不但能够实现一个Sugeno模糊推理系统的功能[4,5],实现图像的模糊输入和模糊推理,而且它能根据系统输出的期望值和实际值的差别自动生成和调整隶属度函数和模糊规则。这种模糊神经网络应用于储粮害虫分类,将更贴近于害虫特征的形成过程,能取得较好的分类结果。
本实验采用的是一阶Sugeno模糊模型,后件是一阶线性方程。其隶属函数生成层、模糊推理层为:
(1-2)
(1-3)
其中,表示生成的隶属度函数,采用的是高斯函数。为参数对,它们称为前件参数,取值情况决定了的形状。表示模糊推理层,模糊推理采用的是积运算,即各节点的输出是输入值的乘积。
反模糊化层采用一阶Sugeno模糊模型的输出。此时,令后件函数为,其模糊推理输出:
(1-4)
学习算法采用误差函数的负梯度下降方法,不断更新网络参数。第n个训练模式的误差参数,可定义为
(1-5)
其中p为输出单元的个数。
按照模糊神经网络的结构,可定义网络参数向量:
(1-6)
参数更新修正规则:
(1-7)
其中为学习速率。
网络分为4层:第1层为输入层,代表储粮害虫的特征向量输入网络;第2层为模糊化层,完成输入特征向量的模糊化,将输入的特征向量分为3个等级{小(small),中(medium),大(large)},隶属函数为高斯函数;第3层为模糊推理层,以使对模糊化后的特征向量进行综合处理,采用积运算,第4层是输出层,它的输出值即表示属于此类的隶属度。
2 试验过程
试验过程分为学习过程和回调过程。
学习过程:(1)确定分类数为9。确定训练的矢量数据,用各分量分别代表害虫特征向量作为输入。取每类害虫的5个特征分量值作为训练数据的输入矢量,从而完备训练数据,同时确定各个输入矢量对应的各类隶属度输出,构成9个5输入单输出的模糊神经网络,每一个对应一类的隶属度输出。(2)将数据送入各自单个的网络训练,直至能模拟所有输出。
回调过程:将待分类储粮害虫的特征向量送入网络,得到各自的单个网络的输出,然后将输出归一化,得到最终的隶属度输出。
3 试验结果
利用Sugeno型模糊神经网络对6类储粮害虫进行了分类研究。试验结果如(表1)所示。
4 Visual C++6.0平台上实现识别
(图1)是在储粮害虫图像分类识别系统中对赤拟谷盗其中一个样本的识别。
5 结语
运用T-S型神经网络对储粮害虫进行分类的识别率达到95.6%,并且利用Visual C++6.0平台实现,操作简单,可读性好,具有较大的实际应用价值。
参考文献:
[1]黑龙江省大豆协会.我国粮食储藏的现况及发展趋势.http://.cn/news/index.php?id=1163
[2]Sugeno M.,Kang G.T.Structure identification of fuzzy model [J].Fuzzy Sets and Systems,1998,28:15-33.
[3]Takagi,M.Sugeno.Fuzzy identification of systems and its applications to modeling and control[J].IEEE Transaction on System,1985,15:116-132.
篇3
关键词:信用风险预警; 模糊神经网络; 模因算法; 粗糙集
中图分类号:TP301.6 文献标识码:A文章编号:2095-2163(2013)06-0010-05
0引言
近年来,人工神经网络已广泛应用于信用风险预警等金融风险管理领域,研究表明神经网络预测准确性优于统计判别分析等传统预警方法,但其中的“黑箱”操作等缺陷却也导致了神经网络在信用风险管理领域的应用遭到多方质疑[1-2]。源自模糊理论与神经网络相融合的模糊神经网络(Fuzzy Neural Network,FNN)提高了网络的透明性、启发性及鲁棒性,在一定程度上克服了神经网络的“黑箱操作”,然而FNN也存在“维数灾难”、结构复杂、学习算法冗长、局部早熟等问题,由此也限制了其在金融风险管理领域中的应用[3]。据此,本文试图在对模因算法(Memetic Algorithms,MA)进行改进的基础上,结合粗糙集(Rough Set,RS)和模糊神经网络提出一种模因进化型粗糙模糊神经网络(MA-RSFNN)模型,旨在利用模因算法进行模糊神经网络的训练学习,发挥模因算法的全局优化能力,消减网络陷入局部早熟的可能性,使网络具有进化和学习的双重智能,同时借助粗糙集知识约简精炼训练集、降低输入维度,避免“维数灾难”现象。
1模因算法
模因算法(Memetic Algorithms,MA)由Moscato和Norman等人于1992年提出,是一种超启发式全局搜索混合算法,主要思想源自道金斯的文化进化思想和达尔文的自然进化法则[4]。其原理是在全局搜索策略中有机集成局域搜索策略,利用局部搜索策略的局部寻优能力提高算法的性能和收敛速度。相关研究表明模因算法在搜索过程中兼顾深度和广度,不仅有较强的全局寻优能力,同时算法收敛速度快,在许多问题上的求解获得了比遗传算法收敛速度更快[6-9]。
经典的模因算法通常采用遗传算法作为全局搜索策略,因此算法流程与遗传算法类似。根据文献[5],模因算法的流程如图1所示。
2模因算法改进
模糊神经网络的训练学习是一个连续函数优化过程,以遗传算法为基础的模因算法能有效求解组合优化问题,但对连续空间问题的求解则效率不高。粒子群算法是一种源自对鸟类等生物群体觅食行为进行模仿的实编码优化算法,其概念简单、结构简洁,是求解实编码优化问题的有力工具。本文提出一种以粒子群算法为全局搜索策略,BP算法为局部搜索策略的改进型模因算法,以期设计出一种高效的模糊神经网络学习算法。
粒子群算法(Particle Swarm Optimization ,PSO)是一种基于群体智能的全局优化算法,其灵感源自鸟群、蚁群等生物群体的觅食过程[10-11]。目前,具有概念简单、算法简洁、隐含并行及全局收敛等优点的粒子群算法已广泛应用到决策分析、知识发现等领域[12-13],并取得了丰硕研究成果。基本粒子群算法的数学描述如下[10]。
假设一颗微粒代表寻优空间中的一个解,算法初始化时随机生成一定数量的微粒构成种群,而后通过不断随机有向迭代寻求问题最优解。在迭代过程中,微粒通过跟踪个体及种群历史最优值,按式(1)、(2)不断调整个体的速度和位置以实现向最优解靠拢。
其中,式(3)为速度vij的调整量;速度vij为位置xij的调整量;w∈[0.4,0.9]为惯性因子;c1=c2=2.0为学习因子; r(·)∈(0,1)为随机数;pij和pg分别为个体及群体历史最优值。
2.2改进型模因算法
改进型模因算法基本流程如图2所示。
3模因进化型模糊神经网络
3.1网络结构
信用风险预警通常为多输入单输出的问题,参照文献[14-15]设计的模糊神经网络拓扑结构如所图3所示。
3.2网络学习算法
(1)编码。微粒的坐标值代表了模糊神经网络的模糊参数与权值,其编码如图4所示。
其中,yi为实际输出;yi为期望输出,P为群体规模。
(3)算法步骤。学习算法的主要步骤如下:
步骤一:初始化。设置全局搜索策略和局部搜索策略的相关参数,随机生成种群。
步骤二:BP算子。采用BP算法对每个个体进行局部寻优。
步骤三:算法终止判断。如果算法满足终止条件则跳转步骤六,否则跳转步骤四。
步骤四:PSO算子。①根据式(4)计算每个个体的适应值;②个体及群体历史最优位置调整;③按式(1)调整微粒速度;④按式(2)调整微粒位置。
步骤五:BP算子。采用BP算法对每个个体进行局部寻优,产生新群体,跳转步骤三。
步骤六:算法结束。
其中,算法终止条件:① MSE最大进化代数。
BP算子的目标函数为式(4)所示的适应值函数,学习过程中,网络参数与权值按以下数学公式作调整:
上述模因进化型模糊神经网络采用模因算法对网络进行学习与训练,使得模型具备了学习与进化的双重智能,但该模型也存在一般模糊神经网络的“维数灾难”现象。为此,采用粗糙集知识约简对模型输入数据进行前置处理,简化训练集、减少输入维数,从而降低网络结构的复杂程度,避免“维数灾难”现象。前置处理的主要步骤如下:
(1)指标初选和数据预处理
在考虑数据可获取性的前提下初步建立预警指标体系,指标体系要求涵盖各方面的信息,力图从全方位、多层次反映信用风险特征。
数据预处理主要是根据指标的特性,对连续型预警指标的数据进行离散化处理。数据离散化的原则是保持数据集分类或决策能力不变的前提下尽可能压缩数据。
(2)建立决策表
以指标初选和数据预处理后的数据为基础,建立如表1所示的决策表。
(3)知识约简
对建立的决策表进行约简处理,得到条件属性的相对约简,选取相对约简所代表的预警指标组成指标集作为模型的输入指标体系。
5模型在信用风险中的应用
从商业银行的角度看,信用风险是指借款人的违约而造成的损失可能性。本文从商业银行的企业贷款违约方面研究模型在信用风险评估中的应用,以检验模型在金融风险管理领域中的应用成效。
5.1指标初选与数据采集
在研究国内外相关成果的基础上,参考相关商业银行的企业绩效评价指标体系[16-19],选择涵盖企业盈利能力、偿债能力、成长能力及营运能力等方面的共21个指标构成初选指标集,如表2所示。
5.2粗糙集前置处理
(1)数据离散化与决策表的建立
采用等频率划分算法在保持数据分类能力的前提下对数据进行离散化处理,断点集数k可通过试验获得,一般取k=3。在数据离散化的基础上,以初选指标为条件属性,属性Bc(1:贷款违约公司,0:贷款正常公司)为决策属性,建立信用风险预警的决策表,如表3所示。
(2)属性约简
5.3模型训练学习
学习算法的相关参数初始化如下:
(1)模糊子集数设为3(代表高、中、低),则该模型为6-18-3-1结构的模糊神经网络,输出Y为企业违约信号(1:违约;0:不违约)。
(2)参数初始化。网络的模糊参数及权值随机初始化,隶属中心∈[-1,1],隶属宽度∈(0,1],耦合权值∈(-1,1)。
(3)模因算法的参数设置。PSO算子随机生成规模M=30的种群,w=0.729, c1=c2=1.49,[Vup,Vdown]为[-1,1],Vmax=0.3,BP算子的学习率η=0.005。
(4)训练终止条件:①适应值10 000。
在Matlab7.0环境中,编程实现上述的模型与算法,采用训练数据集的150份数据对模型进行训练学习,训练过程误差变化如图5所示。经过3 000多代的进化,MSE达到了0.000 281。
采用测试集的数据对预警模型进行仿真实验,表4汇总了三类模型的实验结果,从中可以看出MA-RSFNN模型的预测准确率高达90%,相比BP神经网络及单纯模糊神经网络均有了大幅度提高。无论是第一类错误还是第二类错误MA-RSFNN模型的表现都最好。
6结束语
模糊神经网络具有启发性、透明性等特征,可处理模糊信息,能避免神经网络的“黑箱操作”,但其存在“维数灾难”现象、结构复杂及收敛性差等缺陷。本文所提出的MA-RSFNN模型将模因算法和粗糙集理论融入模糊神经网络,发挥模因算法的全局搜索能力提升模糊神经网络的学习能力,借助粗糙集知识约简的降维消冗能力对训练数据进行降维消冗处理,从而精简网络结构,避免网络陷入“维数灾难”。应用实例的结果表明了新模型的有效性,可望为金融风险管理提供一种新方法和新思路。
参考文献:
[1]MIN J H, LEE Y C. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications, 2005, 28 :603-614.
[2]BAHRAMMIRZAEE A. A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems[J].Neural Comput & Applic,2010,19:1165-1195.
[3]HAMDANI T M, ALIMI A M, FAKHRI K. Enhancing the structure and parameters of the centers for BBF fuzzy neural network classifier construction based on data structure[A]// Proceedings of the International Joint Conference on Neural Networks[C]. Piscataway NJ: IEEE, 2008: 3174-3180.
[4]MOSCATO P. On evolution, search, optimization, genetic algorithms and martial arts: towards memetic algorithms[A]//Tech. Rep. Caltech Concurrent Computation Program [C]. Pasadena, California, USA, 1989: 1-67.
[5]NORA S,CHRISTIAN S, ANDREAS Z.A memetic clustering algorithm for the functional partition of genes based on the gene ontology[C]//Proc of the 2004 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology.San Diego,USA,2004:252-259.
[6]DAWKINS R. The selfish gene[M].UK:Oxford University Press,1976.
[7]MOSCATO P, NORMAN M G. A memetic approach for the traveling salesman problem-implementation of a computational ecology for com-binatorial optimization on message-passing systems[C]// Proceedings of the International Conference on Parallel Computing and Transport Applications. Amsterdam:IOS Press,1992: 177-186.
[8]RADCLIFFE N J, SURRY P D. Formal memetic algorithms[J]. Evolutionary Computing, 1994,865: 1-16.
[9]XU Xin,HE H G.A theoretical model and convergence analysis of memetic evolutionary algorithms[C]//Proc of Int Conf on Natural Computation.Changsha,2005:1035-1043.
[10]KENNEDY J. EBERHART R C. Particle swarm optimization [A]// Proceedings of IEEE, International Conference on Neural Networks [C]. Piscataway NJ:IEEE, 1995: 1942-1948.
[11]KENNEDY J. The particle swarm: social adaptation of knowledge [A]//Preceedings of Evolutionary Computation [C] ,Indianapolis: IEEE, 1997:303-308.
[12]EBERHART R C, SHI Y H. Particle swarm optimization: developments, applications and resources [A]//Proceedings of the IEEE Congress on Evolutionary Computation [C]. Piscataway, USA: IEEE Service Center, 2001:81-86.
[13]吴启迪,汪镭. 智能微粒群算法研究及应用[M]. 南京:江苏教育出版社,2005-04.
[14]AKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and, Cybernetics, 1985,15(1): 116-132.
[15]黄福员. 金融风险预警的MPSO-FNN模型构建与应用[J]. 计算机工程与应用,2009,45(14):210-212.
[16]ALTMAN E I, MARCO G, VARETTO F. Corporate distress diagnosis: comparisons using linear discriminant Ana analysis and neural networks[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[17]李志辉, 李萌. 我国商业银行信用风险识别模型及其实证研究[J]. 经济科学, 2005(5): 61-71.
篇4
【关键词】模糊神经网络;异步电动机;故障诊断
1.引言
异步电动机作为人们日常生活和工业生产的主要驱动装置和动力装置,具有广泛的应用范围已成为人们生活生产中不可或缺的重要装置。据资料显示,90%的工业生产原动力是大型异步电动机。各种小型的电动机也广泛的应用于人们的日常生活中比如一些风扇、冰箱等家电。显而易见,电动机的正常工作对保证工业生产和日常生活的低耗、优质、高效和安全运行意义重大。由此看出,电机一旦发生故障甚至停机,必将带给个人生活和企业的生产带来不便和损失。因此,对于电机故障的准确和及时地诊断并加以排除具有较大的意义。
2.异步电动机常见故障及诊断方法
异步电动机常见故障按照发生位置不同主要分为定子绕组故障、转子绕组故障、轴承故障等几类。根据多年经验研究以及对电动机故障的分析,其故障发生概率分别为30%、10%、15%。根据异步电动机的结构特点可知,其系统主要分为机械系统和电气系统,机械系统故障包括偏心故障及轴承故障,而电气系统故障包括定子绕组和转子绕组故障。根据异步电动机的常见故障发生概率以及针对性,故本文主要是对定子匝间短路、转子断条、转子偏心故障、轴承内圈故障进行诊断分析研究。
目前,用于电机故障诊断的常用技术包括:定子电流检测法、振动检测法、温度检测法等传统的故障诊断方法一般是在实际测量的参数基础上,用数学的(FFT)、信号处理(小波分析)等方法对测量参数进行故障特征参数的提取,对故障特征参数进行分析来确定其故障。测量的参数主要包括定子电流、电机温度、振动、噪声等信号。以上方法各有自己的优点和特点,一般根据实际情况和研究对象来选择合适的方法。在本文主要采用定子电流频谱分析法和振动信号时域均方根分析法。当异步电动机发生故障时,就是改变正常的气隙磁通波形,进而改变定子电流频率波形,对采集到的定子电流信号进行频谱分析可以判断出电机故障类型。而振动信号的故障分析同上,只是采用的是时域的均方根特征,因为它是振动信号一个广泛的特征参数。
3.模糊神经网络构建
神经网络与模糊逻辑的建立有多种方式,将模糊逻辑引入神经网络中,对模糊网络的输入数据进行模糊化预处理。本文将采用上面的模糊神经网络建立方法。
3.1 神经网络结构、输入和输出神经元个数的确定
对于BP神经网络,有一个非常重要的定理,是对任何在闭区间内的一个连续函数都可以用单隐层的网络来逼近。因而一个三层BP网络就可以完成任意的n维到m维的映射,增加隐含层固然可以提高神经网络的处理能力,但同时也使网络的规模增大,结构变得复杂。加大了计算工作量及模式样本数量。这样一来,使网络的训练时间变长,所以增加一个隐层是可以的,但BP神经网络隐层数一般不超过两层。本文采用只包含一个隐层的BP神经网络对电机发生的故障进行诊断。
根据本文研究的故障诊断对象,是通过5个不同位置的振动信号和对应的2个定子电流特征频率的检测来分析和诊断,故确定网络输入是一个7维向量,即输入神经元个数为7个。由于本文研究的电机故障包括4种模式(定子匝间短路,转子断条,转子偏心,轴承内圈),其对应的定子电流特征频率为(147.8Hz,245.6Hz,47.7Hz,52.3Hz,707.8Hz,807.9Hz,710.6Hz,950.9Hz)。接下来确定网络输出模式。神经网络输入数据是提取相应特征频率的幅值,输出是对故障进行相应的编码。从而建立故障模式与故障原因之间的映射关系,谁发生故障谁的期望输出位是1,否则为0。因此网络的神经元输出为4个,可采用如下输出:
1)匝间短路(1,0,0,0)
2)转子断条(0,1,0,0)
3)转子偏心(0,0,1,0)
4)轴承内圈(0,0,0,1)
3.2 训练样本数据的处理
在神经网络进行故障诊断过程中,一般要对数据进行预处理,数据预处理是指通过变换将网络的输入、输出数据限制在(0,1)或(-1,1)区间内。由于数据的取值比较分散,采集的各数据单位有时不一致,因此须对数据进行归一化处理,消除量纲的影响。所谓归一化就是要把需要处理的数据经过处理后限制在一定范围内,归一化是为了后面数据处理的方便,保证程序运行时收敛加快。
BP网络的神经元均采用sigmoid转移函数,变化后可防止因净输入的绝对值过大而使神经元输出饱和,继而使权值调整进入误差曲面的平坦区。Sigmid转移函数的输出在(0,1)或(-1,1)之间,作为教师信号的输出数据如不进行处理,就会使数值大的输出分量绝对误差大,数值小的输出分量绝对误差小,网络训练时只针对输出的总误差调整权值,其结果是在总误差中份额小的输出分量相对误差较大。对输出量进行归一化变换后这个问题可迎刃而解,如果直接用原始数据处理,则可能导致数据误差增大,收敛性下降,甚至不收敛。故对特征值和幅值进行归一化处理,其归一化公式如下:
利用高斯型隶属度函数(式4、5、6)对输入数据进行模糊化处理,对上述每组7个输入模糊化将得到4组,每组21个的模糊量。
3.3 隐含层神经元个数选取
对于BP神经网络来说,隐含层神经元个数的确定是非常重要的,一般认为隐含层神经元个数过多或过少都会导致神经网络的性能不佳。因此根据前人的经验可以参照以下公式进行隐含层神经元数的设定。隐含层数:(其中为隐含层节点数,m为输出层节点数,n为输入层节点数,a为[1,10]之间的常数),确定。为6-15。
对于隐含层神经元个数确定的问题,本文采用试凑法,在其它参数不变的情况下,选用同一样本集进行网络训练,设定相同的目标误差,比较训练步数,从中确定网络误差最小所对应的隐层神经元个数。故障珍断的神经网络模型为3层,分别是输入层,隐含层和输出层。输入层神经元个数为21,输出层神经元个数为4。
运用MATLAB2010神经网络工具箱,针对同一组训练样本,选取不同的隐含层神经元个数,采用trainglm自适应修改学习率算法,训练目标为10-5,分别对网络训练1000次。
隐含层取不同的神经元节点经训练后得出结果如表2。
从以上训练结果表中可以得到,当隐含层神经元个数为13个时,网络训练的误差最低为1.2387e-007。此时经过9次迭代达到训练设定的精度。所以隐含层神经元个数最后确定为13个。因此本文故障诊断采用的BP神经网络是21-13-4的三层结构。模糊神经网络误差收敛图如图1。
3.4 模糊神经网络分析结果
输出结果:
[1 1.2768e-011 1.5529e-011 1.3627e-011;
3.5896e-005 1 3.9006e-005 3.87979e-05;
3.1034e-005 0.00034563 0.99997 0.00032671;
4.23123e-05 2.3578e-11 1.2323e-05 0.99989 ]
根据上述的输出结果,误差5%,满足诊断要求,故证明使用模糊神经网络对异步电动机进行故障诊断是可行的,满足实际需求。
4.结论
针对异步电动机的各种故障特点,提出将神经网络和模糊逻辑结合的模糊神经网络的诊断方法,利用模糊逻辑对输入数据进行模糊化处理,然后将模糊化后的输入导入神经网络中进行诊断分析,最后得到的结果基本满足误差需求,达到故障诊断的要求,证明了模糊神经网络在异步电动机故障诊断应用中的可行性。
参考文献
[1]王江萍.神经网络信息融合技术在故障诊断中的应用[J].石油机械,2009,8:27-30.
[2]孙向作,潘宏侠.基于多传感器数据融合的电机故障诊断[J].微计算机信息,2008,24(9):218-219.
[3]王笑宇.基于BP神经网络的感应电动机故障诊断技术研究[D].桂林理工大学硕士论文,2009.
篇5
1变压器故障分析
电力变压器固体绝缘材料和油在电和热的双重作用下,会产生各种气体,而这些气体将溶解于变压器内部的油中,通过对油中气体种类和含量进行分析,就能判断变压器的故障。产生的气体主要有氢气、烃类、一氧化碳和二氧化碳,其中氢气、甲烷、乙炔、乙烷、乙烯、一氧化碳、二氧化碳是判断故障时用到的主要气体,称为特征气体。热性故障主要是因热应力造成绝缘加速老化引起的。当过热只影响到绝缘油分解而不影响到其他材料时,会发生低温过热,此时主要产生低分子烃,特征气体主要是甲烷和乙烷,并且这两种烃占总烃的80%以上。当温度较低时,甲烷所占比例最大;当温度继续升高到500℃时,即中温过热,乙烯和氢气的含量急剧增大;温度继续升高到700℃(高温过热)以上时,会产生乙炔,但含量不太大,不会超过总烃量的6%。电性故障是在高电应力的作用下导致绝缘老化而引起的内部故障。根据能量密度的不同可分成不同的几种故障类型:(1)高能放电,常见的是线圈匝和层间击穿,其次是对地闪络及分接开关飞弧或者引线断裂,发生前没有先兆现象,很难预测。特征气体主要有乙炔、氢气,其次有乙烯和甲烷。(2)低能放电,低能放电发生的情况较多,如铁芯接地片接触不良或者引线接触不良而引起放电等。特征气体主要有乙炔和氢气,但烃的含量不高。(3)局部放电,局部放电较上面两个放电发生的机率要小很多,发生局部放电时,特征气体会跟随放电能量密度的变化而变化,通常总烃的含量不高,主要是氢气,还有甲烷,氢气通常占氢和总烃的90%以上。
2基于径向基神经网络的变压器故障诊断模型
RBF神经网络是由输入层、隐含层和输出层构成的三层前向网络[10]。输入向量信号传递到隐层,隐层有S1个隐神经元,其节点径向基传递函数为高斯函数(radbas);输出层有S2个神经元,节点函数是线性函数(pruelin)。函数网络的结构如图1所示。当输入向量进入网络的输入端时,径向基层的每个神经元都会输出一个值,代表输入向量和神经元权值向量之间的接近程度。如果输入向量与权值向量相差很多,则径向基层的输出接近0,经过第二层的线性神经元,也输出接近0;如果输入向量与权值向量很接近,则径向基层的输出接近1,经过第二层的线性神经元,输出值就更加接近第二层权值;在这个过程中,如果只有一个径向基神经元的输出为1,而其他的神经元输出均为0或者接近0,那么线性神经元层的输出就相当于输出为1的神经元对应的第二层权值的值。一般情况下,不止一个径向基神经元的输出为1,所以输出值就会有所不同。
2.1径向基神经网络输入输出设计网络输入层节点数就是一个故障模式包含的特征量数。基于油中溶解气体与内部故障的对应关系,本论文采用6种特征气体作为网络的输入向量,它们是H2,CH4,C2H4,C2H2,C2H6,CO2,这样,网络的输入层的节点数被确定为6.在对变压器的故障识别中,采用6种故障类型:低温过热、中低温过热、高温过热、低能放电、高能放电和局部放电,这样输出层的节点数也为6。下图为实现变压器故障诊断的RBF网络拓扑结构。
2.2径向基网络径向基函数确定及样本数据处理针对变压器故障的特点,本文选用高斯函数为径向基函数,具体如下式所示。其中:x是6维输入向量;c为基函数的中心,是与x具有相同维数的向量;δ决定基函数围绕中心点的宽度。径向基函数的优点在于:(1)表现的形式简单,即使是多变量的输入也不会增加过多的复杂性;(2)径向对称;(3)便于理论分析;(4)函数光滑性好,任意阶的倒数都存在。为保证网络的学习信息准确和网络不出现饱和,以及网络的规模不会过大,在把数据输入网络前,把数据进行归一化处理,归一化公式如下。其中:xi表示特征气体的数值,xmin表示所有气体数值中的最小值,xmax表示所有气体数值中的最大值。
2.3用径向基网络进行变压器故障诊断的基本步骤用RBF神经网络诊断变压器故障大致分为三步:(1)收集变压器故障样本数据,对输入向量即6种特征气体数据进行归一化处理;(2)为得到网络训练的输出向量,对变压器故障样本数据中的故障类型进行编码。从RBF神经网络的输入和输出样本数据中选出一些作待测样本,剩下的作训练样本;(3)构建和训练RBF神经网络。根据第一步和第二步得到的RBF神经网络的输入和输出训练样本和待测样本数据,构建和训练RBF神经网络,直到达到满意的精度为止。
3径向基神经网络训练及变压器故障诊断
RBF神经网络训练及变压器故障诊断实验在Mat⁃lab应用软件的神经网络工具箱中进行,实验选取273组故障数据作为训练样本,另外60组故障数据作为待测样本。利用函数newrb()构建RBF神经网络。newrb()函数可自动增加网络的隐层神经元数目,直到均方差满足精度或者神经元数目达到最大为止。调用方式如下:Net=newrb(P,T,goal,spread)其中,P为归一化以后的输入向量构成的矩阵,T为归一化以后的期望输出向量构成的矩阵,goal为训练精度,spread为径向基层的散布常数。用sim()进行故障诊断测试构建的RBF神经网络。调用方式如下:zhenduan=sim(netrbf,P1)其中,P1为归一化以后的待测样本的输入向量构成的矩阵。选取精度goal为0.02,径向基层的散布常数spread为5,构建和训练RBF神经网络,并用待测样本的输入向量P1进行故障诊断测试。RBF神经网络训练过程中的均方差变化情况如图3所示。从图中可以看到,均方差随着训练次数的增加而逐渐减小,当训练次数达到150次的时候,均方差达到目标值。RBF神经网络对待测样本的故障诊断结果如下所示。应用最大隶属原则,将zhenduan中的各个列向量的最大值取为1,其它分量的值取为0,然后与故障类型目标矩阵T1的各个列向量进行比较,有49个诊断结果正确,正确率为81.67%。选取精度goal为0.02,径向基层的散布常数spread分别取为spread=10、spread=14、spread=10.5,构建和训练RBF神经网络,并用待测样本的输入向量P1进行故障诊断测试,诊断结果准正确率列于表2。经比较可以得出,当spread=10.5时准确率最高。所以选择spread=10.5时训练得到的RBF神经网络模型变压器故障诊断模型。
4径向基神经网络故障诊断和三比值法的比较
三比值法的基本原理是变压器发生故障时,从变压器油中提取五种特征气体H2、CH4、C2H2、C2H4、C2H6的成分含量,计算出相应的三对比值C2H2/C2H4、CH4/H2、C2H4/C2H6并赋予相应的编码,再由编码规则,得到一组编码表,然后根据提供的诊断标准就可找到相应的故障类型。用三比值法对上述60组样本检验数据P1进行故障诊断,结果如表3。从表3可以看出,用三比值法有26组数据无法诊断故障类型,有6组故障类型诊断错误,故有32组数据不能正确判断故障类型。三比值法与径向基神经网络模型故障诊断准确率的比较如表4所示。通过上面的实验可知,选择适合的spread参数,基于径向基神经网络模型的变压器故障诊断方法比三比值法具有很好的优越性,诊断的准确率有很大的提高。
5总结
篇6
关键词:神经网络;预测;剩余油气;模式识别;训练
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2015)09-0200-02
Abstract: The paper is aimed at the problem of traditional exploration methods can not predict the remaining oil and gas accurately, the methods of fuzzy theory and self-organizing map are approached. It takes the advantage of Fuzzy neural network system converging faster and higher prediction accuracy, as well as the unsupervised competitive learning mechanism of self-organizing map, it achieves the goal of predicting the remaining oil and gas. The method of neural network improve the precision of remaining oil and gas, it obtains better effect of prediction.
Key words: neural network; predict; remaining oil and gas; pattern recognition; train
石油是国家经济发展的命脉,油气勘探开发则是石油工业的基础,在国民经济的地位举足轻重。随着地震勘探理论方法日趋成熟,我国各大油气田勘探程度相继提高,油气田已经被大幅度开采。然而我国的石油平均采收率并不高,约为30%多一点,还有近70%的油气并未采收,传统的油气勘探方法已经不能满足增加石油的采收率。当前我国各大油田的地质勘探工作已经进入中后期,迫切需要一些新的方法研究方法和技术,对油气田剩余油气的分布和变化趋势做出预测,以便在寻找新的勘探开发领域,同时也能继续对老油气田进行挖掘,从而提高油气产量。
近些年来,随着神经网络技术[1]的日趋成熟,基于模式识别的各类方法技术,如统计模式识别、神经网络、模糊判别等技术和理论在剩余油气预测方面都得到了较多的应用,也取得了较好的结果。其中模糊理论具有很强的表达能力并且容易被人理解,神经网络的自适应学习能力很强。由于模糊理论和人工神经网络各自的优点,常常被单独或者是组合起来运用到实践中,本文主要介绍神经网络的方法运用于预测剩余油气的工作中。
1 模糊理论
1.1 发展历程
1965年美国加州大学伯里克分校的扎德教授首先创立了模糊集合的数学理论,随后P.N.Marions也开始从事相关研究,于1966年发表了一份关于模糊逻辑的研究报告。1974年扎德教授作了模糊推理的研究报告,同年英国的E.H.Mamdanl运用模糊逻辑和模糊推理首次实现了蒸汽机的实验性控制,从此模糊理论的雏形形成了,随后模糊理论[2]掀起了一波热潮。
1.2 在剩余油气预测中的应用
在预测剩余油气[3]的实践中,首先对地震资料做初步的特征提取,然后将提取的样本用模糊理论的聚类方法进行训练,对训练样本进行几类。每类都有各自对应的神经网络,用专属于每类的样本依次训练各自对应的神经网络。具体步骤如下:
1)流体属性的提取
流体属性数据是三维数据,属性的提取方法依赖于具体的物理问题与数据网格的划分。三维数据场属性边界的提取所采用的方法是求出网格点的梯度,特征区域一般是梯度模值较大的区域。对于均匀的三维网格,估计其梯度的方法可采用三维差分。为得到网格点上的梯度值,简单的方法是利用前、后、左、右、上、下六个邻近点的场值进行简单的差分估计。在计算流体力学问题中,采用的网格大都是结构化网格,为计算网格点上的梯度,需将网格变换为均匀规则正交网格。设三维网格交换为[x=T1(ξ,η,?)],[y=T2(ξ,η,?)],[z=T3(ξ,η,?)],在点(m,n,p),其场值梯度在两种网格上的关系式为:
[?f?ξ?f?η?f??=?f?x?f?y?f?z?x?ξ?x?η?x???y?ξ?y?η?y???z?ξ?z?η?z??]
2)模糊系统处理流体属性
确定输入输出的学习样本[(αK,βK,γk)],k为样本个数。利用模糊聚类的方法将输入样本分成N类,N类样本对应N条神经网络。利用各自的样本训练各自的神经网络,选择合适的学习样本,系统经过多次样本训练和样本学习之后,优化出一部分识别精度高的样本,优选的样本到达能辨别精度后,将该样本输出,这样就可以被识别了。
2 自组织神经网络
2.1 结构与工作过程
自组织神经网络是上世纪80年代芬兰Helsink大学的Kohonen在Willshaw与Von der Malsberg在的工作上,结合对自然界中的生物神经系统的理解,创建Kohonen模型,又称Kohonen网络。自组织神经网络[4]的特征映射是基于生物的大脑神经系统,模拟它的自组织特征映射机制,在样本训练中有很强大学习能力,在组织学习中不需要监控,是一种无监督竞争式学习的前馈网络。自组织神经网络通过学习,从而提取某组数据中的某种重要特征或内在规律,按离散时间的方式进行分类。网络可以把任意高维的输入作为输入神经元,映射到低维空间得到输出神经元,并且使得输入神经元内部的某些相似性质表现为几何上邻近的特征映射,这就是人们常说的降维处理。这样输出神经元会聚集成一个输出层,输出层就可以绘制成一维或二维离散几何图形,并且其拓扑结构保持不变。此分类反映了样本集之间的本质区别,大幅度降低了一致性准则中的人为因素。
如图1所示,SOM网络是一种比较简单的双层网络, 由若干输入神经元和输出神经元组成。输入层与输出层各神经元之间实现了全部互相直接或间接的连接方式,每个输出神经元可通过可变连接权与所有输入神经元相连, 且输出神经元间存在局部相互连接。每个连接都具有对应的连接权值,用于表示该连接的强度。各个神经元的连接权值均具有一定的分布,每个输入神经元与输出神经元之间的联系通过连接权来传达。输出层的神经元之间实行侧向连接,相邻的神经元相互激励,距离较远的神经元则相互抑制,然而超过了一定的距离的神经元又具有较弱的激励作用,最后剩下的一个神经元或一组神经元,则反映该类样本的属性。
2.2 预测剩余油气的步骤
1)根据勘探数据体提取流体属性[5],并对其进行预处理。
2)优选出所要了解的流体属性,对其进行降维压缩,将压缩集作为模式识别的输入,以统计的油气储层参数作为输出来训练组组织神经网络。
3)利用模式识别[6]参数和降维压缩集对储层的油气进行预测,从而得到如今的剩余油气的分布。
3 结束语
本文针对传统油气勘探的方法难以满足预测油气田剩余油的难题,着重介绍了模糊理论和自组织神经网络的方法,这两种神经网络的方法各有优势。其中模糊神经网络的系统训练和学习速度快,收敛较快,预测的精度高。自组织神经网络的竞争模式起到了快速优选的作用,神经元之间的协作模式在某种意义上则缩短了整个流程的工作时间。总而言之,神经网络的技术与方法在预测油气田的剩余油气的实践中取得了不错的成果。
参考文献:
[1] 汪镭,周国兴,吴启迪.人工神经网络理论在控制领域中的应用综述[J].同济大学学报:自然科学版,2001,03:357-361.
[2] 王晓军,杨海峰,邱志平,等.基于测量数据的不确定性结构分析的模糊理论[J].北京航空航天大学学报,2010,08:887-891.
[3] 熊艳,包吉山,肖慈.模糊神经网络预测储层及油气[J].石油地球物理勘探,2000,02:222-227.
[4] 易荣庆,李文辉,王铎.基于自组织神经网络的特征识别[J].吉林大学学报:工学版,2009,01:148-153.
篇7
关键词:信用风险评估;支持向量机集成;预测
中图分类号:F830.51
文献标识码:A
文章编号:1003-5192(2009)04-0057-05
1 引言
商业银行作为国民经济的总枢纽和金融信贷中心,发挥着融通资金、引导资产流向和调节社会供需平衡等诸多不可替代的作用。然而商业银行在营运过程中面临着各种各样的风险,包括系统风险和非系统风险,其中在非系统风险中信用风险占有特殊的重要地位。世界银行对全球银行业危机的研究表明,导致银行破产的最常见原因就是信用风险。信用风险又称违约风险,是指借款人、证券发行人或交易对方因种种原因,不愿或无力履行合同条件而构成违约,致使银行,投资者或交易对方遭受损失的可能性[1]。信用风险是商业银行信贷风险管理中一项基础性的工作,其目的在于分析银行在贷款业务中可能面临的信用风险――借款人如期履行特定债务的能力与意愿,从而为贷款决策提供依据。
信用评估方法在不断演进,大致经历了定性分析、统计分析和人工智能三个发展阶段,最初它只是通过信贷分析员阅读申请表并决定是否放贷,但是这一方法主观因素太强,必然存在误判的可能性。统计方法主要是判别分析(DA)[2],判别分析是分类预测的主要研究范畴之一[3],但是判别分析在操作上的一个缺点是其基本假设很容易被打乱。另外,模型只能在已被通过的贷款样本中进行估计,因此存在参数估计的样本偏差。随着信用行业的发展以及贷款组合种类的不断增加,信用评估的准确率哪怕只提高零点几个百分点,都会带来巨大的效益,因此,人们积极探索开发更加准确的信用评估模型,先后就非参数统计模型、人工智能等方法在信用评估方面的应用进行了尝试[4],尤其是最近几年中己经开发出来包括分类树[5]、神经网络[6]以及多元判别法分析[7]等在内的多种方法。但是,这些方法都存在一些缺点,即不能量化解释指标的重要程度,在分类树分析中没有参数,而在神经网络中则没有参数解释,用于信用风险评估具有一定的片面性。同时,神经网络的训练是在黑箱中进行的,这种运算摒弃许多行业经验和专家经验,具有一定的盲目性,人们不能对之进行干预。神经网络适合于对数量指标的分析,而忽略对影响因素中的定性指标的分析,显然是不合理的、片面的。而且用神经网络来评价经济问题时,很难说明神经网络训练后,各网络参数和阀值的经济含义,使得模型缺乏说服性。
研究表明组合分类器的分类精度一般比单个分类器的分类精度高,但是神经网络集成[8]在信用评分中的应用结果表明,神经网络集成的分类精度不如单个神经网络。因为神经网络分类建立在大样本的基础上,而目前银行所保存的数据样本量有限,用集成神经网络分类则必须把所收集的样本分割成多个子样本,从而减少了单个神经网络的训练样本数,进而影响了其分类精度。基于此,许多学者在支持向量机[9~11]的基础上又发展了基于小样本学习的支持向量基集成[12~14],许多领域都用此方法来改善分类精度,应用结果表明支持向量机集成的分类精度至少和单个支持向量机的分类精度一样好。但是目前的研究普遍是基于最多投票原则的集成方法,该方法没有考虑子支持向量机分类器的输出重要性。
长期以来信用风险评估一直被看作是模式识别中的一类分类问题,依据的信用风险衡量标准是贷款企业“违约与否”,利用的是模型与方法的分类功能,形成信用风险的分类评估模式,这种做法被称为“粗暴的经验主义方法”。分类评估模式所反映的有限的经济信息并不能充分满足信贷风险决策的需要,转变评估模式的关键在于确立更为有效、客观的信用风险衡量标准和评估预测模型, 而实施贷款风险的五级分类体系可以提高分类准确性,本文建立基于模糊积分的支持向量机集成方法,该方法考虑了各子分类器的分类结果和各子分类器判决对最终决策的重要程度,并对商业银行信用风险进行五级分类,以某商业银行的实际数据进行实证研究,评估结果表明该评价方法具有科学、简洁、预测精度高等特点,而且模型的结构与方法应用前景广阔。
2 基于模糊积分SVMs集成的模型构建
2.1 Bagging个体生成
Bagging[15]的基础是可重复采样(Bootstrap Sampling)。在该方法中,各支持向量分类器的训练集由原始训练集中随机抽取若干示例组成。训练集的规模通常与原始训练集相当,训练例允许重复选取。这样,原始训练集中某些示例可能在新的训练集中出现多次,而另一些示例可能一次也不出现。Bagging方法通过重新选取训练集增加了分类器集成的差异度,从而提高了泛化能力。
3 模糊密度的确定方法
由模糊积分的定义可知,确定描述各个子支持向量分类器重要性的模糊密度值是基于模糊积分的多分类器集成的关键所在。本文使用混淆矩阵来确定各个支持向量分类器的模糊密度值。
在子支持向量分类器训练完毕后,用子分类器各自的训练集对各个子分类器进行测试得到各自的混淆矩阵。
假定一个K类分类问题,对于子分类器SVCk,其混淆矩阵可以定义为
通过混淆矩阵可以得到各个支持向量机的模糊密度,为利用模糊积分进行支持向量机集成奠定了基础。
4 五类别问题实证分析
4.1 试验过程
仿真实验在Libsvm软件的基础上进行,采用Visual C++编译实现。验证平台为256MB内存的AMD Athlon 1800+,操作系统为Windows 2000。支持向量机集成流程如图1所示。
实验过程如下:
第1步 使用Bagging方法从原始训练集中产生各个子支持向量分类器的训练集,对各子支持向量分类器进行训练;
第2步 给出各训练完毕的子支持向量分类器的五级分类的概率输出模型[17];
第3步 根据第3节中介绍的方法确定模糊密度{g({SVMi,}),k=1,…,c},以此来表示各子支持向量机SVMi,i=1,…,m在各自训练样本上执行好坏的概率密度;
第4步 当给定一个测试样本,得到各子支持向量分类器对该测试样本的类概率输出;第5步 对于ωk,k=1,…,c,根据2.2计算模糊积分ek,集成各子支持向量机;
4.2 指标体系的建立
商业银行面临的信用风险主要与贷款企业本身的信用状况有关,另外还与银行自身贷款分布和行业集中度等因素有关,具体可分为贷款企业风险、商业银行风险、宏观经济风险和其他风险因素。
综合考虑信用风险的各影响因素,依据指标选择原则,借鉴我国财政部统计评价司的企业绩效评价指标体系和中国工商银行企业资信评估指标体系,并参考国内外有关文献,兼顾我国信用风险的特殊性和数据的可获得性,最终确定以下16个指标(图2)用作商业银行信用风险评估。
图2 信用风险评估指标体系
4.3 样本的获取
本文的数据来源于中国工商银行哈尔滨某分行,在采集数据时,注重样本自身的行业特征,不同行业的企业经营环境和业务范围差距很大,企业的各项财务指标和非财务指标也不具有可比性,而且又缺乏必要的行业标准和经验值,因此模型中选用同一行业短期贷款的样本数据来避开这一问题。采集的数据检索条件如下:
(1)样本行业范围:制造业;
(2)贷款种类:短期贷款(一年及一年以内);
(3)贷款发放日期:1998年1月1日至1月31日;
(4)贷款余额截止日:2001年8月13日;
(5)贷款金额:贷款实际发放金额;
(6)贷款余额:截止2001年8月13日确定为损失的贷款余额;
(7)贷款形态:贷款目前所处的形态;
(8)企业全称及代码:识别企业的唯一标识码;
(9)报表日期与报表:1997年12月31日的企业资产负债表和损益表;
(10)经过收集、整理共获取176个样本,涉及贷款额50多亿元人民币。
4.4 样本数据处理
首先对样本进行稳健性处理,选用两倍、三倍标准差检验法进行异常数据剔除,最终获得157个样本数据。将样本集划分为训练样本集和测试样本集,随机抽取35%(56家)作为训练样本集,用于构造SVMs集成模型,其余的65%(101家)作为测试样本集,用于检验模型的泛化能力。以风险为依据,按银行所承受的风险大小来划分贷款质量的分类法,即通常所说的将贷款分为正常、关注、次级、可疑、损失五类的“五级分类法”(表1)。原始数据中,关于原始数据的实际信用等级,该商业银行是按贷款损失占贷款总额的比率来进行统计的。本文采用的是用贷款损失/贷款总额来确定贷款划分的类型,因此不可能完全按照中国人民银行规定的贷款五级分类法的标准,具有一定的预测性,但是,同样,对贷款风险也有较好的指导作用。
在因子分析之前还需要进行巴特利特球体检验和KMO测度,测试结果显示有必要对模型输入指标进行因子分析。本文采用主成分分析法求解初始因子,依据特征值准则(取特征值大于等于1的主成分作为初始因子),因子个数应该确定为4,根据碎石检验准则(Scree Test Criterion)也得到同样的结论,而此时因子累计解释方差的比例可以达到74%以上,保留了原有数据的主要经济信息,并且各因子经济含义较为明确,表明因子个数的确定较为适宜。由于在因子负载矩阵中,相对于0.3的负载而言,变量的方差能够被该因子解释的部分不足10%,所以对于绝对值小于0.3的负载一般可以不予解释,各因子的经济含义较为明确,而且因子与指标间的内在联系比较显著,各因子依次可以归结为营运能力因子、偿债能力因子、盈利能力因子和贷款方式因子。
4.5 实证结果分析
依据表1,按银行所承受的风险大小来划分贷款质量,将贷款分为正常、关注、次级、可疑、损失五类,再将分类结果和实际的分类进行比较,判断分类的正确性,以此对信用风险模型进行评价。
本文采用一对一策略来实现多类别分类,训练出9个SVMs。各子支持向量分类器使用RBF核函数,每个SVM通过10重交叉验证的方法来选择相应的参数,本文进行了10次实验,并将本文提出的模糊积分支持向量机集成方法在五级分类上的执行效果与单一SVM和基于最多投票原则的SVMs集成等的执行效果进行比较,图3为平均执行效果比较,从左到右依次是:(1)神经网络集成;(2)单一模糊神经网络,(3)单一SVM,(4)基于最多投票SVMs集成,(5)基于模糊积分的SVMs集成。由图3可知,基于模糊积分的SVMs集成的分类正确率为87.10%,基于最多投票的SVMs集成的分类正确率为85.17%,单一SVM的正确率为84.524%,模糊神经网络的分类正确率为82.59%,神经网络集成的分类正确率为81.72%。
应用结果表明,基于模糊积分SVMs集成比单个SVM、基于最多投票的SVMs集成和单个模糊神经网络的分类效果好,而单个模糊神经网络的分类正确率比神经网络集成的分类正确率高。支持向量机集成的分类精度最高,可能是因为银行目前所保存的样本量有限,支持向量机适合小样本训练,而神经网络训练则需要大样本支持,在有限的样本中重复抽样,会减少样本量,这样就会降低神经网络的训练精度,从而进一步证明了支持向量机对于小样本训练的优势;并且模糊积分在进行多分类器决策融合的时候综合考虑了各子分类器的分类结果和各子分类器判决对最终决策的重要程度的缘故,证实了本文提出的方法的准确性和有效性。
5 结束语
本文提出了一个基于模糊积分的支持向量机集成方法。该方法最主要的优点是它不仅组合各个分类结果,而且考虑不同SVMs分类器的相对重要性。将此方法应用于商业银行信用风险评估,模拟结果表明该方法比单个SVM、基于最多投票的SVMs集成方法、神经网络和神经网络集成的效率高,效果好。说明基于模糊积分的SVMs集成的商业银行信用风险评价是可行和有效的。进一步研究的方向是设定更加合理的模糊密度和用其它方法(如加速法)来构建SVMs。
参 考 文 献:
[1]丁欣.国外信用风险评估方法的发展现状[J].湖南大学学报(社会科学版),2002,16(3):140 142.
[2]Jackson P, Perraudin W. Regulatory implications of credit risk modelling[J]. Journal of Banking and Finance, 2000, 24(1): 1 14.
[3]De Andres J, Linda M, Lorca P. Forecasting business profitability by using classification techniques: a comparative analysis based on a Spanish case[J]. European Journal of Operational Research, 2005, 167(2): 518 542.
[4]West D. Neural network credit searing models[J]. Computers & Operations Researeh, 2000, 27(4): 1131 1152.
[5]姜明辉,王欢,王雅林.分类树在个人信用评估中的应用[J].商业研究,2003,(12):15 19.
[6]Lee K C, Han I, Kwon Y. Hybrid neural network models for bankruptcy predictions[J]. Decision Support System, 1996, 18(1): 63 72.
[7]方洪全,曾勇.运用多元判别法评估企业信用风险的实例[J].预测,2004,23(2):6568.
[8]Tsai C F, Wu J W. Using neural network ensembles for bankruptcy prediction and credit scoring[J]. Expert Systems with Applications, 2008, 34(4): 2639 2649.
[9]Huang C L, Chen M C, Wang C J. Credit scoring with a data mining approach based on support vector machines[J]. Expert Systems with Applications, 2007,33(4): 847856.
[10]Xu Xiujuan, Zhou Chunguang, Wang Zhe. Credit scoring algorithm based on link analysis ranking with support vector machine[J]. Expert Systems with Applications, 2008, 36(2): 18.
[11]Crook J N, Edelman D B, Thomas L C. Recent developments in consumer credit risk assessment[J]. European Journal of Operational Research, 2007, 183(3): 1447 1465.
[12]Nanni L, Lumini A. MppS: an ensemble of support vector machine based on multiple physicochemical properties of amino acids[J]. Neurocomputing, 2006, 69(13): 1688 1690.
[13]Li Bo, Li Xinjun, Zhao Zhiyan. Novel algorithm for constructing support vector machine regression ensemble[J]. Journal of Systems Engineering and Electronics, 2006, 17(3): 541 545.
[14]Bertoni A, Folgieri R, Valentini G. Bio molecular cancer prediction with random subspace ensembles of support vector machines[J]. Neurocomputing, 2005, 63(6): 535 539.
[15]Breiman L. Bagging predictors[J]. Machine Learning, 1996, 24(2): 123 140.
[16]Kwak K C, Pedrycz W. Face recognition: a study in information fusion using fuzzy integral[J]. Pattern Recognition Letters, 2005, 26(6): 719 733.
篇8
关键词:智能家居 神经网络推理算法 遗传算法 径向基函数神经网络
中图分类号:TU855;TU892 文献标识码:A 文章编号:1007-9416(2016)04-0000-00
随着科技的进步和生活质量的提升,智能家居必将成为未来家居的发展趋势。为了提高防火控制器系统的辨别能力,利用多源信息融合技术,利用遗传算法改进径向基函数神经网络(RBF),充分结合模糊控制和神经网络处理两者的优点,极大的改善系统的控制误差及误差变化,并且自适应、自组织,通过数据的采集、MATLAB仿真,验证了所提改进方法的正确性和有效性。
1 多元信息融合技术
信息融合技术应用十分广泛,在火灾检测系统中,烟雾传感器、温度传感器、CO传感器等虽然各具特色,但通过多元信息融合将不同的传感器采集的信号进行抽象化分类组合,以获得准确的判断,从而大大提高防火系统的稳定度与灵敏性。信息融合算法众多,本问采用模糊逻辑算法和神经网络算法,利用遗传算法改进径向基函数神经网络,来进行各输入信号的融合处理,具体问题具体分析,解决火灾检测难题。
其中 反映学习速度, 为系统输入, 、 、 分别为烟雾、温度和CO浓度调整参数,来控制 。RBFNN和反向传播前向网络(BP)相比较,BP网络由于采用非线性梯度优化算法,容易形成局部极小不易获得全局的最优性,相反RBFNN更加容易获得最优解,并且学习速度更快,以便提高探测精度。
3 遗传算法的 、 、 整定
遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。特别对于一些非线性模块的函数优化方面,基于“适者生存”的机制,快速响应得到最终结果,具有良好全局搜索能力,收敛速度迅速,不被局部优化解的困扰。遗传算法的这些性质,已被广泛应用与信号处理、自适应控制和组合优化等领域,是智能计算的必不可少的技术。
一般选择适应度高的种群进行复制、交叉以及变异操作,对隐含层节点中心值、隐含层节点宽度和输出线性权值优化,最终确保RBFNN网络系统能够得到全局最优解。
4 网络学习算法的实现
网络学习算法需要解决RBFNN的中心选取、方差和输出权值等问题,由于火灾检测具有随机性与动态性,应该选取能够在线动态学习的算法来选取中心,因此采用自组织选取中心法,无需确定隐含层的节点个数。最近邻法基于类比学习,既可以用于聚类,也可以用于分类,K-means是基于最近邻法的聚类方法,采用其来选取中心最大的优势在于简洁和快速。
5 模糊RBFNN系统设计与仿真
本文设计的火灾探测系统算法由两部分组成,第一部分为模糊神经网络系统,其输入为三种传感器采集火灾现场的数据,进行相应的归一化处理,输入到改进型的RBFNN网络中,再输出三种火情概率;第二部分运用模糊逻辑系统进行推理判决,得到最终的控制信号。
由于明火或阴燃火概率处于中间值,系统难以准确判断是否有火灾,本系统中加入烟雾持续时间函数 , 为判断阈值, 为实际烟雾持续时间,只有当烟雾浓度持续的时间超过阈值, 才会被累加,否则为离散时间变量。仿真结果如图1:
图1中,曲线a代表无火概率,b代表阴燃火概率,c代表明火概率,d代表判断阈值,可知,当明火概率大于0.6时,则输出判断发生火灾。根据仿真图验证了所改进算法以及设计方法的正确性和有效性,能够有效判断是否发生火灾,降低系统误报率。
参考文献
[1]林文韬,刘太君,叶焱 等.基于改进型径向基函数神经网络的功放线性化[J].微波学报,2015,31(5):47-50.
[2]王嘉轶,闻新.基于改进RBF-NN优化模糊PID控制器的设计方法[J].航空兵器,2015,10(5):60-65.
[3]韦巍,何衍.智能控制基础[M].北京:清华大学出版社,2008.
篇9
关键词:安全气囊;点火算法;智能控制
中图分类号: U461.91文献标文献标识码:A文献标DOI:10.3969/j.issn.2095-1469.2013.02.01
自从20世纪80年代在汽车上应用以来,安全气囊已经挽救了无数乘员的生命,尤其是其与安全带配合使用,可以使车辆在发生碰撞事故时前排乘员的死亡率降低61%[1]。然而,由于气囊不适当的展开造成乘员损伤甚至死亡的事件也愈见频繁。据NHTSA报道,在2001~2006年间,美国有大约1 400位乘员因为安全气囊的误点火死亡,这为安全气囊的应用前景蒙上了一层阴影[2]。
汽车安全气囊点火算法是安全气囊控制系统的核心,它依据各安全法规的乘员碰撞损伤要求,并综合判断点火条件,来解决气囊是否需要点火以及何时点火的问题。如果算法判断气囊在不需要点火的低速碰撞、干扰路况时误点火,或者在高速柱碰撞时漏点火、迟点火都会对乘员造成生命危险。由于算法计算误差造成气囊在高强度碰撞时早点火,则会引起乘员在碰撞过程中接触已泄气的气囊,而得不到最佳保护。因此,安全气囊算法的优劣直接关系到驾乘人员的生命安全。本文对目前国内外常用的安全气囊点火算法进行了总结归纳,并指出了今后的发展方向。
1 点火算法的理论依据
1.1 乘员损伤准则
安全气囊的点火阈值是依据碰撞中乘员所受的损伤程度来确定的。如果在某一碰撞条件下乘员的损伤程度达到法规规定的乘员损伤指标,则该碰撞条件所确定的阈值为气囊必须点火的阈值,因此了解乘员伤害的评价指标是开发安全气囊算法的首要任务。在安全气囊碰撞试验中,不但需要评价乘员头部的伤害指标值,还要评价气囊对乘员的面部、胸部、颈部、下肢等部位的伤害情况[3-4]。表1是美国、欧洲以及中国正面碰撞法规对乘员损伤指标的规定,美国FMVSS 208法规比较全面地规定了各种碰撞假人在不同碰撞形式下的试验要求和损伤指标,这里仅选取50百分位男性假人在100%正面碰撞中的损伤指标为例进行介绍。
1.2 点火条件
安全气囊点火条件指碰撞过程中用来判断气囊是否需要点爆的输入条件。传统的安全气囊算法是把碰撞事故的严重程度作为气囊的点火条件,碰撞事故的严重程度用气囊的点爆速度表示,即汽车和固定壁障发生与碰撞事故强度相当的正面碰撞时的等效初速度。欧洲ECE R94法规规定作为安全带辅助装置的安全气囊的点爆速度为:低于20 km/h正面撞击固定壁障时不应点火,大于30 km/h时必须点火,20~30 km/h时不作要求。在美国,要求安全气囊对未佩戴安全带的乘员也有较好的保护作用,因此Ford公司规定的安全气囊引爆速度为:低于12.8 km/h正面撞击固定壁障时不点火,高于22.4 km/h时必须点火,12.8~22.4 km/h时不作要求。我国的汽车安全法规主要参考欧洲法规,在安全气囊的设计准则上与欧洲ECE R94法规的要求相一致。
近年来,随着智能型安全气囊的提出,要求相应的智能安全气囊点火算法不仅要考虑汽车碰撞的严重程度这一个点火条件,还需要判断汽车的碰撞形式和乘员的状态等条件。文献[8]详细介绍了汽车所有可能发生的碰撞形式。而汽车乘员的状态主要包括乘员大小、乘员佩戴安全带状态以及乘员的离位状态。
1.3 点火时刻
1.3.1 最佳点火时刻
气囊最佳点火时刻是指当乘员的面部刚刚接触到安全气囊气袋时,气袋恰好充满气体,这时气袋对乘员的冲击力最小,又能通过压缩和泄气孔吸收乘员大部分的碰撞能量,对乘员的保护效果最好。对于驾驶员侧气囊目前最常用的是“127 mm-30 ms”准则。这个准则的含义是:在汽车碰撞过程中,乘员相对于车体向前移动127 mm时刻的前30 ms是气囊的最佳点火时刻。其依据是大多数轿车乘员与转向盘之间的间距为305 mm,气囊充满气的厚度为178 mm,气囊从点火至展开到最大体积的时间约为30 ms,由此确定乘员前移127 mm这一时刻的前30 ms为最佳点火时刻。
1.3.2 实际点火时刻
安全气囊的实际点火时刻是指实际碰撞事故中气囊点爆的时刻。在前排成年乘员正常坐姿和佩戴安全带的状态下,针对不同车型确定其点火条件的阈值,在实际撞车事故中,当点火条件超过阈值时气囊点爆。由于汽车碰撞事故的不确定性以及算法本身的缺陷,实际点火时刻与最佳点火时刻往往不会重合。如果实际点火时刻提前,乘员头部与气囊相接触时,气囊通过泄气孔流失了大部分气体,不能对乘员起到最佳保护作用;如果实际点火时刻延后,乘员与继续膨胀的气囊接触时,气囊展开的强大冲击力同样会对乘员造成致命的伤害。因此,确保实际点火时刻与最佳点火时刻的一致性是目前智能安全气囊控制算法设计的主要目标。
2 传统安全气囊点火算法
传统的安全气囊点火算法主要根据汽车碰撞时的加速度信号及其线性变化量,例如速度变化量、车辆碰撞力或者能量变化等作为基本参数,判断安全气囊点火条件,最终确定气囊是否需要点火。主要的算法形式包括加速度峰值法、加速度梯度法、速度变化量法、比功率法、移动窗算法、ARMA模型预报算法。
2.1 加速度峰值法
加速度峰值算法直接利用加速度传感器信号来控制安全气囊的点爆,当加速度信号超过预先设定的阀值就发出气囊点火信号,使气囊充气。
加速度传感器在车辆上的主要安装位置包括:发动机舱内左右大灯或翼子板附近、车辆左右B柱。中央气囊传感器安装在中央仪表板下方或者地板控制台下方。无论是安装在发动机舱内还是左右B柱的加速度传感器,安装位置处于车辆碰撞时的变形区,噪声干扰会对加速度信号造成很大的影响;中央气囊传感器未处于变形区,受到噪声的影响较小,但是采集到的信号不能正确反映碰撞的真实情况。因此除非处于变形区的传感器已经被撞坏,否则不会单独使用[9-11]。所以,采用加速度峰值算法需要对加速度信号进行很好的滤波,它一般应用于机械式的安全气囊控制系统。目前,加速度峰值算法主要有以下两方面的应用。
(1)“门槛”作用:在一些气囊点火算法中,当加速度值超过一定阈值(如3 g)时,判断有碰撞发生,主体安全气囊点火算法开始计算。
(2)高速碰撞时直接点爆气囊的作用:当车辆以特别高的速度发生碰撞时,加速度值超过设定的高阈值,则直接向气体发生器发出点火信号,省去复杂的信号处理和计算过程,在高速碰撞时及时点爆气囊。
2.2 加速度梯度法
加速度梯度算法是对加速度变化率的判断,把滤波后的加速度数据对时间求导数,然后与预先设定的阈值进行比较,确定气囊是否需要点火。
加速度梯度法对噪声非常敏感,当车辆在起伏路上行驶、紧急制动或者与阶梯发生低速碰撞时,加速度梯度值也有可能超过阈值而导致气囊点爆,对乘员造成伤害。因此加速度梯度算法需要对加速度信号进行很好的滤波,这样就造成了碰撞检测时间的增加,并提高了气囊控制系统的开发成本。不过,正如加速度梯度法的提出者美国ASL实验室的Tony Gioutsos指出的那样,加速度梯度参数对碰撞具有预测能力,它能够在碰撞发生之前预测到即将发生的碰撞,并预测乘员的位移,在控制气囊的点火时刻方面有着其它传统算法无法比拟的优越性[12-13]。因此,将加速度梯度算法与其它算法,如抗干扰能力较强的移动窗算法结合使用,可以综合两者的优点,并弥补加速度梯度法抗干扰能力差的缺点。
2.3 移动窗积分算法
在介绍移动窗算法之前,简要介绍一下速度变化量法。对碰撞过程中的加速度信号进行积分可以得到速度变化量,当速度变化量超过预先设定的阈值时就发出点火信号。速度变化量算法的关键是确定积分开始的时刻,现在一般通过加速度阈值来确定碰撞的起始时刻,同时认为碰撞的起始时刻为积分开始时刻。
为了避免选取积分开始时刻带来的误差和不便,一般使用移动窗积分算法代替速度变化量法。选取一个适当的窗宽T,对当前时刻之前T时间段内的加速度数据进行积分,并将积分结果与阈值比较,如果超过预先设定的阈值,则发出点火信号。由移动窗积分算法得到的速度变化量曲线比较平滑,有一定的抗干扰能力,在汽车发生100%正面碰撞时,能够很容易判断车辆碰撞的严重程度,确定气囊是否需要点火。但是仅仅利用速度变化量参数ΔV,不能区分碰撞类型,当车辆发生柱碰撞、角度碰撞时,气囊会发生漏点火现象。
文献[14]和[15]在移动窗积分算法的基础上引入了另外一个参数,用加速度曲线的长度L来判断汽车的碰撞形式(a为加速度)。
.
因为高速柱碰撞的加速度比低速正面碰撞的加速度振荡幅度更大,振荡频率也更快,即加速度曲线上的褶皱更加严重、密集,因此利用移动窗内加速度曲线的长度参数可以轻易地将高速柱碰撞从低速正面碰撞中区分出来,避免高速柱碰撞时由于安全气囊不展开而造成的乘员伤害。然而,当汽车紧急制动或者在起伏路、搓板路等崎岖不平的道路上行驶时,加速度曲线长度值也会很大,抗干扰能力变差。因此只有同时使用速度变化量和加速度曲线长度两个参数,才能实现对安全气囊系统的准确控制。另外,为了提高移动窗算法的路面抗干扰能力,文献[16]提出同时对水平方向ax和垂直地面方向az进行两向加速度合成积分,来削弱路面干扰信号对碰撞信号的影响。
,
式中:Sc为双向合成积分量;n为当前时间点;k为算法考虑的采样点数,即窗宽;fs为采样频率;ρ为合成因数,表征两个方向加速度在合成算法中的权重。
2.4 比功率算法
对碰撞过程中汽车的动能两边进
行求导,可以得到汽车碰撞过程中的功率
。接着对其两边再进行求导可以得到比功率公式d,将得到的结果与阈值进行比较,可以判断气囊是否需要点火[17-18]。
比功率算法综合了加速度、速度变化量和加速度梯度3个参数,同时融合了加速度峰值法、移动窗算法和加速度坡度法3种算法的优点。(1)对于偏置碰撞、柱碰撞和角度碰撞等碰撞形式,单纯的速度变量参数不能很好地识别碰撞,而较敏感的加速度梯度参数可以解决这一问题。(2)加速度坡度法比较敏感,在进行长时间的车辆状态判断中会出现混乱,而速度变量法比较稳定,可以长时间判断汽车安全气囊是否需要点火。(3)加速度梯度法在起伏路等干扰路况中很敏感,容易出现误点火的情况,在比功率算法中综合了速度变化量参数,就可以通过一个很小的ΔV来调整梯度值,增强了算法的抗干扰能力。然而,比功率算法只是考虑了车辆碰撞强度这一点火条件,未考虑乘员状态,也未对碰撞时刻进行控制,仍然会出现误点火、迟点火、早点火的现象。
2.5 ARMA模型预报算法
ARMA模型预报算法是一种运用系统辨识建立的预测车身加速度和乘员头部位移之间关系的方法。将系统假设为单输入单输出(SISO)系统,系统的“输入”就是车身加速度,系统的“输出”就是乘员头部的位移,乘员头部的位移除了受车身加速度的影响外,还要受到安全带的自由行程、安全带的制造误差、座椅的刚度和乘员的坐姿等不确定因素的影响,用噪声N(k)来表示[4]。系统的结构图如图1所示。
建立了系统的模型后,根据试验数据训练系统的参数,从而对系统进行预报控制,一般采用二阶的ARMA模型就可以满足预报要求。ARMA模型控制安全气囊的步骤为:(1)检测成员位置和车身减速度信号。(2)辨识乘员位置与车身减速度信号关系的数学模型。(3)预报30 ms后时刻乘员头部位置。(4)如果达到127 mm就发出气囊点火信号,否则重复步骤(1)。
2.6 安全气囊传统点火算法的优缺点对比
安全气囊传统控制算法结构简单,容易实现,各有其特点。这里分别从算法的复杂度、稳定性、抗干扰能力、点火时刻控制、滤波要求和使用范围进行列表对比,见表2。
综上所述,传统安全气囊主要基于汽车碰撞过程中的加速度信号及其线性变化量,判断汽车发生碰撞的情况,在控制安全气囊的起爆过程中存在着一些缺陷。(1)缺少乘员检测程序,造成座位无乘员乘坐、乘坐儿童等小个子乘员或者乘员处于离位状态时气囊全力展开。(2)不能判断出汽车的碰撞形式,造成安全气囊在高速柱碰撞、偏置碰撞、斜碰撞等碰撞形式下不展开。(3)抗干扰性能不佳,造成安全气囊在起伏路、阶梯等干扰路况行驶时展开。(4)点火时刻控制不佳,造成气囊的早点火和迟点火。(5)不能实现气囊的分级起爆。
3 智能安全气囊点火算法
NHTSA指出由于目前的车辆乘员约束系统对碰撞类型识别、乘员类型识别以及约束系统工作时刻判断的不准确,导致汽车发生正面碰撞事故时乘员因为约束系统的误动作而死亡的情况经常发生。因此随着法规以及消费者对汽车安全性能要求的提高,智能安全气囊点火算法的研究越来越被重视。目前,研究较多的智能安全气囊算法主要有:基于乘员检测的自适应安全气囊算法、模糊神经网络算法、主被动安全系统一体化算法。
3.1 基于乘员检测的自适应安全气囊算法
乘员检测技术应用在汽车上至少可以带来3个方面的好处。(1)降低乘车成本。如果检测到乘员座位无人,当车辆发生碰撞时乘员侧安全气囊不需要点爆,这样就减少了更换安全气囊带来的花费。(2)提高乘车舒适性。当检测到乘员座位有人乘坐时,可以自动打开空调等系统,使乘员乘车舒适。(3)提高乘车安全性。当乘员座位为小个子乘员、婴儿或乘员处于离位状态时可以使安全气囊不展开或者低级展开,避免因气囊全力展开对乘员造成伤害。乘员检测的内容包括:乘员占座检测、乘员大小分类、乘员坐姿检测和乘员佩戴安全带状态检测[19-21]。
近年来,乘员检测系统致力于融合多种乘员信息,综合考虑乘员大小、乘员坐姿以及乘员佩戴安全带的状态,为安全气囊点火系统提供丰富的乘员信息。文献[22]和[23]首先利用重力传感器检测乘员占座情况,根据体重对乘员进行分类,并根据重心初步检测乘员的位置,然后利用视觉传感器跟踪乘员头部运动轨迹,实时检测乘员的坐姿。文献[24]基于不同类型乘员的体压分布特征,采用支持矢量机(Support Vector Machine,SVM)算法,通过压力传感器测得不同乘员类型在不同坐姿下的体型特征样本对SVM进行了训练及检验,最终得到满足精度要求的乘员坐姿识别器。随着摄像机和立体图像处理技术的发展,仅仅使用视觉检测系统来识别乘员综合状态的目标正在逐步实现。文献[25]和[26]开发的视觉传感系统主要检测乘员脸部位置,其中文献[25]提出了适用于乘员脸部检测的3种算法即Viola-Jones算法, Kienzle算法和Nilsson算法,虽然通过验证发现这3种算法在人脸检测系统中还存在不稳定的缺点,但是为乘员检测算法指出了一个有效的研究方向。文献[27]介绍了视觉传感器与先进的数字信号处理器DSP的应用,结果显示乘员分类以及乘员坐姿分析的正确率可以达到97%,但耗时为970 ms,这对于实现实时跟踪乘员头部位移以及控制气囊在最佳时刻点火的目标仍然存在一定的差距。现在基于视觉传感器以及体压分布的乘员识别系统所采用的模式识别技术跟模糊神经网络的应用密不可分[28-30]。
3.2 模糊神经网络算法
模糊神经网络算法将模糊算法的非线性信息处理能力和神经网络的自学习自适应功能应用于汽车安全气囊控制系统中,有以下两个方面的用途[4,31]。(1)与乘员识别系统相结合,实现乘员分类、乘员坐姿识别以及乘员头部跟踪。(2)与汽车加速度传感器结合使用,通过对加速度序列的训练,实现对碰撞严重程度、碰撞形式的判断。模糊神经网络的基本构造思想为:构造一个包含输入层、隐含层和输出层的神经网络系统,应用实际碰撞试验中的加速度序列值或者乘员图像信息作为输入量,利用反向传播算法(BP算法)训练神经网络,逐步修改模糊隶属度函数,确定相关参数阈值,最终获得精准的模糊规则,应用于实际汽车碰撞事故时安全气囊的点火控制[32-34]。
文献[35]和[36]介绍了一种基于自适应模糊神经网络系统(ANFIS)的安全气囊控制算法,其中文献[36]设计了一种“两阶段模糊算法”的ANFIS结构,利用了多个设计参数来支持算法。当加速度信号G超过预先设定值后,利用该时间段内对加速度信号两次积分得到一个距离值“disp1”与设定的阈值作比较,判断碰撞是否是“严重”碰撞。如果不是严重碰撞或者不能判断,则进入第二层判断,引入了加速度值对时间的导数“jerk”,加速度超过阈值后“jerk”值超过阈值的次数“njerk”以及加速度超过阈值与“jerk”值第1次超过阈值的时间间隔“tw”这3个参数,利用当前时间段内的“disp2”,“njerk”和“tw”3个参数来判断碰撞的严重程度。文献[37]利用遗传算法对模糊神经网络的隶属度函数进行训练,通过随机但有向的搜索机制寻找全局最优解。解决了由人类经验产生的模糊控制规则固定不变的问题,并且在设计空间可以进行多点搜索,大大降低了系统陷入局部最优值的概率。文献[38]提出的应用进化策略对参数进行优化的算法,选择碰撞过程中的速度、加速度、加速度偏差和乘员的头部位移4个参数集作为系统的输入,通过对参数集进行一系列的变异、复制和选择,确定最优参数集,并建立一个质量函数来评价算法的功能。
3.3 主被动安全系统一体化的预测算法
主动安全系统通过其高性能的传感器,例如雷达传感器、立体视图摄像机和超音波感测传感器等,在汽车即将发生碰撞时发出警告,并通过制动踏板或者转向轮来避免碰撞发生。主动安全系统提供的信息可以应用于安全气囊的预碰撞识别系统,根据碰撞时车辆相对于前端障碍物的航向角、相对位置和相关速度预测即将发生的碰撞的场景,预测碰撞的严重程度和碰撞类型,为安全气囊准确展开提供保证。文献[39]中,Kwanghyun等人基于预警制动防撞系统(CMS)、自适应巡航系统(ACC)、车道偏离警示系统(LDWS)等主动安全装置提供的信息和加速度传感器信息提出了一种预碰撞算法和碰撞算法相融合的安全气囊算法。该算法利用预碰撞算法得到以下3方面的信息。(1)通过估计前端障碍物的位置预测碰撞发生的可能性。(2)通过利用雷达传感器提供的相关速度和距离来计算碰撞发生的时间。(3)基于前端障碍物的位置来描述碰撞类型。然后应用碰撞算法判断汽车碰撞的发生时刻、碰撞类型、碰撞严重度和气囊点火时刻,与预碰撞算法通过“AND”语句实现对汽车碰撞现场的精确掌握,以保证安全气囊准确动作。文献[40] 提出了一种针对汽车100%正面碰撞的主被动安全系统集成算法,并指出主被动融合技术的下一步就是实现碰撞的准确预测和在汽车上的匹配应用。
4 结论
本文详细介绍了传统安全气囊点火算法,对传统安全气囊点火算法的优缺点进行了列表对比,并针对智能安全气囊算法的3个发展方向进行了详细分析,总结出安全气囊算法的发展方向。
(1)自适应安全气囊算法:安全气囊控制系统根据座位乘员的大小、坐姿以及佩戴安全带状态选择气囊是否起爆或者调整气囊起爆级别,目前需要解决系统的实时性问题。
(2)基于模糊神经网络的智能算法:利用模糊神经网络解决非线性问题的能力,处理汽车碰撞类型的识别问题,并实现乘员头部位移的跟踪,目前模糊神经网络的应用还存在稳定性问题和局部最优解问题。
篇10
80年代初,在美国、日本、接着在我国国内都掀起了一股研究神经网络理论和神经计算机的热潮,并将神经网络原理应用于图象处理、模式识别、语音综合及机器人控制等领域。近年来,美国等先进国家又相继投入巨额资金,制定出强化研究计划,开展对脑功能和新型智能计算机的研究。
人脑是自生命诞生以来,生物经过数十亿年漫长岁月进化的结果,是具有高度智能的复杂系统,它不必采用繁复的数字计算和逻辑运算,却能灵活处理各种复杂的,不精确的和模糊的信息,善于理解语言、图象并具有直觉感知等功能。
人脑的信息处理机制极其复杂,从结构上看它是包含有140亿神经细胞的大规模网络。单个神经细胞的工作速度并不高(毫秒级),但它通过超并行处理使得整个系统实现处理的高速性和信息表现的多样性。
因此,从信息处理的角度对人脑进行研究,并由此研制出一种象人脑一样能够“思维”的智能计算机和智能信息处理方法,一直是人工智能追求的目标。
神经网络就是通过对人脑的基本单元---神经元的建模和联结,来探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。本文介绍神经网络的特点以及近年来有关神经网络与混沌理论、模糊计算和遗传算法等相结合的混合神经网络研究的动态。
一.神经网络和联结主义
回顾认知科学的发展,有所谓符号主义和联结主义两大流派。符号主义从宏观层次上,撇开人脑的内部结构和机制,仅从人脑外在表现出来的智能现象出发进行研究。例如,将记忆、判断、推理、学习等心理活动总结成规律、甚至编制成规则,然后用计算机进行模拟,使计算机表现出各种智能。
符号主义认为,认识的基本元素是符号,认知过程是对符号表示的运算。人类的语言,文字的思维均可用符号来描述,而且思维过程只不过是这些符号的存储、变换和输入、输出而已。以这种方法实现的系统具有串行、线性、准确、简洁、易于表达的特点,体现了逻辑思维的基本特性。七十年代的专家系统和八十年代日本的第五代计算机研究计划就是其主要代表。
联接主义则与其不同,其特点是从微观出发。联接主义认为符号是不存在的,认知的基本元素就是神经细胞(神经元),认知过程是大量神经元的联接,以及这种联接所引起的神经元的不同兴奋状态和系统所表现出的总体行为。八十年代再度兴起的神经网络和神经计算机就是这种联接主义的代表。
神经网络的主要特征是:大规模的并行处理和分布式的信息存储,良好的自适应、自组织性,以及很强的学习功能、联想功能和容错功能。与当今的冯.诺依曼式计算机相比,更加接近人脑的信息处理模式。主要表现如下:
神经网络能够处理连续的模拟信号。例如连续灰度变化的图象信号。
能够处理混沌的、不完全的、模糊的信息。
传统的计算机能给出精确的解答,神经网络给出的是次最优的逼近解答。
神经网络并行分布工作,各组成部分同时参与运算,单个神经元的动作速度不高,但总体的处理速度极快。
神经网络信息存储分布于全网络各个权重变换之中,某些单元障碍并不影响信息的完整,具有鲁棒性。
传统计算机要求有准确的输入条件,才能给出精确解。神经网络只要求部分条件,甚至对于包含有部分错误的输入,也能得出较好的解答,具有容错性。
神经网络在处理自然语言理解、图象模式识别、景物理解、不完整信息的处理、智能机器人控制等方面有优势。
符号主义和联接主义两者各有特色,学术界目前有一种看法:认为基于符号主义得传统人工智能和基于联接主义得神经网络是分别描述人脑左、右半脑的功能,反映了人类智能的两重性:精确处理和非精确处理,分别面向认识的理性和感性两个方面,两者的关系应该是互补而非互相代替。理想的智能系统及其表现的智能行为应是两者相互结合的结果。
接下去的问题是,符号AI和联接AI具体如何结合,两者在智能系统中相互关系如何?分别扮演什么角色?目前这方面发表的文献很多,大致有如下几种类型:
1.松耦合模型:符号机制的专家系统与联接机制的神经网络通过一个中间媒介(例如数据文件)进行通讯。
2.紧耦合模型:与松耦合模型相比较,其通讯不是通过外部数据进行,而是直接通过内部数据完成,具有较高的效率。其主要类型有嵌入式系统和黑板结构等。
3.转换模型:将专家系统的知识转换成神经网络,或把神经网络转换成专家系统的知识,转换前的系统称为源系统,转换后的系统称为目标系统,由一种机制转成另一种机制。如果源系统是专家系统,目标系统是神经网络,则可获得学习能力及自适应性;反之,可获得单步推理能力、解释能力及知识的显式表示。当然,转换需要在两种的机制之间,确定结构上的一致性,目前主要问题是还没有一种完备而精确的转换方法实现两者的转换。有待进一步研究。
4.综合模型:综合模型共享数据结构和知识表示,这时联接机制和符号机制不再分开,两者相互结合成为一个整体,既具有符号机制的逻辑功能,又有联接机制的自适应和容错性的优点和特点。例如联接主义的专家系统等。
近年来神经网络研究的另一个趋势,是将它与模糊逻辑、混沌理论、遗传进化算法等相结合,即所谓“混合神经网络”方法。由于这些理论和算法都是属于仿效生物体信息处理的方法,人们希望通过她们之间的相互结合,能够获得具有有柔性信息处理功能的系统。下面分别介绍。
二.混沌理论与智能信息处理
混沌理论是对貌似无序而实际有序,表面上看来是杂乱无章的现象中,找出其规律,并予以处理的一门学科。早在七十年代,美国和欧洲的一些物理学家、生物学家、数学家就致力于寻求在许许多多不同种类的不规则性之间的联系。生物学家发现在人类的心脏中有混沌现象存在,血管在显微镜下交叉缠绕,其中也有惊人的有序性。在生物脑神经系统中从微观的神经膜电位到宏观的脑电波,都可以观察到混沌的性态,证明混沌也是神经系统的正常特性。
九十年代开始,则更进一步将混沌和神经网络结合起来,提出多种混沌神经网络模型,并探索应用混沌理论的各种信息处理方法。例如,在神经元模型中,引入神经膜的不应性,研究神经元模型的混沌响应,研究在神经网络的方程中,不应性项的定标参数,不定性时间衰减常数等参数的性质,以及这些参数于神经网络混沌响应的关系,并确定混沌---神经网络模型具有混沌解的参数空间。经过试验,由这种混沌神经网络模型所绘出的输出图形和脑电图极为相似。
现代脑科学把人脑的工作过程看成为复杂的多层次的混沌动力学系统。脑功能的物理基础是混沌性质的过程,脑的工作包含有混沌的性质。通过混沌动力学,研究、分析脑模型的信息处理能力,可进一步探索动态联想记忆、动态学习并应用到模式识别等工程领域。例如:
对混沌的随机不规则现象,可利用混沌理论进行非线性预测和决策。
对被噪声所掩盖的微弱信号,如果噪声是一种混沌现象,则可通过非线性辨识,有效进行滤波。
利用混沌现象对初始值的敏锐依赖性,构成模式识别系统。
研究基于混沌---神经网络自适应存储检索算法。该算法主要包括三个步骤,即:特征提取、自适应学习和检索。
模式特征提取采用从简单的吸引子到混沌的层次分支结构来描述,这种分支结构有可能通过少数几个系统参数的变化来加以控制,使复杂问题简单化。自适应学习采用神经网络的误差反传学习法。检索过程是通过一个具有稳定吸引子的动力学系统来完成,即利用输入的初始条件与某个吸引子(输出)之间的存在直接对应关系的方法进行检索。利用这种方法可应用于模式识别。例如黑白图象的人脸识别。
三.模糊集理论与模糊工程
八十年代以来在模糊集理论和应用方面,也有很大进展。1983年美国西海岸AI研究所发表了称为REVEAL的模糊辅助决策系统并投入市场,1986年美国将模糊逻辑导入OPS---5,并研究成功模糊专家系统外壳FLOPS,1987年英国发表采用模糊PROLOG的智能系统FRIL等。除此通用工具的研制以外,各国还开发一系列用于专用目的的智能信息处理系统并实际应用于智能控制、模式识别、医疗诊断、故障检测等方面。
模糊集理论和神经网络虽然都属于仿效生物体信息处理机制以获得柔性信息处理功能的理论,但两者所用的研究方法却大不相同,神经网络着眼于脑的微观网络结构,通过学习、自组织化和非线性动力学理论形成的并行分析方法,可处理无法语言化的模式信息。而模糊集理论则着眼于可用语言和概念作为代表的脑的宏观功能,按照人为引入的隶属度函数,逻辑的处理包含有模糊性的语言信息。
神经网络和模糊集理论目标相近而方法各异。因此如果两者相互结合,必能达到取长补短的作用。将模糊和神经网络相结合的研究,约在15年前便已在神经网络领域开始,为了描述神经细胞模型,开始采用模糊语言,把模糊集合及其运算用于神经元模型和描述神经网络系统。目前,有关模糊---神经网络模型的研究大体上可分为两类:一类是以神经网络为主,结合模糊集理论。例如,将神经网络参数模糊化,采用模糊集合进行模糊运算。另一类以模糊集、模糊逻辑为主,结合神经网络方法,利用神经网络的自组织特性,达到柔性信息处理的目的。
与神经网络相比,模糊集理论和模糊计算是更接近实用化的理论,特别近年来美国和日本的各大公司都纷纷推出各种模糊芯片,研制了型号繁多的模糊推理板,并实际应用于智能控制等各个应用领域,建立“模糊工程”这样一个新领域。日本更首先在模糊家电方面打开市场,带有模糊控制,甚至标以神经---模糊智能控制的洗衣机、电冰箱、空调器、摄象机等已成为新一代家电的时髦产品。我国目前市场上也有许多洗衣机,例如荣事达洗衣机就是采用模糊神经网络智能控制方式的洗衣机。
四.遗传算法
遗传算法(GeneticAlgorithm:GA)是模拟生物的进化现象(自然、淘汰、交叉、突然变异)的一种概率搜索和最优化方法。是模拟自然淘汰和遗传现象的工程模型。
GA的历史可追溯到1960年,明确提出遗传算法的是1975年美国Michigan大学的Holland博士,他根据生物进化过程的适应现象,提出如下的GA模型方案:
1.将多个生物的染色体(Chromosmoe)组成的符号集合,按文字进行编码,称为个体。
2.定义评价函数,表示个体对外部环境的适应性。其数值大的个体表示对外部环境的适应性高,它的生存(子孙的延续)的概率也高。
3.每个个体由多个“部分”组合而成,每个部分随机进行交叉及突然变异等变化,并由此产生子孙(遗传现象)。
4.个体的集合通过遗传,由选择淘汰产生下一代。
遗传算法提出之后,很快得到人工智能、计算机、生物学等领域科学家的高度重视,并在各方面广泛应用。1989年美国Goldberg博士发表一本专著:“GeneticAlgorithmsinSearch,OptimizationandMachineLearning”。出版后产生较大影响,该书对GA的数学基础理论,GA的基本定理、数理分析以及在搜索法、最优化、机器学习等GA应用方面进行了深入浅出的介绍,并附有Pascal模拟程序。
1985年7月在美国召开第一届“遗传算法国际会议”(ICGA)。以后每隔两年召开一次。近年来,遗传算法发展很快,并广泛应用于信息技术的各个领域,例如:
智能控制:机器人控制。机器人路径规划。
工程设计:微电子芯片的布局、布线;通信网络设计、滤波器设计、喷气发动机设计。
图象处理:图象恢复、图象识别、特征抽取。
调度规划:生产规划、调度问题、并行机任务分配。
优化理论:TSP问题、背包问题、图划分问题。
人工生命:生命的遗传进化以及自增殖、自适应;免疫系统、生态系统等方面的研究。
神经网络、模糊集理论和以遗传算法为代表的进化算法都是仿效生物信息处理模式以获得智能信息处理功能的理论。三者目标相近而方法各异;将它们相互结合,必能达到取长补短、各显优势的效果。例如,遗传算法与神经网络和模糊计算相结合方面就有:
神经网络连续权的进化。
传统神经网络如BP网络是通过学习,并按一定规则来改变数值分布。这种方法有训练时间过长和容易陷入局部优化的问题。采用遗传算法优化神经网络可以克服这个缺点。
神经网络结构的进化。
目前神经网络结构的设计全靠设计者的经验,由人事先确定,还没有一种系统的方法来确定网络结构,采用遗传算法可用来优化神经网络结构。
神经网络学习规则的进化。