神经网络的训练流程范文

时间:2024-03-27 18:03:00

导语:如何才能写好一篇神经网络的训练流程,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

神经网络的训练流程

篇1

关键词: 图像检索; 特征提取; 神经网络; 机器学习; 相关反馈

中图分类号: TN711?34; TM417 文献标识码: A 文章编号: 1004?373X(2016)21?0078?05

Design and development of image retrieval platform based on artificial neural network

ZHANG Weihua, GAO Ang

(Department of Information Engineering, Zhengzhou Chenggong University of Finance and Economics, Gongyi 451200, China)

Abstract: Since the difference exists between the high?level abstract semantics and underlying feature of the user?description image, the retrieval system based on the image content feature can′t accurately accomplish the user′s retriecal task. To solve the above problem, an image matching calculation method based on neural network is proposed. The correct mapping from image low?level feature to image classification is formed by means of sample automatic learning and user feedback learning. The neural network after learning can classify and retrieve the image automatically. This method is combined with the image low?layer feature description and user high?level semantics feedback to effectively recover the semantic gap. The whole process of neural network learning and image retrieval was realized by integrating the Web front end, image extraction module, neural network module and database module.

Keywords: image retrieval; feature extraction; neural network; machine learning; relevance feedback

在利用神经网络进行图像检索的过程中,图像的大小、精度及细节越来越丰富,信息含量相应的也越来愈多,当使用大量的信息进行神经网络的构建和训练时,所需的时间和成本都大大增加,并且神经网络的检索效率也会降低,这就使得其满足不了用户准确搜索图像的需求[1]。同时,随着神经网络技术的发展,可以利用各种改进技术提高神经网络的学习效率和预测准确率,使得利用神经网络来模拟人脑对图像的分类和检索可以得到更好的效果。

1 图像特征的提取

系统使用图像分割方法对图像的形状特征进行描述,提取图像中各个部分的形状特征。

1.1 形状特征的提取

使用K?均值聚类分割算法进行图像的分割。将图像分割后,由于每个簇中的像素在视觉特征上具有很强的相似性,因此对每一区域的特征进行简单的描述,提取相应的图像特征然后保存结果,并将其作为图像检索系统的区域特征库。系统针对不同的图像特征选取不同的方法进行描述:

(1) 区域颜色特征,提取该区域中像素点在Lab颜色空间中的均值来描述。

(2) 区域位置特征,提取该区域中像素点在二维空间中的坐标的平均值来描述。

(3) 区域纹理特征,提取该区域中像素的平均对比度及平均各向异性来描述。

(4) 区域形状特征,提取该区域的封闭轮廓,并将其分解为可由若干椭圆重构的由椭圆参数组成的序列,然后通过傅里叶描述符来描述该封闭曲线[2]。

1.2 颜色特征的提取

由于颜色直方图的限制,选择颜色相关图进行图像颜色的提取。图像的颜色相关图就是由所有颜色对进行索引的表,在表中[(i, j)]的第[m]个条目表示找到与颜色为[i]的一个像素点距离为[m]的颜色为[j]的一个像素点的几率。在计算颜色相关图时需采用一些并行计算,这样可以提高计算效率。

1.3 纹理特征的提取

通过对比基于Tamura纹理特征算法的检索程序、基于灰度?梯度共生矩阵算法的检索程序和基于Gabor小波变换算法,基于Tamura纹理特征提取算法的检索程序的查询准确率要比后两者都高,且其查询使用的时间也要少很多,因此系统选择采用Tamura纹理特征提取算法。

2 BP神经网络模型的搭建

2.1 BP神经网络特点

选择BP神经网络作为图像的神经网络分类器,其将[n]维图像底层视觉特征映射为图像的分类。通过实验对BP神经网络进行一些改进和优化,使其能有效地完成图像检索的任务。典型样本集的选择、学习复杂性、网络结构的选择、输入特征向量的选择、预测能力的极限都是需要在搭建BP神经网络时需要考虑的问题[3]。

2.2 BP神经网络的原理及拓扑结构

基于BP神经网络相关原理的学习与分析,确定了系统中BP神经网络的结构和构建过程:首先定义输入层、隐含层和输出层的神经元数目分别为[n,l]和[m,]则[(x1,x2,…,xn)]为网络的输入矢量,[(h1,h2,…,hl)]为隐含层神经元的输出矢量,[(y1,y2,…,ym)]为网络的实际输出矢量,同时定义[(d1,d2,…,dm)]为训练样本所对应的预期输出矢量。然后定义输出层神经元[i]与隐含层神经元[j]的连接权值为[Vij,]隐含层神经元[j]与输出层神经元[k]的连接权值为[Wjk,]隐含层神经元[j]的阈值为[b,]输出层神经元[k]的阈值为[c。]由于传递函数需要表示具有线性特性的输入信号与输出信号的联系,又根据BP神经网络要求传递函数必须连续可导,因此其一般使用在(0,1)之间连续并可导的Sigmoid函数作为传递函数,该函数公式为:

[f(x)=11-e-x] (1)

实际输出矢量与预期输出矢量的误差计算公式为:

[E=12j=1m(dk-yk)2] (2)

隐含层神经元输出矢量的计算公式为:

[hj=fj=1N-1Vijxi+?j] (3)

输出层神经元输出矢量的计算公式为:

[yk=fj=0L-1Wjkhj+θk] (4)

BP神经网络通过反向传播算法调整权值,其权值修正公式为:

[Wij(n+1)=Wij(n)+ηδjx′i] (5)

在式(5)中,[Wij(n)]表示第[n]次学习后的神经元[i]与神经元[j]之间的连接权值,信号输出的神经元为[i,]信号输入的神经元为[j,][Xi]为神经元[i]的实际输出,[η]为网络的学习速率,[δj]为神经元[j]的学习误差。

系统中BP神经网络的构建流程如下:

(1) 初始化网络的连接权值和阈值,其值为均匀分布的随机数。

(2) 对网络使用一组样例数据进行训练。

(3) 网络搭建完成,将输入矢量输入网络可仿真输出符合预期的输出矢量[4]。

2.3 BP神经网络的学习过程

通过对相关反馈算法的学习,提出了一种基于BP神经网络进行学习的图像检索方法,它包含两种学习过程:

(1) 自动样例学习,首先通过包含高层语义标注的样例图像的学习构建图像高层语义的分类器,其中对于图像的每种语义分别构造一个分类器,输入样例图像后使系统提取图像的底层特征作为神经网络的输入,然后经过一定时间的学习可以得到网络的解,使分类器能够初步完成分类任务;

(2) 用户交互学习,首先通过用户的指导,将初步检索结果进行分类,然后系统将用户的反馈整理为学习样本,同样使用自动样例学习过程进行学习,最后得出网络最新的解,使分类器能更精确地完成分类任务。系统中BP神经网络的学习流程如图1所示。

2.4 BP算法的改进

使用附加动量法可以使网络在修正连接权值时,不只考虑误差在其梯度上的变化趋势,还考虑误差在其曲面上的变化趋势。在没有附加动量的情况中,网络在训练过程中有可能陷入局部极小状态,通过使用附加动量则可以在一定程度上绕过这些极小值,避免进入极小状态[5]。附加动量法在反向传播过程中,在每一个神经元的连接权值及阈值的当次训练的变化量上附加一个正比于上次训练后的连接权值及阈值的变化量的项,根据新的变化量计算出新的连接权值及阈值。添加了附加动量因子的连接权值和阈值的变化量计算公式分别为:

[Δwij(k+1)=(1-mc)ηδjpj+mcΔwij(k)] (6)

[Δbj(k+1)=(1-mc)ηδj+mcΔbij(k)] (7)

式中:[k]表示第[k]次训练;[mc]表示动量因子,[mc]的取值一般在0.95附近。

在结合附加动量法的网络训练过程中,需要根据不同条件判断何时使用动量因子来修正权值,其判断条件为:

[mc=0,E(k)>E(k-1)×1.040.95,E(k)

式中[E(k)]为第[k]步的误差平方和。

自适应学习速率的调整公式为:

[η(k+1)=1.05η(k),E(k+1)E(k)×1.04η(k),etc] (9)

式中[E(k)]为第[k]步的误差平方和。

动量法可以帮助BP算法正确找到全局最优解,自适应学习速率法可以帮助BP算法缩短训练时间,通过这两种方法的使用,可以有效地提高神经网络的学习效果。

2.5 实验结果分析

实验目的为确定系统中BP神经网络分类器的隐含层神经元数目。首先根据研究获得的图像特征向量的元素个数构建神经网络分类器的学习样例,此处每个样例的输入向量的元素个数为165个,因此构建16组含有165个元素的输入向量,4个一组划分为一种类别,最终形成含有4种类别的16组训练样本,以此方法再生成该4种类别的4组测试样本。然后根据经验公式获得合适隐含层神经元数目的取值范围,此处为9~17个。最后将训练样本及测试样本先后输入隐含层神经元数目不同的网络中进行训练和测试,记录数据。

表1记录了隐含层神经元数目及对应的训练误差和测试误差的数据,由其数据可以看出,随着隐含层神经元数目的增加训练误差总体上逐渐减小,当个数超过15后训练误差出现一定程度的波动,出现小幅的增加,虽然不影响网络的学习效果,但是过多的神经元个数会增加学习时间,而此时测试误差还是处于降低的趋势。综合分析实验结果,本系统确定采用较合适的15个隐含层神经元。

3 检索系统的设计与实现

3.1 系统结构分析

3.1.1 系统结构

系统的结构如图2所示,图中除了与用户交互的Web前端,其余的图像特征提取模块、神经网络模块及数据库都在服务器端,这种浏览器?服务器结构平台搭建后,用户可以通过不同客户端的Web浏览器进行图像检索的功能,而不必安装本地应用程序,同时将主要的核心功能集中到服务器上,不仅大大简化了系统的开发和维护流程,降低了成本,还增强了系统的扩展性。

3.1.2 系统流程

系统针对不同的功能需求设计了相应的不同流程,这些流程包括系统样例学习流程、用户反馈学习流程、用户查询流程。

如图3所示,在系统的样例学习过程中,系统接收到样例数据后会先对数据进行分析,然后交给神经网络进行学习,最终生成对应类别的分类器,这些分类器会在用户检索时对数据库中的图像进行分类,查找到符合用户需求的图像[6]。样例学习的流程是本系统学习分类知识的关键步骤,在该步骤中用户并不参与系统的学习过程,整个学习过程均为系统自动进行,因此需提供大量被正确标注的清晰图像样例,通过对这些优质样例的学习,系统会自动生成针对图像各种分类所对应的分类器,且经过长时间的学习,这些分类器的准确率会不断上升,最终使查询结果更符合用户需求。

如图4所示,在系统的用户查询流程中,用户的查询条件为图像特征的语义描述,系统最终返回为包含该描述特征的图像集,这个过程利用神经网络分类器学习的高层描述语义与低层图像特征之间的映射,因此随着神经网络学习时间的增大,这种映射也就越精确,系统完成的查询也就越符合用户要求。

3.1.3 图像特征提取模块

如图5所示,当图像输入到图像特征提取模块中时,图像会进行K?均值聚类分割算法处理、颜色相关图算法处理及Tamura纹理特征算法处理,这三个处理过程并行进行。

经过K?均值聚类分割算法处理,图像被分割为若干块区域,每个区域中的像素都具有相似的属性,对于每个区域,会提取其简单的区域特征,如颜色特征、位置特征、纹理特征及形状特征等;经过颜色相关图算法处理,生成当前图像的颜色自相关图;经过Tamura纹理特征算法处理,计算出图像的粗糙度、对比度、方向度、线性度等数值。将经过三个算法处理后得到的数值整理后得到图像的特征向量[7]。

3.1.4 神经网络模块

系统中的图像神经网络分类器由三层组成,分别为输入层、隐含层及输出层,其中输入层的神经元个数与归一化后的图像特征向量的个数相同,为固定值;隐含层的神经元个数通过前文中的实验得出,适合于本系统中神经网络的要求;输出层只有一个神经元进行分类,设定1为属于该分类的学习期望,设定0为不属于该分类的学习期望,但是实际运行时需要设定1为0.9,0为0.1,这是因为Sigmoid函数无法经过有限的连接权值计算得到1与0的值[8]。

3.1.5 Web 平台模块

系统的Web界面包括用户查询输入框、用户图像上传框、查询结果浏览框等。

3.2 实验结果分析

为了检验图像检索平台的性能,首先将系统设置为学习模式,然后从图像库中选取1 000幅已进行人工标注的样例集输入系统,最后当系统发出已训练完毕信号后,对系统已学习的分类当作查询输入系统进行检索,记录系统检索结果。

检索结果可知经过人工指导学习,系统可以仿真模拟更符合人类视觉感知的分类方式,并将其记忆于相应的神经网络分类器中,经过不断的学习,系统可以返回更准确的符合用户需求的检索结果。

4 结 论

本文主要研究包括基于内容的图像检索技术及人工神经网络技术两个方面。首先使用K?均值聚类分割算法、颜色相关图算法及Tamura纹理特征提取算法提取图像相应的形状、颜色及纹理特征,通过整合形成可以完整描述图像信息的特征向量。同时,针对基于内容的图像检索系统中用户高层语义与图像底层特征之间存在的问题,通过样例自动学习和用户反馈学习两种学习方式,BP神经网络通过反向传播学习算法调节网络权值,从而形成图像底层特征到图像分类的正确映射,学习后的神经网络通过这种映射可以进行图像的自动分类及检索,该方法结合了图像的底层特征描述及用户的高层语义反馈,有效地弥补了语义鸿沟。

参考文献

[1] KHERFI M L, ZIOU D. Relevance feedback for CBIR: a new approach based on probabilistic feature weighting with positive and negative examples [J]. IEEE transactions on image processing, 2006, 15(4): 1017?1030.

[2] TRAINA A J M, MARQUES J. Fighting the semantic gap on CBIR systems through new relevance feedback techniques [C]// Proceedings of 2011 the 21th IEEE International Symposium on Computer?Based Medical Systems. [S.l.]: IEEE, 2006: 881?886.

[3] 周资云.基于内容的图像检索系统研发与应用[J].华章,2012(29):22.

[4] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报,2013,14(4):622?635.

[5] KANUNGO T, MOUNT D M, NETANYAHU N S, et al. An efficient k?means clustering algorithm: analysis and implementation [J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(7): 881?892.

[6] WILLIAMS A, YOON P. Content?based image retrieval using joint correlograms [J]. Multimedia tools and applications, 2007, 34(2): 239?248.

篇2

上海市作为国家云计算服务创新试点城市之一,“十二五”期间将在五大领域推进云计算的示范应用,其中包括以云计算、物联网等信息服务系统来支撑上海建设“智慧城市”的交通管理。面对传统交通信息来源有限、可靠性差、滞后等缺陷,急需借助于云计算环境来研究多源交通信息的融合机理,催生多源交通信息服务模式的改变。本文着力构建多源信息云智能交通系统自适应服务模型,筛选年鉴数据为样本,通过SPSS软件仿真,最终验证此模型的可行性。

模型构建

1、处理流程云计算环境下智能交通系统中多源信息渠道得到的原始数据具有典型无组织性。本文构建多源信息云智能交通系统自适应服务模型,处理流程如图1所示。多源信息云智能交通系统自适应服务模型全流程均在云计算环境下进行,实时信息至历史信息的传递过程体现本模型处理过程的动态性。此模型中自适应性体现在:(1)通过Newton多元参数优化法实现样本降维处理;(2)通过前馈神经网络训练过程得到云智能交通系统信息服务最优拓扑结构,即确定前馈神经网络中隐藏层逻辑结构,通过前馈神经网络训练过程得到最优层间权重和最优迭代参数,从而得到最优神经网络;(3)通过有限混合分布拟合前馈神经网络正向输出数据,得到更具灵活性的全局分布。2、多元参数优化多元参数优化目的旨在寻找维元参数向量的标量评分函数的最小值。在多源信息神经网络自适应服务模型中,实验样本维数通常比较大,而多维空间中局部最小值现象突出,如果在多源数据预处理过程中找到局部最小值,则能剔除非最小值空间,从而有效将样本数据降维。多元参数优化运用迭代的思想,直至找到局部最小值。局部迭代一般过程为:其中,是第步迭代时的估计参数,是下一步迭代移动方向的维向量。神经网络中的反馈思想运用的是最陡峭下降算法,最陡峭下降的梯度不一定指向最小值,理论上经过有限次迭代可以找到对应的,但并不是优选迭代法。Newton方法定义局部迭代过程为:其中,是在点处二阶导数矩阵的逆矩阵(),为函数的一阶导数,为矩阵中元素,帮助判定并剔除迭代过程中非指向局部最小值的点。3、前馈神经网络多层前馈神经网络包括输入层、若干隐藏层和输出层。训练样本反馈入输入层,输入层与隐藏层、隐藏层与输出层之间加权全连接,和分别为其权重,如图2所示。多层前馈神经网络层数取决于隐藏层个数,若隐藏层个数为3,则有4层输出单元,则此多层前馈神经网络为四层神经网络。神经网络结构越复杂,则多层前馈神经网络的层数越多,需要权重参数参与数越多,自适应系统训练能力也就越强。确定最优系统的隐藏层个数没有确定的规则可以遵循,多层前馈神经网络最优结构的确定与网络层间最优参数的确定一样,都是重复训练过程,训练结果直接影响神经网络自适应系统的准确性。估计的准确性为本模型重要精度指标。4、有限混合分布一般地,多源数据集数据为异质数据集,代表数据来自不同的小组,而非单一同质组。通常,异质数据可能反映不同内在现象,简单处理异质数据将人为导致数据信息沉没。引入权重处理有限源数据集的数据异质性,使得混合分布模型比单一拟合分布模型在分析和预测上更具灵活性和灵敏性。假设全局分布为:其中,为随机变量的值,为随机变量在分量上的分布函数,是分量上的参数向量,为分布函数的权重,全局混合度有限,为。

仿真与结果

1、样本选择本次仿真样本来源于2003年至2011年的《上海年鉴》以及2001年至2011年的《上海统计年鉴》,抽取2000年至2010年间4组大类8组小类共32个属性(如图3)验证本文中多源信息云智能交通系统自适应服务模型的可行性。样本数据从旅客出行行为出发,对不同交通出行模式和支付方式数据依次进行预处理、优化处理、前馈神经网络训练、混合分布拟合。2、前馈神经网络训练结果本次仿真在进行神经网络训练之前,运用SPSS软件对维度为11×32维数据进行预处理,首先通过区间估算方法处理统计过程中的缺省数据,其次统一所有数据量纲,最后Newton法优化为11×19维。优化结果显示,{{旅客发送量,公路},{{“市民信箱”累计注册用户“,付费通”业务平台交易量“,付费通”业务平台交易额,交通卡销售额,银行卡交易额},{个人信用报告累计出具数量}},{{轨道运营车辆,轨道行驶里程,轨道客运总量},{高架道路长度}},{{公交线路长度,公交线路条数,公交客运总量},{出租运营车辆数,出租载客车次量,出租运营里程},{轮渡乘客人数}}}被保留进入神经网络训练进程。本次仿真取100%样本作为训练数据集,运用SPSSClementine软件进行神经网络训练,对隐藏层数为1、2、3三种情况分别做训练,结果如表1所示。结果显示,本次样本训练得到2个隐藏层的神经网络为本次最优神经网络,估计的准确性可达90.188%。同时证明Newton法预优化原始数据一方面缩短神经网络训练时间,另一方面控制神经网络具有较高估计准确性。可以认为,本多源信息云智能交通系统自适应服务模型基本可行。3、混合分布拟合结果本次仿真运用SPSS软件拟合混合分布。拟合结果如图4所示。X轴为时间轴,Y轴为数量轴,X轴下方19个属性代号,代表混合分布由19个简单分布混合拟合得到。综上证明,源信息云智能交通系统自适应服务模型具有可行性。

篇3

【关键词】 遗传算法 BP神经网络 结构参数 优化

一、引 言

传统的滤波器设计需要大量繁琐计算和曲线查找,在商用电磁仿真软件出现后,微波滤波器的设计得到了很大的改善,但是在实际操作中对经验依赖性还是很强。如何快速准确的设计出符合要求的滤波器,是传统的滤波器设计方法和目前的商用电磁仿真软件难以有效解决的。针对以上问题,本文将遗传算法和BP神经网络结合[1],在MATLAB环境下实现了对腔体滤波器结构参数的设计。

二、遗传神经网络优化

BP神经网络尤其适用在有大量实验数据,而数据间的内在关系很难用明确的表达式的非线性系统中,但在实际应用中神经网络存在学习时间长,容易陷入局部极小点等弊端。因为该算法从本质上来说属于局部寻优算法,为此利用遗传算法全局搜索能力强的特点,结合神经网络的局部寻优能力,可以更好的实现对非线性系统的预测,其基本思想是通过遗传算法得到更好的网络初始权重。

2.1算法实现过程

遗传神经网络分为BP神经网络结构确定、遗传算法优化和BP神经网络预测3个部分。本文是以三腔体滤波器为例,将滤波器的频率f和耦合系数c作为输入向量

其次,使用改进的遗传算法对网络初始权重进行优化,将初步得到的权重赋给尚未开始训练的BP神经网络。然后,设置训练参数,开始训练网络,将 90组数用于网络训练,10组作为测试样本。最后将预测结果反归一化,观察得到的误差值,其流程图如图1所示。

2.2 优化结果

采用上述遗传神经网络算法对腔体滤波器的结构参数进行优化,均方误差为5.0972×10-5, 时间为1.056s;BP网络的均方误差为2.8871×10-4,时间为2.103s,可以看出遗传神经网络优化值更加精确,速度快。

三、结论

本文针对遗传算法和神经网络的优缺点,将遗传算法与BP神经网络有机地结合在一起,应用在腔体滤波器结构参数的优化中,优化结果表明此方法可以在较短的时间内达到精度范围内的优化值,为腔体滤波器的结构参数优化设计提供了一种新方法。

篇4

关键词:粒子群 径向基 神经网络 语音识别

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2013)04-0109-02

近年来,语音识别作为一种便捷的人机交互方式被大量研究,并在日常生活中得到广泛应用。大体上讲,语音识别就是在给定的语料库中找出与待识别词语相同的语料,其识别方法的选择对识别效果至关重要。语音识别的方法主要有3种:基于语音特征和声道模型的方法、模板匹配的方法和人工神经网络[1]。第1种方法出现较早,但由于其模型过于复杂,并未得到实际应用。第2种方法较为成熟,主要通过动态时间规整(DTW)、隐马尔可夫模型(HMM)和矢量量化(VQ)技术实现[2]。第3种方法充分利用人工神经网络较强的分类能力和输入——输出映射能力,非常适合解决语音识别这类难以用算法描述而又有大量样本可供学习的问题[3]。

因此,本文将智能领域广泛使用的RBF神经网络运用到语音识别中,针对RBF神经网络隐层基函数的中心值和宽度随机确定的缺陷,运用具有全局寻优能力的粒子群算法(PSO)进行优化,来提高网络的泛化能力和收敛速度,从而提高识别率。实验结果表明,粒子群优化的RBF神经网络用于语音识别,能够显著提升识别性能。

1 粒子群优化RBF神经网络

1.1 RBF神经网络

1.2 粒子群优化RBF网络算法

因此,RBF神经网络隐层基函数中心值和宽度的优化过程就是PSO算法依据输入样本进行聚类的过程,其基本流程为:

(1)参数初始化,包括粒子速度、位置,个体最优位置和全局最优位置;

(2)据(5)式计算惯性权重;

(3)据(3)(4)式更新粒子的速度和位置;

(4)据(6)式计算各粒子适应度值,并更新个体最优位置和全局最优位置;

(5)用全局最优粒子代替本次迭代适应度差的粒子;

(6)反复迭代,直到最大迭代次数则停止,得聚类中心。

2 PSO优化RBF语音识别系统

语音识别过程主要包括信号预处理、特征提取、网络训练及识别[6]。预处理主要对语音进行分帧、预加重和加窗处理。特征提取用于提取语音中反映声学特征的相关参数,本文采用的是过零峰值幅度(ZCPA)。网络训练是在识别之前从语音样本中去除冗余信息,提取关键参数,再按照一定规则对数据加以聚类,形成模式库。网络识别是通过已训练好的网络,计算测试样本数据与模式库之间的相似度,判断出输入语音所属的类别。粒子群优化RBF神经网络的语音识别系统原理框图如图1所示。

PSO优化RBF神经网络进行语音识别的实验步骤如下:

第1步:提取特征。

首先对用于训练和识别的各种信噪比的语音文件进行ZCPA特征提取。语音信号的采样频率为11.025kHz,每帧为256个采样点,经过时间和幅度归一化处理后,得到256维特征矢量序列。

第2步:网络训练。

网络训练的过程就是调整RBF神经网络基函数的中心和宽度以及隐层到输出层之间的连接权值。实验中,类别数为待识别的词汇数,如对10个词进行识别,则隐层节点数、输出层节点数和聚类中心均为10,如对20个词进行识别,则隐层节点数、输出层节点数和聚类中心均为20,以此类推,本文对10词、20词、30词和40词分别进行训练识别。利用PSO优化算法通过聚类获取隐层基函数的中心值和宽度,网络输出权值使用伪逆法得到。在PSO算法中,种群大小为20,最大进化迭代次数为40。

第3步:网络识别。

RBF神经网络训练好后,将测试集中的样本输入网络进行识别测试。每输入一个单词的特征矢量,经过隐层、输出层的计算后可得一个单词分类号,将这个分类号与输入词自带的分类号进行对比,相等则认为识别正确,反之,识别错误。最后将识别正确的个数与所有待识别单词数的比值作为最终的识别率。

3 实验仿真分析

本文运用matlab在PC机上仿真实现了PSO优化RBF神经网络的孤立词语音识别系统,选用在不同高斯白噪声条件下(包含15dB、20dB、25dB和无噪声),18个人分别录制40词各三次,形成实验语音数据,实验时选其中10人的10词、20词、30词、40词语音数据分别作为训练样本,另外8个人对应的10词、20词、30词、40词语音数据分别作为测试样本进行实验,得到了不同噪声和词汇量下的粒子群优化RBF神经网络的语音识别结果。

表1所示为在不同词汇量和不同SNR下,分别基于PSO优化RBF神经网络和标准RBF神经网络采用ZCPA语音特征参数的语音识别结果。由表中识别率的变化可知,基于PSO优化的RBF神经网络的识别率在不同词汇量和不同信噪比下都比标准RBF神经网络的高,正确识别出的词汇量明显增多,这充分证明改进后的RBF神经网络具有自适应性和强大的分类能力,缩短网络训练时间的同时,提高了系统的识别性能,尤其在大词汇量的语音识别中表现出更加明显的优势。

4 结语

本文采用粒子群优化算法来聚类RBF神经网络隐层基函数中心值和宽度,并将PSO改进的RBF神经网络用于语音识别中。通过仿真实验,得出了其与标准RBF神经网络在不同词汇量和不同SNR下的语音识别结果。通过分析比较,证明了PSO优化后的RBF神经网络有较高的识别率,且训练时间明显缩短,表明神经网络方法非常适宜求解语音识别这类模式分类问题。

参考文献

[1]Edmondo Trentin, Marco Gori. A survey of hybrid ANN/HMM models for automatic speech recognition[J].Neurocomputing,2001,(37):91-126.

[2]王凯.免疫粒子群改进LBG的孤立词语音识别算法研究[J].数字技术与应用,2013,(1):111-113.

[3]夏妍妍,黄健,尹丽华.基于径向基函数神经网络的语音识别[J].大连海事大学学报,2007,(S1):157-159.

[4]孟艳,潘宏侠.PSO聚类和梯度算法结合的RBF神经网络优化[J].自动化仪表,2011,(02):6-8.

篇5

人工神经网络是在非线性经济预测领域应用较为广泛的一种方法。它是模拟人的大脑的一种非线性映射,不仅具有很强的容错性,而且能够从大量的历史数据中进行学习,从而揭示大量复杂数据中隐含的重要信息。神经网络方法已经在很多领域得到了成功的应用,在煤炭行业,煤炭生产成本预测、煤炭需求量的预测、煤炭企业可持续发展的评价、煤炭建设项目投资估算、煤炭成浆浓度预测、煤炭调运的优化等很多方面都有神经网络模型成功应用的案例。但是,在实际应用中由于缺乏问题的先验知识,往往很难找到理想的网络结构,这就影响了神经网络的泛化能力。神经网络的泛化能力是指学习后的神经网络对测试样本做出正确反应的能力,神经网络是否成功不在于对训练样本本身拟合误差的大小,而关键在于其泛化效果。本文探讨了神经网络集成的框架模型,并对煤炭企业的可持续发展评价进行了实证研究,以期在提高神经网络泛化能力的同时让这种技术更加有效地应用于煤炭领域。

二、神经网络集成

1990年,Hansen和Salamon开创性地提出了神经网络集成,为解决神经网络泛化能力提高的问题提供了一个简易可行的方法。使用这种方法,可以简单地通过训练多个神经网络并将其结果进行合成显著地提高学习系统的泛化能力。1996年,Sollich和Krogh为神经网络集成下了一个定义,即“神经网络集成是用有限个神经网络对同一个问题进行学习,集成在某输入实例下的输出由构成集成的各神经网络在该实例下的输出共同决定”。目前这个定义已被广泛接受。

1 神经网络集成个体生成方法

在生成集成个体网络方面,目前最重要的技术是Boosting和Bagging。这两种技术本身并非专为神经网络集成设计,可用于多种学习模型。

Boosting是一大类算法的总称,通过这种方法可以产生一系列神经网络,各网络的训练集决定于在其之前产生的网络的表现,被已有网络错误判断的实例将以较大的概率出现在新网络的训练集中。这样,新网络将能够很好地处理对已有网络来说很困难的实例。另一方面,虽然Boosting方法能够增强神经网络集成的泛化能力,但是同时也有可能使集成过分偏向于某几个特别困难的实例。因此,该方法不太稳定,有时能起到很好的作用,有时却没有效果。

Bagging的基础是可重复取样。在该方法中,各神经网络的训练集由从原始训练集中随机选取若干实例组成,训练实例允许重复选取。这样,原始训练集中某些实例可能在新的训练集中出现多次,而另外一些实例则可能一次也不出现。Bagging方法通过重新选取训练集增加了神经网络集成的差异度,从而提高了泛化能力。

2 神经网络集成结论生成方法

当神经网络集成用于分类器时,集成的输出通常由个体网络的输出投票产生。通常采用绝对多数投票法(某分类成为最终结果当且仅当有超过半数的神经网络输出结果为该分类)或相对多数投票法(某分类成为最终结果当且仅当输出结果为该分类的神经网络的数目最多)。理论分析和大量试验表明,后者优于前者。因此,在对分类器进行集成时,目前大多采用相对多数投票法。

三、神经网络集成的框架模型

为了增强神经网络模型的泛化能力,笔者使用了如下图所示的神经网络集成框架模型,模型使用了对训练样本利用得比较充分的Bagging技术来产生个体神经网络,即通过Bagging从初始训练集中随机抽取出多个规模相同的训练集,然后为每一个训练集训练出一个神经网络个体,再结合具体应用实际使用相应的结论生成方法将上述多个神经网络的输出进行合成从而得到最初问题的结论。

四、用于煤炭企业可待续发展评价

煤炭资源属不可再生资源,煤炭开采必然受到矿区剩余储量的制约,煤炭企业迟早要面临资源衰竭。因而,煤炭企业的可持续发展问题日益突出,国内外学术界和决策部门为此进行了大量的探索,特别是在煤炭企业可持续发展水平评价上,开展了不少的研究。应用神经网络集成模型对煤炭企业可持续发展水平进行评价,可以避免复杂的数学推导,在样本缺损和参数漂移的情况下,仍能保证得到稳定的结果,同时,也有效回避经典的可持续发展评价方法(如层次分析法、模糊数学和主成分分析法等)无法回避的经验知识以及决策者个人主观意向所起的作用,集成学习的方法也保证了模型的泛化能力,这对解决煤炭企业全局性的决策规划是大有裨益的。

实际操作中,可以先按照煤炭企业可持续发展的涵义和指标体系设计的原则结合已有的研究成果构建评价指标体系;然后根据所评价的问题,结合具体的神经网络算法建立煤炭企业可持续发展神经网络评价模型;接下来对训练样本采用Bagging方法进行处理,然后为每个训练样本训练出一个神经网络模型,对这些训练好的神经网络模型的输出采用相应的结论生成方法进行合并,最后得到模型输出的最终评价结果。

1 煤炭企业可持续发展评价指标体系

对于煤炭企业可持续发展评价指标体系的建立,目前有不少科研机构和学者进行了大量的研究,但煤炭企业可持续发展的度量和评估还未达成共识,还需有较大的改善。但作为煤炭企业,在研究其可持续发展时,应该包括生态持续、经济持续和社会持续等方面内容,并从煤炭企业的实际需要和可能出发,我们把煤炭企业可持续发展评价指标体系划分为三个层次,即目标层、准则层和指标层,如表1所示。

经过训练学习,评价网络可以输出衡量可持续发展水平的评价值O,为明确煤炭企业可持续发展水平,设可持续发展状态分为四级:一级为可持续发展;二级为初级可持续发展;三级为由传统发展向可持续发展过渡,四级为传统发展。

2 煤炭企业可持续发展评价神经网络集成模型

(1)神经网络评价模型的建立

设可持续发展评价时采用的指标集合为I,评价企业的非空有限集合为U,Iu,表示评价企业u在指标集I上的取值,Ou表示评价企业u对应的可持续发展评价结果,则Ou是在一定的可持续发展评价准则下获得的,即:

Ou=EVA(Iu)

对所有的评价企业而言,上式可以表达为:

O=EVA(I)

由上式构造BP神经网络模型,以I为输入向量,O为输出向量,即为IO映射模型。本文中设置神经网络的输出神经元个数为2,分别以[0,0]、[0,1]、[1,0]、[1 11]代表企业可持续发展的四级状态。通过大量煤炭企业可持续发展评价的实例数据的收集,用样本(I,O)对其进行训练,BP神经网络即可学习煤炭企业可持续发展的评价准则,在给定的误差要求下,当网络学习完成后,仟意给定煤炭企业可持续发展评价的指标值向量I,神经网络评价模型将给出其可持续发展结论O,从而完成对煤炭企业可持续发展的评价。

(2)神经网络评价模型的训练

本文将所获得的煤炭企业可持续发展评价的数据按训练数据集和测试数据集分为两部分,应用Matlab 7中神经网络工具箱提供的函数对建立的训练数据集进行训练,I和O分别表示训练数据集的输入和输出,测试数据集的输入和输出分别为I′和O′,网络训练完成后,将I′输入该网络,Ol为模型识别后的输出结果。设定训练终止次数为100次,训练终止误差为10-2,训练函数为TRAINLM,经反复试验网络在隐层神经元个数为26个、经68次训练达到误差要求。然后将O+与O′进行比较,选取均方差MSE、隐层结点数Nh总评价错误率做为检验模型的指标。表2所示为训练完成的神经网络评价模型N的检验指标。

(3)神经网络集成评价模型

在神经网络集成识别模型中,个体神经网络的输入、输出向量的维数相同,结论合成方法采用相对多数投票法。先生成10个BP网络作为神经网络集成的个体网络,这些网络的输出神经元分别表示可持续发展评价的结论。通过Matlab对神经网络集成识别模型进行仿真,神经网络集成评价模型的检验指标如表3所示。

按图1的流程利用训练好的神经网络集成对测试集进行识别,总评价错误率为9.2%,这个指标远远优于表2中的单一神经网络。实证研究的结果表明神经网络集成学习的评价模型可以在很大程度上提高神经网络模型的泛化能力。

篇6

[关键词]人工神经网络;旅游物流;需求预测

[DOI]1013939/jcnkizgsc201538051

1引言

旅游物流对广西地区经济的发展至关重要,准确把握、预测旅游物流需求有助于有关部门制定合理的旅游物流规划、促进国民经济可持续发展、提高居民生活水平。国内学者通过一定的方法和模型确定了影响旅游物流能力的关键要素,为旅游物流需求的预测提供了一定的理论基础,而在物流需求预测方面也提出了很多如时间序列模型、灰色预测、回归分析等具有创新性和实践意义的方法。由于旅游物流具有的独特性和负责性使得这些模型及分析方法在前提条件、适用范围和侧重点的选取方面具有一定的困难,因此在实际应用中各有利弊。人工神经网络可以将定量或定性的信息等势的分布贮存于网络内的各神经元,有很强的鲁棒性和容错性,通过建立基于人工神经网络的预测模型,利用Braincell软件进行计算以期达到精确预测旅游物流需求的目的。

2旅游物流的需求界定

经过多年的发展,关于旅游物流需求的定义至今仍没有一个令各方满意的结论。物流服务贯穿了整个旅游活动过程中,旅游物流可以看作为了使旅游消费者获得更好地满足感和旅游体验,与旅游相关的主体提供让旅游消费者更为畅通流动的旅游服务,与此相应的旅游物流的能力指提供的旅游服务内容以及相关主体使用物流设施对旅游物流活动进行计划、组织、协调和控制的能力,到旅游物流的具体环节,可以从涉及旅游者的吃、住、行、购、游、娱等方面界定旅游相关主体运用物流设施为游客提供旅游服务的能力。文中对旅游物流需求的预测可以从往年的旅游物流能力方面进行预测,通过准确的预测旅游物流需求可以较好地规划未来年份旅游业发展方向,对物流设施和设备进行准确的投入,减少资源的浪费及设施投入不足的状况。

旅游物流能力是指旅游服务主体向旅游消费者从“吃、住、行、购、游、娱”6个方面提供服务的能力,旅游物流需求可根据这6方面来选取指标,但是旅游物流需求预测的准确性不仅受到旅游物流的独特性的制约,还受到一些客观性条件的影响。如物流统计制度不健全,目前,我国仍没有建立系统全面的物流统计制度,更没有涉及旅游物流领域;物流统计没有涉及物流活动的全过程;物流统计指标过于单一。此外,国内只有基本的货物运输量和货物周转量统计,其他与物流相关的指标没有公开的统计资料,也没有权威的统计方法和基础数据,致使物流需求预测不能通过直接指标来衡量需求规模的大小。

3基于神经网络的旅游物流需求预测模型的建立

神经网络具有非线性、曲线拟合能力、学习能力和抗干扰能力,是一种通用的非线性函数逼近工具。通过对BP神经网络的训练,特别适用于构造非线性预测函数,而且精度可达到预定的要求。

31预测领域中的BP神经网络模型简介

BP神经网络通过正向输入,反向传播误差不断迭代的学习过程,直到误差减到可以接受的程度。一般包括输入层、隐含层和输出层的单隐含层网络就能以任意精度表示并揭示任何连续函数所蕴含的非线性关系。其中:

(1)工作信号正向传播。输入信号从输入层经过隐含层,传向输出层,在输出端产生输出信号,这是工作信号的正向传播。在信号的正向传播过程中网络的权值是固定不变的,上一层神经元的只影响下一层神经元的状态,即正向影响。如果在输出层不能得到期望的输出,则转入误差信号反向传播。

(2)误差信号反向传播。网络的实际的输出与所期望的输出之间差值即为误差信号,误差信号由输出端开始逐层向前传播,即误差信号的反向传播。在误差信号反向传播中,神经网络的权值根据误差的反馈进行调节。通过不断地对权值的修正,使实际输出更加接近期望输出。

(3)预测神经网络流程。通过了解工作信号与误差信号的传播方向,可以清楚地了解预测神经网络的工作流程。预测开始时神经网络读入样本、权值,通过计算输入层的输入得出结果传递到输出层,在输出层进行计算,最后在计算输出值与期望值的误差。若误差小于确定值则计算结束,若误差大于确定值则继续回到前两层进行权值调整,把调整后的权值重新输入到模型中,直到误差小于设定的确定值。

本文应用Braincell神经网络软件来实现神经网络的计算与分析。

32BrainCell软件及实现

321BrainCell 神经网络基本原理

BrainCell 神经网络采用误差反向传播学习算法,算法从两个方面(信号的前向传播和误差的反向传播)反复进行迭代学习,与神经网络预测模式基本原理相同。

322BrainCell 神经网络实现步骤

(1)数据的预处理和后处理。为方便的计算减少误差,保证数据同一量纲,需要将数据归一化为区域[0,1]之间数据。在实际的预测模型中当数据接近0或1的时候训练效果会明显下降。因此,为了避免数据落入最大饱和区,保持数据的原有特征,根据经验将数据规范到[015,085]来进行修正。模型中采用反归一化处理输出数据。

(2)网络层数目的确定。由Kolmogorov定理可知,含有一个神经元隐含层的三层神经网络可以从任意精度逼近一个从输入到输出的映射关系,因此在Braincell神经网络中采用含有单隐层的三层神经网络[2]。

(3)网络节点的确定。输入层节点的多少与评价指标个数是相对应的。

(4)网络训练。假设训练样例是形式(x,y),其中x为输入向量,y为输出值。N为输入节点数,M为输出层节点数。从单位i到单位j的输入表示xij,单位i 到单位j的权值表示Wij。一是创建具有N 个输入单位,M 个输出单位的BrainCell 神经网络;二是用随机数(0 或1)初始化某些数字变量网络权值Wij;三是对于第k个训练样例(a,b),把入跟着网络前向传播,并计算网络中每个单元x的输出Qx,使误差沿着反向传播;四是对于每个输出单元u,计算它的误差项;五是对于每个隐含单元h,计算它的误差项;六是利用误差项更新调整每个网络权值;七是重复三到六点,直到完成指定的迭代次数或者是其误差值达到可接受的范围。

33神经网络的旅游物流需求预测模型的建立

331模型中数据指标确定

目前我国仍没有健全的物流统计制度,因此实际工作中收集旅游物流需求数据十分困难。这里采用间接指标法――利用与旅游物流需求相关的经济指标来建立旅游物流需求的经济指标体系,通过数学的方法进行总结与推导,确定旅游物流需求模型。

旅游物流需求是一种派生需求,这种需求的大小与其本身发展有着密切的关系。从宏观层面上考虑主要有内外两部分因素:旅游业自身发展的状况及外部环境的影响。从微观层面来说,旅游业自身发展的状况是旅游物流需求的关键因素。旅游业产值越高,旅游物流需求增长随之增加,反之亦然。由此,本文选取旅游总收入和接待人数作为预测旅游物流需求的指标。其次,影响旅游物流的其他关键因素就是旅游行业本身所投入的设施、人员、公路铁路旅客周转量等因素。根据旅游物流能力的理解从“吃、住、行、购、游、娱”等方面进行指标的选取,如“吃、住”方面使用餐饮住宿从业人数、星级饭店数目衡量;“行”使用公路、铁路旅客的周转量来衡量等;“游”则使用旅行社从业人数等方面来衡量。这些因素都对行业的产值有较大的影响。因此,在模型中可将这些相关经济指标作为旅游物流需求规模的影响因素。由此可选择如下输入层指标:星级饭店数X1、接待入境旅游者平均每人消费额X2、餐饮住宿业从业人数X3、旅行社从业人数X4、铁路旅客周转量X5、公路旅客周转量X6、旅游部门游船年末实有船数X7,旅游部门旅游客车年末实有数X8,共有8个。而把旅游业的年收入Y1与年接待入境旅游者人数Y2作为物流需求预测的目标。

332数据来源

本文选取的数据资料来源于广西壮族自治区历年统计年鉴、中国统计年鉴、中国旅游年鉴,如表1所示。根据样本数据选取原则,将2005年和2012年的数据作为网络测试样本,最后用训练好的神经网络预测2014―2016年的物流需求规模。

333广西旅游物流需求的BP人工神经网络模型

(1)样本数据的归一化处理。选取X1,X2,X3,X4,X5,X6,X7,X8作为广西旅游物流需求预测BP人工神经网络模型的输入,Y1,Y2为BP网络的输出。根据BP 的本身特点,对输入层数据进行归一化时,采用如下公式:y=log[JB((]x[JB))]/10。对输出层数据则使用归反一化处理,公式如下:P=log[JB((]tT[JB))]/10。

(2)网络节点的确定。根据构建好的评价指标体系,可以确定输入层的节点数为8,输出层的指标数为2。

(3)网络训练。以traindx作为训练函数,利用matlab计算。可知在最大训练次数为200次,目标误差为001,学习率设置为003,误差曲线收敛于目标001,进过45次迭代后,网络达到目标要求,训练误差图见下图。

训练误差图

通过设置的数据,使用Braincell软件对数据进行训练,选取全部数据作为样本数据组,2010―2013年的样本作为将预测样本,输入模型可得2010―2013年的预测值见表2。

据表3可以看出,预测效果较好,一般来说,对于经济指标的预测,误差能够控制在3%以内就算比较准确。因此,基于与旅游物流相关的其他经济数据来建立BP神经网络模型预测旅游物流需求有一定的实用价值。

4结论

根据人工神经网络理论建立的旅游物流需求预测模型,通过Braincell神经网络的自学习特征,运用traindx函数进行训练,在训练过程中对权值进行不断修正,误差比率控制合适的在范围内,使网络的实际输出向量逐渐地接近期望的输出值。最后把仿真的预测结果与真实量进行初步比较分析,得出的结果能够证明使用神经网络模型对旅游物流的预测精度较高。因此可以得出以下的结论:用BP神经网络建立模型,可以准确地把与旅游物流相关的经济数据与目标本身的需求量进行结合,可得到较为精准的旅游物流需求预测值。由此可以推断,人工神经网络作为高度的非线性体系,能够对经济系统中个变量之间的非线性关系进行高精度的预测,将其运用在物流领域中的应用具有更加广阔的发展潜力。

参考文献:

[1]王新利,赵琨基于神经网络的农产品物流需求预测研究[J].农业技术经济,2010(2):64-66

[2]秦立公,韦金荣等基于BrainCell 的B2B 电子商务供应链协同绩效评价体系[J].中国集体经济,2014(15):112-113

[3]张圣楠,郭文义,等基于MATLAB的BP神经网络的设计与训练[J].内蒙古科技与经济,2005(17):96-98

[4]熊勋人工神经网络在环境质量评价和预测中的应用研究[D].武汉:华中科技大学,2009

[5]白平,陈菊红基于旅游物流能力的西部旅游发展研究[J].新疆大学学报,2013(41):16-17

[6]秦立公,王东,等旅游景区物流能力优化研究[J].现代商业,2010(24):47

篇7

人脸识别是指利用计算机分析人脸图像,在安全系统、刑侦方面有非常大的应用空间,本文主要分析基于子图分割和BP神经网络的人脸识别研究,证明该方法运行速度快、效果好,具有使用价值。

【关键词】人脸识别 子图分割 BP神经网络

当前人脸识别已经发展到三维的复杂背景的人脸识别,所涉及的背景也是更加复杂,在人脸识别的的研究中存在不少的困难,本文主要基于子图分割思想和BP神经网络的开发,构建人脸识别流程,希望能为人脸识别提供一些参考。

1 子图分割和BP神经网络概述

子图分割思想是将原始的人脸图像转化为灰度矩阵,把分割的子图进行奇异值分解变化,进而归一化处理。神经网络有很多简单单元组成,属于并行的分布式系统,具有自组织学习的优点。BP算法主要是推算前导层的误差,进而得到其他各层的误差估计,BP神经网络当前存在些问题,理论研究还不够完善,想要提高人脸图像的识别率,还需要进行改进和完善。

2 基于子图分割和BP神经网络的人脸识别方法构建

基于子图分割和BP神经网路的人脸识别框架图包括训练过程和识别过程,主要包括人脸图像的载入、预处理、特征图像的提取以及识别等步骤。

2.1 试验环境

试验硬件主要是1.6GHzCPU,内存512MB,编程工具为Matlab7.0平台,这种编程平台语法结构简单,图像功能比较完善,方便开展神经网络训练。

人脸图像样本库采用剑桥大学的ORL人脸数据库,实验者拍摄不同的图像,由于拍摄的时间不同,各个图像之间在光照、脸部以及面部表情等方面存在很多的不同。在本研究中采用200幅图像作为样本库。

2.2 特征提取

为控制神经网络的输入层节点数,对人脸图像进行压缩,在提取人脸特征时先将人脸图像转化为灰度矩阵,选择子图的最大奇异值,归一化处理。依照子图分割影响,将人脸图像分割成16维、32维、48维。经过子图分割后,图像矩阵大小相等,组合每个子图矩阵的最大奇异值,归一化处理组合后的向量。

在设计中将BP神经网络作为识别分类器,输入层节点由特征向量的维数决定,试验研究中输入层节点数根据上文确定的人脸分割图像维度分别为16、32、48。在隐含层数的选择中,增加隐含层可以进一步降低误差,但是也会导致神经网络更加复杂化。增加隐含层节点数也会提高训练的误差精度,更加易于观察和调整。BP神经网络的隐含层的选择也会影响神经网络的性能,若是节点过少,可能训练不出来,若是节点过高,会增加一次训练的时间,降低神经网络分类器的推广,在本试验中层内节点数设定为40、60、80。

确定训练数据和拓扑结构后,就能确定传递函数,由于神经网络是非线性的,若是初始权值过大,会导致导数过小,一般情况下,要求初始加权后的神经元都不接近零。因此神经网络的初始权值确定为[-1,1]。神经网络在学习训练中受到学习速率η影响,若是速率较小,时间就会比较长,若是速率过大,就难以得到恰当的值。在本实验中设定学习速率为0.01,得到较快的收敛速度。

传递函数设定为双曲面正切S型函数,若是输入向量不合适,会导致输出函数斜率无线接近零,若是无法得到最优值会使得训练结束。权值大小与幅值无关的修正值密切相关,本试验中采用弹性梯度下降算法,增量因子和减量因子分别设置为1.2和0.5.人脸识别程序主要代码包括读入人脸图像M=double(imread(e)),根据特征矩阵对抽样训练集进行归一化处理,构建BP神经网络,num_train=5;func_hidden=tansig,调用MATLAB神经网络工具箱,构建BP神经网络[netl,trl]=train(net,pnl,tl),用训练好的神经网络进行识别result _test=sim(net2,pnewn),[C,I]=max(result_test)确定测试集图像数目count_test=count_test+1;计算识别率Test_reg=conut_test/total_test。

2.3 试验结果

对不同输入层特征向量个数和隐含层节点数进行试验,训练集数目、测试集数目均为5,隐含层到输入层的传递函数为purelin,BP神经网络训练目标为0.001,学习效率为0.01,结果表示输入层特征向量32个,人脸识别率最高为86.5%,增加特征向量的个数能够提高人脸识别率,增加神经网络的隐含层节点数,能够提高人脸识别率。

3 结束语

综上所述,本文主要分析构建子图分割和BP神经网络的人脸识别方法,试验表明该方法人脸识别率比较好,由于研究时间比较短,基于ORL人脸图像样本库,范围比较小,还不能很好的解决光照强弱等问题,会受到网络参数很大的影响,这些还需要人们更多的研究。

参考文献

[1]冯玉涵.BP神经网络在人脸识别中的应用研究[J].计算机光盘软件与应用,2014(02):152+154.

[2]吴岸雄.基于RBF神经网络的人脸识别方法[J].肇庆学院学报,2014(02):27-31.

[3]许S. 基于子图分割和神经网络的人脸识别研究[D].中山大学,2010.

作者简介

唐守军(1980-),男 ,山东省淄博市人。现为广东开放大学、广东理工职业学院讲师。主要研究方向为神经网络、数据库性能优化、人脸识别。

作者单位

篇8

是以研究以模拟人体神经系统的运动行为,建立神经网络基本特征的一种神经网络系统运算算法。这种算法可在计算机上,通过硬件与软件的相互配合来实现,也可以在神经网络计算机上更加快捷的实现,最终可以实现智能计算机终端智能运算的目标。神经网络系统是由大量的神经元--简单的信息处理单元,按特定的配对方式相互构成,神经元之间的信息传递和储存,依照一定的规则进行,网络连接规则以及数据存储方式有一定的稳定性与匹配性,即具有学习和训练的特定效果。

1.1神经网络系统模型与应用范围

有反馈网络模型。有反馈网络也称回(递)归网络,在这这当中,多个神经元互联以组成一个互连神经网络。有些神经元的输出被反馈至同层或前层神经元,因此,信号能够从正向和反向流通。

1.2神经网络的设计

在决定采用神经网络技术之前,应首先考虑是否有必要采用神经网络来解决问题。一般地,神经网络与经典计算方法相比并非优越。只有当常规方法无法解决或效果不佳时神经网络才能显示出其优越性。尤其是当问题的机理等规律不甚了解,或不能用数学模型表示的系统,神经网络往往是最有力的工具。另一方面,神经网络对处理大量原始数据而不能用规划或公式描述的问题,表现出极大的灵活性和自适应性。

2建筑管理模式

建筑管理模式是在TFV理论基础上构筑的。建筑管理模式在国外,对精益建造的理论和应用研究已取得了很多成果,但国内对于精益建造,未能给予足够重视。数据处理技术在企业的逐步成功应用,企业积累了大量的生产科研相关和业务数据,但面对浩如烟海的企业数据,决策人员常常难以及时获得足够信息,提出决策的现状,许多企业已经构建了完善的数据库.并且通过联机分析处理的方式技术,可以使决策人员更快捷的从数据仓库中提取精良信息。

3建筑管理模式

3.1任务制度管理

任务制度管理是从生产管理转换的角度管理生产制造,虽然本质依然是硬性管理,但管理的内容为与适应建造相关用户的合理配合安排,主要依据顾客需求设计来配编生产系统,最后一招合同流程来实现。

3.2流程过程管理

流程过程管理是从流程的角度管理数据模型,其本质为软性数据管理。流程管理的目标是不但要有高效率可预测数据目标的综合流程,而且要做好建设项目的相关单位,现场数据工作人员之间的相互协调工作。

3.3价值趋向管理

价值趋向管理是从数据价值的角度管理生产,它是以一种更加柔性的方式来体现顾客消费价值和一种硬性的方式完成生产预订目标的的趋向性管理。

4数据仓库概论

数据仓库,就是一个更完全面支持企业组织的决策分析处理数据的面向主题的总成的,不可随时间不断变化持续更新的数据仓库体系结构,美国哈佛大学计算机科学系的专门小组,通过长期对数据技术的研究,提出了数据仓库技术的完善概念,该概念是在体系结构整体上对数据仓库进行了描述,从各个数据源收集所需数据,并与其他数据源的数据衔接,将集成的总体数据存入数据仓库终端,用于用户直接从数据仓库中访问相关数据,用于理论和实践应用的案例.运用这种建筑管理模式,可以提高生产率,降低成本和增加顾客满意度,在建筑业中有广阔的应用前景。

5结语

篇9

关键词:光伏发电;发电量预测;BP神经网络;果蝇算法

中图分类号:TM615;TP39 文献标识码:A 文章编号:2095-1302(2017)04-00-02

0 引 言

随着全球经济的不断发展,人类对能源需求不断增长,不可再生能源不断减少,使得发展并利用新能源迫在眉睫。研究和实践表明,太阳能是资源最丰富的可再生能源,是人类社会未来能源的基石。由于光伏发电具有较强的随机性和波动性,光伏电站并网势必会造成电网的不稳定,因此准确预测光伏发电量具有重要意义。

目前,国内外对光伏发电量预测已有相关研究,一些相关人工智能算法也被应用到预测模型中,如马尔科夫链,神经网络,灰色理论,粒子群,遗传算法等。考虑到神经网络具有很强的非线性拟合、学习规则简单,但收敛速度慢且易陷入局部最优等缺点,同时考虑到果蝇算法与其他算法相比具有全局寻优能力强、计算复杂度小、精度高、收敛速度快等优点,故本文提出一种果蝇算法结合神经网络的混合算法。此混合算法能很好的结合两者的优点。

1 光伏发电量预测模型

1.1 BP神经网络模型

神经网络(Neural Network)是模拟人大脑学习知识的过程而提出的一种人工智能算法。神经网络分为单层前馈网络(LMS学习算法)、多层前馈网络(BP神经网络)、后馈网络等。其中BP神经网络是目前研究最为成熟、广泛的预测网络模型之一。预测模型分为输入层、隐含层以及输出层,如图1所示。

(1)输入层

针对本文的预测模型,输入变量为光伏发电系统各个时段的平均温度、平均光照。

(2)隐含层

本文模型采用双隐含层。多层前向网络是单层感知器的推广,解决了非线性可分问题。隐含层由神经元组成,神经元决定了各输入变量权值以及各输出变量权值。

(3)输出层

本文预测模型的输出变量为当日各时段的光伏发电量。文中将光伏发电预测模型分为24小时/天,每一个小时为一个计算单位。输入层中的每个结点作为激励信号,组成下一层的输入信号,而该层输出信号又作为下层的输入信号,以此类推。神经网络具有很好的非线性拟合性,学习规则简单。

1.2 果蝇算法

果蝇优化算法(Fruit Fly Optimization Algorithm, FOA)是一种基于果蝇觅食行为的人工智能仿生算法,是由台湾潘文超教授于2011年6月提出的。果蝇可以使用嗅觉和视觉来寻找食物及同伴,具有很好的群体智能性。

果蝇寻找食物时飞行线路具有一定的随机性,为了寻找食物,果蝇会根据空间中的食物气味浓度进行判定,向浓度高的方向飞行。其算法流程如下所示:

(1)在搜索空间中随机产生果蝇种群。随机产生个体果蝇的位置及各自飞行方向向量。

(2)各果蝇分别沿预定方向移动一定的步长,计算各果蝇所在位置的浓度。

(3)找出种群中浓度最高的果蝇的位置,保存为Piter,然后所有果蝇飞向浓度最高的位置。

(4)计算移动后各果蝇所处位置的浓度,若Piter,i比Piter浓度更高,则更新Piter,再转到步骤(2),直到找到食物位置。

Piter表示第iter代的浓度最高的位置;Piter,i表示第i个果蝇第iter代的位置。

1.3 FOA-BP算法

榻饩錾窬网络收敛速度慢以及容易陷入局部最优的缺点,本文提出一种果蝇算法结合神经网络的混合算法,该混合算法具有较强的全局搜索能力、不易陷入局部最优、收敛快等优点。本文主要利用果蝇算法来优化神经网络权值以达到优化的目的。混合算法流程如下所示:

(1) 初始化。初始化种群规模S,最大迭代次数iter,随机生成各果蝇的位置、移动方向、移动步长及神经元权值等。

(2) 读取数据。读取光伏发电系统训练样本数据,包括各时段的平均温度、平均光照强度以及光伏发电量,对样本数据进行归一化处理。

(3)通过神经网络样本进行训练,得到相应的权值,并利用果蝇算法对权值进行修正与优化。果蝇个体向预定方向移动一定的步长,计算浓度,此时浓度即预测值,若预测值Pbest更优,则保留,继续迭代,直到达到预测精度为止。

(4)输出种群中果蝇所处浓度最高的位置,即神经网络的最优权值。输出预测结果。FOA-BP算法流程如图2所示。

2 实验结果与分析

本模型采用武汉某发电企业发电机组1的发电数据进行试验。时间段选取6:00-19:00。训练样本选取6月份的数据120组,其中输入量是各时段的平均光照强度、平均温度,输出量是各时段的发电量。预测样本是6月6日6:00-19:00各时段的数据。神经网络激励函数采用单极性sigmod激励函数g(x)=1/(1+e-x),神经网络结构为双隐含层,隐含层神经元个数为25,预测样本各时段的平均温度以及平均光照,分别如图3,图4所示。

预测发电量与实际发电量的对比如图5所示。预测误差如图6所示。

由图6的预测曲线图可知,大部分时段的预测误差都在15%内,在第6、第10时段误差较大,总体来看发电量预测曲线能很好的与实际发电量曲线拟合。

3 结 语

本文提出的FOA-BP算法能应用到光伏发电量预测模型,使得输出结果具有较强的准确性、收敛速度快以及寻优能力强等特点。本模型算法可以有效为光伏发电厂的选址以及电厂维护提供理论依据,从而为发电企业带来更多的利益。准确的光伏发电量预测能够为公共电网的维护和电力的再分配提供有力的理论支持。

参考文献

[1]李春鹏,张廷元,周封.太阳能光伏发电综述[J].电工材料,2006(3):45-48.

[2]孟杰,李庚银.含风光电站的电力系统动态经济调度[J].电网与清洁能源,2013,29(11):70-75.

[3]潘文超.果蝇最佳化演算法[M].台北:沧海书局,2011.

[4]景亚平,张鑫,罗艳.基于灰色神经网络与马尔科夫链的城市需组合预测水量[J].西北农林科技大学学报(自然科学版),2011,39(7):229-234.

[5]陈勇,刘洲,李伏麟,等.人工神经网络在货运预测系统中的应用[J].物联网技术,2016,6(1):42-43.

[6]刘瑞叶,黄磊.基于动态神经网络的风电场输出功率预测[J].电力系统自动化,2012,36(11):19-22.

篇10

焦孟孟

(中国71320部队66分队,河南 开封 475000)

【摘要】本文利用仿真分析软件采集电路各种故障模式的特征数据,后将采集到的数据构造多层次的神经网络来进行诊断,最后使用虚拟仪器LabVIEW完成对整个流程的编程与控制,通过实际验证故障诊断正确率非常好。

关键词 BP神经网络;多级构架;Labview

【Abstract】Characteristics of the data we use simulation software acquisition circuit failure mode analysis, the neural network structure of multi-level data collected for diagnosis, finally, using the virtual instrument LabVIEW to complete the programming and control of the whole process, through the actual verification accuracy of fault diagnosis is very good.

【Key words】BP Multilevel;Framework;Labview

0引言

模拟电路故障诊断研究在军事领域率先兴起,随后在通讯、自动控制、电气化网络等领域掀起研究热潮,引起广大学者的兴趣,至今与电网分析和电网综合一起作为网络理论的重要分支[1]。国内外学者已提出的故障诊断理论和方法包括:神经网络、蚂蚁算法、主元分析、遗传算法、马氏距离、及其他故障诊断方法[2]。根据实际工作中对装备故障排除的方法与经验,本文在提出多级神经网络构造的思路上,并最终使用LabVIEW完成系统设计。

1多级神经网络的模型

模拟电路的故障诊断可以看作是故障分类问题。BP神经网络用于故障诊断的原理是:通过分析确定电路故障集,选择电路测试点对某一或多种特征参数进行测量,根据得到的数据进行BP神经网络训练,经过训练的网络即可对故障数据进行判断,识别故障类型,但是往往会存在这样的问题,故障集内总有几个故障非常类似,只有少量参数有所区别,造成网络对这类故障的识别率不高,本文针对这种问题提出多级神经网络的来解决。

1.1软件平台实现功能介绍

首先利用Pspice软件对电路进行器件灵敏度分析,找出器件故障时影响最大的参数,一般根据电路特性选择即可,如放大电路选择节点电压或信号幅值,锁相环电路选择节点电压或输出频率值等,然后利用蒙特卡罗分析功能(抵消器件容差的影响)对电路进行分析,输出故障数据到输出文件。

其次在Matlab设计程序对Pspice软件生成的数据进行读取,读取后的数据进行预处理后利用BP神经网络进行训练,训练完成后,利用训练好的网络对检验样本进行检验,利用诊断结果对故障模式进行再分类,组建成多个神经网络,以故障类型最多的神经网络为主网络,少的为子网络,并将子网络中的故障做为一类在主网络中进行体现。

最后,在Labview中利用MathScript节点实现对Matlab程序的调用,并通过图形化程序完成对多级神经网络的控制。

1.2多级神经网络构建步骤

第一步:对样本数据进行神经网络训练。

第二步:用测试样本检验是故障诊断结果。

第三步:若诊断结果无错误则结束训练。若存在错误,对诊断错误的故障类型进行分析,找出差异特征参数集M,和共同参数集N。

第四步:将诊断错误的故障类型合为一类与其它故障类型组成主网络故障集,特征参数使用N,诊断错误的故障类型使用参数集M组成子网络,分别进行训练。

第五步:若诊断结果无错误则结束训练,对主网络及子网络进行参数记录。若仍有错误,返回第一步。

2故障诊断实例

本文采用的一个典型负反馈放大器电路,如图1所示。电阻的容差范围取5%,信号源采用幅值0.1V,频率10Mhz的固定信号频率(与实际测试电路相符),V2为12V直流电压,R1=500k,R2=1k,R3=l0k,R4=2k,R5=0.5,R6=3k,R7=1k,R8=9k,R9=5k。

按照器件不同的故障类型,使用蒙特卡洛分析方法,对所有器件故障状态响应数据进行采集并分析数据,找到电路故障时比较灵敏的特征参数,同时确定电路故障集,最终找出确定14种故障模式:正常状态,R2开路,R3开路,R4开路,R5增大50%,R6开路,R7开路,R8开路,C4短路,Q4基极与发射极短路,Q5基极与发射极短路,Q4基极开路,Q5基极开路。

对样本数据进行BP神经网络进行分析后发现,故障11、12难以分辨故合为一类,差异主元为V2频率幅度值,3、8、14难以分辨故合为一类,差异主元无,另选主元Q5基极电压。最终主网络共有10类故障模式,其中有两个代表多种模式,其余为单故障模式。分别对网络进行训练后,利用测试样本进行诊断,结果为100%,样本与诊断结果见表1。

3诊断系统的实现

若要对多级网络在Matlab中实现,程序过于繁琐,因此本文采用虚拟仪器Labview对程序的控制进行实现,本文是通过Labview软件实现的其程序图与前界面如图2所示。

其程序流程为:输入相关测试参数,对主元参数通过Matlab节点进行网络训练,输出分10路,每一路都于0.9进行比较,若某一输出大于0.9则认为某一故障为真,故障灯亮。若子网络判定条件为真,则开始子网络训练,对子网络模式进行识别。

4结束语

本文提出一种基于优化类间间距的方法,通过实际验证与文献相比,故障模式多5种,故障诊断率却上升到100%,显然大提高了诊断正确率,最后通过Labview软件完成系统的实现,界面直观,自动化诊断,具有很大的实际运用价值。该方法对于大型模拟电路同样具有研究价值,只需将大型电路撕裂成分电路即可,为大规模电路的诊断研究提出了一种可行的方法。

参考文献

[1]杨士元.模拟系统的故障诊断与可靠性设计[M].北京:清华大学出版社,2001,11.