神经网络的实现范文
时间:2024-03-27 16:40:45
导语:如何才能写好一篇神经网络的实现,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
1程序设计
三角基神经网络流程图如图2所示。Qt中有自己C++标准库,其C++语言库文件与标准版C++有所不同[7],但语法相同,设计程序相关参数如下:(1)这里滤波的理想目的是检出直流分量,其函数为:(2)初始化参数:神经元个数n为9个,训练次数上限为500次,学习率初始值为0.1。在程序中增加计时函数,运行7ms内便有输出,随着误差变小,数据输出时间变短。滤波输出为大约23ms后便可以得到稳定输出,误差精度高于10-5。在Qt工程文件.pro中添加Qwt/lib文件路径,qmake编译。在X86的Linux系统上运行结果如图3所示,把数据制成表格如图4所示,运行时间160ms。
2低通滤波器谐波检测
与上述程序中相同的谐波函数,由低通滤波器滤波来分析处理,并采用2阶和6阶截止频率为分别为100Hz和20Hz的ButterWorth滤波器进行滤波分析,Matlab仿真结果如图5-8所示。从图5和8可以看出截止频率在100Hz的低通滤波器响应时间在最快0.03s左右,但是误差百分比在11%;图6-7可以看出截止频率相同阶数不同的响应时间0.2s左右,误差百分比在2.54%,这也说明随着ButterWorth低通滤波器阶数越大,其稳态误差越小,而动态响应时间越长[8]。为解决ButterWorth低通滤波器稳态误差和动态响应时间之间的矛盾,很多学者进行了研究,其主要的解决方法是低通滤波器的参数在两个性能之间进行折中选择[9],同时这样的结果也给对后续工作带来更多的误差。由比较可知,本文算法比低通滤波器精确度高,而且响应速度也较快,可以代替在电力系统的谐波检测中低通滤波器做滤波处理。
3基于ARM芯片算法实现
Linux系统具有多任务多进程的系统特征,有些还具有实时特征。它非常适合于在企业的应用,对于单一的任务,一个简单嵌入式Linux即可以完成这种任务,而且配置要求简单,成本较低。这里使用的是TE6410(ARM1176)开发板,最高主频553Hz,2GnandFlash,支持SD烧写系统。首先基于开源代码uboot1.1.6编译系统适合开发板配置的uboot文件;然后根据Linux内核开源代码Linux3.0.1制作文件zImage,由于是单一的最小化系统,在内核配置时加上LCD驱动模块[10],最后编译,大小也只有3MB左右,所需的存储空间也很小;文件系统是算法的运行实现平台,用busybox1.20先制作yaffs2文件系统编译器和最小的文件系统,添加系统相关配置文件;最后从安装Qt4.8.4中复制Qt/Qwt和Qt/lib库文件到制作的文件系统/lib文件夹中,以便程序链接调用,最后配置启动后Qt环境变量。程序在经过交叉编译,编译成ARM可以运行的程序,放到文件系统根目录的/mnt下,并设置开机自动运行。根据上述步骤制作一个最小文件系统,虽然Qt相关库文件静态链接库较大,但最后制作出来大小仅有130M左右,占用很少的内存资源,其测试效果显示如图9所示。图9中x轴是以秒为单位,y轴是谐波中的直流分量。可以看出响应时间在35ms以内便可以得出精确度相当高的响应输出。
4结束语
篇2
关键词:图像分类;深度学习;Caffe框架;卷积神经网络
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)35-0209-03
Research and Implementation of Image Classification Based on Convolution Neural Network
WANG Chao
(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)
Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.
Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network
S着计算机与互联网技术的快速发展,我们已经进入了一个以图像构建的世界。但是面临有海量图像信息却找不到所需要的数据的困境,因而图像分类技术应运而生。通过各种机器学习算法使计算机自动将各类图像进行有效管理和分类,但是由于图像内容包含着大量复杂且难以描述的信息,图像特征提取和相识度匹配技术也存在一定的难题,要使得计算机能够像人类一样进行分类还是有很大的困难。
深度学习是近十年来人工智能领域取得的重要突破,在图像识别中的应用取得了巨大的进步,传统的机器学习模型属于神经网络模型,神经网络有大量的参数,经常会出现过拟合问题,因而对目标检测准确率上比较低。本文采用卷积神经网络框架,图像特征是从大数据中自动学习得到,而且神经网络的结构深由很多层组成,通过重复利用中间层的计算单元来减少参数,在特征汇聚阶段引入图像中目标的显著信信息,增强了图像的特征表达能力。通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示,通过实验测试,效果比传统的图像分类算法预测的准确度有明显的提升。
1 基于卷积神经网络的图像分类方法
1.1 人工神经网络
人工神经网络(Artificial Neural Network, ANN)是描述生物神经网络运行机理和工作过程的抽象和简化了的数学物理模型,使用路径权值的有向图来表示模型中的人工神经元节点和神经元之间的连接关系,之后通过硬件或软件程序实现上述有向图的运行[1]。目前最典型的人工神经网络算法包括:目前最典型的人工神经网络有BP网络 [2]Hopfield网络[3]Boltzmann机[4]SOFM网络[5]以及ART网络人工神经网络[6],算法流程图如图1所示[7]。
1.2 卷积神经网络框架的架构
Caffe是Convolutional Architecture for Fast Feature Embedding的缩写[8],意为快速特征嵌入的卷积结构,包含最先进的深度学习算法以及一系列的参考模型,图2表示的是卷积神经网络结构图。Caffe深度学习框架主要依赖CUDA,IntelMKL,OpenCV,glog软件以及caffe文件。本文使用的各个软件版本说明,如表1所示。
Caffe深度学习框架提供了多个经典的卷积神经网络模型,卷积神经网络是一种多层的监督学习神经网络,利用隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能,卷积神经网络模型通过采取梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练来提高网络的精度。卷积神经网络使用权值共享,这一结构类似于生物神经网络,从而使网络的复杂程度明显降低,并且权值的数量也有大幅度的减少,本文使用这些模型直接进行训练,和传统的图像分类算法对比,性能有很大的提升,框架系统训练识别基本流程如图3表示。
1.3 图像分类特征提取
卷积神经网络的结构层次相比传统的浅层的神经网络来说,要复杂得多,每两层的神经元使用了局部连接的方式进行连接、神经元共享连接权重以及时间或空间上使用降采样充分利用数据本身的特征,因此决定了卷积神经网络与传统神经网络相比维度大幅度降低,从而降低计算时间的复杂度。卷积神经网络主要分为两个过程,分为卷积和采样,分别的对上层数据进行提取抽象和对数据进行降维的作用。
本文以Caffe深度学习框架中的 CIFAR-10数据集的猫的网络模型为例,如图4所示,对卷积神经网络模型进行训练。CIFAR-10是一个标准图像图像训练集,由六万张图像组成,共有10类(分为飞机,小汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车),每个图片都是32×32像素的RGB彩色图像。通过对数据进行提取和降维的方法来提取图像数据的特征。
2 实验分析
将猫的图像训练集放在train的文件夹下,并统一修改成256×256像素大小,并对猫的图像训练集进行标记,标签为1,运行选择cpu进行训练,每进行10次迭代进行一次测试,测试间隔为10次,初始化学习率为0.001,每20次迭代显示一次信息,最大迭代次数为200次,网络训练的动量为0.9,权重衰退为0.0005,5000次进行一次当前状态的记录,记录显示如下图5所示,预测的准度在98%以上。而相比传统的图像分类算法BP神经网络网络的收敛性慢,训练时间长的,网络的学习和记忆具有不稳定性,因而卷e神经网络框架在训练时间和预测准度上具有非常大的优势。
3 结束语
本文使用Caffe深度学习框架,以CIFAR-10数据集中猫的网络模型为例,构建小型猫的数据集,提取猫的图象特征信息,最后和目标猫图像进行预测,并和传统的图像分类算法进行对比,预测的准确率有很大的提升。
参考文献:
[1] 杨铮, 吴陈沭, 刘云浩. 位置计算: 无线网络定位与可定位性[M]. 北京: 清华大学出版社, 2014.
[2] 丁士折. 人工神经网络基础[M]. 哈尔滨: 哈尔滨工程大学出版社, 2008.
[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.
[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.
[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.
[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.
篇3
关键词:神经网络 建筑管理 数据仓库
中图分类号:F274 文献标识码:A 文章编号:1007-9416(2015)09-0000-00
1神经网络系统理论的研究目标
是以研究以模拟人体神经系统的运动行为, 建立神经网络基本特征的一种神经网络系统运算算法。这种算法可在计算机上,通过硬件与软件的相互配合来实现, 也可以在神经网络计算机上更加快捷的实现,最终可以实现智能计算机终端智能运算的目标。神经网络系统是由大量的神经元--简单的信息处理单元,按特定的配对方式相互构成, 神经元之间的信息传递和储存,依照一定的规则进行, 网络连接规则以及数据存储方式有一定的稳定性与匹配性, 即具有学习和训练的特定效果。
1.1神经网络系统模型与应用范围
有反馈网络模型。有反馈网络也称回(递)归网络, 在这这当中, 多个神经元互联以组成一个互连神经网络。有些神经元的输出被反馈至同层或前层神经元, 因此, 信号能够从正向和反向流通。
1.2 神经网络的设计
在决定采用神经网络技术之前, 应首先考虑是否有必要采用神经网络来解决问题。一般地, 神经网络与经典计算方法相比并非优越。只有当常规方法无法解决或效果不佳时神经网络才能显示出其优越性。尤其是当问题的机理等规律不甚了解, 或不能用数学模型表示的系统, 神经网络往往是最有力的工具。另一方面, 神经网络对处理大量原始数据而不能用规划或公式描述的问题, 表现出极大的灵活性和自适应性。
2 建筑管理模式
建筑管理模式是在TFV理论基础上构筑的。建筑管理模式在国外,对精益建造的理论和应用研究已取得了很多成果, 但国内对于精益建造,未能给予足够重视。
数据处理技术在企业的逐步成功应用,企业积累了大量的生产"科研相关和业务数据,但面对浩如烟海的企业数据,决策人员常常难以及时获得足够信息,提出决策的现状,许多企业已经构建了完善的数据库.并且通过联机分析处理的方式技术,可以使决策人员更快捷的从数据仓库中提取精良信息。
3 建筑管理模式
3.1 任务制度管理
任务制度管理是从生产管理转换的角度管理生产制造, 虽然本质依然是硬性管理, 但管理的内容为与适应建造相关用户的合理配合安排, 主要依据顾客需求设计来配编生产系统, 最后一招合同流程来实现。
3.2 流程过程管理
流程过程管理是从流程的角度管理数据模型, 其本质为软性数据管理。流程管理的目标是不但要有高效率可预测数据目标的综合流程, 而且要做好建设项目的相关单位,现场数据工作人员之间的相互协调工作。
3.3 价值趋向管理
价值趋向管理是从数据价值的角度管理生产, 它是以一种更加柔性的方式来体现顾客消费价值和一种硬性的方式完成生产预订目标的的趋向性管理。
4 数据仓库概论
数据仓库,就是一个更完全面支持企业组织的决策分析处理数据的面向主题的总成的,不可随时间不断变化持续更新的数据仓库体系结构,美国哈佛大学计算机科学系的专门小组,通过长期对数据技术的研究,提出了数据仓库技术的完善概念,该概念是在体系结构整体上对数据仓库进行了描述,从各个数据源收集所需数据,并与其他数据源的数据衔接,将集成的总体数据存入数据仓库终端,用于用户直接从数据仓库中访问相关数据,用于理论和实践应用的案例.运用这种建筑管理模式, 可以提高生产率, 降低成本和增加顾客满意度, 在建筑业中有广阔的应用前景。
5 结语
在当今日益激烈的竞争环境下决策人员能否及时地从大量原始数据中提取更多更好的信息是一个企业生存发展的关键,传统的神经网络系统的建筑管理数据仓库的设计已不能适应行业的发展精益建造这种体系应运而生。他是由精益生产延伸而来,将神经网络系统的建筑管理数据仓库的设计以及实践应用到行业之中。
参考文献
[1]赵璐.基于精益建造的成本管理[J].华中科技大学学报,2005.
[2]肖智军,党新民.精益生产方式JIT[M].广州: 广东经济出版社,2004.
[3]Glenn Bllard3 刘来红, 王世宏.空气过滤器的发展与应用.过滤与分离,2000,10
[4]Lauri Koskela. We Need A Theory Of Construction
[C], Berkeley - Stanford CE&M Workshop: Defining a Research
Agenda for AEC Process/Product Development in2000 and Beyond Stanford, Berkeley, 1999.
篇4
关键词:BP神经网络;三维加速度;特征值提取
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)51-0197-02
随着物联网的高速发展,智慧医疗的应用也越来越广泛,人体行为识别作为智能监测中一个重要的研究方向,也逐渐受到各国学者的广泛关注。随着我国人口老龄化不断加剧,老年人意外摔倒问题受到人们关注,而人体行为识别方法的研究将推进更有效更准确的跌倒检测算法研究。按照信号的获取方式,可将现有的人体行为识别方法分为以下两种:基于计算机视觉的方法和基于传感器的方法。基于三轴加速度信号的识别方法属于第二种,第二种方法相较于第一种具有低功耗、高精度、携带方便等优点。目前BP神经网络是目前人工神经网络中研究最深入、应用最广泛的一种。本文选用已有的三轴加速度信号数据集,在MATLAB仿真环境下,基于BP神经网络设计并实现人体行为识别算法。
一、数据预处理
本文选用的三轴加速度数据来源于南加州大学人体行为数据集,这个数据集包括了对14名受测者的12种动作的三轴加速度信号采集。采集过程中,三轴加速度传感器位于受测者右前臂;采样频率为100Hz;12种动作每种动作由每名受测者做5次,即对每种动作采集70个样本,每个样本采集时长不定但是足够捕获动作的所有信息。考虑实际意义,本文只选取上述14名受测者的7类动作,共计490个加速度数据样本。在特征值提取前需要对滤波得到的加速度数据再进行加窗处理。选用窗口长度N为512的矩形窗,则结合采样频率可得窗口时间跨度为5.12秒,足够包含单个完整动作。经过预处理后的数据才可以用于后续的特征值的提取,并用来训练和测试所建立的BP神经网络。
二、BP神经网络的建立
BP神经网络由输入层、输出层和隐含层组成,其中输入层与输出层各为一层,隐含层可以有多层。在网络中,相邻两层间实现全连接,而处于同一层的神经元之间无连接。BP学习算法需要提供教师信号。BP网络的学习过程包括工作信号的正向传播和误差信号的反向传播,并通过修改连接两个神经元的边的权值来使得误差函数达到最小。①工作信号的正向传播。设X■■表示第k层神经元i的输入总和,Y■■为输出,第k-1层神经元j到第k层神经元i的权值为Wij,则有如下函数关系:Y■■=f(X■■)X■■=■W■Y■■ (1)
称f激励函数,通常取f为非对称Sigmoid函数,即 f(X■■)=■ (2)
②误差信号的反向传播。设输出层为第m层,则输出层第i个神经元的实际输出为Y■■,设对应的教师信号为Yi,定义误差函数e为 e=■■(Y■■-Y■)■ (3)
定义d■■表示误差函数e关于U■■的偏导数,可推得 当k=m时,有d■■=Y■■(1-Y■■)(Y■■-Y■)(4)
k
③权值的修正。设某一次学习权值的修改量为ΔWij,考虑两次学习的相关性,可定义权值修改量如下:
ΔWij(t+1)=-μ・d■■・Y■■+γ・ΔWij(t)(6)
其中,γ为表示两次修正间的相关程度的系数, μ为学习速率。综上,BP神经网络的学习目标就是:找一组最合适的边的权值Wij,使得误差函数满足 e=min■■(Y■■-Y■)■ (7)
三、BP神经网络结构设计
1.输入层。BP神经网络的输入即为各种行为的特征向量,因此首先需要选取合适的特征值构建特征向量。根据统计学原理和所选加速度信号数据集的特征,选取5个特征值:均值、方差、相关系数、偏度和峰度。5个特征值均以窗长N为提取单位,特征值的计算直接使用MATLAB已有的函数。以窗长为单位,分别计算三个轴的加速度信号的上述5种特征值,一次特征值提取可得到一个15维的特征向量,将此向量作为BP神经网络的输入,则输入层可有15个神经元。
2.隐含层。隐含层待定的系数包括隐含层的层数和每个隐含层包含的神经元个数。为提高学习速率,通常选用单隐层的神经网络,但为获得更好的学习效果,本文考虑单隐层以及双隐层的BP神经网络。
关于隐含层神经元的个数n1选取,本文参考公式如下:n■=■+p (13)
其中,n0为输入层神经元个数,nm为输出层神经元个数,p为[1,10]之间的一个常数。在利用上述公式估算的基础上,根据网络学习的结果对隐含层神经元个数再做调整,以达到最好的学习效果。
3.输出层。神经网络的输出层表示人体行为识别的结果,即判断该动作属于哪一类。根据所研究的7类动作,可以构造一个7维的输出向量。每一个输出向量对应每一次输出,向量的每一维对应每一类动作。若输入特征值来源于第Z类动作,则期望的输出向量为第Z维置“1”,其余维置“0”,而实际的输出向量的7个维度的数值分别代表属于7种动作的可能性大小,取数值最大的维度为分类结果。
篇5
关键词:船舶市场预测;NARX神经网络模型;模糊聚类
中图分类号:F272 文献标识码:A
0 引 言
学者陶永宏、陈定秋和戈铮曾经对船舶行业风险进行过定性分析和研究,但尚未开展深入的定量化分析[1]。陶永宏和祁爱琳将功效系数法与BP神经网络相结合来衡量我国船舶制造业的风险。采用功效系数法获得了历史数据警情,并用历史数据训练模型以检验模型的预警能力,且对2011年前的造船业市场进行了市场参数预测和风险预警[2]。余思勤等人利用BP神经网络和市场均衡模型对过去30年的船舶市场参数特征进行分析,并依此预测和评估船舶市场的未来风险[3]。但是在没有消除市场变动的周期性和波动性的前提下直接利用神经网络对船舶市场特征参数和风险值进行预测评估,在一定程度上影响和局限了预测结果的准确性。
针对当前出现的问题,本文提出两阶段市场风险预警模型。首先基于以往船舶市场表现特征,利用动态模糊聚类算法对时间序列数据进行模糊分组,得到不同市场环境下的时间片段。接着,对未来市场环境进行初步判断,选取与待预警市场环境特征相符合的时间段数据,经过数值修正和数据差值后,利用NARX非线性自回归神经网络对该组数据进行预警。本文的重要创新在于,由于神经网络预测需要依靠大量的历史数据,以进行训练和结构优化,而本模型对历史数据分组后带来分段数据大量减少。为此本模型尝试性地引进原始数据的插值算法,在不改变原始数据变化特征和数据结构的基础之上大幅度增加数据量,从而完善数据的补充和修正,提高了NARX神经网络预警的准确性。
1 船舶市场风险预测指标确定
基于市场均衡理论,本文选择造船完工量、新增订单量及船舶价格指数三个市场指标作为风险预警的影响因素。这三个因素作为市场均衡理论当中的需求、价格、供给三要素,可以全面反映船舶市场的发展特征。
针对当年的船舶价格指数、新船订单量和新船完工量特征,可以根据一系列条件和规则[3]给出当年期船舶市场风险指数专家评分。风险指数评分由0,25之间的任意整数表示风险由小到大的变动范围,其中根据风险警戒级别的不同,将其划分为五个不同的警情级别,分别为:“巨警、重警、中警、轻警、无警”。其中专家评分及预警区间和引入的历史数据如表1、表2所示:
2 船舶市场风险预警两阶段预测模型构建
2.1 时间序列模糊聚类模型
针对历史数据的模糊聚类可以消除在时间序列上某些歧点数据,对原始数据亦可以起到一定的平滑作用。使经过模糊之后的时间段内的数据均为相对连续的,可以较好反应该段时期内市场特征。
(1)数据标准化
(3)聚类
从(2)中求出的N阶模糊相似矩阵R出发,用平方法求其传递闭包tR。这就是将改造成的n阶模糊等价矩阵,之后让λ由大变小,便可以形成动态过程的聚类结果。根据实际的市场情况控制λ的值,使经过聚类之后,原始历史数据分为市场低风险时间段、市场中等风险时间段、市场高风险时间段。
(4)计算
将表格当中所列除专家评分之外的数据依照上述模糊聚类过程进行分组并对比各时期专家评分之后,结果如表3所示:
对照表3与之前历史数值,发现该模糊聚类算法对时间段划分起到了非常好的效果,可以较好地拟合及表现各个时间段的市场特征。
2.2 数据修正和数据插值
(1)数值修正
船舶需求量、供给量和价格在遵循一定的变化规律的同时,也在进行着稳定增长。因此,单纯使用过去的数据直接用神经网络进行训练,得到的结果也只是针对过去那些年的预测值,而不是针对现在得到未来的预测值。因此在不改变数值变化特征的情况下,需要针对现在一段时期的数据对过去时间段内的历史数据进行整体修正。修正算法如下:
2.3 NARX神经网络预测
(1)模型介绍
NARX非线性自回归神经网络是一种封闭的动态神经网络,是由普通的动态神经网络将结果反馈到输入层以影响和改变网络结构以实现网络在训练过程当中的逐步调整。该模型基于线性ARX模型而建立,通常用于时间序列的预测。NARX的模型定义为:
fx为用神经网络实现的非线性模糊函数。
对于每一个y的输出,都指向元神经网络层的输入当中,作为下一次输出的调整参数并且完成对神经网络的调整ux。随着数据在时间序列上的递进,此式表示了神经网络的时间序列实现及函数模拟功能的数据关联性建模思想。
该神经网络的结构如图1所示:
本文利用MAYLAB神经网络工具箱当中的时间序列预测可视化工具完成了对该网络的构建和参数调整、训练和仿真。由于输入权值和阈值同时影响着神经网络的实际预测效果,因此在构建神经网络时要多次调整相关参数,才可以在前期的训练当中取得较好的预测效果。
NARX神经网络的训练有多种函数可以选择,其中较为典型的算法有动态BP算法(DBP)、实时递归算法(RTTL)等。
(2)数据准备
由表3的分类结果可知,1975到1987年的数据为一个小组,警情为中警;1988到1997年、2004到2007年这两个时间段为一个小组,警情为轻警;1998到2003年为一个小组,警情为无警;2008到2012年数据为一个小组,警情为重警。这里需要注意的是在轻警警区的小组内有两批数据,这两批数据是不连贯的时间段,因此不能将其合并,而是在以后的训练过程中先后使用这两批数据分别训练以增强网络训练的有效性。
对上述各个分组分别进行数值修正和插值,作为训练用原始数据。其中插值的多少根据该组内数据的多少分别决定而不遵循统一标准。
(3)神经网络训练
为了验证该模型的准确性,笔者选取2012年的数据作为待预测数据,将2011年之前的历史数据作为预测输入。由于2012年世界经济形势并不乐观,因而即使是在2012年之前,仍可以断定2012年船舶市场风险属于重警区间。故选取2008到2011年这一组的数据对神经网络进行训练。
使用原始参数训练结果如图2所示。
经过反复调试和修改神经网络参数,最后在使用隐藏节点为30,延迟为4的时候发现训练效果较好。其训练结果如图3、图4所示。
最终训练后的神经网络结构,采用两层NARX神经网络展现新船订单、新船价格和船舶完工量的转换。隐藏神经元的个数确定为30个,传递函数采用TanGis函数,最后得到的训练误差大致为6×10-20,结果满意。因此可以认为该神经网络可以用来实现这一个关系映射。
(4)神经网络预测
使用之前的历史数据和已经训练好之后的神经网络对2012年的市场三要素进行预测,得出结果如表4。
由表4可以看出,次神经网络模型对实际的预测有很好的表现性。
已经确认该模型有较好的预测能力之后,笔者尝试利用模型对2013年的船舶市场各项数值进行预测,得到的结果如表5:
3 模型预警结果比较
为了与直接使用神经网络预警的模型进行结果比较,笔者在该阶段将未分组的历史数据直接使用上述神经网络进行预警。这种方法的优点是绝对保证输入神经网络的原始数据的完整性、连续性和大量性。得到的结果如表6所示:
由表4和表6的对比可以很明显看到,尽管直接预警有上述若干优点,但使用聚类再预警的模型比直接预警的模型在预警准确度方面有很明显的优势。可以提供更加性能优良的市场预警结果和风险指示导向。
4 结 论
本文综合模糊聚类、神经网络方法建立了聚类-预测两阶段风险预警模型,并使用船舶市场数据进行了预警和与实际值的对比分析。本文的创新之一体现在,为了发现不同时间段的船舶市场特征,利用模糊聚类进行了船舶市场分类,结果发现聚类提高了预警精度,体现出本模型的优越性。本文的创新之二体现在,当神经网络的训练数据不足时,提出了针对原始数据的插值思想。聚类和插值思想的提出和实现取得令人满意的效果,在提高整个模型预警精度的过程中起到关键作用。
参考文献:
[1] 陶永宏,陈定秋,戈铮. 基于动态利润模型的人民币升值对中国造船业影响的分析[J]. 中国造船,2009(1):44-51.
[2] 陶永宏,祁爱琳. 基于功效系数法与BP 神经网络的造船业风险预警研究[J]. 中国造船,2010(3):191-198.
篇6
【关键词】电力负荷;神经网络;网络模型
1.电力负荷预测的重要性
电力工业在我国经济迅速发展的今天,正飞速的发展,而电力工业在生产与传输过程中存在不能对其进行保存的特性,所以这就要求发电厂与用户间的供求关系应平衡,否则会造成用户用电的质量受影响,也会使供电部门经济利益受得损失,因此电力系统负荷预测方法迅速的发展,而精度高、速度快的电力负荷预测的保证电力市场供求关系平衡的一个重要前提,同时也是电力系统安全稳定运行的一个重要保障,因此电力负荷预测的方法研究的重要性可想而知。
2.建立神经网络模型
在本文中,将以河北省泊头市的2013年6月1日至6月7日的电力负荷作为样本对进来几天的电力负荷进行预测。
以神经网络的非线性映射能力为依据来建立短期的电力负荷预测模型,可以将其过程归纳为以下几步:
(1)先确定所要研究的神经网络模型的结构;
(2)对所选取的电力系统中的历史电力负荷数据进行分析,并按照一定的经验选取最能反映电力负荷变化的一部分电力负荷数据作为该神经网络模型的输入量,再选取该网络中历史负荷预测值作为该网络模型的输出量;
(3)选取合适的样本数据集作为该网络训练的样本集;
(4)将选取的样本集作为输入,输入到神经网络模型中进行运算,然后将期望的输出值和与经过神经网络训练后输出值进行比较,并按照一定的网络算法规则去调整该神经网络中各层之间的连接权值。并反复进行该网络输出误差计算和权值修改的工作,当误差输出满足一定的输出精度,或达到规定的迭代次数时完成训练;
(5)将这里训练好的神经网络模型应用到短期电力负荷预测中;
(6)该电力网络负荷预测模型使用一段时间后,在保留原有权值不变的基础上,根据实际的情况选取一些新的数据样本集对该神经网络进行重新的训练,使网络权值能够适应最近一段时间的负荷变化情况,保证预测电力负荷数值具有良好的精确度。
3.样本数据的预处理
在对短期电力系统负荷样本的处理前,应先对其日期的类型进行划分,其负荷日期的类型大致可以分为以下三种:
第1种:将一周内的七天分成两类:一类命名为工作日(周一至周五),一类命名为休息日(周六、周日);
第2种:将一周的七天分成五种类型:周一为一个类型、周二到周四为一个类型、周五、周六、周日分别作为一种类型;
第3种:将一周的七天分为七种类型:即每天都作为一种类型。
在本文中采用第三种类型,即把一周中的每一天都看作一种类型,并且又做了进一步的细分,在这里对一天内的24小时中的每个时辰的电力负荷量进行统计并作为本文的研究样本。
4.气象特征的量化处理
本文在分析历史电力负荷数据的同时考虑了与该电力负荷数值密切相关的气象变化,如采集历史电力负荷数据当日天气的温度、湿度及当是的天气特征(阴天,雨天,晴天)等,经大量观察分析这些因素对电力负荷值所起的影响,影响最大的是温度因素和天气特征,因此本文采用选取当天的最高温度、最低温度及天气特征作为该神经网络模型的三个输入量值,在本文中分别用 0代表情天、0.5代表阴天、1代表雨天的情况。
表1 河北省泊头市区6月1日到7日电力负荷表
日期 6月1日 6月2日 6月3日 6月4日 6月5日 6月6日 6月7日
0时 0.5513 0.636 0.6487 0.6371 0.6258 0.6352 0.603
1时 0.5341 0.6122 0.6249 0.6142 0.6006 0.6108 0.5861
2时 0.5277 0.6004 0.6089 0.6024 0.5902 0.5933 0.5616
3时 0.5202 0.5888 0.5939 0.5876 0.5846 0.5794 0.5701
4时 0.5164 0.5829 0.6098 0.5865 0.5956 0.5887 0.559
5时 0.5759 0.6269 0.6515 0.6254 0.6432 0.621 0.5911
6时 0.6481 0.6913 0.7118 0.6868 0.7003 0.6721 0.6276
7时 0.7299 0.7641 0.7875 0.7649 0.7752 0.7496 0.6923
8时 0.8331 0.8657 0.898 0.8778 0.8785 0.8368 0.7609
9时 0.8993 0.942 0.9522 0.9398 0.9358 0.89 0.8177
10时 0.9292 0.958 0.9741 0.9658 0.9626 0.9114 0.8381
11时 0.8542 0.8829 0.8904 0.8915 0.8829 0.8326 0.7794
12时 0.8183 0.8389 0.8477 0.843 0.8416 0.8015 0.7461
13时 0.8854 0.914 0.9106 0.9191 0.9172 0.8603 0.7862
14时 0.8878 0.9203 0.911 0.9128 0.916 0.8571 0.7886
15时 0.8912 0.9186 0.9118 0.9096 0.9166 0.8571 0.7974
16时 0.8833 0.912 0.9071 0.8966 0.8995 0.8425 0.8148
17时 0.8545 0.872 0.8652 0.8612 0.8567 0.8157 0.8043
18时 0.8341 0.8501 0.8474 0.8248 0.8333 0.7932 0.7752
19时 0.8388 0.8586 0.8459 0.8338 0.8334 0.799 0.7601
20时 0.8323 0.8521 0.8331 0.8304 0.8336 0.7916 0.7401
21时 0.7641 0.7928 0.7618 0.7657 0.7688 0.742 0.6797
22时 0.7374 0.7515 0.7312 0.7303 0.7422 0.7118 0.6469
23时 0.6754 0.6796 0.6659 0.656 0.6726 0.6397 0.5913
最高温度 0.0023 0.0031 0.0028 0.002 0.0023 0.0023 0.0014
最低温度 0 0.0003 0.0006 0.0003 0.0006 0.0003 0.0003
天气 0 0 0 1 0.5 0 0
5.实验仿真结果
5.1 参数设计
(1)BP神经网络:学习速率η=0.1,学习目标ε=0.00001,最大循环次数100次。
(2)ELMAN神经网络:训练次数300次,mc的值为0.9,自适应学习速率初始学习速率为0.01,训练目标为0.0001,学习速度增长比例因子为1.05,学习速率下降比例因子为0.7,最大确认失败次数为5。
(3)PSO算法:种群规模N=20,最大进化次数为100次,惯性权重ω从0.9到0.4线性减小。
(4)本文以前20天每个时辰的负荷值作为训练样本集数据,以第21天的每个时辰的负荷值作为测试样本集数据。
5.2 实验结果
图1 经PSO算法优化的BP、ELMAN网络预测输出与期望输出比较
通过实验我们可以看出:
从图1中可以明显看出,经PSO-ELMAN神经网络预测值与期望值十分接近,预测效果要明显好于经PSO―BP神经网络预测的结果,经PSO-BP神经网络预测误差平均值为0.031792,而PSO-ELMAN神经网络预测误差平均值为0.016792。PSO-ELMAN网络预测结果要比PSO-BP网络预测结果精度高得多。
参考文献
篇7
关键词: FPGA; BP神经网络; 线性拟合; 非线性拟合; 自适应训练
中图分类号: TN702.2?34; TP183 文献标识码: A 文章编号: 1004?373X(2016)15?0115?04
Abstract: Using software for neural network has the disadvantages of low parallelism and slow speed, the hardware design resource utilization of the traditional neural network is high, and the network training is uncontrollable. To solve these problems, a new FPGA?based design method of back propagation (BP) neural network is proposed. The method can realize the Sigmoid excitation function through piecewise linear fitting and nonlinear fitting based on symmetry, and uses the finite state machine (FSM) to accomplish the training times adaption based on error. The Verilog HDL language is used to design the 1?3?1 BP neural network to approximate the function [y=cosx.] The resource occupancy of the network is 2 756 LEs, the training times are 1 583, the average relative error of the network test sample is 0.6%, and the maximum clock frequency is 82.3 MHz. The verification results show that the neural network designed with the method has the advantages of less resource occupancy, high accuracy and fast running speed, and can control the network training automatically.
Keywords: FPGA; BP neural network; linear fitting; nonlinear fitting; adaptive training
0 引 言
人工神经网络(ANNs)[1]通常都是采用基于软件的方法实现。但作为一个并行计算系统,软件实现的方法存在速度慢的缺点,而硬件方式具有高并行性的特点,适合于人工神经网络。FPGA作为一种通用的硬件设计平台,其内部分布式的资源与神经网络的结构非常契合,是一个实现神经网络硬件化设计的良好选择。
资源占用是FPGA设计的一个重要考量因素,而网络训练是神经网络功能实现的基础。已有的神经网络硬件设计工作在这两方面还存在巨大的空间。例如,薛维琴等利用FPGA实现了BP神经网络[2],该网络经过训练能够描述非线性函数,但没有提出BP神经网络的激励函数和训练控制模块的具体硬件实现方法。李利歌等提出了直接利用查找表实现神经网络激励函数的方法[3],但是查找表存在占用资源大,运行速度慢的缺点。张海燕等采用基于查找表的STAM算法实现神经网络激励函数[4],且文中也没有提到训练控制模块。Javier Valls等提出利用CORDIC算法实现神经网络的激励函数[5],资源利用率低,但是存在精度不足的问题。刘培龙利用分段拟合实现激励函数[6],但是激励函数资源占用较多。
基于这一现状,本文通过对Sigmoid函数基于对称性分段拟合以及基于误差的训练自适应技术,提出了一种新的神经网络FPGA设计方法。该方法设计的神经网络资源占用少,网络训练自适应,同时还具有精度高,运行速度快的优点。
1 BP神经网络的FPGA设计
根据BP神经网络的结构,本文将网络划分为神经元模块、激励函数模块、误差计算模块,权值更新模块、权值存储模块以及自适应网络训练模块。图1给出了不同功能模块之间的连接和训练过程。其中,权值存储模块和输入神经元将输入层的权值以及训练的样本输入到隐含层神经元进行乘累加运算,其结果输入到激励函数模块得到激励函数输出,该输出和隐含层的权值作为输出层神经元的输入得到本次训练结果。该结果再经过误差计算模块计算误差值和权值改变量。权值改变量在权值更新模块中得到新权值存入到权值存储模块。误差值输入到自适应网络训练模块判断网络训练是否达到最优。网络训练达到最优前,该过程循环,当网络训练达到最优,自适应训练模块控制网络停止训练。
系统中神经元模块、误差计算模块、权值更新模块按照BP网络算法规则可调用加、乘、乘累加等功能模块,权值存储模块可调用RAM模块。激励函数模块和自适应训练模块关乎系统资源占用及训练过程的实现,是本文BP神经网络FPGA设计的重点。
1.1 激励函数模块设计
激励函数模块是影响整个神经网络资源利用的主要因素之一,在保证误差足够小的前提下,激励函数模块资源占用越小越好。
式中含有指数运算,较难在FPGA 中直接实现。利用Sigmoid函数具有对称性以及较好的线性区域和非线性区域分界的特点,本文提出一种资源占用小、精度高的基于对称性分段拟合的激励函数硬件实现的方法。
考虑到Sigmoid函数的对称性,只需完成[x>0]的区域硬件实现,根据对称性即可求出[x0]区域,根据Sigmoid函数线性区域和非线性区域分界良好的特点,分别采用线性拟合和非线性拟合的方法分段逼近。具体而言,如图2所示,将整个激励函数模块分为预处理模块、函数逼近模块以及最终输出模块三个子模块。
1.1.1 预处理模块
激励函数的输入[x]为16位定点数,最高位为符号位,中间五位为整数部分,后十位为小数部分。当[x]输入到激励函数模块时,首先进行预处理。截取二进制输入[x]的最高位判断[x>0]或者[x0]时,[x=x,]将[x]输入到后续处理模块,若判断出[x
1.1.2 函数逼近模块
基于对输入[x]的预处理,此子模块只需要对[x>0]的情况做线性拟合和非线性拟合。分段逼近函数如表1所示。
1.1.3 最终输出模块
最终输出模块由预处理模块输出的控制信号控制。若[x>0,]则控制信号控制最终输出模块直接输出函数逼近模块中[x]对应的输出[fx;]若[x
1.1.4 激励函数模块分析
按照上述设计方法完成激励函数模块的设计后,对激励函数模块进行功能仿真和误差分析。从-8~8以0.001为间隔生成测试数据输入到激励函数模块,得到的ModelSim仿真结果如图3所示,其各区间绝对误差如表2所示。从中可以看出,各区间的误差值均很小且误差分布较为平均,体现出良好的逼近效果。
1.2 自适应训练模块设计
网络训练是神经网络功能实现的基础。神经网络随着训练的进行,权值逐渐改变,误差逐渐减小,但如果网络训练不能适时结束,造成过度训练,则网络性能会变差。然而对网络训练的控制在硬件上并不易设计,故很多工作未讨论这一点或简单的以固定周期来完成训练。本文提出了一种基于可容忍误差值的自适应网络训练硬件设计方法,可有效的自动控制神经网络训练过程。
分析神经网络的训练过程,每一次输入样本值都会在本次训练完成时得到一个误差值,当误差在可以容忍的范围内可以认为网络已经训练完成。认为在给定的可容忍误差值的情况下,如果连续两次整个样本集输入得到的误差绝对值都要比给定的可容忍误差值要小,则该神经网络训练已经达到最优。根据这个思想,提出利用有限状态机实现自适应网络训练。
如图4所示,有限状态机的状态数是样本集中样本数的两倍,状态机初始为零状态。当某一次训练得到的误差绝对值小于可容忍误差值时,状态机进入第一个状态。若紧邻的下一次训练得到的误差绝对值也小于可容忍误差值,状态机进入下一个状态,否则状态机状态回到第0个状态。当状态机跳转到最后一个状态时,网络训练完成,此时输出控制信号控制权值存储模块停止权值更新,提示信号提示训练完成。该模块的分析需要结合网络中的其他模块,故测试结果在下一节中给出。
2 验证和分析
2.1 验证平台
根据上述方法,设计了一个1?3?1三层BP神经网络验证其性能。验证平台为Altera公司的EP2C70F896C6。
以[y=cosx]函数为学习对象,从[0~2π]之间以[0.062 5π]为间隔选取33个样本组成样本集,随机选取其中25个作为训练样本,剩下8个作为测试样本。神经网络的初始权值和阈值的选取具有一定的随机性,根据网络需要逼近的函数数值大小,输入层到隐含层的初始权值矩阵[W1=[2.5,0.5,-0.3],]隐含层到输出层的初始权值矩阵[W2=[0.35,0.4,0.3],]隐含层阈值选为[0.2,0.3,0.4],输出层阈值选为[0.3]。隐含层的学习率设为0.4,输出层的学习率设为0.3,容忍误差设为0.01。
2.2 结果分析
ModelSim仿真得到的结果如图5所示,从图5中可以看出该BP神经网络的训练是自适应的。当网络训练到最优时,产生一个控制信号和一个提示信号以及网络训练的次数,此时权值存储器的值不再变化,训练完成。
25个训练样本集训练的平均误差为0.003,分析8个测试样本集的误差,如表3所示。从表3中可以看出,其误差与训练数据的误差大体相当且均很小。计算测试样本的平均相对误差为0.6%,小于1%,说明该方法实现的基于FPGA的BP神经网络精度较高。
将该网络下载至Altera公司EP2C70F896C6的FPGA中,其最高时钟频率为82.3 MHz,可见该方法具有运行速度快的优点。将该神经网络资源占用情况与已有相关工作的资源占用情况作对比,如表4所示。虽然其中各设计的规模和平台有所差异(如1 Slice≈4 LEs),但仍可估算出即便添加了自适应训练模块,本设计对资源的占用依然较低。
从表5中可以看到,当学习对象不同时,网络训练的次数也不同,实现了训练过程的自适应。由此亦可推至,若采用传统的预设固定次数的方式完成训练,则对于不同学习对象难免会造成训练不充分或过度训练的情况,从而影响网络的性能。因此,该表也进一步证明了该设计自适应训练的优越性。
3 结 论
本文以典型的BP神经网络为例,提出了一种自适应训练的神经网络FPGA设计方法。通过对Sigmoid激励函数基于对称性做分段拟合减少了资源占用,使用基于可容忍误差完成了网络训练自适应。该方法设计的神经网络具备训练可控、资源占用低、精度高的优点。此方法不仅适合于 BP网络,也可推广至采用Sigmoid函数及需要训练控制的其他类型的神经网络。
注:本文通讯作者为常胜。
参考文献
[1] 蒋宗礼.人工神经网络导论[M].北京:高等教育出版社,2001:15?16.
[2] 薛维琴,李莉华,戴明.基于FPGA的人工神经网络系统的实现方法[J].电子设计工程,2010,18(9):151?154.
[3] 李利歌,阎保定,侯忠.基于FPGA的神经网络硬件可重构实现[J].河南科技大学学报(自然科学版),2009,30(1):37?40.
[4] 张海燕,李欣,田书峰.基于BP神经网络的仿真线设计及其FPGA实现[J].电子与信息学报,2007,29(5):1267?1270.
[5] VALLS J, KUHLMANN M, PARHI K K. Evaluation of CORDIC algorithms for FPGA design [J]. Journal of VLSI signal processing, 2002, 32(3): 207?222.
篇8
关键词: 小波神经网络; 网络流量; 预测研究; 训练样本
中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2016)23?0098?02
Research on network traffic prediction based on wavelet neural network
LI Xin, SUN Shanshan
(College of Information Engineering, Suihua University, Suihua 152000, China)
Abstract: The relevant theory and method of wavelet neural network are used to establish and predict the network traffic situation of a certain uptown. The acquired network traffic change situation is used as the training sample of the wavelet network to realize the traffic prediction of the network. The simulation results show that the constructed wavelet neural network model has high precision to predict the network traffic.
Keywords: wavelet neural network; network traffic; prediction research; training sample
0 引 言
随着互联网规模的不断增大以及各种网络“新应用”、“新服务”的不断涌现,网络信息变得越来越庞大和多变,对网络访问流量进行精确地预测从而实现对网络运行状态的有效管理,已经逐步成为目前的一个研究热点。网络流量预测是实现网络控制、网络规划,保证网络安全以及提高网络服务质量的重要前提。
网络流量具有自相似性、长相关性和多重分形性等复杂性质,对其进行精确地预测一直以来都是一个难点。目前,常见的网络流量预测方法主要有自回归分析法、马尔科夫分析法、分形布朗运动分析法和神经网络分析法。与前面三种传统方法相比,利用神经网络对网络流量进行预测具有预测精度高、方法简单、泛化性强和稳定性好的特点,正在逐步成为网络流量预测研究中的主流方法。
文献[1]根据网络流量的变化特征,基于BP神经网络提出了一个P2P网络流量预测模型,实现了网络流量的较高精度预测。文献[2]结合小波变换和人工神经网络的优势,建立一种网络流量预测的小波神经网络模型,通过将流量时间序列进行小波分解,获得了网络的训练和验证样本,试验表明采用这种方法进行流量预测,要比直接采用神经网络对样本进行预测的精度高。文献[3]根据网络流量自身的特征,研究了BP神经网络和小波神经网络在校园流量预测中的应用,其所建立的模型,经仿真验证证明,可以较好地预测学校网络的流量变化情况,可以为校园网络的规划和管理提供一定参考。
小波神经网络是一种以BP神经网络拓扑结构为基础,把小波基函数作为隐含节点的传递函数,其拓扑结构如图1所示。它类似于BP神经网络权值修正算法,采用梯度修正法修正网络的权值和小波基函数参数,从而使小波神经网络预测输出不断逼近期望输出[4?5]。
采用小波神经网络进行网络流量预测的基本流程如图2所示。
1 网络流量预测
1.1 试验数据来源
采用网络流量监测软件对某小区的网络流量进行实时采集,得到了该小区5天内的网络流量数据,每隔15 min记录一次该时间段内的网络流量值,一共获得了480个时间点的数据。用4天共384个网络流量的数据训练小波网络,最后用训练好的小波神经网络预测第5天的网络流量。为了避免局部数值偏移造成的误差,本文采用编组的方式提高模型预测精度,用前三个时间点的网络流量来综合预测后一个时间点的网络流量情况[6?7]。
图1 小波神经网络的拓扑结构
图2 小波神经网络进行预测的流程图
1.2 构建小波神经网络模型
本文采用的小波基函数为Mexican Hat小波基函数,其表达式为:
[ψ(t)=(1-t2)e-t22ψ(ω)=2πω2e-ω22]
函数的时域和频域波形图如图3所示[7?8]。
图3 Mexican Hat函数的时域和频域特征
本文采用的小波神经网络结构为3?5?1;输入层有3个节点,表示预测时间节点前3个时间节点的网络流量;隐含层有5个节点;输入层有1个节点,为预测的网络流量。设置网络预期误差值为[1×10-2,]将训练数据输入到Matlab软件中进行训练,训练过程中小波神经网络的误差变换情况如图4所示。由图4可知,该小波神经网络经过58步运算后收敛到预定精度要求。
用训练好的小波神经网络对该小区内第五天的网络流量情况进行预测,预测结果与交通流量的实际值比较如图5所示。在图5中,加“*”曲线对应预测数据,加“[]”曲线对应实际数据,可以看到小波神经网络可以较好地预测网络流量。
为了进一步分析仿真结果,采用绝对值误差均值(MAE)和绝对百分比误差均值(MAPE)两个指标进行评价分析,其中MAE和MAPE分别用下式计算[9]:
[MAE=1ni=1nxi-xiMAPE=1ni=1nxi-xixi×100%]
式中:[xi]表示模型的预测值;[xi]表示模型预测值的算术平均值;[n]为样本数。
小波神经网络的MAE和MAPE值如表1所示。
从表1可以看出,本文构建的小波神经网络的MAE值在3.36 GB左右,而MAPE值小于0.1,说明该预测模型可以较好地预测网络流量的变化情况,反应该小区的流量信息变化,为小区网络的规划和管理提供可靠的依据。
2 结 论
本文在网络流量的预测研究中引入了小波神经网络模型,利用收集到的某小区5天内的网络流量变化数据作为训练和测试样本对构建的小波神经网络进行训练和测试研究。试验结果表明,本文构建的小波神经网络具有较高的预测精度,可以对该小区网络的流量变化情况进行较高精度的预测。
参考文献
[1] 韩志杰,王汝传.一种新的 P2P 网络流量预测模型[J].计算机科学,2008(9):39?14.
[2] 雷霆,余镇危.一种网络流量预测的小波神经网络模型[J].计算机应用,2006(3):526?528.
[3] 张昕.校园网络流量分析与预测研究[D].西安:西安电子科技大学,2012.
[4] 王鸣,孙奕鸣.小波支持向量机的网络流量预测研究[J].计算机仿真,2012,29(11):198?201.
[5] ZHANG Li, ZHOU Weida, JIAO Licheng. Wavelet support vector machine [J]. IEEE transactions on systems, man, and cybernetics, 2004, 34(1): 34?39.
[6] 邓远.BP神经网络评价方法在交通流量评价方面的应用[J].中国交通,2011,35(5):146?151.
[7] 李远航.网络流量预测技术的应用[J].计算机工程应用研究,2014,34(1):131?138.
篇9
关键词:人工神经网络;机械工程;应用
中图分类号:TP183文献标识码: A
1 人工神经网络类简介
人工神经网络(Artificial Neural Networks)是采用物理可实现的系统来模仿人脑神经细胞的结构和功能。它反映了生物神经系统的基本特征,是对生物神经系统的某种抽象、简化与模拟。人工神经网络早在20 世纪 40~50 年代已被提出,但直到 20 世纪 80 年代后期,该技术才被人们广为重视并应用。神经网络的特征有:
1) 非线性。人类大脑的智慧就是一种非线性现象。处理元素处于激活或抑制两种不同的状态,这在数学上就是一种非线性关系。利用神经网络可以实现多变量之间的多种非线性映射,因而可以描述大规模非线性复杂系统。
2) 自学习自适应能力。神经网络经过前期的训练,能够处理大量信息,并允许信息是变化的。除此以外,神经网络在处理信息的同时,能够总结、综合输入信息和输入信息以及已有信息之间的规律,采用迭代过程优化自身的拓扑关系,丰富自身的知识和经验,从而提高处理分析数据的能力。
3)并行性。输入到神经网络中的信息是各处理元素并行处理的。现代计算机CPU相当于计算机的司令部,所有指令由CPU一条一条发出,串行工作。工作量很大时,效率必然很低。而神经网络所不同的是,每个处理元素相当于一个独立的微型CPU,各自独立地从其他处理元素采集数据,分析综合后再输入到其他神经元素。各个神经元素相互独立,又相互配合,无统一指挥。神经网络这一特性,使其对信息的响应和处理效率大大提高。
4) 分布式信息存储。神经网络的信息存储不是分别存储在各个处理元素中,而是存储在处理元素之间的拓扑关系中。处理元素之间不同行的联接方式反映了不同的存储信息。输入的信息在神经网络中传播、调整,直到找到与之最佳匹配的存储信息。在这一过程中,神经网络各部分信息相互补充,相互支持,并可以为不完整的信息找到最佳匹配。因此,神经网络具有很强的联想能力和容错能力。
2 、神经网络在机械工程中的应用
2.1 CAD技术
目前,CAD技术已经从传统的绘图功能发展为集需求分析、原理方案设计、初步结构设计与分析、详细设计、工程分析、工艺设计等功能于一身的CAD专家系统。但CAD专家系统存在自身缺陷。第一,知识的获取存在“瓶颈”,主要来源于专家。第二,知识量越丰富,推理链越长,效率越低。第三,求解问题所需知识超出其知识库,系统无能为力。而神经网络的应用弥补了上述缺陷。其知识的获取一部分通过前期训练,另一部分通过自身实践。其信息处理过程是在自身知识网络中寻找最佳匹配的过程,冗余知识耗用时间少。再有,神经网络的联想能力和容错能力使其处理问题时能够克服自身知识量的约束。可见,神经网络可作为CAD专家系统很好的补充。
2.2 机械优化设计
机械优化设计,就是根据机械设计的规范,从设计问题中抽象出数学模型,采用数学归纳法和计算机技术,在约束条件下求目标函数的最优解。可应用于机械优化设计的主要有 BP 神经网络、反馈神经网络。
BP 神经网络BP 神经网络是一种应用比较广泛的人工神经网络,是模仿大脑神经网络结构和功能而建立的一种新型智能信息处理系统。它通过对人脑的形象思维、联想记忆等的模拟和抽象来实现与人脑相似的识别、记忆等信息处理功能。BP 网络具有较强的自适应性和自组织性、高度并行信息处理能力、强大的非线性映射能力,硬件实现后分类速度快,可以快速准确的实时处理等。根据 Kosmagoro定理:在有合理的结构和恰当权值的条件下,三层前馈网络可以逼近任意的连续函数,所以从简捷实用的角度一般只选取一个隐层。标准的 BP 网络相邻两层的神经元之间全连接,每层内的神经元没有连接。机械优化设计中,可利用 BP 神经网络的非线性映射能力进行机械系统的结构优化设计和多目标优化设计。利用BP 神经网络模型还可以进行机械产品的多目标优化设计。利用BP神经网络的非线性映射能力,在进行优化设计时,可以避开确定各个目标函数的权重,较为有效地进行多目标优化设计。其方法是:首先根据产品的具体情况构造一个 BP 神经网络,以各个设计变量作为这个神经网络的输入向量,以各个分目标函数作为这个神经网络的输出向量,利用已有的经验数据训练该网络,确定网络各个联接的联接权重,即确定设计变量空间到目标函数空间的映射关系,然后在进行系列产品设计时,根据业已确定的设计变量空间到目标函数空间的映射关系,确定各个设计变量的取值,从而达到新产品的综合性能最优,达到多目标优化设计的目的。
2) 反馈神经网络
1982 年,美国加州理工学院生物物理学家 J.Hopfield,提出了模拟人脑联想记忆功能的神经网络模型- 反馈神经网络。该神经网络模型是由一些相互双向连接的神经元组成,每个联接有一个权值。网络中每个神经元的输出均反馈到同一层次其它神经元的输入上。由这种拓扑结构构成的网络在没有外部输入的情况下,网络自身状态的演化使得网络收敛到一个稳定态;在该稳定状态下,两神经元之间的联接权值相等,网络趋于平衡,Hopfield 等人将能量函数引入到该网络结构中,并以此来判定该方法的稳定性。将 Hopfield 神经网络模型应用到机械优化设计中,其关键是在机械优化设计问题与Hopfield 神经网络模型之间建立一种对应关系,用人工神经网络有效地表示优化设计中的设计变量、约束条件和目标函数,将该种神经网络的动态演化过程与机械优化设计的在解空间寻优过程对应起来。
2.3 故障诊断
机械故障诊断在产品维修保养方面有广阔的应用前景,受到广泛重视。故障状态信息和故障原因之间是一种非线性映射关系。而神经网络对处理非线性复杂问题有独特的优越性。首先,从传感器获得的信息是工况信息的集合,神经网络可以从中提取出故障征兆信息,相当于滤波;然后利用联想能力和自适应能力对故障征兆进行分析,从而判断是否有故障或者故障类型;最后将处理结果作为输出。
2.4 工况检测与控制
机械加工制造过程中的参数如温度、应力、振动、惯性力等具有复杂性和随机性。传统的精确数学模型应用受到一定限制。而神经网络为复杂的非线性映射问题提供了解决办法。神经网络经过前期培训和学习,对输入的非线性复杂信号进行分析,识别出工艺系统的状态,并根据经验给出控制策略,实现在线控制,主动控制。
2.5 智能控制与机器人工程
对于可抽象精确数学模型的问题,传统的控制方法已非常有效,但对于复杂的控制系统,如机器人控制系统,很难建立精确数学模型。其接受的信号为非确定的非线性信号。利用神经系统的自适应性,充分逼近已有数学模型,利用自身组织能力迅速作出反馈,其联想能力和容错能力大大提供了系统处理不确定信号的能力。因此,可作为机器人的自适应控制器。此外,神经网络在可靠性设计、自动设计、专家系统、几何建模等方面也得到较广泛的应用。
3 结语
随着人工神经网络相关理论的研究,更多优化网络模型的建立,以及计算机技术的发展,神经网络在机械方面会得到更加充分的利用。从而为机械产品在设计、制造、评估、使用和维护等阶段提供巨大便利,推动机械制造业向前飞速发展。
参考文献
[1]徐秉铮.神经网络理论与应用.广州:华南理工大学出版社.
[2]黄洪钟,黄文培,王金诺.神经挽留过技术在机械工程中的应用与展望.机械科学与技术,1995.4
篇10
【关键词】人工神经网络;故障诊断;模式识别;Matlab软件
一、人工神经网络综述
BP神经网络是目前应用最为广泛和成功的神经网络之一,它是由一个输入层,一个或多个隐层以及一个输出层组成,上下层之间实现全连接,而每层神经元之间没有连接。网络的学习过程包括信号正向传播和误差反向传播。在正向传播进程中,输入信息从输入层经隐层加权处理传向输出层,经功能函数运算后得到的输出值与期望值进行比较,若有误差,则误差反向传播,沿原先的连接通道返回,通过逐层修改各层的权重系数,减小误差。随着这种误差逆向传播修正的不断进行,网络对输入模式响应的正确率也不断上升。
二、人工神经网络的识别、诊断过程
滚动轴承在设备中是比较典型的,本文以滚动轴承的故障识别、诊断为例。进行模式识别的大体步骤为:首先对经过零均值化后的振动信号数据进行时域、频域分析,将筛选后的有效时域、频域特征值作为人工神经网络输入层的输入,经Matlab软件进行神经网络的训练,最后可得出一个可以识别轴承工作状态的神经网络,进而可以对滚动轴承进行模式识别。可见采用振动信号检测法对机器设备进行故障诊断的过程包含信号采集、特征提取、状态识别、故障分析和决策干预等五个基本环节,在滚动轴承故障诊断中,振动信号的采集是关键,保证信号采集的准确性、合理性和实时性是正确实现故障诊断的前提。(1)信号采集。每台机器设备都有自身的固有频率,若设备发生故障,其频率变化,其振动信号也会发生变化。因此,振动信号可以作为故障诊断的一个重要标准。在信号采集中主要用到加速度传感器、电荷放大器、带滤波的A/D转换器。先通过压电式加速度传感器对振动信号进行拾取,然后经过电荷放大器及通过带滤波的A/D转换电路得到微机可以识别的数字信号,从而实现振动信号的采集。(2)特征值提取。为了便于观察,要把采样点的值分布在0附近,故先对采集的采样点值进行零均值化。用matlab对零均值化后的的采样点进行时域、频域分析。时域分析是计算振动信号的在时域范围内的特征参数,包括:平均值、方差、均方根、峰值峰值因子、峭度系数等参数。频域分析是对零均值化后数据进行傅里叶变换,绘制频谱图,对不同样本故障轴承和正常轴承的频谱图进行对比,找出幅值差别比较明显的几组,作为频域分析的特征值。由于各个特征值的幅值大小不一致,不便于比较同一特征值在不同样本之间的差异,所以对所有有效特征值进行归一化,归一化后的结果可以作为神经网络的输入值。(3)模式识别和故障分析。在状态检测过程中,样本数据来源于实验数据分析后提取的有效特征值,这些有效的特征值作为神经网络的输入。神经网络的输出为轴承状态,分为正常轴承和故障轴承(也可以把故障具体分,比如内圈、外圈、滚动体故障等),可以用(0 1)表示正常轴承,(1 1)表示故障轴承,因此网络中设计2个输出神经元表示这2个状态。对轴承的不同状态进行识别,建立神经网络对它进行训练,可以用公式(其中是输入层神经元数,是隐层神经元数)大体的计算出隐层神经元层数。我们设计一个隐层可以随意改变的BP神经网络,通过误差对比确定隐层数目。设定神经网络的隐含层神经元的传递函数为tansig,输出层神经元的传递函数为logsig,目标误差为0.001,最大训练步数为1000。由以上设计写出网络训练代码,经Matlab运行,找出网络误差最小所对应层数,该层数作为神经网络的隐层。
确定神经网络的隐层后便可确定神经网络的最终结构,下一步就要对网络进行训练,使人工神经网络所产生的网络误差小于目标误差,对神经网络训练好以后,接下来就是对轴承的测试,神经网络测试代码为:y=sim(net,测试数据)。把正常轴承和故障轴承的测试数据导入Matlab程序中,结果整理后可得(以实验室中的一组实验数据为例):
用均值表示结果为:
把预先设定好的状态值和测试后的结果进行比较,很清楚的可以辨别出正常轴承和故障轴承。可见,对机器设备或者系统的故障诊断实质是一个模式识别过程。利用神经网络的模式识别能力,直接识别系统的当前模式,实现正常模式和故障模式之间、以及不同故障模式或不同故障程度之间的区分。
参 考 文 献
- 上一篇:手术室护理中的隐患与预防
- 下一篇:低成本融资方式