神经网络语义分割范文

时间:2024-03-29 11:12:57

导语:如何才能写好一篇神经网络语义分割,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

神经网络语义分割

篇1

关键词: 图像检索; 特征提取; 神经网络; 机器学习; 相关反馈

中图分类号: TN711?34; TM417 文献标识码: A 文章编号: 1004?373X(2016)21?0078?05

Design and development of image retrieval platform based on artificial neural network

ZHANG Weihua, GAO Ang

(Department of Information Engineering, Zhengzhou Chenggong University of Finance and Economics, Gongyi 451200, China)

Abstract: Since the difference exists between the high?level abstract semantics and underlying feature of the user?description image, the retrieval system based on the image content feature can′t accurately accomplish the user′s retriecal task. To solve the above problem, an image matching calculation method based on neural network is proposed. The correct mapping from image low?level feature to image classification is formed by means of sample automatic learning and user feedback learning. The neural network after learning can classify and retrieve the image automatically. This method is combined with the image low?layer feature description and user high?level semantics feedback to effectively recover the semantic gap. The whole process of neural network learning and image retrieval was realized by integrating the Web front end, image extraction module, neural network module and database module.

Keywords: image retrieval; feature extraction; neural network; machine learning; relevance feedback

在利用神经网络进行图像检索的过程中,图像的大小、精度及细节越来越丰富,信息含量相应的也越来愈多,当使用大量的信息进行神经网络的构建和训练时,所需的时间和成本都大大增加,并且神经网络的检索效率也会降低,这就使得其满足不了用户准确搜索图像的需求[1]。同时,随着神经网络技术的发展,可以利用各种改进技术提高神经网络的学习效率和预测准确率,使得利用神经网络来模拟人脑对图像的分类和检索可以得到更好的效果。

1 图像特征的提取

系统使用图像分割方法对图像的形状特征进行描述,提取图像中各个部分的形状特征。

1.1 形状特征的提取

使用K?均值聚类分割算法进行图像的分割。将图像分割后,由于每个簇中的像素在视觉特征上具有很强的相似性,因此对每一区域的特征进行简单的描述,提取相应的图像特征然后保存结果,并将其作为图像检索系统的区域特征库。系统针对不同的图像特征选取不同的方法进行描述:

(1) 区域颜色特征,提取该区域中像素点在Lab颜色空间中的均值来描述。

(2) 区域位置特征,提取该区域中像素点在二维空间中的坐标的平均值来描述。

(3) 区域纹理特征,提取该区域中像素的平均对比度及平均各向异性来描述。

(4) 区域形状特征,提取该区域的封闭轮廓,并将其分解为可由若干椭圆重构的由椭圆参数组成的序列,然后通过傅里叶描述符来描述该封闭曲线[2]。

1.2 颜色特征的提取

由于颜色直方图的限制,选择颜色相关图进行图像颜色的提取。图像的颜色相关图就是由所有颜色对进行索引的表,在表中[(i, j)]的第[m]个条目表示找到与颜色为[i]的一个像素点距离为[m]的颜色为[j]的一个像素点的几率。在计算颜色相关图时需采用一些并行计算,这样可以提高计算效率。

1.3 纹理特征的提取

通过对比基于Tamura纹理特征算法的检索程序、基于灰度?梯度共生矩阵算法的检索程序和基于Gabor小波变换算法,基于Tamura纹理特征提取算法的检索程序的查询准确率要比后两者都高,且其查询使用的时间也要少很多,因此系统选择采用Tamura纹理特征提取算法。

2 BP神经网络模型的搭建

2.1 BP神经网络特点

选择BP神经网络作为图像的神经网络分类器,其将[n]维图像底层视觉特征映射为图像的分类。通过实验对BP神经网络进行一些改进和优化,使其能有效地完成图像检索的任务。典型样本集的选择、学习复杂性、网络结构的选择、输入特征向量的选择、预测能力的极限都是需要在搭建BP神经网络时需要考虑的问题[3]。

2.2 BP神经网络的原理及拓扑结构

基于BP神经网络相关原理的学习与分析,确定了系统中BP神经网络的结构和构建过程:首先定义输入层、隐含层和输出层的神经元数目分别为[n,l]和[m,]则[(x1,x2,…,xn)]为网络的输入矢量,[(h1,h2,…,hl)]为隐含层神经元的输出矢量,[(y1,y2,…,ym)]为网络的实际输出矢量,同时定义[(d1,d2,…,dm)]为训练样本所对应的预期输出矢量。然后定义输出层神经元[i]与隐含层神经元[j]的连接权值为[Vij,]隐含层神经元[j]与输出层神经元[k]的连接权值为[Wjk,]隐含层神经元[j]的阈值为[b,]输出层神经元[k]的阈值为[c。]由于传递函数需要表示具有线性特性的输入信号与输出信号的联系,又根据BP神经网络要求传递函数必须连续可导,因此其一般使用在(0,1)之间连续并可导的Sigmoid函数作为传递函数,该函数公式为:

[f(x)=11-e-x] (1)

实际输出矢量与预期输出矢量的误差计算公式为:

[E=12j=1m(dk-yk)2] (2)

隐含层神经元输出矢量的计算公式为:

[hj=fj=1N-1Vijxi+?j] (3)

输出层神经元输出矢量的计算公式为:

[yk=fj=0L-1Wjkhj+θk] (4)

BP神经网络通过反向传播算法调整权值,其权值修正公式为:

[Wij(n+1)=Wij(n)+ηδjx′i] (5)

在式(5)中,[Wij(n)]表示第[n]次学习后的神经元[i]与神经元[j]之间的连接权值,信号输出的神经元为[i,]信号输入的神经元为[j,][Xi]为神经元[i]的实际输出,[η]为网络的学习速率,[δj]为神经元[j]的学习误差。

系统中BP神经网络的构建流程如下:

(1) 初始化网络的连接权值和阈值,其值为均匀分布的随机数。

(2) 对网络使用一组样例数据进行训练。

(3) 网络搭建完成,将输入矢量输入网络可仿真输出符合预期的输出矢量[4]。

2.3 BP神经网络的学习过程

通过对相关反馈算法的学习,提出了一种基于BP神经网络进行学习的图像检索方法,它包含两种学习过程:

(1) 自动样例学习,首先通过包含高层语义标注的样例图像的学习构建图像高层语义的分类器,其中对于图像的每种语义分别构造一个分类器,输入样例图像后使系统提取图像的底层特征作为神经网络的输入,然后经过一定时间的学习可以得到网络的解,使分类器能够初步完成分类任务;

(2) 用户交互学习,首先通过用户的指导,将初步检索结果进行分类,然后系统将用户的反馈整理为学习样本,同样使用自动样例学习过程进行学习,最后得出网络最新的解,使分类器能更精确地完成分类任务。系统中BP神经网络的学习流程如图1所示。

2.4 BP算法的改进

使用附加动量法可以使网络在修正连接权值时,不只考虑误差在其梯度上的变化趋势,还考虑误差在其曲面上的变化趋势。在没有附加动量的情况中,网络在训练过程中有可能陷入局部极小状态,通过使用附加动量则可以在一定程度上绕过这些极小值,避免进入极小状态[5]。附加动量法在反向传播过程中,在每一个神经元的连接权值及阈值的当次训练的变化量上附加一个正比于上次训练后的连接权值及阈值的变化量的项,根据新的变化量计算出新的连接权值及阈值。添加了附加动量因子的连接权值和阈值的变化量计算公式分别为:

[Δwij(k+1)=(1-mc)ηδjpj+mcΔwij(k)] (6)

[Δbj(k+1)=(1-mc)ηδj+mcΔbij(k)] (7)

式中:[k]表示第[k]次训练;[mc]表示动量因子,[mc]的取值一般在0.95附近。

在结合附加动量法的网络训练过程中,需要根据不同条件判断何时使用动量因子来修正权值,其判断条件为:

[mc=0,E(k)>E(k-1)×1.040.95,E(k)

式中[E(k)]为第[k]步的误差平方和。

自适应学习速率的调整公式为:

[η(k+1)=1.05η(k),E(k+1)E(k)×1.04η(k),etc] (9)

式中[E(k)]为第[k]步的误差平方和。

动量法可以帮助BP算法正确找到全局最优解,自适应学习速率法可以帮助BP算法缩短训练时间,通过这两种方法的使用,可以有效地提高神经网络的学习效果。

2.5 实验结果分析

实验目的为确定系统中BP神经网络分类器的隐含层神经元数目。首先根据研究获得的图像特征向量的元素个数构建神经网络分类器的学习样例,此处每个样例的输入向量的元素个数为165个,因此构建16组含有165个元素的输入向量,4个一组划分为一种类别,最终形成含有4种类别的16组训练样本,以此方法再生成该4种类别的4组测试样本。然后根据经验公式获得合适隐含层神经元数目的取值范围,此处为9~17个。最后将训练样本及测试样本先后输入隐含层神经元数目不同的网络中进行训练和测试,记录数据。

表1记录了隐含层神经元数目及对应的训练误差和测试误差的数据,由其数据可以看出,随着隐含层神经元数目的增加训练误差总体上逐渐减小,当个数超过15后训练误差出现一定程度的波动,出现小幅的增加,虽然不影响网络的学习效果,但是过多的神经元个数会增加学习时间,而此时测试误差还是处于降低的趋势。综合分析实验结果,本系统确定采用较合适的15个隐含层神经元。

3 检索系统的设计与实现

3.1 系统结构分析

3.1.1 系统结构

系统的结构如图2所示,图中除了与用户交互的Web前端,其余的图像特征提取模块、神经网络模块及数据库都在服务器端,这种浏览器?服务器结构平台搭建后,用户可以通过不同客户端的Web浏览器进行图像检索的功能,而不必安装本地应用程序,同时将主要的核心功能集中到服务器上,不仅大大简化了系统的开发和维护流程,降低了成本,还增强了系统的扩展性。

3.1.2 系统流程

系统针对不同的功能需求设计了相应的不同流程,这些流程包括系统样例学习流程、用户反馈学习流程、用户查询流程。

如图3所示,在系统的样例学习过程中,系统接收到样例数据后会先对数据进行分析,然后交给神经网络进行学习,最终生成对应类别的分类器,这些分类器会在用户检索时对数据库中的图像进行分类,查找到符合用户需求的图像[6]。样例学习的流程是本系统学习分类知识的关键步骤,在该步骤中用户并不参与系统的学习过程,整个学习过程均为系统自动进行,因此需提供大量被正确标注的清晰图像样例,通过对这些优质样例的学习,系统会自动生成针对图像各种分类所对应的分类器,且经过长时间的学习,这些分类器的准确率会不断上升,最终使查询结果更符合用户需求。

如图4所示,在系统的用户查询流程中,用户的查询条件为图像特征的语义描述,系统最终返回为包含该描述特征的图像集,这个过程利用神经网络分类器学习的高层描述语义与低层图像特征之间的映射,因此随着神经网络学习时间的增大,这种映射也就越精确,系统完成的查询也就越符合用户要求。

3.1.3 图像特征提取模块

如图5所示,当图像输入到图像特征提取模块中时,图像会进行K?均值聚类分割算法处理、颜色相关图算法处理及Tamura纹理特征算法处理,这三个处理过程并行进行。

经过K?均值聚类分割算法处理,图像被分割为若干块区域,每个区域中的像素都具有相似的属性,对于每个区域,会提取其简单的区域特征,如颜色特征、位置特征、纹理特征及形状特征等;经过颜色相关图算法处理,生成当前图像的颜色自相关图;经过Tamura纹理特征算法处理,计算出图像的粗糙度、对比度、方向度、线性度等数值。将经过三个算法处理后得到的数值整理后得到图像的特征向量[7]。

3.1.4 神经网络模块

系统中的图像神经网络分类器由三层组成,分别为输入层、隐含层及输出层,其中输入层的神经元个数与归一化后的图像特征向量的个数相同,为固定值;隐含层的神经元个数通过前文中的实验得出,适合于本系统中神经网络的要求;输出层只有一个神经元进行分类,设定1为属于该分类的学习期望,设定0为不属于该分类的学习期望,但是实际运行时需要设定1为0.9,0为0.1,这是因为Sigmoid函数无法经过有限的连接权值计算得到1与0的值[8]。

3.1.5 Web 平台模块

系统的Web界面包括用户查询输入框、用户图像上传框、查询结果浏览框等。

3.2 实验结果分析

为了检验图像检索平台的性能,首先将系统设置为学习模式,然后从图像库中选取1 000幅已进行人工标注的样例集输入系统,最后当系统发出已训练完毕信号后,对系统已学习的分类当作查询输入系统进行检索,记录系统检索结果。

检索结果可知经过人工指导学习,系统可以仿真模拟更符合人类视觉感知的分类方式,并将其记忆于相应的神经网络分类器中,经过不断的学习,系统可以返回更准确的符合用户需求的检索结果。

4 结 论

本文主要研究包括基于内容的图像检索技术及人工神经网络技术两个方面。首先使用K?均值聚类分割算法、颜色相关图算法及Tamura纹理特征提取算法提取图像相应的形状、颜色及纹理特征,通过整合形成可以完整描述图像信息的特征向量。同时,针对基于内容的图像检索系统中用户高层语义与图像底层特征之间存在的问题,通过样例自动学习和用户反馈学习两种学习方式,BP神经网络通过反向传播学习算法调节网络权值,从而形成图像底层特征到图像分类的正确映射,学习后的神经网络通过这种映射可以进行图像的自动分类及检索,该方法结合了图像的底层特征描述及用户的高层语义反馈,有效地弥补了语义鸿沟。

参考文献

[1] KHERFI M L, ZIOU D. Relevance feedback for CBIR: a new approach based on probabilistic feature weighting with positive and negative examples [J]. IEEE transactions on image processing, 2006, 15(4): 1017?1030.

[2] TRAINA A J M, MARQUES J. Fighting the semantic gap on CBIR systems through new relevance feedback techniques [C]// Proceedings of 2011 the 21th IEEE International Symposium on Computer?Based Medical Systems. [S.l.]: IEEE, 2006: 881?886.

[3] 周资云.基于内容的图像检索系统研发与应用[J].华章,2012(29):22.

[4] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报,2013,14(4):622?635.

[5] KANUNGO T, MOUNT D M, NETANYAHU N S, et al. An efficient k?means clustering algorithm: analysis and implementation [J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(7): 881?892.

[6] WILLIAMS A, YOON P. Content?based image retrieval using joint correlograms [J]. Multimedia tools and applications, 2007, 34(2): 239?248.

篇2

关键词关键词:视频监控;异常行为检测;团块提取

DOIDOI:10.11907/rjdk.171656

中图分类号:TP317.4

文献标识码:A文章编号文章编号:16727800(2017)005018903

0引言

由于人群场景分析的巨大应用价值,人群异常行为检测已经成为近几年视频监控领域的研究热点,吸引了大量研究者关注。人群异常行为检测指对人群场景中不符合规则的行为进行检测。这里不符合规则的行为即异常的定义往往带有主观性,比如可以把人群恐慌当作异常行为,也可以把在场景中打架斗殴当作异常行为,或者是在人行道上骑车等,而且视频数据量巨大,依靠人工检测不现实,必须依靠计算机技术实现人群异常的自动检测。另外,人群密度高、模式变化快、场景中存在巨大遮挡等挑战,令传统视频监控技术不能直接应用于人群场景,这使人群异常行为检测仍是一个有待解决的问题,涌现出了大量相关研究,但仍然没有被普遍接受的用于人群场景分析的问题解决方案。基于此,本文提出了基于深度学习的人群异常行为检测方法。

主要工作包括:①提出基于团块的BMHOF运动特征提取方法;②将BMHOF运动特征与HOG静态特征进行联合表达作为异常行为的检测模型输入;③应用多层递归神经网络构建异常行为检测模型。

1相关工作

异常行为检测领域包括个人异常行为检测和人群异常行为检测。其中,人群异常行为检测正在成为研究热点[1]。异常行为样式各异,很难有一个明确的定义和界限,通常认为异常行为有以下特点:①偶尔发生;②无法提前预知;③可能和某个任务有关。目前在视频监控领域的异常行为检测主要是针对人群的异常行为检测,人群异常检测可被建模为“正常―异常”二分类问题。

目前,对异常行为检测的方法主要是监督学习的方法,即预先对行为模式或异常行为的模型进行定义,然后对待识别的行为进行学习或匹配。Yang Cong等[2]提出了一种基于MHOF特征和稀疏表达的异常行为检测方法,该方法通过对异常行为特征进行字典学习,获得异常行为的表达方式,但该语义表达只能描述一些简单的异常行为,对过于复杂的或某些未知的异常行为无法检测;Si Wu等[3]提出用贝叶斯模型对人群的逃跑异常行为进行识别,取得了良好效果,但是针对单个人的行为特征表达仍不够完善;在文献[4]中,提出采用HOG特征融合的方法提高人体识别精度;A Adam等[5]利用多个监视器从视频序列中提取运动目标的光流特征并定义光流量级,然后在此基础上进行异常行为检测。

近年来,深度学习在图像识别领域表现出较高的识别准确率,成为图像识别领域的研究热点,在异常行为检测方面也具有很高的检测准确率。文献[6]提出了多尺度时间递归神经网络的人群异常检测方法,通过该方法来考虑帧与帧之间的时空关系,从而提高了检测准确率。

2异常行为检测

算法框架如图1所示,主要分为联合静态特征和基于团块的多尺度光流方向直方图特征提取(Blob Based Multi-scal HOF,BMHOF)、基于深度递归神经网络的异常行为检测模型训练和异常行为检测模型测试3部分。首先进行团块检测提取运动人群的团块,同时计算光流场,然后提取团块的纹理特征和运动特征,其中运动特征包括运动信息熵、平均速度,再应用VLAD将运动特征和静态特征进行联合特征表达,最后训练时间递归神经网络作为异常行为检测模型,完成异常检测模型构建。

2.1基于团块的BMHOF特征提取与静态特征联合表达

2.1.1Blob团块检测

基于Blob团块提取的特征更符合人类观察现实世界的方式[8]。Blob团块提取的主要过程是当检测出前景并进行二值化后,计算连通区域的轮廓,如果轮廓目标内部存在空洞则不予考虑。

但是由于目标可能存在断裂的情况,所以需要将距离比较近的目标轮廓合并。通过设定阈值,判断目标轮廓的外接矩形是否邻接,如果邻接,则在合并时取这些邻接轮廓的外接矩形。接下来计算合并后的矩形参数,包括矩形的宽高以及形心的位置。然后删除宽高过小的矩形,以进一步去除目标之外的噪声干扰。如果该目标矩形符合一定条件,则认为该团块为目标团块。

2.1.2BMHOF特征提取

Blob分析的核心是连通区域检测算法,它能够将人群中的不规则目标进行分割,降低前景噪声。本文提出采用MHOF特征作为时空运动信息的特征表达。首先对视频序列进行光流场计算和团块提取,然后对视频划分序列段,根据式(2)序列段中帧的光流场求和,得到序列段中每像素的光流和。

2.1.3静态特征提取

主要采用纹理作为静态特征,其中纹理特征主要采用Hog特征[4]。Hog特征是对图像进行分块,获得每个块的纹理直方图,在行人检测方面效果非常好,因此本文采用Hog特征、轮廓特征以及灰度共生矩阵作为联合静态特征表达。

2.1.4基于VLAD的特征编码

应用VLAD特征编码方法[7]联合动态特征和静态特征共同表达运动图像序列的特征。动态特征具有时空信息,静态特征则包含局部信息和全局信息。因此将两者进行统一联合表达能够同时利用运动图像序列的时空信息和局部信息。联合特征表达是通过将运动特征和静态特征表达为一个特征向量,以实现运动视频的特征表达。通过联合视觉特征表达,可有效利用时空信息和纹理信息。

2.2多层递归神经网络结构

首先将特征向量作为输入层,多层神经元作为隐层,训练结果分为异常和正常;然后用训练样本对多层递归神经网络进行训练,根据输出结果不断调整连接权重,获得神经网络每层的连接权重;最后测试阶段将测试运动图像序列,提取相同特征,采用与训练特征向量同样的方法得到融合特征向量,输入到已训练好的多层递归神经网络中,从而实现异常行为检测。本文选择隐层为三层的递归神经网络结构,学习率设置为0.01。

3实验

3.1数据集

实验采用3个数据集,分别是3个场景和3种异常行为。这3个数据集中有一个是公开数据集,即UCSD数据集,另外两个数据集是从网络上下载的,分别是人群异常行为数据集和稀疏人群的异常行为数据集。由于采用有监督的学习方法,因此这些视频文件需要人工标注。对于每个数据集采用5折交叉验证方法来验证模型的有效性。

3.2评估方式

对于本文提出的方法,使用受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC)对其进行评估。ROC曲线的横坐标表示本身为负类被检测为正类的比例,即假阳性率(False Positve Rate,FPR);纵坐标表示本身为正类被检测为正类的比例,即真阳性率(True Positive Rate,TPR)。

在两个数据集上作了5折交叉验证,并使用阈值平均方法[9]求取5 折交叉验证的平均ROC 曲线。该方法在给定的阈值下得到每条ROC曲线对应的点,然后对这些点求均值,得到在阈值下的平均值。变换阈值得到不同阈值下的平均值,最终得到5 折交叉验证的平均ROC曲线。同时本文采用异常检测结果ROC曲线下的面积(Area Under Curve,AUC)作为算法的整体评价指标。

3.3实验结果

分别在Scufflec数据集、Ped1数据集、Ped2数据集和crowdNormal数据集上,采用blobHogMHOF特征和MHOF特征在多层递归神经网络下绘制ROC曲线(见图5~图8)。从图5的ROC曲线中可以发现,采用blobHogMHOF特征的分类性能明显好于采用MHOF特征。从图6中可以得出,在Ped1数据集上基于blobHogMHOF方法的性能优于仅使用MHOF特征的方法。主要原因是在Ped1数据集中是人群散步,同时增加Hog特征能更好地表达人体特征,从而提高了人群异常行为的检测精度。

方法,针对基于MHOF特征方法的不足提出了基于Blob块和HOG特征的MHOF特征表达,即HOG-BMHOF特征表达方法,并提出基于HOG-BMHOF的人群异常检测的算法框架。实验结果表明,本文提出的方法针对稀疏人群或密集人群的异常行为,特别是在打架等异常行为方面具有较好的识别率。但是改进方法的不足之处主要是不具有实时性,其次是场景迁移后检测效果不够理想。今后的研究方向是在提高检测实时性的同时能够实现场景迁移的异常行为检测。

参考文献参考文献:

[1]TENG LI,HUAN CHANG,MENG WANG,et al.Crowded scene analysis: a survey[J].IEEE Trans.on Circuits and Systems for Video Technology,2014,25(3):367386.

[2]YANG CONG,JUNSONGYUAN,JILIU.Abnormal event detection in crowded scenes using sparse representation[J].Pattern Recognition,2013(46):18511864.

[3]SI WU,HAUSAN WONG,ZHIWEN YU.A bayesian model for crowd escape behavior detection[J].IEEE Transactions on Circuits and Systems for Video Technology,2014,24(1):8598.

[4]GUO JINXIN,CHEN WE.Face recognition based on hog multifeature fusion and random forest[J]Computer Science,2013,40(10): 279282.

[5]A ADAM,E RIVLIN.Robust realtime unusual event detection using multiple fixedlocation monitors[J].Pattern Analysis and Machine Intelligence,2008,30(3): 555560.

[6]CAI RUICHU,XIE WEIHAO,HAO ZHIFENG,et al.Abnormal crowd detection based on multiscale recurrent neural network[J].Journal of Software,2015,26(11): 28842896.

[7]HERVE JEGOU,MATTHIJS DOUZE,CORDELIA SCHMID,et al.Aggregating local descriptors into a compact image representation[C].2013 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2010:33043311.

篇3

>> 基于粗糙集理论的图像分割 基于相容粗糙集的图形图像信息预检索 一种基于粗糙集理论的图像分割方法 一种基于粗糙集理论的神经网络图像分割方法 粗糙集理论在数字图像水印中的应用 基于粗糙集理论的Prim算法的推广 基于粗糙集理论的智能销售系统设计 基于粗糙集理论的属性约简算法 基于粗糙集理论的并行约简算法 基于粗糙集理论的属性约简新算法 粗糙集理论在客户分类中的应用 基于粗糙集理论的遗传挖掘在教学质量评估中的应用 基于粗糙集的层次分析及其应用 基于粗糙集和属性直方图的医学图像增强* 基于粗糙集的火灾图像特征选择与识别 基于粗糙集与模糊集理论的图书馆最优购书算法 基于粗糙集理论的城市轨道交通项目效益指标权重分析与应用 粗糙集与模糊集理论的概述 粗糙集理论及应用研究综述 粗糙集理论在肝病辅助诊断中应用 常见问题解答 当前所在位置:l,一个专业的Web图像网站。当输入查询图像,检索出对象相似度Object Similarity Ratio的值接近于1的图像,并跟具对象相似度值对图像集中的图像按照降序排序,根据用户选择的数量返回检索图像,实验中返回的检索图像为4。选取了2幅图像分别作为输入,得到的检索结果如图2所示。

图2 两次检索的查询图像和检索图像。中间一行为查询图像1的检索结果,第三行为查询图像2的检索结果。

通常用查准率(Pr)和查全率(Re)[5]评价检索算法的效率。设Nr为检索出的相关图像,K为检索出的总的图像数量,Nt为图像数据集中所有相关图像。则Rr=Nr/K,Re=Nr/Nt。表1显示了两次查询的查准率和查全率以及它们的平均值。

表1 两次检索的结果

5 总结

传统的图像检索主要依赖于颜色、纹理和形状特征,由于这些可视特征仅是图像信息的一部分,不能很好的表达人们对图像语义层次的理解,因此检索结果并不是十分的完美。

应用粗糙集理论虽然实现了基于图像对象的检索,但是它仅局限于具有单个中心对象的灰度图像,应用范围有限。因此,今后的研究可以扩展到具有多个对象的彩色图像的检索,使其具有更加广阔的应用空间。

参考文献:

[1] Eakins J, Graham M, Content-based image retrieval, Technical Report, University of Northumbria at Newcastle, 1999.

[2] Ying Liu, Zhang Deng-sheng. A survey of content-based image retrieval with high-level semantics. Pattern Recognition Society,2006.

[3] Paw lak Z Rough sets[J].International Journal of Computer and Information Sciences,1982(11):341-356.

篇4

关键词:FCM聚类算法 MFCM FPCM 医学图像处理 图像分割

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2012)09-0116-03

图像分割问题可以看成是一个待分割图像根据性质不同分割成若干精确细分。早期相关文献提出了许多图像分割算法,其中包括直方图技术、区域分割技术、结合区域与边缘的分割技术等[1]。近些年来,图像分割技术已经在医学图像领域广泛应用于诊断疾病方面。

图像分割技术在机器视觉、目标跟踪、医学影像[2]中起到重要作用。在医学诊断领域中已经广泛应用在X光放射图片、CT(Computed Tomography)扫描图像和MRI(Magnetic Resonance Imaging)核磁共振图像的分割过程中[3][4]。近些年来,CT扫描在胸部疾病诊断影像检查中是最为有效的方法,例如肺癌、肺结核、肺炎、肺气肿等肺部疾病诊断。随着医学图像尺寸大小和对机器速度需求上升,因此有必要使用计算机辅助诊断系统进行医学图像处理。虽然模糊C均值(Fuzzy C-Means Clustering,FCM)算法应用领域有利于进行自由图像中噪声分割,却不能分割通信噪声、极端值和其他人为差值。

本文将提出一种利用改进模糊C均值(MFCM)算法与模糊可能性C均值(Fuzzy Possibilistic C-Means Clustering,FPCM)算法的图像分割新方法。在近期的研究成果中,文献[5]和文献[6]提出了新方法来完善FCM算法,该方法是FCM算法的一种广义扩展。本文的MFCM算法是通过调整FCM算法的测量距离来批准标签像素受到其他图像像素和在切分中抑制噪声效果来进行约束,从而使得成员变量没有最大约束。基于真实医学图像的实验结果表明MFCM算法在医学图像中进行分割的实际效果,实验部分通过对FCM、MFCM、FPCM进行精度对比来证明。

本文以下部分组织:第1部分概述了在医学图像分割领域中的有关研究;第2部分描述了FCM算法,然后对本文提出的改进FCM和FPCM算法进行说明;第3部分论述基于真实医学图像的实验结果;第4部分总结本文结果。

1、相关研究工作

Kenji Suzuki[7]给出了使用大规模训练神经网络(Massive Training Artificial Neural Networks,MTANN)的图像处理方法。为了训练MTANN网络,文献[7]应用线性输出的反向传播(Back-Propagation,BP)算法,生成线性输出的多层神经网络模型。

Kazunori Okada[8]提出一种鲁棒性统计估计和验证体系框架,其中归纳在多层X射线和CT扫描图像中肺部几何结构。Ingrid Sluimer[9]提出分段注册方案,此方案中正常的肺部扫描将注册含有病理特征的扫描。Ghosh[10]提出了遗传算法应用于医学图像分割。文献[10]比较遗传分割工具GENIE和纹理提取算法的算法结果。M.Antonelli[11]描述了新的测试肺部结构的方法。Wang[12]提出一种鲁棒医学图像分割算法。自动化图像分割是从像素提取语义的重要中间过程。利用FCM算法对于图像分割来说有效,但是对于FCM算法,在属性特征空间上基于聚类的任务是独有的像素分布,不考虑其空间分布的图像像素。

2、各种FCM算法

2.1 模糊C均值算法(FCM)

FCM算法目标是确定聚类中心和生成类成员矩阵。根据从相似数据点到一个子类,该子类赋予类成员到相似数据点。此矩阵是矩阵:其中为组数,是样品数,为训练集,且是整数。矩阵表示模糊分割区,作为一个聚类的成员,通过预测,能够用于描述的聚类结构。通过利用公式(1)最小化变形测量,对相关矢量进行评价。

2.2 改进模糊C均值算法(MFCM)

FCM算法的主要弱点是目标函数不考虑空间依赖性。因此,FCM算法处理图像时就像在处理独立像素点。为了减小噪声在图像分割中的影响,本文使用新标准来代替标准距离度量来将本地背景空间和非本地信息通过FCM算法进行融合。非本地信息计算意味算法试图利用图像的高冗余度,成员价值决定图像分割结果。因此,距离测量对成员价值进行预测,该方法修改距离测量参数会受到本地信息和非本地信息的影响。

距离测量会受本地信息影响,距离测量会受非本地信息影响,为控制平衡之间的加权因子。

距离测量受本地测量影响,由公式(3)计算。

其中,为欧氏测量距离,为的每个图像像素的权值。

距离测量受非本地信息影响,作为所给图像中所有像素加权的平均值,由公式(4)进行计算得到。

2.3 模糊可能性C均值聚类算法(FPCM)

本文在PCM算法基础上提出FPCM算法,它包括可能性和隶属度,FPCM模型可被视作公式(5)所示。

为隶属矩阵,为可能性矩阵,为合成聚类中心,和是聚类个数和数据点数量。的必要条件是对于所有的i、k、m,且和中至少含有截然不同的数据点,若有时,则:

当且仅当上式成立时,才可以最小化。

上述公式表明成员是受所有聚类中心的影响。可能性只会受到第的聚类中心的影响。可能性将分配给所有个数据点,但不是针对所有聚类,所以隶属称为相对典型性。相对于其他聚类,它测量属于一个聚类的点,并用于标记标签数据点。可能性视作绝对典型性,对于所有其它数据点,它测量属于一个聚类的点,可降低检定效果,结合隶属和可能性可得到更好的聚类结果。

3、图像分割方法应用

本文使用MATLAB和真实医学图像来探索分割精度的方法实现本文提出的改进FCM算法与模糊可能性C均值聚类算法。三种不同类型的FCM算法已在实验中进行比较,分别是FCM、改进FCM、模糊可能性C均值聚类算法。

本实验应用真实医学图像集合进行,在该数据集上进行图像分割用来预测各种算法的准确性。针对结果进行对比算法精度。FCM、MFCM、FPCM的分割结果被认为是探讨将分割结果应用到真实医学图像中的最佳途径。用于确定算法准确度的三个参数是相似性、主动失误率和被动失误率。从实验结果可以得出,在真正医学图像分割方面,比起其他算法本文算法表现良好。对于全部三个图像分割算法而言,上述三个主要属性即相似性、主动失误率、被动失误率如表1,图1显示了FCM和FPCM的分割结果。

FPCM算法获得的实验结果显示该方法相对其他FCM衍生方法具有较好的图像分割性能。另外,本文提出的FPCM算法同时消除了噪声干扰的影响,同时增加了所提出的图像分割技术的图像分割精度。

4、结语

FCM算法是应用广泛的聚类方法,已应用于医学图像分割。FCM算法时常受到图像中的噪声影响。尽管已有多种基于FCM的改进算法,但没有任何改进算法是完美解决噪声问题的。本文以FCM算法和PCM算法进行改进,从而提出MFCM算法和FPCM算法。本文提出的MFCM算法既与本地及非本地信息合并来控制相互之间进行调节。MFCM算法通过调整FCM算法的距离测量来实现,批准一个像素标签受到其他像素点在切分抑制噪声的影响。FPCM算法针对隶属度和可能性进行聚类,并包括隶属度函数。实验结果表明,FPCM算法比其他FCM衍生算法表现更好,分割效果也更佳。

参考文献

[1]K. Haris,“Hybrid Image Segmentation using Watersheds and Fast Region Merging”, IEEE Transactions on Image Processing, vol. 7, no. 12, pp. 1684-1699, 1998.

[2]W. M. Wells, W. E. LGrimson, R. Kikinis and S. R. Arrdrige, “Adaptive segmentation of MRI data,” IEEE Transactions on Medical Imaging, vol. 15, pp. 429-442, 1996.

[3]D. L. Pham, C. Y. Xu, and J. L. Prince, “A survey of current methods in medical image segmentation,” Annual Review on Biomedical Engineering, vol. 2, pp. 315-37, 2000.

[4]Liew AW-C, and H. Yan, “Current methods in the automatic tissue segmentation of 3D magnetic resonance brain images”, Current Medical Imaging Reviews, vol. 2, no. 1, pp.91-103, 2006.

[5]R. J. Hathaway, and J. C. Bezdek, “Generalized fuzzy c-means clustering strategies using Lp norm distance”, IEEE Transactions on Fuzzy Systems, vol. 8, pp. 567-572, 2000.

[6]S. C. Chen, D. Q. Zhang, “Robust image segmentation using FCM with spatial constraints based on new kernel-induced distance measure”, IEEE Transactions Systems Man Cybernet, vol. 34, no. 4, pp. 1907-1916, 2004.

[7]Kenji Suzuki, Hiroyuki Abe, Heber MacMahon, and Kunio Doi, “Image-Processing Technique for Suppressing Ribs in Chest Radiographs by Means of Massive Training Artificial Neural Network (MTANN)”, IEEE Transactions on medical imaging, vol. 25, no. 4, pp. 406-416, 2006.

[8]Kazunori Okada, Dorin Comaniciu, and Arun Krishnan, “Robust Anisotropic Gaussian Fitting for Volumetric Characterization of Pulmonary Nodules in Multi-slice CT”, IEEE Transactions on Medical Imaging, vol. 24, no. 3, pp. 409-423, 2005.

[9]Ingrid Sluimer, Mathias Prokop, and Bram van Ginneken, “Toward Automated Segmentation of the Pathological Lung in CT”, IEEE Transactions on Medical Imaging, vol. 24, no.8, pp. 1025-1038, 2005.

[10]Payel Ghosh, and Melanie Mitchell, “Segmentation of medical images using a genetic algorithm”, Proceedings of the 8th annual conference on Genetic and evolutionary computation, pp. 1171-1178, 2006.

篇5

关键词:web2.0,无尺度现象;复杂网络;教育信息资源建设

        巨人的身高之大,已不能用普通人高度的尺度来度量,于是想出了“无尺度”的用词,形容少数节点连接数大大超出普通节点的现象。统计物理学家也习惯于把这种服从幂律分布的现象称为无尺度现象。而这种大多数节点仅有少量连接,而少数节点拥有大量连接,呈现出无尺度的特性的网络称为无尺度网络;那些具有大量连接的节点称为“集散节点”,所拥有的连接可能高达数百、数千甚至数百万[1]。

        无尺度现象不仅仅出现在万维网中,在神经网络、细胞网络甚至人际网络中均有体现。可以说,凡有生命的地方,有进化、有竞争的地方都有不同程度的体现。社会学家所说的“马太效应”同无尺度现象也有某种相通之处。

        2  无尺度现象成因分析

        关于无尺度现象的成因,Barabasi等人解释,优先连接性和网络的成长性是它的两个起因。所谓网络的成长性是指,万维网的页面数量绝对不是恒定的,而是规模在不断扩大的,具有不断成长的本性;优先连接性指新网民在选择将网页连结到何处时,虽然可以从数十亿个网站中进行选择,但大部分人只熟悉整个万维网的一小部分,并且总是优先选择前人经常访问的网站,因为这样的站点更容易为人所知。随着时间的演进,将导致某些热门的网站愈加热门,不知名的网站愈加冷门。计算机仿真可以演示验证,万维网如何由相对均衡分布的随机网络逐渐演化为极不均衡分布的无尺度网络。

        然而这毕竟是相对比较简单的解释,而从哲学的角度来看,其主要原因还在于:存在决定意识。某人选择连接某一网站,虽然是一种个人意识,但生活在相同或者相似客观境遇中的人群,往往会形成相同或相似的个人意识,只是平日我们接触的范围狭小,更多关注的是人与人之间差异的一面,而大量的数据统计却把深藏于个性中的共性强烈地反应出来了。充分的自由民主,在一定条件下,有可能转化为高度的集中统一,是“对立统一”的例证,一点也不值得奇怪。

        3  无尺度现象对教育信息资源建设的启示

        目前随着我国信息化教育逐渐普及,数字化网络教育资源以其独有的优势被应用到教育教学中。然而在网络教育资源建设的热潮中,一些问题逐渐凸显出来,比如一方面是互联网中每天更新的教育信息资源以幂的速度增长,而另一方面,使用者却苦于找不到真正适合于自己的教育资源;于是,各教育机构鼓励开发适合自己的教育资源,比如开发各级各类精品课程,打造属于自己的教育品牌,却又造成了相同教育资源的重复建设,设耗费大量人力物力。然而更加严重的是,当耗费大量人力物力开发出来的精品课程传到互联网上准备供更多的人学习、共享时,却因为各种原因经不起时间的考验,在经历了短暂的门庭若市以后逐渐被人遗忘,成为茫茫网络中的沧海一粟。面对网络教育资源建设中如此多的尴尬,我们不得不进行进一步的思考。

 近年来逐渐引起国内科学界注意的无尺度现象理论可以为我们提供有用的启示:一方面,无尺度现象让我们认识到:信息社会同时兼有“大世界”与“小世界”两种属性。另一方面,无尺度网络中由数百或数千资源构成的热门群体,承载了大部分的网络连接,成为网络中的集散节点。

        4  教育信息资源建设的现实对策

        要解决以上网络资源建设与网络安全方面的矛盾,Web2.0不失为一种很好的技术与方案。Web2.0始于2005年,是以Blog,Tag,SNS,RSS,Wiki等社会性软件的应用为核心,依据六度分割、XML、AJAX等新理论和技术实现的互联网新一代模式,其显著特点有:①去中心化(Decentralization),使得用户成为网络中的内容节点,网络中没有了集中式的内容提供商;②微内容(Mircocontent)的可重用性;以及③通过各种机制来满足人的社会需求的社会性特点。目前已经有越来越多的网络教育资源建设利用了Web2.0的技术与理念,比如众所周知的东行记、教育博客人等网站。

        然而也正是由于Web2.0的这些特点,目前利用Web2.0进行的网络教育资源建设在以下方面存在困难:一是有效资源难以挖掘;二是在于资源的离散性,即海量的离散资源造成资源结构水平低下,并为检索和利用带来不便;三是在于学习资源的异种性(Heterogeneity),即资源编码形式存在差异;四是内容组织上,局部可能是良构的,但总体是劣构的。针对以上问题,有学者借鉴无尺度网络理论,认为“良构——同构——分布”是一种比较现实的低成本高效用的目标状态。

        5  教育信息资源建设的发展方向

        如同现代教学系统设计呼唤使用者设计与置身于其中的设计(Designing Within)一样,探索创造个人化与社会化的正向循环、开放性与聚合性并存的参与式架构的群智组织的网络教育资源建设新模式。

        Web3.0在Web2.0的基础上提出了信息集成与重组、跨平台通信及信息的个性化组合等设想,虽然目前还没有权威、确切的定义,但其核心软件技术——人工智能,能够进行语义的智能学习和理解,因此,Web3.0技术的运用可使教育信息资源建设更加个性化、精准化和只能化,必将成为未来的一个发展趋势。

篇6

关键词:图像分割;视觉注意模型;显著图;注意焦点;感兴趣区域

中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)08-1857-03

Image Segmentation Based on Regions of Interest

GUI Xiao-ling

(Department of Computer Science, Xiamen University, Xiamen 361005, China)

Abstract: Based on the regions of interest, a procedure for image segmentation is proposed. In the procedure, an integrated saliency map for a given image, which reflects the significance of regions in the image, is generated first based on the bottom-up human visual attention model, then two region segmentation methods, the image segmentation using the maximum entropy of the one-dimensional histogram and the region growing based on the focus of attention, are defined and used to separate the image into different regions. Here, the focus of attention is obtained from the saliency map. Hereafter, combining the saliency map and the segmented image, the first three most salient regions, as the salient region set, are obtained in term of the average saliency of the regions. Experimental results show that our method can reflect the semantic feature of a given image to a certain extent, and it can obtain better segmentation results.

Key words: image segmentation;visual attention model;saliency map;focus of attention;region of interest

在对图像的研究和应用中,人们往往只对图像中某些部分感兴趣,这些部分常称为前景或目标,它们对应图像中具有特定的、独特性质的区域[1]。为了辨识和分析目标,只有将它们分离提取出来,才能对目标进一步分析和利用。图像分割[2]就是把图像分割成若干个有意义区域的过程,它是图像分析和理解的基础。其中,显著区域即感兴趣区域(Regions of Interest简称ROI),是图像中最能引起用户兴趣、最能表现图像内容的区域。而人眼的视觉选择性注意机制就是使人们能够在复杂的视觉环境中快速定位感兴趣目标。

目前,关于图像显著性提取方法很多[3-5],其中最具代表性的成果是Itti[6]等人依据生物视觉系统的注意机制提出的中央-周边(Center-Surround)结构的显著性计算方法。大量实验表明,该算法的实验结果与视觉主观分析结果基本吻合。为此,本文借鉴Itti等人的视觉注意计算模型来提取图像的显著区域。同时,本文在该模型提取显著图的基础上,运用图像分割和区域生长,提出了两种ROI提取算法,分别是基于1-D直方图最大熵法的区域分割算法和基于注意焦点的区域增长算法,并把这两种算法相结合,扬长避短,提取出图像的感兴趣区域。

1 图像显著图的计算

1.1 视觉注意模型

Itti[6]模型把人观察图像时的注视焦点作为用户感兴趣点,采用一种自下而上的注意机制提取输入图像的亮度、颜色和方向特征作为视觉初级特征,采用中央-周边差操作和非线性归一化得到对应的特征显著图,将各特征显著图进行线性组合得到总显著图,最后采用胜者占有的神经网络和抑制返回机制进行注意转移。模型如图1所示,该模型能自适应地检测图像中的感兴趣区域,相比于需要人为指定感兴趣区域的大多数传统算法,在目标检测和识别等图像处理任务中有很大的优势。

1.2 显著图提取效果及击中率

图2列出了部分图像及其对应的显著图。

在计算显著图的过程中,结合胜者占有和抑制返回会产生一系列的局部极大显著点,即注意焦点的重心,这些极大显著点是否坐落在用户感兴趣区域内,是衡量显著图生成算法的一个重要准则。HITn表示前n个极大显著点落在标注的显著矩形区域的图像比例。其中,测试数据集采用微软亚洲研究院Jian Sun和Tie Liu等人建立的图像库[7]。这个图像库包含了5000幅图片,并且这些图片由9个用户手工标注了显著矩形区域。实验表明,上述的显著图生成算法,较准确地说明图像显著区域所处的位置,HIT3就能达到95%左右。表1中是对应于不同用户标注显著区域的HITn。

2 感兴趣区域的提取

2.1 基于1-D直方图最大熵法的区域分割

所谓基于1-D直方图最大熵法的区域分割,是指首先根据1-D直方图最大熵法[8]把图像分割成前景和背景部分,然后结合图像的综合显著图,并融合数学形态学操作,以提取感兴趣区域的过程。算法描述如下:

输入:图像i

输出:图像i的m个显著区域Ri1,Ri2,…,Rim,m=3

步骤:

1)运用1-D直方图最大熵法对图像i进行二值化,得到二值化后图像igray(包括0-像素集:黑色和1-像素集:白色);用上文提到的Itti方法[6]生成igray的综合显著图和注意焦点显著区域(极大显著点的有限邻域)。

2)计算综合显著图的平均显著度,取显著度值高的像素集为前景区域集。若取的是0-像素集,则进行取反处理,即0,1互换,方便后面形态学方面的处理。

3)对前景区域集进行形态学开操作(先腐蚀后膨胀),以去掉图像中噪音和面积过小的区域;

4)计算注意焦点显著区域被前景区域包含的比例。若超过阈值T,则该注意焦点合格,反之,该注意焦点不合格;

5)对合格的注意焦点集进行区域生长来实现图像的分割,生长准则是相邻像素的像素值小于阈值,以4连通的方式遍历;计算生长后区域的平均显著度,取最为显著的m个为候选区域集;

6)对分割效果进行评价,根据分割出的区域块数和区域的重心来衡量。若评价好,则算法结束;若评价不好,返回步骤3,并把开操作改成闭操作(先膨胀后腐蚀),以解决因开操作使区域分裂为过小的区域而无法获取的问题;

7)运行到步骤5,并再次对分割进行评价,若评价好,则算法结束;若评价不好,返回步骤2,取与原先相反的像素集作为前景区域集(防止由于之前对前景区域集判断错误而无法获取区域的问题);

8)运行到步骤5,算法结束。

实验中,阈值T取为60%。算法的部分效果图如图3的第二列所示,其中第一列为原图,图中紫色方框表示的是用户标注的前三个显著区域。

2.2 基于注意焦点的区域增长

区域生长是图像分割中一种简单而有效的方法,而且种子点的选取很容易结合高层语义,这对提取感兴趣区域来说非常有效。算法主要思想是:以注意焦点为种子点,相邻像素的相似度为依据进行区域增长,最终形成目标区域,具体描述如下:

输入:图像i及其综合显著图

输出:图像i的m个带权显著区域Ri1,Ri2,…,Rim,m=3

步骤:

1)利用上文提到的Itti方法[6]生成图像i的综合显著图和注意焦点集;

2)计算注意焦点的特征向量:以注意焦点的N*N邻域为分析对象,统计其像素集特征,如色度、饱和度、亮度、显著度,并将其均值、方差作为该注意焦点的特征值;

3)比较待增长点的特征值与注意焦点的特征值,以特征值的相似性为度量。若待增长点的特征值与注意焦点(或相邻合格点集)的特征值的差距小于注意焦点特征值的方差,则定义为相似;反之,定义为不相似;

4)如果显著度相似,则待增长点合格,可以加入;如果显著度不相似,则考虑色度、饱和度和亮度特征,若其中至少有2个相似就加入,反之,放弃;

5)分别对前m个合格的待增长点进行生长,并计算生长后区域的平均显著度;

6)以区域的平均显著度为依据对区域排序并赋权值,平均显著度越高赋予的权值越大。

算法的部分效果图如图3的第三列所示。

2.3 综合算法

基于1-D直方图最大熵法的区域分割处理的是灰度图,有时候在彩色图像中易于辨认的区域,灰度信息并不足以区分它们,因为其缺乏颜色信息,特别是在二值化时可能把用户的感兴趣区域划分为背景,从而找不到合适的区域,如图3(a)所示。基于注意焦点的区域增长算法以注意焦点(极大显著点)为种子点,以颜色相关性为增长的条件,生成的区域具有相似的颜色,但由于区域生长对噪声敏感,易导致抽取出的区域有空洞或者在局部体效应的情况下将分开的区域连接起来,如图3(e),3(f)所示。

考虑到这两种算法各自的不足,我们把它们产生的区域合并起来以生成更准确的区域集,合并时分下面几种情况:

记它们各自产生的区域为Ri,区域的宽和高分别为wi和hi,i∈{1,2}。

1)当两区域的重心距离满足下面两个不等式时,合并两个区域。

(1)

(2)

式中,Rix和Ri.y为区域的重心坐标,θ

2)当两区域相交部分的面积大于相交度阈值T时,合并两个区域。

3)对于不满足1)和2)的区域,则直接加入到整合区域中。

实验中,θ取0.1,相交度阈值T取80%,算法的部分效果图如图3的第四列所示。

2.4 正确率

本文使用正确率来衡量生成的感兴趣区域集的准确性。由于提取的显著区域是不规则的,故采用面积比较的方法。以用户手工标注的矩形显著区域为标准,假设提取的区域有i%的面积落入矩形显著区域中时为可接受的,这时的正确率定义为Ri。例如设定本文提取的显著区域有80%落入矩形区域中即认为是正确的,则可以分别得到以不同用户为标准的正确率。在衡量分割正确率的时候,与击中率一样,采用的是微软亚洲研究院的Jian Sun和Tie Liu等人建立的图像库[7]。其中,80%并非唯一的阈值,评价的标准是可以改变。对于综合算法,正确率如表2所示。

3 结论

本文采用的是自底向上的视觉注意模型来提取显著区域,显著图生成算法有较好的击中率,HIT3就能达到95%左右,能够较准确地说明图像显著目标所处的位置,但该模型是以图像底层特征为出发点,语义鸿沟并没有得到彻底的解决。图像分割采用的是基于边缘和区域的传统方法,提出的基于显著图的感兴趣区域提取算法能较好地实现图像分割,正确率R80接近于77%,但仍然是以底层特征的相似性为基础,这样有时难以提取前景目标,特别是对于组成较复杂的图像。本文虽然在显著图的基础上,提取的区域包含了注意焦点区域,但对于缺少显著区域的图像类,常常无法分割出感兴趣区域。图像分割是一种与任务相关的过程,在后续的研究中,可针对具体任务进行训练和学习,建立与其对应的图像分割数学模型。

参考文献:

[1] 章毓晋.图像工程(中)--图像分析[M].北京:清华大学出版社,2005:73.

[2] 章毓晋.图像分割[M].北京:科学出版社,2001.

[3] Marfil R,Bandera A,Rodríguez JA and Sandoval F.A novel hierarchical framework for object-based visual attention[C].Proceedings of 5th International Workshop on Attention in Cognitive Systems,2009:27-40.

[4] Hu Yi-qun,Xie Xing,Ma Wei-Ying.Salient region detection using weighted feature maps based on the human visual attention model[C].5th IEEE Pacific-Rim Conference on Multimedia,2004:993-1000.

[5] 陈嘉威.视觉注意计算模型的研究及其应用[D].厦门:厦门大学,2009.

[6] Itti L,Koch C,Niebur E.A model of saliency-based visual attention for rapid scene analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(11):1254-1259.

篇7

2.联机手写化学公式识别与分析杨巨峰,史广顺,王恺,YANGJufeng,SHIGuangshun,WANGKai

3.视线追踪系统征参数提取方法研究张闯,迟健男,邱亚飞,张朝晖,ZHANGChuang,CHIJiannan,QIUYafei,ZHANGZhaohui

4.人机交互中的人脸信息曲波分析吴贤星,赵杰煜,沈明炘,WUXianxing,ZHAOJieyu,SHENMingxin

5.NLTV:非局部数字全变差滤波算法肖亮,韦志辉,吴慧中,XIAOLiang,WEIZhihui,WUHuizhong

6.一种基于频分复用的数字指纹技术晏钊韬,张汗灵,YANZhaotao,ZHANGHanling

7.基于时空相关性的视频隐写分析徐长勇,平西建,XUChangyong,PINGXijian

8.针对H.264/AVC的时域错误隐藏算法周启亚,杨高波,刘志成,彭勇,周庞荣,ZHOUQiya,YANGGaobo,LIUZhicheng,PENGYong,ZHOUPangrong

9.基于结构张量和Wasserstein距离的纹理图像分割谢晓振,吴纪桃,XIEXiaozhen,WUJitao

10.基于人类视觉模型的区域生长图像分割谭洪波,侯志强,刘荣,TANHongbo,HOUZhiqiang,LIURong

11.复杂背景图像中的车牌定位算法刘濛,吴成东,樊玉泉,王力,LIUMeng,WUChengdong,FANYuquan,WANGLi

12.面向室外视频监视的感兴趣区域提取郑锦,李波,ZHENGJin,LIBo

13.基于模糊灰度共生矩阵与隐马尔可夫模型的断口图像识别李凌,黎明,鲁宇明,LILing,LIMing,LUYuming

14.基于定量定性互信息的多层次特征图像匹配算法杨猛,潘泉,张绍武,朱英,赵春晖,程咏梅,YANGMeng,PANQuan,ZHANGShaowu,ZHUYing,ZHAOChunhui,CHENGYongmei

15.一种内容完整的视频稳定算法彭艺,叶齐祥,黄钧,焦建彬,PENGYi,YEQixiang,HUANGJun,JIAOJianbin

16.深度剥离与GPU结合的近似软影算法孙明彦,吕伟伟,刘学慧,吴恩华,SUNMingyan,L(U)Weiwei,LIUXuehui,WUEnhua

17.基于云影距离模型的遥感图像多尺度融合算法柴勇,何友,曲长文,CHAIYong,HEYou,QUChangwen

18.改进的两步迭代阈值的遥感图像恢复算法刘卫华,何明一,LIUWeihua,HEMingyi

19.TB级地形数据实时漫游核心算法研究左志权,陈媛,ZUOZhiquan,CHENYuan

20.面向对象的扫描地形图自动分层算法研究陈鸿,汤晓安,王晨昊,干哲,CHENHong,TANGXiaoan,WANGChenhao,GANZhe

2.支持隐式人机交互的分布式视觉系统王国建,陶霖密,WANGGuojian,TAOLinmi

3.一种草图形式的视频摘要生成方法陈佳,滕东兴,杨海燕,马翠霞,王宏安,CHENJia,TENGDongxing,YANGHaiyan,MACuixia,WANGHongan

4.虚拟环境中的人脸姿态交互方法杭飞,刘惠义,HANGFei,LIUHuiyi

5.实物界面下的虚拟装配喻晓宇,张凤军,戴国忠,YUXiaoyu,ZHANGFengjun,DAIGuozhong

6.Delaunay三角网构建方法比较研究中国图象图形学报A 余杰,吕品,郑昌文,YUJie,L(U)Pin,ZHENGChangwen

7.基于灭点理论和平面控制场的相机标定方法研究杨化超,张书毕,刘超,YANGHuachao,ZHANGShubi,LIUChao

8.基于Markov链安全性的二阶统计保持隐写算法张湛,刘光杰,戴跃伟,王执铨,ZHANGZhan,LIUGuangjie,DAIYuewei,WANGZhiquan

9.码书排序对快速码字搜索算法性能影响的分析乔阳,潘志斌,乔瑞萍,QIAOYang,PANZhibin,QIAORuiping

10.用于内容认证的半脆弱可逆视频水印算法曾骁,陈真勇,范围,陈辉,熊璋,ZENGXiao,CHENZhenyong,FANWei,CHENHui,XIONGZhang

11.一种模糊特征驱动曲线演化的图像分割石澄贤,王洪元,夏德深,SHIChengxian,WANGHongyuan,XIADeshen

12.基于像素层背景模型的复杂场景运动目标检测韩建平,张明敏,潘志庚,HANJianping,ZHANGMingmin,PANZhigeng

13.基于LHBP多尺度向性滤波的文字检测算法许鹏飞,姚鸿勋,纪荣嵘,王积成,孙晓帅,XUPengfei,YAOHongxun,JIRongrong,WANGJicheng,SUNXiaoshuai

14.一种Beamlet变换下的图像边缘检测算法陈雨,方滨,王普,CHENYu,FANGBin,WANGPu

15.基于稳定区域的形变指纹匹配算法陈小光,封举富,CHENXiaoguang,FENGJufu

16.花粉外壁纹饰的图像分析方法裴勇,付慧,陆光沛,袁军辉,曹卫群,陈建军,PEIYong,FUHui,LUGuangpei,YUANJunhui,CAOWeiqun,CHENJianjun

17.一种新的基于局部特征的图像质量评价方法任雪,孙涵,张金国,RENXue,SUNHan,ZHANGJinguo

18.盲复原图像振铃效应评价左博新,明德烈,田金文,ZUOBoxin,MINGDelie,TIANJinwen

19.基于多模式均值时空模型的目标融合检测方法赵高鹏,薄煜明,ZHAOGaopeng,BOYuming

20.基于MMP三角曲面测地线算法研究周刚,邬义杰,宋德玉,李岸,ZHOUGang,WUYijie,SONGDeyu,LIAn

21.IHS和小波变换结合多源遥感影像融合质量对小波分解层数的响应龚建周,刘彦随,夏北成,陈健飞,GONGJianzhou,LIUYansui,XIABeicheng,CHENJianfei

22.热红外与多光谱遥感图像的神经网络回归融合方法研究姚为,韩敏,YAOWei,HANMin

1.一种Post-WIMP界面:PGIS的实现石磊,邓昌智,戴国忠,SHILei,DENGChangzhi,DAIGuozhong

2.情境感知驱动的移动设备自适应用户界面模型程时伟,刘肖健,孙守迁,CHENGShiwei,LIUXiaojian,SUNShouqian

3.基于知觉控制的用户界面设计研究蔚娣,华庆一,王小文,李珍,李倩,YUDi,HUAQingyi,WANGXiaowen,LIZhen,LIQian

4.笔式界面软件快速开发工具华超,邓昌智,戴国忠,HUAChao,DENGChangzhi,DAIGuozhong

5.通过模式语言研究GIS用户界面李响,华一新,王双,孙丰垒,LIXiang,HUAYixin,WANGShuang,SUNFenglei

6.中国多媒体技术研究:2009史元春,徐光祐,高原,SHIYuanchun,XUGuangyou,GAOYuan

7.主观评价JPEG与JPEG2000标准的彩色图像最佳压缩比的实验研究李琼,石俊生,毛小群,LIQiong,SHIJunsheng,MAOXiaoqun

8.基于融合的高分辨率彩色图像拷贝-变换-移动篡改检测王鑫,轩波,彭思龙,WANGXin,XUANBo,PENGSilongHtTp://

9.一种结合SPIHT编码的自嵌入水印算法钟晓燕,冯前进,ZHONGXiaoyan,FENGQianjin

10.红外凝视成像系统中的CDS噪声抑制技术白俊奇,陈钱,钱惟贤,BAIJunqi,CHENQian,QIANWeixian

11.一种基于类主题空间的图像场景分类方法唐颖军,须德,解文杰,薄一航,TANGYingjun,XUDe,XIEWenjie,BOYihang

12.灰度共生矩阵在皮肤纹理检测中的应用研究郭航,霍宏涛,GUOHang,HUOHongtao

13.一种基于码本模型的运动目标检测算法郭春生,王盼,GUOChunsheng,WANGPan

14.基于圆结构光的复杂深孔内轮廓尺寸测量方法冷惠文,徐春广,冯忠伟,肖定国,LENGHuiwen,XUChunguang,FENGZhongwei,XIAODingguo

15.基于小波域信息融合的MSR改进算法汪荣贵,杨万挺,方帅,吴昊,WANGRonggui,YANGWanting,FANGShuai,WUHao

16.3维建模中视频图像与磁跟踪器的多模态标定在微创手术中的应用秦文健,辜嘉,QINWenjian,GUJia

17.训练样本数目选择对面向对象影像分类方法精度的影响薄树奎,丁琳,BOShukui,DINGLin

18.大场景高分辨率SAR图像中机场快速检测方法张立平,张红,王超,张波,杨浩,ZHANGLiping,ZHANGHong,WANGChao,ZHANGBo,YANGHao

19.中国图象图形学报A 矢量地图水印的数据质量评价研究赵晶,林鸿飞,王凡,ZHAOJing,LINHongfei,WANGFan

20.高精度高速度曲面建模的3维地表模拟和漫游算法闫长青,岳天祥,YANChangqing,YUETianxiang

1.中国图形工程:2009潘志庚,白宝钢

2.一种利用视觉掩蔽效应的感兴趣区域视频编码方法刘琼,胡瑞敏,韩镇

3.清除椒盐噪声的局部L1去噪保边方法阮正旺,张建州,张亮

4.利用SIFT特征和群体统计信息进行CT前列腺图像分割冯前进,秦安,陈武凡

5.一种具有旋转鲁棒性的文本图像文种识别方法顾立娟,平西建,程娟,郝玉保

6.基于微观图像的加工表面3维形貌重建算法研究孙林丽,李言,郑建明

7.概念间关联依赖多标记视频语义概念分类方法魏维,魏敏,刘凤玉

8.基于对象的遥感案例推理方法检测岩溶地面塌陷窦杰,钱峻屏,陈水森,郑小战,刘瑞华,朱俊凤,夏换

9.SAR图像斑点噪声整体变分偏微分方程滤波算法研究李贺,秦志远,周丽雅

10.道路转向延迟的动态对偶图模型郑年波,陆锋,段滢滢

11.基于空间数据挖掘的分区异步元胞自动机模型研究柯新利,边馥苓

12.快速结构化图像修补路平,陈敏刚,马利庄,桑胜举

13.基于非线性流形学习的3维人体运动合成王宇杰,肖俊,魏宝刚

14.基于社群隐含主题挖掘和多社群信息融合的自动图像标注陈烨,邵健,朱科

15.求解方程RaRx=RxRb的四元数几何研究毛剑飞,邵黄芳,蒋莉,梁荣华

17.基于手绘轮廓的3维服饰模型生成张尧烨,孙正兴,刘凯,张岩

18.基于学习的群体动画生成技术研究中国图象图形学报A 魏迎梅,瞿师,吴玲达

19.一种改进的Voronoi图增量构造算法孟雷,张俊伟,王筱婷,杨承磊

1.中国图像工程:2009章毓晋,ZHANGYujin

2.图像去噪中的纹理保护方法研究姚伟,孙即祥,YAOWei,SUNJixiang

3.基于时空注意模型的视频分割算法郑河荣,褚一平,潘翔,ZHENGHerong,CHUYiping,PANXiang

4.基于多尺度局部分形维的黑色素瘤轮廓不规则性描述方法马莉,MALi

5.基于LBP和小波纹理特征的室内室外场景分类算法李锦锋,许勇,LIJinfeng,XUYong

6.车牌识别中先验知识的嵌入及字符分割方法顾弘,赵光宙,齐冬莲,孙赟,张建良,GUHong,ZHAOGuangzhou,QIDonglian,SUNYun,ZHANGJianliang

7.基于云模型的图像区域分割方法许凯,秦昆,黄伯和,杜鹢,XUKai,QINKun,HUANGBohe,DUYi

8.基于Hough谱的任意形状表示与配准王彩玲,赵春霞,WANGCailing,ZHAOChunxia

9.基于自适应Eikonal方程的改进透视SFS算法王学梅,孙即祥,WANGXuemei,SUNJixiang

10.一种新颖的快速水平集初始化方法刘涛,张大龙,周秦武,曹铁生,卞正中,LIUTao,ZHANGDalong,ZHOUQinwu,CAOTiesheng,BIANZhengzhong

11.一种应用机载LiDAR数据和高分辨率遥感影像提取城市绿地信息的方法余柏蒗,刘红星,吴健平,YUBailang,LIUHongxing,WUJianping

12.陆架区海洋内波传播特性遥感方法分析高国兴,王振占,陈标,刘翠华,张本涛,GAOGuoxing,WANGZhenzhan,CHENBiao,LIUCuihua,ZHANGBentao

13.一种基于DFT的DEM自适应数字水印算法王志伟,朱长青,殷硕文,安敏,WANGZhiwei,ZHUChangqing,YINShuowen,ANMin

14.基于智能符号回归的路径规划A~*算法均衡控制方法周亮,陆锋,郑年波,ZHOULiang,LUFeng,ZHENGNianbo

15.隐式曲面上两相图像分割的变分水平集方法李建国,潘振宽,魏伟波,石洁,李华,LIJianguo,PANZhenkuan,WEIWeibo,SHIJie,LIHua

16.3维物体SIFT特征的提取与应用熊英,马惠敏,XIONGYing,MAHuimin

17.利用分水岭分割的多分辨率遥感图像融合算法胡学龙,沈洁,HUXuelong,SHENJie

篇8

2014年3月,“大数据”首次出现在我国《政府工作报告》中。2015年7月,国务院办公厅《关于运用大数据加强对市场主体服务和监管的若干意见》。8月,国务院印发《促进大数据发展行动纲要》,明确规划国家将实施政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程等十项大数据工程。10月,党的十八届五中全会提出,实施网络强国战略,实施“互联网+”行动计划,实施国家大数据战略,标志着大数据战略正式上升为国家战略,开启了大数据建设的新篇章。

一、从信息视角认识世界

人类已经进入信息社会、信息时代,信息是我们这个世界赖以运行的血液、食物和生命力。尽管信息的原始形式已经存在了成千上万年,但是真正对信息进行理性认识,却还是上个世纪中叶左右的事。信息是什么?1948年,控制论的创始人维纳(Norbert Wiener)在《控制论――关于在动物和机器中控制和通信的科学》一书中指出:“信息就是信息,既不是物质也不是能量。”从而第一次把信息提到了与物质、能量并驾齐驱的地位,勾画出了一幅“物质―能量―信息”的世界三要素的新图景。哈佛大学信息政策研究中心主任A.欧廷格(Oettinger)说:“没有物质,任何东西都不存在;没有能量,任何事情都不会发生;没有信息,任何东西都没有意义。”

人们一般很少去思考信息与讯息、消息、知识、数据等之间的联系和区别。第一次洞察信息本质、也是第一次赋予“信息”一词精确定义的是克劳德・香农(Shannon)。1949年,香农发表了《通信的数学理论》,经典地阐明了通信的基本问题,提出了通信系统的模型,给出了信息量的数学表达式,这是人类第一次系统、全面、理性地认识信息,从此奠定了一门新的学科――信息论。香农认为,剥除了语义内容,“信息是用来消除随机不确定性的东西”,是出人意料,这一定义被人们看作是经典性定义并加以引用。香农还引入了测量信息的最小单位――比特(bit),如今已经跻身为量纳的一员,成为今天日常生活都离不开的词汇。信息与概率密不可分。1比特,从根本上说,就是代表一次掷硬币猜正反面时的不确定程度。令人颇感兴趣的是,香农当时能够想到的最大信息仓库是美国国会图书馆。

从此以后,信息论犹如一股洪流,在心理学、遗传学、量子力学、经济学、语言学等一个又一个领域掀起了颠覆性的革命,极大地改变了现代科学的面貌。万物源自比特。在这个大数据时代,所有新闻出版行业从业人员在世界观方面,应该具有“信息”视角,让信息成为我们世界观的核心之一,因为我们本身就是信息行业,我们现在所从事的社会活动和工作岗位,归根结底都是信息的获取利用、生产加工和传播消费。

二、树立三种新的数据思维

西方有一句话:“除了上帝,任何人都应该用数据说话。”《促进大数据发展行动纲要》提出建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,这将建立起全社会的数据思维和数据文化。正解大数据要上升到文化的高度,其本质就是理性思维、科学精神、实事求是,因为数据就是事实。大数据专家维克托・迈尔・舍恩伯格在《大数据时代》一书中具有洞见性地提出三种数据思维:整体思维、多样思维和相关思维,已经成为共识。但我认为,新闻出版行业更应该具备如下三种思维:

一是价值思维。我们要明明白白地认识到:数据是一种资产,数据是财富。大数据思维的核心是价值思维。这里所说的数据,不仅包括管理数据、交易数据和社交数据,也包括用户数据。传统新闻出版单位一定要充分认识到:用户也是不可忽视的一笔重要财富。2014年2月20日,Facebook宣布用160亿美元收购WhatsApp,在整个收购的价值组成中,对WhatsApp逾5亿用户的估值约为20亿美元(约合人民币123亿元),相当于每名用户约4美元(约合人民币25元)。

二是应用思维。有人说,谁拥有了大数据,谁就拥有了未来,就占领了制高点、取得了主动权。这种观点值得商榷,因为数据的价值在于应用,而不在于拥有。大数据真正重要的不是数据本身,如何利用数据驱动单位内部的业务流程和产品研发才是重中之重,这意味着要从业务驱动转变为数据驱动,这正是传统产业转型升级的关键所在。数据比流程更重要,这一点对于新闻出版行业尤其关键,因为我们这个行业定量思维、数据决策严重匮乏,选题策划、印数决策等更多地依赖于经验。亚马逊与传统书店对决的胜出,最核心的原因在于,其电子商务架构于大数据平台之上,通过全维度记录、存储与描述数据,深入进行数据关联与数据挖掘,并基于数据进行预测与推荐。而传统发行行业面临的痛点在于,产品与服务无法数据化。

三是共享思维。出版单位内部的数据孤岛现象是普遍存在的,有的出版社不同编辑室之间连作者信息都不能共享。出版传媒集团不同企业之间的孤岛效应更加明显,新闻出版行业层面更是缺乏大数据平台。大数据的发展需要全社会、全行业协同,最终实现数据共享。共享是指“使用而非拥有”,非公非私,既可以公有私用,也可以私有公用。必须要认识到,本部门、本企业、本集团、本行业内部数据如果不流动起来,不与外部数据融合,就会成为死数据。越共享,效率越高。当然共享并不意味着免费,关键在于利益机制设计。

三、大数据在解决新闻出版业痼疾方面大有可为

长期以来,新闻出版行业形成了几大痼疾,严重影响产业健康发展:一是库存暴涨,产能过剩,供需严重不匹配,已经成为产业不能承受之重,风险极大,行业亟需绿色发展。出版业和全国经济一样,面临巨大的去库存问题。2004到2014年10年时间,全国总库存(出版社和新华书店系统)数量增长近25亿册,金额突破1000亿元,达到创纪录的1010亿元,而2014年全国纯销售仅为778亿元,早已形成倒挂之势,剔除中小学教材,实际库销比已经逼近2。二是发行市场诸侯割据,条块分割,缺乏全国性的发行中盘,统一开放竞争有序的全国大市场远远没有形成,导致我国的出版传媒集团难以做大主业。三是出版发行生态链畸形,寄销制导致无条件退货,账期长,回款难,诚信缺失,真正意义上的出版社图书单品种核算难以实现,编辑绩效考核和激励机制难以建立,整个行业仍是粗放式管理。要想从根本上解决上述问题,就必须充分利用大数据技术,建立行业大数据平台和信用信息平台,从产业链上中下游进行精确管理,数据驱动选题策划、印刷决策,分析用户行为,精准营销、个性化推荐,重塑出版生产、销售和管理模式。

四、新闻出版行业有哪些大数据

人人都在谈大数据,到底新闻出版行业拥有哪些大数据?仁者见仁,智者见智,分类方法很多。我认为,从业务来分,新闻出版大数据可分为七类:一是机构数据。主要包括新闻出版政府机构、事业单位、行业协会,出版传媒集团、出版社、报社、期刊社、音像电子社、印刷厂、发行集团、书店等企业和机构的名称、地址、法定代表人、网址、规模、业务范围、收入、利润等数据。二是人员数据。主要包括公务员、企业管理人员、编辑、记者、发行、技术、作者、专家等新闻出版行业从业人员的基本数据,如姓名、性别、地区、行业、专长、职务、职称、主要作品、发表文章、教育经历、职业经历等数据。三是产品数据。包括图书数据、报纸数据、期刊数据、音像制品数据和网络出版物数据。既包括作者等元数据,也包括选题数据、发稿数据、印刷数据、版权数据等。四是政务数据。指政府在综合办公、市场监管、公共服务过程产生的数据,包括人事信息、财务数据、政策法规、统计信息、规划计划、标准信息等。五是商务数据。指新闻出版企业主体在市场交易过程中产生的数据,包括合同、供货、采购、发货、退货、结算、版权交易等数据。包括用户人口属性数据、用户关系数据、用户行为数据等。像评论、转发、分享、下载、点赞、收藏数据,粉丝数、认证信息、学习时段、阅读工具、阅读方式、阅读时间段、阅读时长、阅读偏好、阅读能力、阅读目的、阅读范围等用户行为数据正是目前移动互联网出版所必须关注的。七是内容数据,包括信息和知识。一般将知识归纳为四种类型:事实知识、原理知识、技能知识和人力知识。中文百科知识体系把人类科学文化知识和实践活动领域分为24个类别,形成了中文百科分类目录。这是我们新闻出版行业所特有的数据宝藏,也是知识服务的基础。

五、了解一点大数据技术

要想不被IT企业神乎其神的大数据软件和技术所忽悠,有必要对大数据技术略知一二。大数据关键技术一般包括大数据采集技术、大数据存储及管理技术、大数据分析及挖掘技术、大数据展现及应用技术等。

网络爬虫、ETL(Extract-Transform-Load)和数据众包属于大数据采集技术。我们所熟知的高德地图则综合采用情报搜集平台LSE、API轨迹分析、卫星影像自动识别、UGC反馈以及浮动车等多种数据采集技术。大数据存储及管理关键技术则包括Hadoop的三大核心技术,即分布式文件系统(HDFS)、分布式系统架构(MapReduce)和分布式数据库(NoSQL)。大数据分析及挖掘技术包括自然语言处理、语义分析、关联挖掘分析、神经网络、话题检测与追踪、情感倾向分析、序列分析、机器学习、个性化推荐、文本智能处理技术、图像识别、模式识别、语音识别等。个性化推荐又可以分别基于协同过滤、关联规则、社交圈、用户画像、内容来进行推荐。文本智能处理技术包括文本分类、相似性检测、自动摘要、主题词标引、信息抽取、文本聚类、中文分词。大数据展现及应用技术值得一提的是数据可视化技术,传统的数据展示是单调、乏味的,多以饼图、柱图和线图等形式展示,远远满足不了多角度、多层次及交互性的要求,那么大数据数据可视化技术则可以提供标签云、聚类图、流图、热图、散点图等更具表现力、更具交互性的数据可视化实现方案,将数据的各个属性值以多维数据的形式表示,使人们能够以更直观的方式看到数据及其结构关系,发现数据中隐含的信息,从不同的维度观察数据,从而对数据进行更深入的观察和分析。最后,还要提一下云计算与大数据的关系。大数据和云计算是一枚硬币的两面,大数据必须云计算来处理,云计算的本质就是大数据处理技术。云计算和大数据应当成为大型新闻出版传媒集团的标配。

六、亟需建立新闻出版大数据标准体系

标准化是建设新闻出版大数据的基础与关键,也是真正实现新闻出版大数据潜在价值的必要条件。2014年,工信部和国标委成立了“全国信标委大数据标准工作组”,负责制定和完善我国大数据领域标准体系。建设新闻出版大数据过程中,多源采集的数据存在格式混乱、对接困难等问题,必然会降低数据挖掘、分析的效率,影响其价值的实现。因此,必须开展新闻出版大数据标准顶层设计,从基础、技术、产品、安全、管理、应用等多个角度梳理新闻出版大数据标准需求,建立健全新闻出版大数据标准体系,重点突破一批涉及大数据的基础性、方法性、应用性标准的研制,指导新闻出版大数据的采集、共享、交换、加工、应用和服务,为新闻出版大数据发展夯实基础。在研究国家大数据技术标准体系框架的基础上,结合出版数据自身的特点,以及未来出版大数据发展的趋势,新闻出版大数据标准体系框架可以包括基础标准、技术标准、产品和平台标准、安全标准、应用和服务标准等五大类。其中,基础标准包括总则、术语、技术参考模型、元数据等标准。技术标准包括数据治理、数据质量等标准。产品和平台类标准主要包括智能工具、可视化工具、大数据平台、测试规范等标准。数据安全标准主要包括通用要求、隐私保护等标准。应用和服务标准包括开放数据集、数据服务平台、领域应用数据等标准。

七、建立新闻出版行业大数据共享交换机制和平台至关重要

正如英特尔中国研究院院长吴甘沙所说,数据之于数据社会,就如同水之于城市或者血液之于身体一样。要真正盘活新闻出版大数据资源,让散落在各处的新闻出版数据真正流动起来,建立新闻出版政府主管部门、新闻出版企业和社会之间的大数据共享交换机制和平台就显得格外必要。一是政府统筹规划、全面部署。倡导通过市场化、社会化方式汇聚和优化配置社会资源,避免出现新的“信息孤岛”。二是开辟多种数据采集渠道。综合行政收集、自愿提供、有偿购买、协议交换、网络抓取、传感收集等方式建立新闻出版大数据采集机制。尤其要加强对新闻出版企业信息化规划与行业大数据采集需求的融合指导,鼓励新闻出版企业加强对其生产经营活动中数据的采集。三是创造多种数据共享模式。鼓励各级新闻出版主管机构率先推进政务数据资源的集中与开放,与社会联动;鼓励新闻出版企业通过商业行为创新数据共享机制,探索既确保多方数据所有权又实现数据整合应用的商业模式;鼓励民间资本参与新闻出版大数据共享交换体系的建立。四是解决信息安全和隐私保护等。只有对涉及隐私保护和商业秘密的数据进行合理化处理,才能最大化发挥数据共享交换各方的积极性,才能实现新闻出版大数据的有序共享。

八、加快建设行业大数据重大工程,构建新闻出版大数据体系

新闻出版大数据体系应该包括基础设施、数据、技术、平台、应用、标准、安全、机构、机制等方面。重大工程对构建大数据体系起着核心作用。“十三五”期间,应该从政府监管、公共服务和产业发展三个层面启动若干重大工程。在政府监管层面,启动新闻出版及扫黄打非大数据监管工程,建设新闻出版信息资源数据库,提升政府决策支撑、风险防范、市场监管、重大事件预警能力。在公共服务层面,启动出版发行信息公共服务平台,建成全国出版可供书目数据库,形成基于国家标准的支撑出版、发行、采购、编目、决策于一体的新型公共服务模式。在产业发展层面,启动新闻出版大数据应用工程,包括国家知识服务大数据应用工程、国家出版发行大数据应用工程、ISLI标准大数据应用工程等。

对于新闻出版人来说,大数据完全不同于云计算、移动互联网、物联网,后者都是技术,而懂技术、关心技术的总是少数,而数据、信息、知识则不同,它们是内容,是我们生存的根本,我们应该具有信息视角、数据思维,我们的重点应该放在数据、信息的采集、处理和应用上,扎扎实实、一点一滴做好数字化转型工作,开创新闻出版业创新、协调、绿色、开放、共享发展之路,因为我们都是马歇尔・麦克卢汉所说的“采集信息为生的人”。

九、数字化转型仍然是大数据的基础

应用大数据首先要拥有大数据。可是,大数据在哪儿呢?目前,出版传媒企业自己拥有大数据平台和大数据采集能力的很少,大多没有用户多方位属性和行为数据,难以对用户行为和个性化需求进行深入分析。而拥有用户大数据的社交网站、电商、互联网公司也不会把大数据给出版企业使用。即使是出版企业内部的小数据,也散落在网站、ERP、协同编辑系统等不同的系统平台,没有统一整合。因此,出版企业大数据建设顶层设计要统筹大数据与小数据、内部数据与外部数据。首先,要全面进行ERP建设,加强对选题、生产、营销、发行、服务、财务、管理等全过程的管理信息化,完整收集过程中的内部数据,这是大数据的基础之基础。临渊羡鱼,不如退而结网。其次,全面推进数字化转型,国家数字复合出版系统工程研发的新闻内容选题与评价系统、图书选题及发行分析系统、出版信息采集与策划服务系统、全文相似性分析系统、内容动态重组系统、管理系统、出版机构运营服务与支撑系统、多形态广告系统、在线学习平台、数字资源标准管理与解析服务系统、复合出版数据传递系统、全国出版内容交换系统等众多系统和平台,全方位支持新闻出版企业的创意、生产、营销和经营管理活动,让新闻出版企业充分拥抱大数据和互联网,希望能在不久的将来全面应用在所有新闻出版企业,否则大数据就是无源之水,无本之本。

十、不能神化大数据

篇9

1快速创新设计理论与方法

1.1模块化设计理论与方法

模块化是指采用具有相对固定结构和功能作用的模块对产品或系统进行组织和规划;通过对产品在某种范围内按照不同功能、相同功能的不同性能或者不同规格进行分析,规划出不同的功能模块,通过不同模块的选择和组合,配置出系列产品,以满足用户的不同需求的设计方法[2]。模块化设计是适应性设计、快速配置设计和可重构设计等现代设计的重要设计方法和核心技术,通过功能模块的配置组合能够实现产品的标准化和个性化设计。模块化设计已在现代产品设计中广泛应用,其理论基础是Suh[3]提出的独立公理理论,即“一个最优设计必须保持功能需求的独立性”。20世纪50年代,欧美一些发达国家提出了模块化设计[4]的概念,随着计算机技术的发展,这一概念越来越得到设计界的广泛关注和深入研究。人们在模块化设计概念的定义、模块的划分与组合、实现过程,以及基于模块化设计的产品平台规划与设计等方面都有相当多的研究。Suh[3]从“功能-设计参数”映射的角度给出了模块化设计的定义:模块化设计是将产品、过程和系统以一定的形式表现,满足预定的客户需求,采用的方法是选择恰当的设计参数,完成从功能需求域到设计参数域的映射。Ulrich等人[4]从设计学角度指出了影响模块化设计程度的两个基本因素:1)产品功能域与物理结构域之间的对应程度。2)产品物理结构间相互关联程度的最小化。PAHL等人[5]仍然认为模块化设计是完成从功能需求域到模块功能域的映射,再考虑模块特性参数(如尺寸、重量等),完成从模块的功能域到模块的结构域映射,并按照不同的模块功能,在设计域内(功能域和结构域)进行模块分类与定义。在模块化设计的方法研究中,模块划分技术是关键技术之一。ERIXON等人[6]提出了产品某项功能成为独立模块需要满足的11个条件,并将其作为模块划分的普遍原则,根据子功能结构建立模块识别矩阵,然后对模块识别矩阵进行聚类分析。STONE等人[7]考虑产品的各个子功能与能量流、物流和信号流的关联性,将一种功能模型定量化建模方法用于产品架构开发,并以客户需求重要度为度量标准,建立需求与功能数据库,将功能与需求的关系定量化作为模块划分与模块发展的主要依据。GU等人[8]提出了一种基于产品全生命周期技术的多目标(可回收设计、可升级设计、可重用设计和重构设计)模块划分方法,并将模糊数学中权重的概念应用于功能结构分析,为定量化模块划分提供了依据。模块组合技术是模块化设计的另一关键技术。O’GRADY等人[9]针对网络设计环境下分布协同设计,研究了其模块组合方法,即建立一个基于面向对象的模块化产品设计环境,根据用户的需要,将不在一个地区的各个模块制造商生产的模块快速组合成模块化产品。TSAI等人[10]考虑产品设计、加工和装配等复杂性,基于并行工程思想,按产品功能在设计过程中的不同类型接口关系进行模块的不同类型划分,并从中选择最优模块,最后根据模块包含的相关信息,对模块中的各个功能进行优先权排序,以此作为产品规划设计的原则。另外,在模块化设计中,模块接口的匹配是模块组合的重要条件,即一个零/部件结构能够成为模块的条件是零/部件的功能、结构以及其接口特征不能超出模块化产品给定的标准接口所允许的范围[11]。HILLSTROM[12]基于公理化设计原理,并结合面向装配和制造的设计方法,对模块化设计的接口进行了系统分析。

1.2参数化设计理论与方法

参数化设计是产品设计规格化、系列化的一种简单、高效和快速的方法,通过改变结构特征某一部分或某几部分的尺寸,基于参数化驱动技术,实现对特征中相关部分的自动改动。参数化设计是CAD的一个重要理论和方法,它包括两个基本要素:参数化图元和参数化修改引擎。CAD中的图元都是以对象特征的形式表现,并通过参数的调整变化驱动图元的变化,参数包含作为数字化对象图元的所有信息。参数化修改引擎所使用的参数驱动技术,使设计者对设计对象所做的全部改动都可以在其他相关联的部分自动反映出来,并采用智能结构单元、视图和注释符号,通过一个变更和约束驱动引擎使每一个图元都可互相关联。对象特征尺寸的改动、移动或者删除所引起的参数变化,会引起相关对象特征参数产生相应的变化,不同视图下所发生的改变都能以参数化的、双向的方式扩散到所有其他视图,以保证所有设计对象的一致性,不必对所有视图逐一进行修改,从而显著提高设计效率和设计质量。1963年由Sutherland[13]在SketchPad系统中提出参数化设计方法,Light等人[14]在1982年提出变量几何和几何约束思想。为提高零件生成的智能化,在20世纪80年代将人工智能技术(AI)应用到参数化设计中,如神经网络和几何推理等技术,更重要的是将参数化技术应用到实体造型并形成了特征造型技术。产品开发之初,零件形状和尺寸都具有一定的不确定性,因此希望零件模型具有柔性修改的能力。参数化设计可将零件模型中固定的参数变量化,使之成为可以在一定范围内修改的参数,根据不同设计要求,对变量化参数赋予不同数值,就可获得不同形状和规格的零件模型。约束是CAD中参数化模型的重要内容,包括零件图形的几何约束和工程约束。几何约束分为尺寸约束和结构约束。尺寸约束是指通过指定特征尺寸参数描述的约束,如长度尺寸、角度尺寸以及直径尺寸等;结构约束是指几何元素间的拓扑约束关系,如垂直、平行、相等、同心和相切等。工程约束是指尺寸之间的函数约束关系,即根据工程设计知识,通过定义尺寸各变量之间在参数值或者逻辑上的关联关系来表示。

1.3产品族设计理论与方法

产品族设计是通过基本特征、组件或子系统的共享,以满足不同市场需求的多产品设计方法,是实现规模化产品制造的有效手段。对于产品族的定义,许多学者给出了不同的描述。Ulrich[4]将产品族定义为由某种参数化数据结构确定的一组产品,当所有参数赋予某一具体数值时,就表现为一个具体产品。Erens等人[15]认为产品族是具有相同内部接口的一组产品,并且在设计的各个领域(功能域、技术域和物理域)中产品族接口为标准化接口,能够实现产品部件的完全互换。McAdams等人[16]将产品族定义为具有相同功能流的一组产品。Simpson等人[17]定义的产品族是建立在通用产品平台之上的一组相关产品,并共享平台通用特征、部件和子系统,以此满足市场的多样化需求。其中,参数化产品族(scale-basedproductfamily)在平台公共变量不变的基础上,通过可调节变量的值来满足不同性能要求的系列化产品,是产品族设计的一个具体方法,平台通用性的考虑和实例产品性能选择是参数化产品族设计的关键问题[18]。产品族结构体系(ProductFamilyArchitecture,PFA)是现代大规模定制设计方法(DesignforMassCustomization,DFMC)的核心部分,它为制造企业内的不同部门协同工作提供一个公共平台,同时作为一个类产品以实现产品变型设计来满足客户多样化需求。目前研究的产品族模型主要有通用物料清单(GenericBill-of-Material,GBOM)模型、三视图模型和产品族主结构模型等。Tseng等人[19]给出的产品族三视图体系结构模型,包括功能视图、行为视图和结构视图及其相互之间的映射关系。其中,功能视图表达产品的总体功能及其子功能结构图;行为视图从技术角度描述产品功能的技术原理;结构视图则描述产品的零/部件组成与装配模型。Hegge等人[20]提出GBOM定义,以产品族将GBOM定义为一组变量,并通过一组参数指定具体值来确定这些变量,现在GBOM已成为表达产品族结构及其构型的基本模型。在国内也开展了产品族的大量研究。祁国宁等人[21]提出了面向大批量定制(MassCustomization,MC)的产品事物特性表建模技术。由描述产品构成的产品族主结构以及描述零/部件的主模型和主文档组成模块化产品族。其中,产品族主结构描述了一个可配置的模块化产品系统的组成情况,并包括所有标准零/部件。基于产品族的主结构、构件主模型和主文档,结合客户的个性化需求,采用配置设计或变型设计方法,可以进行产品的快速定制设计。此外,Jiao等人[22]在面向对象方法和语义网络的基础上,建立了通用产品族信息模型,其多视图产品族结构采用树形结构、多样化变量值和配置规则进行表达,以此生成不同特殊需求的产品变型,同时减少各视图间的数据冗余。Nomaguchi等人[23]根据标准建模语言(UnifiedModelingLanguage,UML),提出了关于产品族体系结构的知识表达模型,该模型记录了设计的整个过程的详细步骤和设计结果,方便设计过程的跟踪查看;为便于设计者进行准确、无冗余的知识获取,模型还将用户需求、产品功能、结构和成本等不同层面的产品信息进行了集成。目前,本体技术开始应用于产品族模型的建立,Nanda等人[24]构建了基于本体的产品族设计方法,在表达产品族结构时使用网络本体语言,应用规范化的概念分析(FormalCon-ceptAnalysis,FCA)方法寻找设计特征间的共性元素,在此基础上,建立了产品族多视图模型的一般表达方式;高鹏等人[25]也基于本体的方法提出了本体之间的映射法则,构建了本体映射、知识映射和模型映射三层映射模式,并以此为核心搭建了产品配置模型的建模框架。Siddique等人[26]研究了产品族设计体系结构的开发过程,给出了产品族体系结构的数学模型、评价指标和有效性推理规则,并对产品组件、模块和体系结构进行了构建,给出了装配过程的描述方案。朱斌等人[27]则对传统设计方法学和面向产品族设计的差异进行了研究,从产品设计的需求模型、功能原理模型和结构设计模型等三个方面,论述了关于产品族设计模型的构建方法。

1.4可重构设计理论与方法

来源于可重构制造系统的可重构性的概念出现于20世纪90年代。1997年美国Michigan大学的Ko-ren等人[28]首次提出可重构制造系统的概念。可重构制造系统(ReconfigurableManufacturingSystem,RMS)指系统能根据生产的需要,准确地构建出需要的生产功能和生产能力。在1999年国际生产工程研究学会(CIRP)上,Koren等人[29]又对可重构制造系统进行了重新定义,即可重构制造系统是一种预先设计为可快速改变结构、硬件与相应软件的制造系统,并能实现在一个零件族内快速调整生产能力和生产功能,以满足市场或客户需求的突然变化;因此,RMS的主要特点是:1)将加工零/部件控制在一个零件族内;2)突出生产能力和生产功能变化而驱动的重构;3)以可重构机床(ReconfigurableMachineTools,RMT)为基础进行重构。随着可重构性及可重构制造系统的研究发展,其重要性日益显现。美国国家研究委员会(NRC)于1998年在《2020年制造挑战的设想》报告中,就明确地将可重构技术列入21世纪的六大挑战与十大关键技术中,而且排在十大关键技术的第一位。随着制造领域的研究应用,可重构思想开始从制造系统逐步发展到组织体系、制造装备以及产品设计等各种领域,形成了可重构性的概念。Setchi等人[30]基于可重构性的用途,从较为宏观的角度给出了可重构性的定义,他们认为可重构性是一种重复变更或重排系统中构件的能力,且具有继承性、定制性、可转换性、可诊断性和产品化等特征,以此实现产品多样性、重用性、快速性、低成本、高效率、可靠性和简化性等要求。英国剑桥大学的Siddiqi等人[31]给出了需要驱动的可重构的主要因素,并提出了可重构系统建模方法。我国在最近几年也开展了可重构性理论相关研究。清华大学的罗振璧等人[32]针对传统可重构的局限性,提出了基于面向用户需求与使用变化的和基于拓扑相似性“广义组合理论”的可重构性定义。梁福军等人[33]综合运用相似性分析、图论和集合论等理论,研究了制造系统的逻辑重构设计;楼洪梁等人[34-35]利用图论研究了机床的可重构性。在可重构算法方面,王素欣等人[36]运用粒子群算法解决了关于制造系统单元可重构的问题。刘溪涓等人[37]研究了零件配置过程中约束的不同类型,利用“有效可选域”的概念,建立了最小损失函数算法,该算法不仅考虑了构件约束,还考虑了零件重构约束。刘世平等人[38]研究并建立了重构目标模型,利用两个聚类定量指标给出聚类的目标函数,并采用遗传算法对重构进行求解。在可重构设计方面,各国学者主要研究了机床、机器人和其他新产品的可重构设计。在机床方面,Tilbury等人[39]对机床的组成原理进行了研究。冯宁等人[40]结合可重构机床的特征,运用矩阵结构化方法建立机床各组成部分的运动学方程,并提出了由所选择的构件组成机床的所有拓扑结构的方法。许虹等人[41]基于并行工程思想,提出了一种考虑加工工艺与机床配置同时完成的可重构机床设计方法。在可重构机器人方面,Hui等人[42]研究了一种产品化、可重构和可扩展的机器人系统(IntegratedRasterImagingSystem,IRIS)。Paredis等人[43]研究了可重构机器人及其可产品化系统(ReconfigurableModularManipula-torSystem,RMMS)。赵广涛等人[44]基于树状拓扑结构研究了产品化机器人的重构规划设计问题。于海波等人[45]结合图论原理方法,给出了一种比较简单有效的可重构机器人构型综合方法。魏延辉等人[46]采用两级计算(遗传算法和迭代算法)优化了机器人构形组合设计。李树军等人[47]研究了可重构机器人产品的结构,最后总结并设计了七种具有功能独立性的产品。李国喜等人[48-49]提出了基于功能-原理-行为-结构的产品模块化可重构设计方法和基于可拓理论的变形设计与配置方法。

2快速设计方法使能技术

快速设计方法离不开其使能技术的支撑,这其中最重要的使能技术有并行工程和虚拟样机技术。

2.1并行工程

并行工程(ConcurrentEngineering,CE)不仅是一种设计思想,更重要的是一种方法论,是现有先进设计制造和管理模式的理论基础[50]。美国防御分析研究院于1988年给出了并行工程的定义[51]:对产品设计及其相关过程,包括设计过程、制造过程和市场营销等过程,进行并行、一体化设计的系统化工作模式。这种工作模式要求产品设计开发者在开始设计时,要考虑产品生命周期中的各个阶段因素,其中包括用户需求、产品质量、生产成本与阶段进度。传统的企业组织结构会带来部门之间的分割与封闭,并行工程打破了这种各自独立的工作局面,站在产品全生命周期整个过程的高度,突出参与者集群协同工作的效应,对产品开发过程进行重构,结合先进的设计方法学,并在产品设计的初期将后期的所有因素进行综合考虑,力争完全实现产品设计和制造一次成功,从而极大地缩短了开发周期,降低了产品成本,增强了企业的竞争能力[52]。传统的产品设计制造模式为串行工程(SequentialEngineering,SE)模式,其产品开发过程是顺序完成,各个过程之间基本上是独立的,每一过程的开始是以上一个过程的结束作为前提,彼此缺乏信息交流。并行工程的关键是以系统集成为基础对产品及其过程实施并行设计,即是通过多学科产品开发人员的协调与合作,整合产品的开发流程,以缩短开发周期、提高产品质量、降低成本和增强企业竞争能力为目标的设计[53]。当然,并行设计的产品开发周期也分为不同阶段,每一阶段都有自己相对独立的时间段,不过时间段之间有一部分相互交叉重叠,而这部分重叠时间表示开发过程是同时进行的,因此,并行设计开发的时间远小于串行设计所用的时间。与传统线形的、顺序的且部门相对独立的过程相比,并行设计要求在设计的各个阶段,企业的相关部门应以互相合作、交互和平行的方式进行产品开发。当然,并行工程必须以先进的信息技术和产品设计技术为支撑,如以产品数据管理平台作为支持产品开发的环境,采用工作流来实现设计流程重组与流程管理,采用产品的数字化描述、面向制造的设计(DFM)、面向装配的设计(DFA)和质量功能配置(QFD)等技术来提高产品的设计水平[54]。

2.2虚拟样机技术

在激烈的市场竞争环境下,企业要想占据市场的主动地位,必须比同类企业提前设计并生产出满足用户需求的具有较高质量的新产品,由于物理样机存在成本高、生产周期长等不足,难以支撑企业的快速生产需求,成为企业保持竞争优势的一大技术瓶颈。越来越多的企业和研究机构开始研究采用何种方法取代物理样机从而突破这一瓶颈,正是在这样的技术背景下虚拟样机技术应运而生。虚拟样机技术(VirtualPrototypingTechnology,VPT)是一种基于数字化样机的虚拟设计方法,是计算机辅助/面向设计(CAx/DFx)技术在各个领域的发展和应用。对于虚拟样机的定义[55-56],从20世纪90年代以来,国内外的研究人员根据各自的研究领域特点,给出了不同的概念。文献[57]中定义虚拟样机技术是“一种崭新的产品开发方法,它是一种基于产品的计算机仿真模型的数字化设计方法”,这里的数字模型指的就是虚拟样机。一个虚拟样机融入了不同工程领域物理模型数据,从产品的功能、技术原理、外观形态到产品的运行管理均模拟真实产品,并支持并行设计等方法学。虚拟样机技术的最核心优势是技术和信息的集成,即基于并行工程思想,应用计算机技术将计算机辅助设计(CAD)技术、系统运动学和动力学、数值计算方法和有限元技术,以及计算机辅助工艺等现代先进设计制造技术结合在一个系统中,迅速高效地解决问题。利用计算机辅助设计建立产品几何结构模型,在计算机技术和专业技术的支撑下,进行虚拟仿真产品的运动学和动力学分析,在此基础上,采用有限元技术进行数值计算分析,验证产品的强度等性能需求,最后将分析的结果通过动画显示、图表等方式直观表达,这样设计者可以方便快捷地对模型进行修改,在同一模型上赋予各种物理特性,取代物理样机,实现产品功能、结构、制造和试验等全过程的仿真分析,由此将设计意图通过计算机实时地表现出来。王栋[58]指出,虚拟样机技术是基于先进建模/仿真技术、信息技术、先进设计制造技术和企业管理技术,并将这些技术应用于复杂产品全生命周期和全系统的设计,并对它们进行集成管理,因此与传统产品设计支撑技术相比,虚拟样机技术更强调系统的集成,集成的思想将覆盖产品整个生命周期,通过不同领域的虚拟化协同设计,实现对产品的全方位测试、分析与验证。随着虚拟样机技术的研究和应用,产品设计开发新模式“设计-虚拟样机-产品样机”逐渐替代了传统模式“设计-样机制造-试验分析”,这对于增强产品设计创新、提高产品设计质量、缩短生产周期和降低产品成本具有重要意义[59]。虚拟样机的应用主要针对大型复杂机械产品,如飞机、车辆和轮船等。最典型的实例为波音公司无纸化研发777飞机[60-61],整个设计过程全部运用虚拟样机技术,研制费用减少94%,模具设计精度提高10倍,研制周期缩短50%,更重要的是确保了产品一次制造成功。基于虚拟样机技术,德国宝马汽车公司(BMW)研究开发了在三维虚拟环境中的交互碰撞仿真系统,通过改变汽车物理参数(如几何、拓扑结构等),进行碰撞仿真分析,快速获得碰撞仿真结果,并实时对结果进行动态显示和分析[62-63]。德国大众汽车公司从1994年开始将虚拟样机技术成功用于新产品开发,开发过程中以实时交互的方式进行,以连续和逼真的方式获得产品的设计结果,明显地提高了产品的质量,缩短了产品的开发周期,产品的开发成本也大大降低[64]。国内在20世纪末开始了对虚拟样机技术的跟踪与研究,并取得了初步的研究进展。在21世纪之初,随着我国市场化机制的日渐成熟,产品在市场中的竞争更加激烈,对虚拟样机技术的需求明显增加,社会逐渐形成了这样一个共识,企业要提高产品竞争力,必须应用虚拟样机这一关键技术。清华大学依托985学科重大项目“轿车数字化工程”[65-67],在国内率先开展了虚拟样机技术的应用。随后,在武器装备[68]、航空发动机和机车车辆等复杂机械产品中也采用了虚拟样机技术,以提高产品的性价比[69-70]。可以预见,在国内复杂产品的设计制造行业中,虚拟样机技术必将成为设计、制造、试验和运行等阶段的技术分析与评价的重要手段之一。

3设计需求与发展趋势

上述每种设计理论都有其各自提出的背景和积极意义,并以解决其应用背景和特定范围内的设计问题为目标,侧重点不尽相同,并无简单的孰高孰低之分。一个好的设计理论应当能适合自身的时代、背景的需求和技术的支持(包括约束),同时集成现有设计方法的可取之处,运用相关领域的先进研究手段创造性地提出自身的解决方案,并且具备可操作的支持工具与相对完善的评价体系。针对复杂机械系统设计,笔者认为上述设计方法有待从以下几方面进一步完善。1)模块化设计:信息技术、先进制造技术等的不断发展,给产品模块化设计理论和应用研究提出了更多新的课题,融合、利用其他现代设计方法、制造和管理技术已成为现代模块化设计的特点,模块化设计是快速设计、产品族设计和可重构设计等设计理论的基础。但是,复杂机械产品系统内部模块间物理相互作用的非线性、过程之间的耦合性,将造成任何环节或过程出现问题都会导致产品的设计出现问题,因此,基于智能知识的用户需求和功能的整理是模块化设计研究的重点。2)参数化设计:经过几十年的发展,参数化技术在设计中应用越来越广泛,不仅极大地扩展了图形的修改模式,增强了设计的弹性空间,在产品设计的各个阶段,包括概念设计、结构设计、实体造型设计、装配与公差分析以及数值仿真、设计优化等,均显示出强大的生命力,发挥的作用越来越大。对于复杂机械产品,产品设计具有层次性、尺度间的耦合性和参数的模糊性,不可能通过零/部件尺度参数简单的放大与缩小来满足多用户环境的需求,因此,多学科、多参数优化设计是复杂产品设计的必然趋势。3)产品族设计:参数化产品族主要关注于产品设计变量取值的合理共享,是参数化和模块化设计的进一步延伸。复杂机械在结构设计上表现为递归性,即迭代性和反复性,一般需要借能仿真系统,因此,要获得具有平台常量和可调节变量集的数学模型。4)可重构设计:相对传统的设计方式,可重构设计方法较好地解决了继承性和创新性两个设计问题,具有显著的优越性。可重构设计在重用已有的各种设计资源和设计经验知识的基础上,实现了产品的创新设计,能够快速响应竞争激烈的市场多样化和个性化需求,符合未来的发展方向。但传统的可重构性设计的理论基础是独立公理设计理论,强调“设计的明智”和“过程的合理”,强调发散性思维带来的设计创新,而复杂结构机械系统的耦合性和模糊性,则很难满足这一条件。借助模糊集理论研究模糊可重构设计理论和方法是发展趋势之一。

4结语