多元统计分析范文
时间:2023-03-18 13:24:02
导语:如何才能写好一篇多元统计分析,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:盈利能力;运营能力;偿债能力;多元统计分析;财务分析
近些年来,随着经济的迅猛发展,无论是一个小企业,还是一个跨国大企业,甚至是一个国家,进行财务分析都是当前工作的重中之重。因此,将多元统计分析应用于财务分析中是很重要的。
1常用的评价指标
目前,我们对财务进行分析时主要有三个常用的指标——盈利能力、营运能力和偿债能力。但是这三个指标各有自己的优、缺点。1.1盈利能力盈利能力,也叫收益能力,指的是企业资金、资本的增值能力。简单地说,就是指企业的获利能力。盈利能力一般表现为:企业获得利润数额的多少以及获利水平的高低。这一指标是企业股东最为关注的。因为企业运营的主要目的就是盈利。如果经营者即将上线的一个项目的利润率很低或者很难盈利,那就要调整企业的经营中心,转变企业的生产目标,以扭转当前面临的不利局面。因此,这一指标是进行财务分析时最直观的一个指标。但是值得注意的一点是,盈利能力是在企业正常营业的情况下计算的。因此,在实际分析中,我们要排除一些非正常的营业情况。例如:重大意外事故、国家法律变更、国家财务制度变化等。
1.2偿债能力
偿债能力,顾名思义,指的是企业偿还债务的能力。这种债务包括短期债务和长期债务另种。企业有无偿还债务的能力,是判断一个企业可否继续生存、发展的关键。也是反映企业财务情况的一个直观指标。偿债能力分为静态和动态两种。静态指的是企业用固有资产清偿债务的能力。动态指的是企业用经营过程中的盈利来偿还债务的能力。所以在计算企业的偿债能力是必须以企业的可持续发展为基础。不然我们得到的只是企业清偿债务的能力。
1.3营运能力
营运能力,指的是企业运营的能力。简单地说,营运能力是指企业综合运用各种资产获取盈利的能力。它直观的反映了企业经营、管理资本的效率。企业资金运转周期越短,资金的流动性就越高,企业的偿债能力就越高,获利速度就越快。因此,营运能力在一定程度上决定企业的获利和偿债能力,是一个财务分析的核心部分。上述三个标准相互联系,又相互影响。单独使用哪一个,都有一定的偏颇,都不能充分展示企业整体的财务情况。因此,要综合运用这些指标,在财务分析中进行多元统计分析。
2多元统计分析的运用
多元统计分析,是在传统统计学基础上发展起来的一个重要分支。它实际上是一种综合分析方法。它可以在多个对象、多个指标相联系、纠缠的情况下,综合运用多种方式,分析多个指标,揭示它们之间深藏的统计规律。上文我们已经提到,营运能力在一定程度上决定企业的获利和偿债能力。由此可见,财务分析的各部分是相互联系的。因此,多元统计分析很适合应用于财务分析之中。多元统计分析在财务分析中的运用主要有几下几方面:
2.1选取样本、变量
分析企业的财务状况离不开建模,而建模的关键就是样本和变量的选取。一般而言,我们主要采取随机抽样、对应样本法两种方法进行选取。一份财务分析往往包括很多变量,例如:销售净利率、净资产收益率、总资产周转率等。这些变量越多,可供选择的余地就越大,建立的模型也就越好。
2.2判别分析
在建模过程中,要对样本和变量进行分析。这就需要运用多元统计分析的知识。我们一般采用Fisher线性判别函数进行判别分析。
2.3分析主要成分
分析主成分也是财务分析的一种常用方式。它的实现也主要依托于建模,但与上文提到的建模有明显的区别。在这种方式中,监测的指数、指标是有基本规定的。当变量过多时,对样本进行研究是很困难的。这时可以采用主成分分析法,使建模过程简单化。随着经济的发展,上到一个国家,下到一个小企业,财务分析都是很必要的。目前,我们常用的财务分析的指标主要有三个,分别是:盈利能力、偿债能力和营运能力。盈利能力主要体现企业的利润率;偿债能力主要体现企业偿还债务的能力;营运能力主要体现企业运用资本获取收益的能力。这三者各有优点,但又相互牵连。因此,我们可以借鉴多元统计分析的知识对财务进行进一步的分析。它可以帮助我们在建模的过程中更好的选择样本和变量,对这些样本和变量进行判别分析。如果变量过多,还可以采用主成分分析法,以简化建模过程。
作者:高雅 单位:沈阳师范大学
参考文献:
[1]李杰,王蔚佳,刘兴智.多元统计分析在企业财务危机预警中的应用[J].重庆建筑大学报,2004(5).
[2]薛薇.统计分析与SPSS的应用[M].北京:中国人民大学出版社,2001.
篇2
医用多元统计分析属于应用性的方法学科,课程性质要求学生在学习多元统计方法之后,要具备将各种多元统计分析方法应用到医疗卫生领域数据中的能力。培养学生的实践能力,仅从理论授课上下功夫提高学生实践能力是远远不够的,必须在理论授课、实验教学和课程考核等各个教学环节中都不脱离实践能力培养的主线。在理论课上讲授的内容一般包括原理方面的知识和如何分析实际数据两个方面。提高学生实践能力要求教学过程中淡化数学原理方面的知识,而将重点放置在如何分析实际数据上,即该多元统计分析方法使用的前提条件是什么,如何使用该方法以及分析结果如何解读,在具体研究的医学问题中此结果具有什么样的意义。尽管在现代教学方法中有体验式教学的渗入,但相对于实验课的实际体验来讲,学生对于数据何时采用、如何采用某种多元统计分析方法,还是保持在似乎知道,但又不完全明确的模糊阶段。很多原理方面的知识,尽管不是重点,但也需要学生了解一下,才能有助于把握整体脉络、合理应用,通过实验课的亲身体验,能直观观察到相对模糊的原理知识得到验证的过程,从而心服口服地从心底接受没有经过手工计算而呈现的分析结果。并且多元统计分析的实验课本身就是让学生去体验各多元统计分析方法怎样应用于实际数据的过程,从而使学生实践能力大大提高。一般课程考试比较侧重理论原理的考核,而医用多元统计分析授课的目的就是给学生讲授多元统计方法应用于医药卫生领域数据的实践过程,学习课程之后学生必须具备这种实践能力,否则就根本没有实现开设这门课程的初衷,没有达到教学目的。因此,课程考试也应侧重在学生实践能力的考核上。课程考核一般有试卷考核、平时实验成绩和上机考核三种形式,而以试卷考核的形式居多。对于医用多元统计分析课程,平时实验成绩考核和上机考核也应该是必须选择的考核形式,除此以外,在试卷考核中也可通过适当的题型体现对学生实践能力的考查。比如,将多元数据分析的结果展示在试卷上,让学生回答此分析结果对于研究目的反映出什么;或者指出研究目的,让学生回答选用何种多元统计分析方法,为何选用这种方法;或者从展现的结果让学生判断是否适用某种多元统计分析方法等多种题型来考查学生的实践能力。通过考核反馈出实践能力欠缺的部分,从而给予相应的应对措施。
2通过教学软件提高教学效率多元统计分析
建模一般都要经过逆矩阵、相关系数矩阵的计算,求解特征根与特征向量等过程,这些过程没有扎实的数学功底是根本不可能完成的。即便能完成这些运算,但也是相当耗时的过程。就运算相对简单的多元统计分析方法而言,如果采用人工计算器计算的话,也需要大约五个学时的时间才能完成,复杂的多元统计方法需要学时数就更多了。假定学校能够安排充分的学时数,学生也必须有足够的能力和耐心去完成这些运算。可见,统计软件和多元统计分析方法教学的结合是非常必要的。目前,常用的统计分析软件有SAS、SPSS和STATA。对于医学专业本科生和研究生的统计分析要求来讲,简单掌握每个软件基本功能就可以满足数据分析的需求,但对统计学专业的研究生而言,一般需要用到可编写程序的SAS软件,并且要深入学习,进行数据的模型拟合分析。各医学院校可根据自己的办学条件、师资力量、教材的情况、授课对象等因素综合考虑本院校采用医用多元统计分析的软件。借助软件在很短的时间能完成模型的建立、模型拟合检验等分析过程,通过分析结果中呈现的模型建立中间步骤,了解矩阵运算,求解特征根与特征向量的信息,把握前因后果、各步骤间的相互关系,大量时间的节余可用在多元统计分析方法的专业应用上。
3通过适宜教材激发学习兴趣多元统计分析
原理部分的繁琐复杂性对该课程的学习形成很大阻碍,且原理部分又不是医学专业学生学习的重点,这提示了教材选择的重要性。合适的教材不应该花费很大的篇幅在理论推导和模型建立的过程上,否则只会增加学生对该课程的畏惧心理。教材应当侧重于多元统计方法的应用部分,应用部分和学生专业的相关性越强,就越容易激发学生学习兴趣。上文中提到学习医用多元统计分析教学要结合统计分析软件,因此,教材中最好在每个多元统计方法的介绍之后都安排一个章节,说明这种多元统计方法通过统计分析软件如何实现,以及软件运行结果如何解读。医学各专业学生一般都未经过系统的统计软件的学习,因此,教材中软件相关内容的安排就尤其重要,不仅要有这样的章节,而且要通俗易懂,适合医学专业学生的初次统计软件学习,在每一种多元分析方法数据集的录入、软件实现的步骤、一些常用选择项的介绍、软件运行结果的每个部分的解读以及结合专业知识后的结论等各个方面都要有详尽的解释。医学可以划分成很多不同的专业,如公共卫生、医药和临床专业等,就公共卫生专业又可以进一步详细划分成劳动卫生、儿少卫生和营养等专业。目前的医用多元统计分析教材没有具体针对各个专业的多元统计分析教材,能选择到和医学专业接近的教材充其量也就是医用多元分析的教材了,因此,通过教材提高学习的积极性还是存在一定的局限性,但这种局限可以通过案例教学来弥补。在授课过程中,授课教师可能通过案例式教学,选择和授课学生专业休戚相关的例子来进行讲解,就格外能吸引学生的注意力。
4通过教学设计引导学生主动学习多媒体技术
在教学中的应用极大优化了教学过程。随着多媒体技术的发展,教学过程中“传统的PPT教学”逐渐形成新的多媒体教学形式——微课件。微课件是指使用多媒体技术在五分钟内就一个知识点进行针对性讲解的一段视频或音频。基于教学设计,微课件可用于难点讲解、内容小结等各个环节。如在教学导入阶段,教师根据新课知识点设计新颖的问题,通过简短的视频的形式展现。微课件以视频的形式吸引学生的注意力的同时,将教学问题引入,让学生带着问题去听完一堂课,从而起到引导学生主动学习、增强听课效果的作用。布置课后作业也是一种很好的引导学生主动学习的途径。以往教学中教师一般也布置作业,但布置的作业大多是多元分析方法基本思想和原则之类的思考题。笔者在教学实践中,将课后布置作业题目设定为“收集适用本次理论课医用多元分析方法的自己专业相关数据,并预计数据分析后可能的结果”。学生在收集数据的过程中,就必须去主动思考这种多元统计分析方法的基本思想、适用原则等问题,并且会进一步产生通过软件分析此数据的欲望。在实习课上,除了教师规定的实习题目之外,学生一般都会主动完成自己专业数据的分析,和教师探讨此数据分析的结果和对专业的指导意义。
5总结
篇3
【关键词】SPSS软件 多元统计分析 实验
【中图分类号】G30-03 【文献标识码】A 【文章编号】1674-4810(2012)21-0093-01
一 前言
“概率论与数理统计”是大学数学本科阶段课程设置中的一门课程,主要讲述一元随机变量的统计规律,但在社会生活及自然现象中,有很多现象需要同时观察多项指标,如研究一个地区经济发展的情况,就需要考虑当地的物价、信贷、税收、总产值、利润、固定资产、流动资金等,每一项指标都可看成一随机变量,如果只对某一项指标进行研究,结果可能是不准确的,因为各个指标之间是有联系的,可能存在相关性,单独分析某一个变量,可能丢失部分固有的信息,因而需要对多个指标(变量)进行整体研究,以发现其内部规律,“多元统计分析”就是研究多个变量相互关系及内在统计规律的一门学科,它起源于1928年Wishart发表的论文《多元正态总体样本协差阵的精确分布》,20世纪40年代,在心理、教育方面有一定的应用,但由于其计算量太大,发展受到一定的制约,到了20世纪50年代,由于电子计算机的发展,“多元统计分析”的方法才在社会各行各业得到迅猛发展,目前其研究工作已取得显著成绩,作为数学专业的学生,掌握该门课程的理论及实验(软件的应用)显得非常必要,但怎样使理论和实验教学并举呢,我们有必要对此问题做进一步的探讨。
二 Spss软件简介
Spss是Statistical Package for the social sciences的缩写,意思是社会统计软件包,是世界上最早的统计软件,由美国斯坦福大学三位研究生研制。如今,Spss已在银行、证劵、保险、教育教学、科研市场调查研究、商业、医疗、通讯等多个领域得到广泛的应用,更为有趣的是,在国际学术交流中,有不成文的规定,凡是用Spss软件做出的计算结果,可以不必说明算法,由此可见其影响和信誉都是非常高的。Spss的基本功能和特点是数据管理、统计分析、图表分析、输出管理等。另外,Spss还具有操作界面友好,输出结果美观且清晰直观的特点。
三 多元统计中Spss软件的辅助作用
1.实验设备
一般情况下,Spss运算的数据量非常庞大,因此对用户的计算机操作系统、CPU、内存、显卡、磁盘空间等做了最基本的要求,例如:操作系统要求为Windows98或者WindowsXP(2003)等;CPU要求为Premium 133MHz;内存要求为128MB……
2.教学内容和实验的安排
在本科低年级,学生已经掌握计算机基础及数据库技术,因此对Spss的教学以自学为主,讲解为辅,提供网上教学网址,督促学生在一段时间内必须自学的内容,辅以作业进行自学效果的测试,作业形式与多元统计分析的教学内容一致。因而,我们只需要掌握多元统计分析的基本原理、方法,了解其计算过程,应用Spss,就可以节省计算所花费的大量时间,把更多的时间、精力用于统计原理的学习和研究。
四 实验
在研究具体问题时,面临的是一些杂乱无章的情景或杂乱无章的数据,我们的任务是从这些杂乱无章的数据中发现规律。首先是对杂乱无章的情景进行资料量化处理,如对学习的态度是端正或不端正,要使其量化才能用统计软件进行分析,因此需要对资料进行编码。当资料实现量化后,就可以在Spss中录入数据,进行计算了。
在教学过程中,提供一个实际问题,如研究影响学生学习成绩的主要因素是什么?要求学生自己设计问卷调查,这样学生就必须学会查阅资料,进行实验设计,然后还需要认真思考,具体地去实施,得到实验结果所需要的数据,再整理这些资料、数据。录入Spss进行计算,看懂分析结果,得到答案,形成自己的研究报告。
通过合理安排实验与理论教学,学以致用,教学目的也就达到了。
参考文献
[1]张立军、任华英.多元统计分析实验[M].北京:中国统计出版社,2009
[2]于秀林、任雪松.多元统计分析[M].北京:中国统计出版社,1999
[3]刘宝权、席仲恩.Spss在英语试卷统计分析中的应用[J].外语电化教学,2004(2)
篇4
【中图分类号】R2-0【文献标识码】A【文章编号】1007-8517(2010)08-021-1
多元统计分析是数理统计学多年来迅速发展起来的一个分支,已广泛应用到各个领域。该方法能够在不损失信息的情况下,通过变换和构造模型,剔除指标间相互制约的成分,使复杂数据简单化[1-4]。在中药研究中,过去传统的鉴定技术有一定的局限性[5]。因此,为了更准确全面地反应出它的特征,就应考虑到与其有关的多方面的因素,进行综合分析和评价。
多元统计分析包括多元回归、主成分分析、因子分析和聚类分析等方法。利用这些方法可以进行中药材质量与生态环境的相关性分析、筛选影响中药材质量的生态主导因子和限制因子、研究影响中药材质量的综合作用及动态变化规律等方面的问题[4]。
多元回归分析已经被广泛地应用于研究环境因素对中药生长的影响及研究作物稳定性,对不同生境与银杏叶黄酮积累的关系的分析[6]以及对盾叶薯蓣皂素含量与气候生态因子的关系分析[7]就应用了这种分析方法。
主成分分析应用于南苍术挥发油[8]分析、山药的道地性分析[9]、不同种类石斛的相关性研究[10]等,为建立一种客观的中药质量评价手段提供参考。
应用因子分析对105味植物类中药所含有的15种稀土元素[11]进行研究,为正确收购及选拔优质药材提供资料,道地性鉴别提供新的思路和方法。
采用聚类分析方法进行枸杞[12]、关黄柏[13]、延胡索[14]、黄芪[15]等中药的研究,微量元素或特征性成分含量与中药药性的相关性研究[16],正品和非正品黄芩[17]、不同产地枸杞[18]、黄精属17种药用植物[19]等的对比研究,均表明聚类分析可用于辅助鉴别中药的正品和伪品,探讨中药各类群间的系统亲缘关系,评价中药材的来源等。
综上所述,多元回归、主成分分析、因子分析和聚类分析已经被广泛地应用于中药研究中。但中药资源种类多、基源复杂、分布广、成分变化,药材质量良莠不齐,导致中药研究受很多因素的影响,使用单一的某种数理统计方法难以对中药材做出合理的评价,必须根据需要,合理配合上述几种统计方法一起使用,对赤芍[20]、武汉市水生态系统[21]分析均是几种方法综合应用的结果。
多变量统计分析方法在鉴定中药的真伪和质量优劣、影响中药材生长发育和品质形成的生态主导因子、限制因子以及这些生态因子的动态变化规律等方面已经取得了可喜的进展。将多变量统计分析结合中药的特殊性和中药的特色[22],运用现代的spss等分析软件研究影响中药材的生态环境因素、对中药材复杂成分进行分析,将成为中药分析研究的发展趋势。
参考文献
[1] 左瑞琼.多元统计分析方法介绍及在经济中的应用[J].时代经贸,2007,
5(78):23.
[2] RichardA.Johnson,DeanW.Wichem.实用多元统计分析[M].北京:清华大学出版社,2003:347.
[3] 林和平,杨晨.模糊主成分分析方法的研究与分析[J].航空计算技术,2006,36(6):16.
[4] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2004:135.
[5] 陈月娥,姚小华.中药鉴定新技术的发展概况[J].广州中医药大学学报,
2007,24(4):346.
[6] 孙视,刘晚苟.生态条件对银杏叶黄酮积累的影响[J].植物资源与环境,1998,7(3):1.
[7] 怀志萍,丁志遵,贺善安,等.盾叶薯蓣皂苷元含量与气候因素的相关性研究[J].药学学报,1989,24(9):702.
[8] 郭兰萍,刘俊英,吉力,等.茅苍术道地药材的挥发油组成特征分析[J].中国中药杂志,2002,27(11):814.
[9] 徐永群,孙素琴,袁子民,等.红外光谱结合主成分分析鉴别道地山药[J].分析化学,2002,30(10):1231.
[10] 吕献康,程存归,杨国平,等.11种石斛植物的FTIR直接测定和主成分分析[J].中国中药杂志,2005,30(10):768.
[11] 祁俊生,徐辉碧.稀土元素与中药药性关系研究[J].计算与应用化学,2000,17(1):181.
[12] 常璇,胡奇林.用聚类分析方法对宁夏中宁县和平罗县枸杞中6种元素综合指标的比较研究[J].宁夏大学学报(自然科学版),2006,27(3):248.
[13] 张水寒,郭伟伟,蔡光先.I-IPLC指纹图谱结合系统聚类法对不同产地关黄柏药材的分析研究[J].科技导报,2006,24(9):53.
[14] 成则丰,李丹婷,李花琼,等.FIIR聚类分析结合差热分析法应用于中药延胡索表征的研究[J].理化检验化学分册,2006,42(8):601.
[15] 沈文英,陈铭华.不同产地黄芪的聚类分析[J].广东微量元素科学,1999,6(10):49.
[16] 祁俊生,徐辉碧.植物类中药中微量元素的因子分析和聚类分析[J].分析化学,1998,26(11):1309.
[17] 苏薇薇.聚类分析法在黄芩鉴别分类中的应用[J].中国中药杂志,1991,
16(10):579.
[18] 周群,孙素琴,梁曦云,等.枸杞产地的红外指纹图谱与聚类分析法研究[J].光谱学与光谱分析,2003,23(3):509.
[19] 林琳,林寿全.黄精属药用植物聚类分析[J].中药材,1994,17(6):12.
[20] 徐永群,黄吴,周群,等.红外指纹图谱和聚类分析法在赤芍产域分类鉴别中的应用[J].分析化学,2003,31(1):5.
篇5
摘 要:该文以安徽省上市公司财务数据作为研究对象,依据国内外已有的分析研究结果,辅之主成分分析方法确定股票市场投资价值评价指标体系,通过运用多元统计分析方法,对其综合实力进行排名,实证结果显示三七互娱的综合实力位居榜首。
关键词:多元统计分析 Spss 股票价值
中图分类号:F832.51 文献标识码:A 文章编号:1672-3791(2016)07(a)-0076-02
证券投资是狭义概念上的投资,是投资者通过购买有价的证券,以获得收益的行为,从中获取利息或差价,是一种直接形式的投资行为。多元统计分析所研究的内容和方法主要包括数据化简、分类和分组、研究变量间的依赖关系和多元数据的统计推断。随着电子计算机的出现和发展,多元统计分析便开始在医学、经济学、文学、气象等方面得到广泛的应用。
选取安徽省上市公司进行分析,原有89只股票,剔除了数据不可得和特殊处理的股票,最后得到有效股票70只分别用 ,来代替。首先,经过主成分分析筛选最终确定净资产收益率、每股收益、每股主营业务收入、应收账款周转率、存货周转率、流动资产周转率、主营业务收入增长率、净利润增长率、净资产增长率、速动比率、利息支付倍数、资产负债率、现金流量比率。用,表示。
70家上市公司13个财务指标组成的矩阵的特征值以及累积贡献率情况参见表1。通过观察表,人们发现一共有5个特征值大于1。它们共同解释了安徽省上市公司综合业绩标准差的77.66%(累计贡献率)。说明这5个公共因子基本上能够代表原始数据包含的大部分信息。
由于因子载荷矩阵得到的未旋转的公共因子的实际意义不好解释,因此,对公共因子进行方差最大化正交旋转(Varimax),得到旋转后的因子载荷矩阵。令成长因子为,营运因子为,盈利因子为,偿债因子为,现金因子为,原变量可由各因子表示为:
其余变量依次类推。计算各因子的方差贡献率占5个因子总方差贡献率的比重,5个因子的比重分别为:29.33%、20.567%、20.13%、17.80%、12.17%。由此可以看出,成长能力因子的比重最大,现金能力因子的比重最小。最后,以各因子的方差贡献率占5个因子总方差贡献率的比重作为权重进行加权汇总,得出综合得分F,即
在财务绩效的得分中,因子得分的正、负代表该公司的财务绩效与新疆地区平均水平的位置关系,把安徽的平均水平算作零点,这是数据标准化处理后的结果,不会影响可比性。
综合排名表明了其财务的整体绩效,整体财务绩效好的公司并不是其财务绩效的各个方面都表现较好。如排在首位的三七互娱,发展能力排名第一;营运能力排名靠前,盈利能力、偿债能力和现金能力排名却是排在后面。说明三七互娱目前发展良好,企业扩大规模;壮大实力的潜力强劲,但资产管理效率低下,企业应加强各项资产的管理和提高经济效益。通过上面分析可以全面反映上市公司的成长性和盈利能力,有利于缩小投资范围,确定投资价值,降低投资风险。文章的分析方法对指导证券投资提供了一条有效的途径。
参考文献
[1] 丁浩.数据挖掘技术在证券分析中的应用研究[D].武汉理工大学,2008.
[2] 马跃.基于因子分析和投资组合理论的股票投资分析[J].市场观察,2015(A1):318.
篇6
[关键词]上市银行;聚类分析;判别分析;主成分分析
1数据来源及模型假设
文章选取 16 家上市银行为研究对象,对其2016年第三季度财务报表进行整理分析,获得所需数据。为了便于解决和研究问题,提出以下几条假设:①假设16 家上市银行的年报真实可信;②假设上市银行在编制年报时使用会计记账方式等一致;③假设设置的变量取值都有实际意义且数据记录准确规范。
2数据指标的构建
文章从公司规模、盈利能力、偿还能力、成长能力、营运能力五个方面选取19个量化指标,分别为基本每股收益、主营业务收入、主营业务利润、营业利润、投资收益、利润总额、净利润、经营活动产生的现金流量净额、总资产、总负债、股东权益(不含少数股东权益)、净资产收益率加权、净资产收益率、净资产报酬率、非主营比重、净利润增长率、资产的经营现金流量回报率、经营现金净流量与净利润比率、经营现金净流量对负债比率。
3聚类分析
31变量分类
第一类中的五个指标是对银行收益进行刻画的指标:第二类中的八个指标是对利润、资产、负债和所有者权益的表现;第三类的两个指标是对银行其他业务的收入的刻画;第四类的四个指标是对银行现金流量的反映。
32样品分类
通过最远邻元素、Ward法和K-均值聚类法三种分类结果比较,民生银行、南京银行、宁波银行分类结果不一致,因而采用判别分析继续研究。
4判别分析
判别分析选用方法:贝叶斯判别。根据分类函数系数表可以得出三组判别函数的表达式。
将各银行数据进行回判结果如下。
回判结果表明:总的回代判对率为100%。待判银行:民生银行、南京银行、宁波银行,其判别结果如下:
民生银行、南京银行属于第二类,宁波银行属于第一类。
5主成分分析
51主成分分析过程
(1)将原始数据标准化。
(2)建立变量的相关系数阵。
(3)求相关系数阵的特征根和相应的单位特征向量。
(4)主成分函数。
在第一主成分表达式中,主营业务收入、主营业务利润、营业利润、利润总额、净利润、总资产、总负债、股东权益(不含少数股东权益)的系数较大,这八个指标起主要作用,可以把第一主成分看作收入、利润、资产、负债、所有者权益的银行总体规模的综合指标。同理,可以把第二主成分看作银行营运能力的指标,把第三主成分看作利润成长能力的指标,把第四主成分看作非主营业务收入能力的指标。
52样品主成分得分结果
综合排名前四名是建设银行、工商银行、农业银行和中国银行,对应聚类分析结果的第三类。国有的四大银行在总体规模、营运能力、利润成长能力、非主营收入能力四方面的综合能力都有着显著的优势。
在y行总体规模方面,四大国有银行的总体规模比较是:工商银行>建设银行>农业银行>中国银行。在银行营运能力方面,建设银行>农业银行>工商银行>中国银行,说明建设银行和农业银行的运转出色。在利润成长能力方面,建设银行>工商银行>农业银行>中国银行,建设银行实现了较高的利润水平。在非主营收入能力方面,中国银行>建设银行>农业银行>工商银行,中国银行和建设银行优化了收入结构,中间业务收入占总收入的比重加大,拓宽了利润空间。
综合排名在第五名到第十一名的银行均是在2016年第三季度业绩优良的商业银行。利用同样的分析方法得出:在银行总体规模方面,民生银行与交通银行的总体实力较强。在银行营运能力方面,民生银行与宁波银行的营运能力较好。在利润成长能力方面,招商银行与浦发银行的利润成长能力较强。在非主营收入方面,民生银行与宁波银行的中间收入较高,突破了传统收入的局限,拓宽了利润渠道。总体来讲,这七家银行各有各的优势,也各有各的不足,水平相当。
剩余五家银行:平安银行、华夏银行、北京银行、南京银行、光大银行总体业绩较差,总体规模较小,营运能力较差,没有自己突出的优势,因此整体业绩落后于其他银行。
篇7
关键词:主成分分析;累计贡献率;卫Ⅷ项目
中图分类号:94 文献标识码:A1概述
近几年来,医疗问题一直是媒介探讨的热点,因为医疗涉及民生,是老百姓所最为关心的切实问题,尤其是对于广大的中国农村来说。农村人民看病难,看病贵,最主要的原因在于医疗卫生条件差,特别是农村贫困地区的基本卫生服务。中国农村贫困地区基本卫生服务关系到广大贫困人口的生命健康,改善农村贫困地区卫生服务提供能力和提高卫生服务利用水平,保证当地居a民获得基本医疗卫生保健服务,是国家医疗改革的基础,也是重点项目。而所有这些改善必须对农村现有医疗水平条件进行充分的统计、分析、论证,形成标准,才能进行具体的改革措施。本文选用了河南省的十个贫困县:固始县、南召县、宁陵县、商城县、嵩县、台前县、息县县、淅川县、伊川县和宜阳县。对各县的各项卫生服务指标进行综合评价、监督,以此为农村的医疗条件健康改善的可持续性发展策略提供依据。由于该项研究所涉监督评价指标多达23个,一般的方法分析起来比较复杂,且不够清晰,所以本文利用主成分分析方法,对2010年河南省十个项目县的有关监督评价指标进行综合分析。
2 项目县的各项卫生服务条件的主成分分析
2.1 项目县的各项卫生服务指标及变量表示
项目县的各项卫生服务指标及变量表示如表1:
2.2 用SAS软件求23个变量X1-X23的相关系数阵
用SAS软件求23个变量X1-X23的相关系数阵,结果如表2:
2.3 特征值柱形图及说明
用SAS软件对23个变量X1-X23的相关系数阵做主成分分析,得到九个特征值、积累贡献率如下:
从上面的图和表中可以看出:前三个主成分的积累贡献率已达74%,前五个主成分的积累贡献率已达89%,前三个、五个主成分分别提取了原信息的百分之七十四、百分之八十九的信息,因此,可以分别用三个、五个主成分指标对十个项目县的各项卫生服务状况进行排序和评价。
2.4 按前三个主成分得分将十个项目县排序
2.4.1 九个特征值对应的九个单位特征向量如表4:
2.4.2 前三个主成分分别为:
Z1=0.142496x1+0.088717x2-0.022254x3-0.132704x4-0.056289x5-0.121313x6+0.199755x7+0.244042x8+0.253440x9+0.277611x10+0.262456x11+0.293805x12+0.321268x13+0.315522x14+0.266463x15-0.001035x16+0.293805x17+0.288888x18+0.157569x19-0.120195x20-.138887x21+0.007701x22+0.194162x23
Z2=0.103055x1+0.123117x2+0.418256x3+0.383862x4+0.408780x5+0.356531x6-0.079160x7+0.007741x8-0.004320x9+0.157139x10+0.090258x11+0.030071x12-0.048633x13-0.029880x14+0.012669x15+0.165422x16+0.030071x17+0.067026x18+0.213974x19-0.306342x20+0.152238x21-0.337493x22-0.068864x23
Z3=0.442950x1+0.485939x2+0.011525x3-0.009673x4+0.105397x5-0.106250x6+0.064607x7+0.191700x8-0.292611x9+0.186519x10-0.201969x11-0.240587x12+0.089550x13+0.126841x14+0.114173x15+0.006817x16-0.240587x17-0.191868x18+0.141740x19+0.086677x20-0.176106x21+0.232383x22-0.201305x23
其中x1,x2,…,x23是标准化后的数据。
2.4.3前三个主成分得分:(表5)
表5:前三个主成分得分表6:按前三个主成分综合得分的排序结果
2.4.4按前三个主成分综合得分的排序(表6)
2.5按前五个主成分得分将十个项目县排序
2.5.1第四、第五主成分分别为:
Z4=0.114497x1-0.116340x2-0.089872x3-0.087571x4-0.005349x5+0.232200x6+0.381680x7+0.400498x8-0.292611x9-0.078958x10-0.036921x11+0.064448x12+0.033396x13+0.015480x14-0.194447x15+0.539327x16-0.064448x17+0.060082x18-0.233232x19+0.303830x20+0.136652x21-0.187477x22-0.020050x23
Z5=0.295989x1-0.061444x2+0.008347x3-0.045274x4-0.120288x5-0.078114x6+0.326381x7-0.118721x8+0.102858x9+0.045083x10-0.045521x11-0.10002012+0.034516x13-0.012080x14-0.358669x15-0.080845x16-0.100020x17-0.172009x18+0.271956x19-0.197948x20+0.518829x21+0.120428x220+0.409487x23
其中x1,x2,…,x23是标准化后的数据。
2.5.2前五个主成分得分(表7)
2.5.3按前五个主成分综合得分的排序(表8)
总结
在第一主成分的表达式中第十二,十三,十四,十七项指标的系数较大,这四个指标起主要作用,我们可以把第一主成分看成是由县卫生局认可与县级机构建立有效转诊、县卫生局认可与县级机构建立督导制度、使用标准临床规范、使用基本药物目录的综合指标。因此,第一主成分主要反映了各个县的医疗卫生制度实施状况,该主成分的得分越高,说明该县的医疗卫生制度实施状况越好。因此通过对第一主成分的排序可以很直观的看出各县的医疗卫生制度实施情况好坏。
在第二主成分的表达式中第三,四,五,六项指标的系数较大,这四个指标起主要作用,我们可以把第二主成分看成是乡卫生院出院病人数和床位使用率(%)的综合指标。因此,第二主成分主要提取的是乡卫生院的治愈率和就诊率的信息,该主成分的得分情况反映了基层医院的医疗水平状况。
在第三主成分中,第一,第二项指数影响较大,远超过其他指标,可看成是乡卫生院门急诊人次数的影响。因此该主成分的得分反映的基层人民的就诊能力状况。
在第四主成分中,第七、第八、第十六项指标的系数较大,可看成是乡卫生院平均每名卫技人员日门急诊人次数、符合国家X线防护要求的综合指标。
在第五主成分中,第二十一、第二十三项指标的系数较大,可看成是非住院分娩新法接生率、特困人口救助注册人数占农业人口的比例的综合指标。
参考文献
[1]何晓群.多元统计分析[M].北京:中国人民大学出版社,2004年4月.
[2]王学民.应用多元统计分析(第二版)[M].上海:上海财经大学出版社,2004年1月.
[3]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005年1月.
[4]乔峰,姚俭.时序全局主成分分析在经济发展动态描绘中的应用[M].北京:北京科技大学学报,2003年10月.
篇8
【关键词】城市交通运输;逐步线性回归;系统聚类分析
1.引言
城市作为政治、经济、文化中心,在国家发展中发挥着重要作用。20世纪80年代开始,学者开展了一系列对中国城市的研究,如提出中国的城市影响域系统,并评价中国城市的影响力。根据因子分析方法,对中国城市进行综合实力的评价,建立综合评价体系,分析中国地级以上城市综合竞争力,以及中国城市人口可比增长速度的空间差异。根据城市网络图探讨新城在城市网络中的作用以及城市网络对新城发展的影响;运用层次分析和多指标加权法对中国城市科教职能进行等级划分及空间分布研究。
国外关于城市交通运输的研究集中在城市交通运输与城市空间、居民出行、城市交通问题及其相关政策等方面,区域中的城市交通运输研究主要是城际问的客货流变化等问题,以及城市交通运输结构变化引发的交通运输问题,例如对尼日利亚、捷克斯洛伐克、印度、巴西、英国等国家的研究;Sylvie选取中国24个省区为基本分析单元,以铁路、公路和水运路网的密度为指标,研究中国省际交通网络发展水平的差异,结果表明交通网络密度较高的省份集中于东部沿海地区,西部地区则较低上述分析基本上是以城市的总体发展或者以人口和土地等要素为主来进行的,在分析中也涉及到了城市交通运输的一些方面。
本文研究的城市交通运输既包括城市对外交通运输发展,也包括城市内部交通运输发展两个部分。城市交通运输发展水平主要表现为城市交通设施的发展和运输能力,主要包括道路面积和车辆、客运量和货运量等。本文在总结上述研究经验的基础上,主要根据城市在城市体系、区域及国家发展中的重要性,资料信息的完备性、可比性及其获取的可能性,确定以2010年的279个地级以上城市的城市交通运输为研究对象和评价目标。
2.指标选取
在前人研究的基础上,本文将影响城市交通运输的因素归结为:货运总量、客运总量、城市GDP、城市产业结构、城市人口、城市道路面积、城市汽(电)车营运数量、城市出租车数量等。鉴于数据获取的有限性和分析的可靠性,本文选取客运总量、货运总量、城市GDP、城市产业结构中的第二产业占GDP中的比重以及第三产业占GDP中的比重、城市人口、城市道路面积、城市汽(电)车营运数量和城市出租车数量9个指标作为研究城市交通运输的影响因素。
(1)客运、货运总量
客运和货运总量是衡量一个城市对内对外交通运输发展的总量指标,通过这个指标可以得出一个城市的城市交通运输发展状况,它包括城市铁路运输量、公路运输量、水路运输量、航空运输量等。
(2)城市GDP
即城市市辖区内年生产总值,是衡量一个城市经济发展水平的最重要指标,GDP总量大意味着经济发展水平高。
(3)城市产业结构
城市社会再生产过程中形成的各产业之间及其内部各行业之间的比例关系和结合状况,由于各个城市的自然条件和社会经济条件不同,引起国民经济部门配置和发展规模不同,因而不同城市的转出产业的差别较大。就城市本身而言,第二产业占GDP的比重越高表明城市工业和制造业越发达;而第三产业占GDP的比重越高表明城市服务水平越高。
(4)城市人口
衡量一个城市社会发展水平的指标,一般情况下城市人口越多,表明这个城市对于人口的吸引力越强,城市的社会发展水平越高。
(5)城市道路面积
城市道路面积对一个城市来说极其重要,是衡量一个城市发展的重要指标。
(6)城市汽(电)车营运数量
城市汽(电)车是城市居民主要的出行交通工具,是城市公共交通最主要的衡量指标。
(7)城市出租车数量
城市车租车也是城市居民较为主要的出行交通工具,但其价格比汽(电)车昂贵。城市出租车数量也是城市公共交通最主要的衡量指标。
将以上指标假设如表1。
本文研究分析我国地级以上281个城市2010年城市交通运输的多元回归分析和系统聚类分析,其数据来源于2011年《中国统计城市统计年鉴》。
3.城市交通运输多元回归分析
城市交通运输发展水平与城市经济发展、城市社会发展以及城市交通基础设施规模是否存在线性关系,下面分别通过逐步回归的方法建立城市客运总量与假设的其余指标之间的线性函数,城市货运总量与假设的其余指标之间的线性函数,旨在通过建立函数揭示城市交通运输发展的影响因素和预测未来城市交通运输的发展趋势。
3.1 以城市客运总量为因变量的逐步回归分析
将客运总量与GDP(当年价格万元)、第二产业占GDP中的比重(市辖区)、第三产业占GDP中的比重(市辖区)、城市市辖区人口(万人)、城市道路面积(万平方米)、城市公共汽(电)车营运数量(量)和城市出租车数量(量)输入统计软件SPSS中,以客运总量为因变量,其他的为自变量,得出如下表2结果:
注:逐步回归进入的自变量为X8, X9, X9, X3, X7;因变量为X1
篇9
Abstract: According to the university scientific research data in nearly ten years, the factor analysis and cluster analysis statistical methods in the multivariate statistical analysis are used to carry out the comprehensive evaluation analysis of the college scientific research status and put forward a method for evaluating the state of the research. Research shows that, in some colleges, the first factor is very high, indicating that these colleges in cutting-edge academic research achievements. But at the same time, the third factor is low, indicating that these colleges and enterprises to contact the lack of scientific research. In other colleges, the second factor is very high, indicating that these colleges in the per capita contribution rate, C class paper per capita contribution rate and other aspects to do better. In addition, some of the college's third factor is very high, indicating that these colleges are closely related to the enterprise's scientific research and cooperation. The results of the subsequent cluster analysis also confirmed the rationality of the conclusion of the comprehensive evaluation analysis. Through the study of this paper, it provides a theoretical basis for the scientific management system and evaluation system of scientific research achievements.
关键词: 高校;科研状况;因子分析;聚类分析;评价
Key words: colleges and universities;research status;factor analysis;cluster analysis;evaluate
中图分类号:G463 文献标识码:A 文章编号:1006-4311(2016)31-0015-04
0 引言
科研能力是衡量一所高校科教水平的重要标志。某高校作为省重点高校有着悠久的办学历史,科研水平在省内也是名列前茅,本文针对该高校20个学院的各项科研指标进行多元统计分析,建立了描述科研水平的各类变量,包括各类科研项目的经费总额、各类论文的发表数量、论著发表数量,投入科研人员数量等。但由于各学院规模不一,各学院科研性质也不尽相同,为了保证研究结果的平衡性,本文采用对科研成果人均贡献率的方式进行研究。然而进行统计分析时,并非变量收集的越多越有利,变量间信息的高度相关、高度重叠会给统计方法的应用带来许多困难,因此本文借助SPSS统计分析软件,采用因子分析方法,在众多变量中提取影响各学院科研状况的主要因子对问题进行分析,最后通过因子变量的聚类分析对评价结果进行验证。国内学者目前主要集中对我国体育事业进行科研状况分析,如贾志强、郑岩平对我国1995-2000年篮球科研状况作了分析。张金、夏秀荣对我国1994-2003年排球科研状况作了分析。在高校科研状况分析方面,孟学英、陈春华利用调查问卷方式对我国部分高职院校教师科研状况做了调查分析。同时国内对多元统计方法的应用也主要集中在医疗、经济方面,如孟莹、谢守祥等利用多元统计分析方法对江苏省经济差异化做了分析。王曦、宋剑南利用多元统计分析方法对影响中医症候的主要因素做了研究。利用多元统计分析方法结合高效科研状况评价分析还鲜有研究。本文结合多元统计分析分析方法对某高校科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。
1 因子分析方法简介
因子分析是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量之间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究问题的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。进行因子分析的步骤如下:①根据研究问题选取原始变量。②对原始变量进行标准化并求其相关阵,分析变量之间的相关性。③求解初始公共因子及因子载荷矩阵。④因子旋转。⑤因子得分。⑥根据因子得分值进行进一步分析。
2 各学院科研状况的因子分析
2.1 数据分析和指标选取
本文选用的数据来源于某高校2006年至2015年的统计数据。设定数据中8个指标变量分别是X1:2006-2015年横向项目金额人均贡献率(万元/人);X2:2006-2015年市校级项目金额人均贡献率(万元/人);X3:2006-2015年省部级项目金额人均贡献率(万元/人);X4:2006-2015年国家级项目金额人均贡献率(万元/人);X5:A类论文人均贡献率(篇/人);X6:B类论文人均贡献率(篇/人);X7:C类论文人均贡献率(篇/人);X8:论著数量人均贡献率(项/人)。数据详情见表1。
在进行数据分析前,进行KMO检验,P值为0.000,检验结果是显著的,同时KMO值达到0.577,结果见表2,表明数据之间具有一定的相关性,可进行因子分析。
从表3变量共同度表中可以看出因子分析的变量共同度均较高,表明变量中的大部分信息均被因子所提取,说明因子分析的结果是有效的。
2.2 因子提取和因子解释
现应用主成分分析法来进行因子提取和因子个数的确定,从表4中可以看出只有前三个因子特征根大于1,并且前三个因子特征值之和接近80%,故提取前三个因子基本包含了全部测评指标的绝大部分信息,因子分析效果较理想。
由于初始载荷阵结构不够清晰,不便于对因子进行解释,因此对因子载荷矩阵实行旋转,达到简化结构的目的,使各变量在某些因子上有较高载荷,而在其余因子上只有小到中等的载荷。这里采用方差最大正交旋转法进行因子旋转。结果见表5。
从旋转后的因子载荷矩阵来看,第一个主因子在省部级项目金额人均贡献率、国家级项目金额人均贡献率、A类论文人均贡献率、B类论文人均贡献率上具有较高载荷,第二个主因子在C类论文人均贡献率、论著数量人均贡献率上具有较高载荷,第三个主因子在横向项目金额人均贡献率、市校级项目金额人均贡献率上具有较高载荷。
2.3 因子得分和因子变量
本文采用回归法估计因子得分系数,并输出因子得分系数矩阵见表6。
根据表6可写出以下因子得分函数:F1=-0.014横向项目金额人均贡献率-0.078市校级项目金额人均贡献率+0.263省部级项目金额人均贡献率+0.293国家级项目金额人均贡献率+0.178A类论文人均贡献率+0.508B类论文人均贡献率+0.021C类论文人均贡献率+0.174论著人均贡献率(1);F2=-0.159横向项目金额人均贡献率+0.065市校级项目金额人均贡献率+0.00省部级项目金额人均贡献率-0.057国家级项目金额人均贡献率-0.235A类论文人均贡献率+0.393B类论文人均贡献率+0.328C类论文人均贡献率+0.570论著人均贡献率(2);F3=0.442横向项目金额人均贡献率+0.582市校级项目金额人均贡献率+0.123省部级项目金额人均贡献率+0.010国家级项目金额人均贡献率-0.076A类论文人均贡献率-0.219B类论文人均贡献率+0.384C类论文人均贡献率-0.010论著人均贡献率(3)
通过上述公式(1)、公式(2)和公式(3)可得到各个学院的因子得分。从而获得三个因子变量,由于这三个因子变量是线性无关的。因此,可以利用它们对各个学院的科研状况做统计分析。
3 各学院科研状况的综合评价分析
下面利用三个因子变量对2006年-2015年该高校各学院科研状况做多元统计分析,并对各学院近10年来科研状况进行综合评价。
首先画出三因子变量的散点图,对各学院近10年来科研状况做对比分析。以第一因子变量为横坐标,第二因子变量为纵坐标,第三因子变量为竖坐标的三维散点图如图1所示。
从图1中可以看出P学院、O学院、M学院等的第一因子很高。说明这些学院在国家级项目人均贡献率、省部级项目人均贡献率、A类论文人均贡献率、B类论文人均贡献率上成绩突出,但在横向项目人均贡献率上稍显不足,这些学院应该在保持尖端学术科研的前提下,多加强与企业的合作,创造更多产业应用成果。L学院、R学院、N学院等的第二因子很高,说明这些学院在论著人均贡献率、C类论文人均贡献率上成绩突出,这与这些学院的科研性质是密不可分的,第二因子很高的学院可以在保持自己科研特色的前提下,多关注学术前沿的相关信息,争取在尖端科研中有更大的突破。如B学院、I学院等的第三因子很高,说明这些学院在横向项目人均贡献率上成绩突出,这些学院可以在紧密保持与企业的科研联系的基础上,加强自己在学科特色科研中的研究,多出一些基础研究方面的尖端科研学术成果,增强学院在科研创新中的能力。
最后利用系统聚类分析法对各学院科研状况进行聚类分析,即利用三因子变量对20个学院进行聚类,结果如表7所示,M学院、P学院、O学院和J学院为一类,B学院、I学院为一类,其它学院为一类。这个结果与散点图分析的情况基本类似。
4 结束语
本文针对某高校各学院科研状况进行综合评价分析,通过对高校近十年科研指标数据进行因子分析,将八个指标变量分为三个科研因子,分别是高端科研因子、校企合作科研因子、基础科研因子,并给出了因子得分模型,对各学院近十年的科研状况给出了分析,最终的聚类分析结果也对各学院科研状况做了验证说明。论文的研究成果为科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。
从分析结果来看,因学院科研特色不同,导致各个学院在学术科研这个万花筒中所扮演的角色也各不相同,但各学院之间还是应当加强科研合作,取他人之长补己之短,这样才能为该高校向科研大校、科研强校的进军道路上打下坚实的基础。
参考文献:
[1]薛薇.SPSS 统计分析方法及应用[M].二版.北京:电子工业出版社,2006:303-349.
[2]张文彤.SPSS11统计分析教程―高级篇[M].北京:北京希望电子出版社,2002:166-210.
[3]李卫东.应用多元统计分析[M].北京:北京大学出版社,2008:226-240.
[4]阎慈琳.关于主成分分析做综合评价的若干问题[J].数理统计与管理,1998(2):22-24.
[5]胡永宏,贺思辉.综合评价方法[M].北京:经济科学出版社, 2000.
[6]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2003,8:15-18.
篇10
关键词 地理信息系统,图象处理,图象分析.
多源图象处理与分析系统的主要研究目的是为了解决栅格化的二维空间分布数据的处理和分析.栅格化的二维空间分布数据包括各种遥感数据、航测数据、航空雷达数据、各种摄影的图象数据,以及通过数据化和网格化的地质图、地形图、各种地球物理、地球化学数据和其他专业图象数据.多源图象处理与分析系统研究的意义是在微机上实现多源图象数据的快速处理和分析,为栅格型地理信息系统的实现开辟一条新的途径.
1 系统总体设计思想和原则
(1)多源图象处理与分析系统的设计应遵循软件工程学的原理,采取模块化的方法来进行设计;对软件的各个底层模块要求具有可移植性和可维护性,以便于在多种软件和硬件平台上进行移植;对WINDOWS操作系统环境的系统高层模块要求具有高度的可移植性和与硬件平台的无关性;在多源图象处理与分析系统和WINDOWS操作系统的功能分工上,主张应由操作系统完成的工作由操作系统去完成为原则;对操作界面则是依照人机工程学的观点来进行设计,以操作使用方便为原则;系统采用C语言进行编程.
(2)多源图象处理与分析系统的设计目标之一是能处理和分析数据量在几百兆到几千兆的大图象,所以系统的设计必须以大图象作为出发点,在数据结构的定义上、算法的实现上以及在系统的软硬件平台的选择上都必须给予充分的考虑.而多源图象处理与分析系统的功能设计则应建立在系统的数据结构上,在数据结构定义好的前提下,功能可多可少,以形成开放性的系统.
(3)作为专业的图象信息系统,必须具备对各类专业数据进行处理和分析的能力.在分析和总结各专业领域的数据类型后,多源图象处理与分析系统引入了以下图象类型:二值图、灰度图、256色索引和分类图(单字节图)、64K的高彩图(索引图、分类图和整数专业数据)(双字节图)、RGB真彩色图(3字节图)、RGBP透明真彩色叠加图(4字节图)、4字节浮点数据图(用于各种频域变换和各种专业图象数据以及图象计算的中间结果)和复数(用于频域变换).
(4)虽然多源图象处理与分析系统是以栅格数据为主的空间信息系统,单作为地理信息系统MAPGIS的一部分,必须支持栅格图、矢量图混合显示、综合处理、综合分析等功能.
(5)图层作为当代地理信息系统的核心数据结构,对数据的组织、管理,数据的叠加分析以及综合处理都具有重要的意义.多源图象处理与分析系统中引入了图层的思想(支持1024层或256层(WIN 32S)),以动态透明地叠加显示各个图层的栅格或矢量图,进行综合动态比较、分析.
(6)建立彩色数据库,以支持RGB,HLS和HSV的选色及色彩的调节和配准,优化的236色调色板以支持256色显示器模拟真彩色显示(建立RGB到236色的索引表);建立HLS,HSV的色库,建立一些常用连续色调的彩色数据以表示数据连续且有大小意义的图象.
(7)图象和图象、图象和图形间的处理、分析、叠加比较、叠加分析、镶嵌等操作均需要各个图象、图形具有统一的坐标,支持各种投影变换及几何校正(建立统一的地理坐标系).
(8)在图象分析的高级和智能化阶段,图象聚类、图象分割、图象自动识别是图象处理和分析的主要任务,在这类处理、分析的结果图象上就存在不确定的数据,支持未定义数据以及保留数据位(以表示未定义数据以及保留数据位……)应是多源图象处理与分析系统的一个重点.
(9)作为人机交互界面的彩色显示器将各个图象、图形等信息以红绿蓝(RGB)彩色点的形式传递给人.RGB彩色模型是一个客观彩色模型,对硬件而言这是很好的彩色模型;但对人来说RGB彩色模型就很难控制和掌握.要对RGB彩色模型进行控制,就需要引入一个更适合人的中间彩色模型.双六棱锥彩色模型[1]和单六棱锥彩色模型[1](HLS和HSV)就是其中的两个适用的主观彩色模型.这是多源图象处理与分析系统的彩色合成、彩色分解、彩色调节、彩色自动赋值的理论基础.
(10)作为人机交互界面的彩色显示器以及人眼的输入与输出的响应都是非线性系统,支持显示器的伽玛校正及色度校正[2],使多源图象处理与分析系统能更好地进行彩色设计.
(11)栅格图象数据量往往很大,而用户的目标区可能很小,同时为支持小区的试错操作,多源图象处理与分析系统支持选区操作和裁剪区操作,支持局部操作,缺省选区为全图.
(12)为了显示系统工作状态,引入状态提示行以显示注释信息并引入等待光标;在窗口标题中放入图象信息;显示光标的客户区坐标、图象位置坐标、图象地理坐标.
(13)支持多类多文档子窗口,包括图象(图象和图形)、文本、表格.
(14)为支持大图象和节省内存空间,客户区的显示内容应是动态生成的.
(15)由于对整数专业数据图、4字节浮点数据图不能直接显示,可以考虑设定一个参数以表示如何显示这个图象数据.
(16)对二值图与256色、64K编码图而言,其彩色值表示类,可以直接通过彩色值查找类别及其面积、方差等,还可以进行膨胀、中值滤波、十字中值滤波、最频值滤波.
(17)数据进入多源图象处理与分析系统前需进行格式转换,系统内部只支持自己的数据格式,其他数据格式需通过转换程序转换,这样可以简化多源图象处理与分析系统的设计和编程.
(18)引入数据库工程和数据库项目的概念,在工程、项目的概念和图层的概念间建立一种关系,以简化系统文件的管理机制.
2 系统总体结构的设计
系统总体结构的设计采用了WINDOWS的多文档窗口界面技术、WINDOWS的虚拟内存管理技术[3]、WINDOWS的内存映射文件技术和多源图象处理与分析系统定义文件系统.在多文档窗口界面的控制下,每个图象对应的各类数据文件通过内存映射文件技术和虚拟内存管理技术建立一个子图象文档窗口,并在多文档窗口界面的控制下,实现各菜单命令和消息通讯.
多文档界面(MDI)是Microsoft WINDOWS处理文本的应用程序规范[4,5].该规范描述了窗口结构和允许用户在单个应用程序中使用多文档的用户界面.利用MDI技术,我们可以打开和生成任意幅图象(只要内存和虚拟内存允许),每个图象作为一个文档,这些文档可同时保留在客户区域内.
利用虚拟内存管理[3],系统可以得到2GB的地址空间,这使得多源图象处理与分析首次摆脱了DOS和WINDOWS 3.1在内存分配上的分段机制,使得多 源图象处理与分析在微机上实现成为可能.
内存映射文件技术是WINDOWS NT提供的一种新的文件数据存取机制.利用内存映射文件技术,系统可以在2GB的地址空间中为文件保留一部分空间,并将文件映射到这块保留空间.一旦文件被映射之后,WINDOWS NT将仔细管理页映射、缓冲以及高速缓冲等任务.
3 系统功能的设计
多源图象处理与分析系统的功能设计是建立在系统的数据结构上,在数据结构定义好的前提下,功能可多可少,以形成开放性的系统.目前设计的功能如下.
(1)输入输出功能.包括各种格式、各种类型数据的输入输出,以及向量、栅格、表格数据的相互转换和注字输出功能(TIGAR,BMP,TIFF,RAW,PCX,GIF栅格格式,WMF,MAPGIS矢量格式,FOXPRO数据库表格).
(2)矢量操作功能.支持各种矢量数据的栅格化,包括线段矢量图、多边形矢量图、点表图的栅格化(用于MAPGIS矢量图向栅格图转变).
(3)图象显示功能.支持彩色查找表的检索和修改(用于256色、64K索引图、分类图),屏幕栅格图拷贝、剪切、粘贴,象素信息检索(分类图的分类信息包括彩色、面积、类别),三维透视显示(利用DEM生成),立体象对生成(利用DEM生成),视域图生成(利用DEM生成),光标、坐标输入的空间查询,三维立体地形显示,最佳路径图生成,密度切片图、密度剖面图、直方图显示,图象加网格(公里网、经纬网),平面等值线图、矢量立体透视图绘制,图象自动漫游,图象注记,光照阴影图、浮雕立体图的生成及图象多层覆盖操作.
(4)空间分析功能.包括多幅图象的自定义宏运算,交叉混合,区域编号,距离图生成,插值栅格化(等值线插值、点插值、栅格重采样),多平台数据配准及重采样,图象地理坐标参照(加坐标、几何变换、图象配准、几何校正、比例尺及地图投影变换),距离量算,面积统计,边界提取,指定属性的空间分布,纹理特征提取,编码图象的空间分析(空间逻辑运算、二值图象的位逻辑运算、共现指数图象生成、图象形态学分析(开、闭、击中、膨胀、腐蚀等操作)),缓冲区分析,三维立体的剖切分析,图象相关矩阵分析和比值分析功能.