统计学决策分析范文

时间:2023-07-18 17:37:04

导语:如何才能写好一篇统计学决策分析,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

统计学决策分析

篇1

[关键词] 医学期刊 统计学问题 编辑

[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2013) 05-0067-03

医学统计学是一门以统计学原理和方法为基础,探索医学科研工作中遇到的有关数据的收集、整理和分析方法的应用科学,又可被看成一个收集信息、处理信息、分析信息,进而从中提炼和总结分析出新的信息的过程[1]。随着医学科研水平和医疗技术水平的不断提高,医学科研和临床实际工作中,人们对待科学的态度逐渐从原来的“经验主义”转变为“论据先行原则”,无论是在一些医学相关学科的基础实验中,还是在一些临床疾病的诊治等工作中,人们遇到问题时不再“想当然”,而是首先考虑为什么,有何依据,而这些依据大多需要通过统计学中的信息收集、整理、分析来提供。因此,医学统计学在医学工作中的地位越来越重要,统计学应用的正确与否直接影响着医学科研结论的科学性、严谨性和可靠性,具体到医学期刊方面,就会出现因统计学应用不恰当而导致医学期刊不严谨、不科学、不可靠和不具有影响力[2]。鉴于医学统计学在医学期刊中的重要地位,作者结合《肿瘤基础与临床》杂志2011年的240篇文章中出现的统计学问题,对目前我国医学期刊中常见的统计学问题进行分析,同时提出一定的解决方案,为医学编辑工作能力的提高以及医学期刊整体水平的上升提供一定帮助。

1 医学期刊中常见统计学问题

统计学的误用、错用和不用问题广泛存在于许多医学期刊中,统计学错误率处于较高水平,有文献报道期刊论文统计学错误率为38%—80%,而且统计学问题的种类几乎涉及统计学的每个方面,包括实验设计不合理、未进行统计学处理、统计分析软件未介绍或介绍不清、统计学数据的描述方法不当、统计学方法的描述不清或错用、统计值或P值不全或描述不清、统计学结果分析或描述错误等[3-4]。王倩等[5]对5种“中华”系列杂志刊登的文章的统计学应用进行回顾性分析,发现1985年统计学方法应用的错误率占24%,1995年占36%。沈进等[6]选取8种医学期刊,分析发表于1998年至2005年的544篇论著文章的统计学方法应用情况,结果显示,136篇的统计学出现明显错误,错误率达到25%,其中以资料处理方法不当所占比例最高,达到61.76%,其次为图表错误、未作统计学处理等。我刊2011年刊登的240篇论文中,排除个案报道、教学论文、棕色行论文36篇,剩余的204篇论文中有126篇论文采用了统计学处理,占61.76%(126/204),现结合本刊统计学应用现状针对医学期刊中常见的统计学问题进行分类分析如下。

1.1 统计研究设计不合理问题

大多数非统计学专业的学者在进行统计研究设计(包括实验设计、调查设计、临床试验设计)时仅仅从本专业的角度考虑,根据主观想要得到的结果进行分组设计,而完全没有考虑该实验设计的可行性、组间数据是否具有可比性等问题,主要表现在实验设计时不遵循随机化原则、未设置对照或对照不合理、均衡性原则贯彻不彻底等[7]。常见的统计研究设计不合理问题包括缺少对照或对照不合理、单因素设计取代多因素设计、样本量选择不具有代表性或样本量不足等[8]。例如,本刊《SMO蛋白及mRNA在食管癌鳞状细胞癌组织中的表达及意义》一文,在实验分组设计时未对各组间数据是否具有可比性进行统计学分析。

1.2 未进行统计学处理问题

许多医学期刊论文虽然也进行了分组设计、设立对照等,但是文中未说明采用何种统计方法,也未对这些数据进行统计学处理,仅仅通过对实验所得的实际数据的直观判断就得出结论[9]。例如,本刊《肺尖癌26例疗效分析》一文中,作者在分析不同治疗方法对肺尖癌的疗效时并未采用任何统计方法,而是直接得出了“综合治疗较单纯治疗更能延长肺尖癌患者生存期”的结论,这不符合现代医学科研的结论需有据而立的原则。

1.3 统计方法的描述不具体或错用问题

1.3.1 统计方法的描述不具体

一些医学期刊论文中列出的统计方法过于简单,甚至未列出,主要有以下几种情况[10-12]:在“材料与方法”部分中的“统计学处理”中未列出所用的统计学软件或仅列出所用软件而未说明所用软件的版本;对于何种数据采用何种统计方法仅笼统描述,未具体列出文中的那些数据应该用何统计方法;对于定量数据仅列出采取t检验或方差分析,而未列出是否进行正态性检验和方差齐性检验;对于两组定量数据无论是应该采用成组设计t检验还是配对设计t检验,均仅描述为“两组定量数据比较采用t检验”;对于两组或多组定性数据的比较,无论是仅需用 2检验,还是需要采用矫正 2检验或 2分割检验,均描述为“两组或多组定性数据的比较采用 2检验”;统计学符号书写不规范,例如,根据GB/T3358-82,F检验、P值、 2检验、t检验等中的字母应为斜体,不符合上述规定的书写均为错误情况,这在论文中非常普遍;未列出检验水准 ,检验水准 是事先设定的判断小概率实践的标准,实际意义是允许犯假阳性错误概率的最大值,需要根据不同的研究目的进行设定。例如,本刊《 -连环蛋白和层粘连蛋白的表达与垂体腺瘤侵袭性的关系》一文在“统计学处理”仅说明数据的比较采用t检验,而未说明t检验的类型。

1.3.2 统计方法的错用

一些医学期刊论文中的统计方法的应用存在明显的错误。对于所有定量数据,常见的错误有[13-14]:无论是否符合正态分布、是否方差齐,一律盲目应用t检验或单因素方差分析等参数检验方法进行比较分析;无论数据分为几组,一律采用t检验进行比较分析,把其当做定量数据比较的万能工具;无论各组数据是何关系,一律采用成组设计t检验或单因素方差分析。例如,本刊《癌症相关性乏力与TGF- 1的关系分析》一文中,定量数据进行比较分析之前未说明是否进行了方差齐性检验和正态性检验。对于所有定性数据,常见的错误有:把 2检验当做所有定性数据的万能统计工具,忽略了其应用的前提条件是, 2检验适用于正态分布的定性数据,且样本量最好>40,列联表数据进行 2检验时不能有1/5以上的格子其理论频数

1.4 统计结果的描述及分析错误问题

许多医学期刊论文中均可见到统计结果的描述或分析错误,常见的有以下几种[15-17]:1)对于定量数据应当根据是否符合正态分布而采用不同的描述方法,符合者一般采用“均数±标准差”或“均数±标准误”表示,而不符合者则采用中位数和四分位间距来进行表示,不按上述规定进行描述者均属于错误描述;2)对于定性数据,常见的错误是构成比和百分率不分,计算率或构成比等相对数的样本量过小;3)解释有统计学意义时仅根据P值的大小得出相应结论,例如对于A、B组2组的疗效(假定A组疗效优于B组),其“P

1.5 统计值和(或)P值描述不清以及统计值缺失问题

许多医学期刊对统计结果进行描述时,通常不能完整清晰地描述出统计值和P值,常见的有以下几种情况[18-19]:统计结果仅用“P0.05”得出结论,缺少相应的统计值;统计结果包括统计值,但是P值仅写出“0.05”,未列出具体的P值;仅列出具体的P值,而统计值缺失,上述几种情况均不利于文献阅读者进行数据验证和meta分析。例如,本刊《同步放化疗治疗局部晚期食管癌临床观察》一文中,所有统计结果均仅列出了“P0.05”,未列出具体的统计值和P值。

2 针对医学期刊中常见统计学错误的解决对策

目前,医学期刊论文的统计学问题已经成为衡量论文质量高低的重要标准,统计学的错误可能会导致论文学术水平和学术质量的降低,甚至有可能导致严重的后果。近年来,随着广大医学科研工作者和医学期刊编辑及审稿专家对医学统计学应用的重视,医学期刊论文中的统计学问题已经明显减少,但仍然处于较高的水平,这可能与以下几点有关[20-22]:论文作者、编辑及审稿专家思想上不够重视论文统计学应用;期刊编辑的统计学应用知识匮乏;选择审稿专家只注重其专业领域内的影响力,而未关注其统计学应用水平。因此,要想提高医学期刊的统计学应用水平,从而更进一步提高期刊总体质量,需要做到以下几点:作为医学期刊编辑,必须不断进行统计学相关知识的学习,例如参加相关培训班、旁听医学院校的统计学课程及请教统计方面的专家等,以提高自身的统计学应用水平,并从思想上重视统计学应用的审查,在给新投稿件的作者的初步意见中就强调统计学应用的重要性,规定一旦统计学有问题,论文可随时退稿;聘请医学统计学专家进入期刊编委会,负责所有论文的统计学审稿;应通过各种途径,向广大科研工作者宣讲统计学在医学科研工作中的重要性,使其养成良好的正确应用统计学的习惯;在科研课题设计过程中要求有统计学相关专家的参与;科技期刊中增加统计学应用栏目,刊登与本刊论文关系密切的统计学方法,或者刊登一些常见的统计学错误,与作者或读者交流,提高其统计学应用能力。

注 释

[1]孙振球.医学统计学(第3版)[M].北京:人民卫生出版社,2010:1-8

[2]胡良平,郭秀花,刘惠刚.医学统计学是评价医学科技论文质量优劣的重要依据[J].中华口腔医学杂志,2011,36(3):229-232

[3][8]胡良平,李子建.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003:4

[4] Garc韆-Berthou E,Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol,2004,4:13

[5]王倩,张博恒.五种中华医学会系列杂志论著中统计方法的应用现状[J].中华医学杂志,1998,78(3):230-233

[6]沈进,苟莉,汤洁,等.生物医学期刊中统计学方法应用情况分析[J].中国修复重建外科杂志,2007,21(5):541-543

[7] [15]王晓瑜,王雅琢.《山东医药》论文中统计学错误分析[J].中国科技信息,2010(16):193-194

[8][9][10][20]邱春晖,郭明兴,邱源.医学论文中统计学方法的误用及其防范措施[J].山东教育学院学报,2009(5):116-118

[11] 冉明会,罗萍,邓丹.医学期刊编辑应注意的几个统计学处理问题[J].编辑学报,2009,21(6):503-505

[12][16][18]李霞,张印朋,闫苏平.医学期刊作者来稿统计学应用与表述常见问题分析[J].中国科技期刊研究,2011,22(1):88-89

[13] 王晓瑜,王雅琢,封艳辉,等.医学期刊投稿常见统计学问题分析[J].科技与出版,2011(11):42-44

[14] 金永勤,王维.医学期刊编辑应重视统计学中的几个问题[J].编辑学报,2009,21(1):33-34

[17]张功员,田庆丰.医学科研论文中统计结果表达和解释错误分析[J].郑州大学学报(医学版),2002,37(3):338-340

[19]叶亮,李伟东,范欣生.医学论文中常见的统计学应用问题辨析[J].南京中医药大学学报(社会科学版),2011,12(4):247-248

[21]吴红艳,尹平.医学期刊编辑应在数据的统计把关中有所作为[J].编辑学报,2008,20(5):400-401

篇2

概率论是风险研究的必备工具,它能帮助工程师通过建模来进行决策分析,以降低工程项目的风险系数。这本教科书是工程学学生及其研究者、应用数学和经济学学生的主要教科书,读者仅需具有大学本科工程数学的基础知识,或是选修过统计学课程就可以阅读。

本书共有1O章,主要向读者提出了风险统计处理的基本概念及其在工程风险和安全分析领域的应用。第1~5章介绍了概率论的基础知识,包括离散型和连续型随机变量及其典型分布;第6~10章涉及了各种类型的概率问题及其在风险和安全分析领域中的应用。各章内容如下:1 概率入门;2 风险分析中的概率;3 随机变量及其分布;4 数据拟合分布:古代的经典推论;5 条件分布及其应用;6 贝叶斯推论;7 密度和泊松模型;8 失效概率和安全系数;9 分位数估计;10 设计荷载和极值。

本书有以下几个特点:多为说明性语言并用案例;每章后面都有部分练习,并在附录中做了简单的解答;前几章的练习仅检测基本概念,后续的练习注重实际问题的解决,体现了循序渐进的学习方法;注重理论的实际应用,所有实例问题的设计都是以实际数据为依据;作者在序言中简要概括了每章学习的主要内容。

作者Igor Rychlik自1986年在瑞典隆德大学获得博士学位后一直留校任教,2007年7月1日获得隆德大学数理统计学院教授职称。他的研究兴趣包括随机过程理论在工程中的应用、建筑与环境的安全分析、随机过程的极值理论及其统计估计技巧和非线性变量系统动力学的统计估计技巧。

本书不仅是一本教课书,而且也是风险研究者和从事工程决策分析等研究人员的参考书。对于上述相关专业的大学高年级学生和研究生而言它也是必备的。

侯玉梅,教授

秦皇岛市燕山大学经济管理学院

北京理工大学管理与经济学院博士后

Hou Yumei,ProfessorThe college of economics and management,

篇3

下面说正经的了,统计学是应用数学的一个分支,主要利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从社会科学到人文科学,甚至被工商业及政府用来决策。举个例子,如果你们班上连你共50个学生,有人和你打赌说:“班里一定有人生日是相同的!”那么在这个赌局里你的胜率是多少呢?假设班上的第一位同学与你生日不同,那么他的生日只能在一年365天中的另外364天,再通过计算全班50名同学生日都不同的概率为0.0295。反过来说你在这个赌局中的成功把握只有3%,于是你果断无视这个“骗局”。这就是统计学在生活中的一个应用。在我国,统计学分为数学类和经济类,大部分综合类和财经类高校开设的统计学专业都是经济类统计方向,少数理工类院校如西北工业大学、北京理工大学等是开设的是应用数学方向的。

经济类统计学专业的学生要学习的东西很丰富。经济学的基础学科都会学习到,如西方经济学、国际经济学、货币银行学、产业经济学、财政学、市场营销……而我们的优势在于专业课的专门性很强,像统计学原理、抽样调查、宏观经济模型分析、国民经济统计学、社会统计学、企业统计学、计量经济学、应用多元统计分析、宏观经济统计分析等课程经济学专业未必会涉及,在学习中你会发现统计学的世界是多么丰富多彩,基础的数据在你的手中可以变幻出不同的统计表格和一条条的分析建议,枯燥的数据在我们这些“魔术师”的手中被赋予了新的生命,新的活力。

在院校选择上,中国人民大学、厦门大学这两所经济统计学实力最强的院校自然是首选。中国人民大学统计学院侧重经济统计方向,学习内容应用性强,毕业生在企业、金融部门、机关就业比较多。厦门大学计划统计系成立于1982年,1987年被国家教委评定为全国唯一的统计学重点学科,分为经济统计与投资决策分析两个方向,也是偏重统计学的应用。

篇4

数据挖掘是从数据当中发现趋势和模式的过程,它融合了现代统计学、知识信息系统、机器学习、决策理论和数据库管理等多学科的知识。它能有效地从大量的、不完全的、模糊的实际应用数据中,提取隐含在其中的潜在有用的信息和知识,揭示出大量数据中复杂的和隐藏的关系,为决策提供有用的参考。数据挖掘是从数据当中发现趋势和模式的过程,它融合了现代统计学、知识信息系统、机器学习、决策理论和数据库管理等多学科的知识。它能有效地从大量的、不完全的、模糊的实际应用数据中,提取隐含在其中的潜存有用的信息和知识,揭示出大量数据中复杂的和隐藏的关系,为决策提供有用的参考。

二、数据挖掘的现代最新方法介绍

常用的数据挖掘方法主要有决策树(Decision Tree)、遗传算法(Genetic Algorithms)、关联分析(Association Analysis).聚类分析(C~smr Analysis)、序列模式分析(Sequential Pattern)以及神经网络(Neural Networks)等。

三、数据挖掘的实际应用

由于数据挖掘市场还处于起步的阶段,但是发展很快。在国外有一些著名的大公司对数据挖掘系统进行了开发。

1.Intelligent Miner这是IBM公司的数据挖掘产品,它提供了很多数据挖掘算法,包括关联、分类、回归、预测模型、偏离检测、序列模式分析和聚类。有2个特点:一是它的数据挖掘算法的可伸缩性;二是它与IBM/DB/2关系数据库系统紧密地结合在一起。

2.EineSet是由SGI公司开发的,它也提供了多种数据挖掘方法,包括关联分析和分类以及高级统计和可视化工具。特色是它具有的强大的图形工具,包括规则可视化工具、树可视化工具、地图可视化工具和多维数据分散可视化工具,它们用于实现数据和数据挖掘结果的可视化。

3.Clementine是由ISL公司开发的,它为终端用户和开发者提供提供了一个集成的数据挖掘开发环境。

4.DBMiner是由DBMiner Technology公司开发的,它提供多种数据挖掘算法,包括发现驱动的OLAP分析、关联、分类和聚类。特色是它的基于数据立方体的联机分析挖掘,它包含多种有效的频繁模式挖掘功能和集成的可视化分类方法

四、数据挖掘与管理会计

1.提供有力的决策支持

面对日益激烈的竞争环境,企业管理者对决策信息的需求也越来越高。管理会计作为企业决策支持系统的重要组成部分,提供更多、更有效的有用信息责无旁贷。因此,从海量数据中挖掘和寻求知识和信息,为决策提供有力支持成为管理会计师使用数据挖掘的强大动力。例如,数据挖掘可以帮助企业加强成本管理,改进产品和服务质量,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。

2.赢得战略竞争优势的有力武器

实践证明数据挖掘不仅能明显改善企业内部流程,而且能够从战略的高度对企业的竞争环境、市场、顾客和供应商进行分析,以获得有价值的商业情报,保持和提高企业持续竞争优势。如,对顾客价值分析能够将为企业创造80%价值的20%的顾客区分出来,对其提供更优质的服务,以保持这部分顾客。

3.预防和控制财务风险

利用数据挖掘技术可以建立企业财务风险预警模型。企业财务风险的发生并非一蹴而就,而是一个积累的、渐进的过程,通过建立财务风险预警模型,可以随时监控企业财务状况,防范财务危机的发生。另外,也可以利用数据挖掘技术,对企业筹资和投资过程中的行为进行监控,防止恶意的商业欺诈行为,维护企业利益。尤其是在金融企业,通过数据挖掘,可以解决银行业面临的如信用卡的恶意透支及可疑的信用卡交易等欺诈行为。根据SEC的报告,美国银行、美国第一银行、联邦住房贷款抵押公司等数家银行已采用了数据挖掘技术。

五、数据挖掘在管理会计中的应用

1.作业成本和价值链分析

作业成本法以其对成本的精确计算和对资源的充分利用引起了人们的极大兴趣,但其复杂的操作使得很多管理者望而却步。利用数据挖掘中的回归分析、分类分析等方法能帮助管理会计师确定成本动因,更加准确计算成本。同时,也可以通过分析作业与价值之间的关系,确定增值作业和非增值作业,持续改进和优化企业价值链。在Thomas G,John J和Il-woon Kim的调查中,数据挖掘被用在作业成本管理中仅占3%。

2.预测分析

管理会计师在很多情况下需要对未来进行预测,而预测是建立在大量的历史数据和适当的模型基础上的。数据挖掘自动在大型数据库中寻找预测性信息,利用趋势分析、时间序列分析等方法,建立对如销售、成本、资金等的预测模型,科学准确的预测企业各项指标,作为决策的依据。例如对市场调查数据的分析可以帮助预测销售;根据历史资料建立销售预测模型等。

3.投资决策分析

投资决策分析本身就是一个非常复杂的过程,往往要借助一些工具和模型。数据挖掘技术提供了有效的工具。从公司的财务报告、宏观的经济环境以及行业基本状况等大量的数据资料中挖掘出与决策相关的实质性的信息,保证投资决策的正确性和有效性。如利用时间序列分析模型预测股票价格进行投资;用联机分析处理技术分析公司的信用等级,以预防投资风险等。

4.产品和市场预测与分析

品种优化是选择适当的产品组合以实现最大的利益的过程,这些利益可以是短期利润,也可以是长期市场占有率,还可以是构建长期客户群及其综合体。为了达到这些目标,管理会计师不仅仅需要价格和成本数据有时还需要知道替代品的情况,以及在某一市场段位上它们与原产品竞争的状况。另外企业也需要了解一个产品是如何刺激另一些产品的销量的等等。例如,非盈利性产品本身是没有利润可言的,但是,如果它带来了可观的客户流量,并刺激了高利润产品的销售,那么,这种产品就非常有利可图,就应该包括在产品清单中。这些信息可根据实际数据,通过关联分析等技术来得到。

5.财务风险预测与评估

管理会计师可以利用数据挖掘工具来评价企业的财务风险,建立企业财务危机预警模型,进行破产预测。破产预测或称财务危机预警模型能够帮助管理者及时了解企业的财务风险,提前采取风险防范措施,避免破产。另外,破产预测模型还能帮助分析破产原因,对企业管理者意义重大。,数据挖掘技术包括多维判别式分析、逻辑回归分析、遗传算法、神经网络以及决策树等方法在管理会计中得到了广泛的应用。

篇5

【关键词】数据挖掘技术 营销策略 数据 模型

为了更加有效的让企业在市场营销、市场资本运作和市场投资策略及市场信息决策方面做到事半功倍,企业高层就需要将企业数据仓库中的原始数据转化为简明扼要的商业数据信息。当企业在商业活动中了解到企业的各种问题并知道其原因后,数据挖掘技术可以很好的帮助企业解决接下来该怎么办的问题,可以帮企业用户了解市场变化,挖掘技术是目前世界上比较流行的一种决策技术,数据挖掘技术其实经历了一个逐渐演化的过程,而统计技术从最初应用到现在已经有一百多年的历史,早在数据挖掘技术正式出现之前,就有许多的统计学家开始将统计技术应用到对数据库中大量信息的处理,开始承担数据挖掘的工作。随着世界商业环境的极其复杂而且日益的竞争激烈,各大中型企业的高层领导或管理者为了让企业在竞争中更好的生存发展,他们的主要职责就是制定良好的商业或市场策略,做出一套可行性强的销售计划,并确定如何能更好的分配有限的企业资源。为了达上以上目的,企业高层往往需要根据特定的信息去了解并评价企业的特性,比如说企业的历史、企业的产业信息、企业的经济状况以及将来会影响企业经济效益的未知事件。

一、数据挖掘技术在市场营销策略中的作用

(1)为决策支持提供有力的保障。随着企业市场竞争环境的日益激烈,决策信息在企业中的价值越来越大,因此,企业管理者对它的要求也越来越高。对企业的决策支持是市场策略的重要组成部分,决策支持的目的是为企业在市场竞争中提供最高效的有市场价值的数据信息。所以,从市场中的海量数据里进行高效的数据和信息的挖掘,能够为企业市场决策提供强有力的支持。例如,利用数据挖掘技术可以帮助企业加强市场运作管理,在调查分析的基础上提高企业产品和在市场中的服务质量并有效的提高销售率,能够为企业在市场竞争中设计最优化的分销策略,从而大大的减少企业的商业成本。

(2)为市场竞争保驾护航。企业在市场中竞赛的因素主要包括市场竞赛环境、市场情况、企业客户和企业的上层供应商等,事实证明数据挖掘技术不仅可以在企业内部工作流程的层面上进行改善,而且还能够对企业的市场竞争环境等方面的因素进行分析设计,从而能够顺利获取市场商业策略情报,以使企业在市场竞争中的持续发展壮大的优势得以保持和提高。比如,通过数据挖掘技术对客户价值取向的分析能够把为企业创造巨大价值的的客户统计出来,以便有针对性的对其提供并保持更优质的服务,实现企业在市场中的有利竞争。

(3)能有效进行市场决策及误差分析。对市场决策分析要借助一些数据挖掘的工具和相应的模型。数据挖掘技术可以利用有效的工具对市场环境以及行业基本状况等大量的数据资料中挖掘出与企业市场决策信息相符的重要数据,充分保证决策者进行市场策略决定的准确性和高效性。比如可以通过采用关键字技术、数据库技术等挖掘技术制定市场策略,让企业在竞争中更好的生存发展,让企业领导能够制定良好的商业或市场策略,从而进一步做出一套行之有效的销售计划,并能够准确的确定如何能更好的分配有限的市场资源。进行决策分析的目的是得出对未来情况的比较准确的值,由于挖掘技术在进行分析模型的初步解释和假设中会出现某些定量因素考虑不完整的现象,在进行市场决策分析过程中会出现一些无法避免的误差问题,即挖掘分析的值与实际值存在差异,当出现这种情况时,要对获得的分析结果进行误差分析,分析完成后再进行参数等方面的修正以达到更好的决策。

(4)为客户关系管理提供保证。企业竞争的最重要的因素之一就是企业的客户,客户关系管理的好坏直接影响企业的市场竞争力。利用数据挖掘技术进行客户关系管理时,首先要通过对数据仓库的分析对客户的群体进行分类,通过分类的方法可以及时发现其行为规律,从而实行有针对性的服务。然后对客户的价值取向进行分析,企业可以从客户关系的数据库中挖掘出客户的一些详细数据信息,并对这部分客户的一系列的详细的运作进行动态的跟踪,并根据不同的客户群的各自的特点提供对应的市场服务,实现与企业客户的长期的互利的合作关系。以大型超市为例,为了能使之有更好的市场竞争力,决策者就需要对其商品的各种销售客户的状况有一定的熟悉才能做到游刃有余,当然除了客户关系的分析还包括对库存量的分析、采购商品的分析等等。

(5)为企业产品和市场分析提供依据。利用数据挖掘技术可以为企业产品和市场分析提供可靠的依据,在企业市场运作中,可以通过品种优化为企业实现最大的经济利益,品种优化就是对企业中的产品进行最恰当的组合,产品组合获得的经济利益可以分为市场短期经济利益和长期市场占有率的利益。企业决策者需要比较准确的挖掘出产品的价格和成本数据以实现以上的目标,还需要利用数据挖掘技术找出其产品和其它产品在市场竞争中的状况。此外企业决策者也需要清楚企业的产品与其它产品之间是如何互相刺激其在市场中竞争的优势等等。比如在市场中虽然部分非盈利性产品本身是不能给企业带来直接的利润,但是,通过此类产品可以带来了很大的客户流量,使企业的客户保持不断增长,同时间接的提高了高利润产品的销售量,所以,根据企业中的实际数据并通过关联分析等技术对企业中的各类产品进行市场分析是至关重要的一个方面。

二、数据挖掘制定策略的实现过程

将每一个样本进行迭代处理,然后进行预测和实际了解的类标号比较,再通过修改每个收集到样本的权值,尽可能的使网络预测值与现实的误差最小。通过后向传播的方式由输出层经过隐藏层再到输入层,其算法主要由计算和修改两个阶段组成,首先将输入信息从输入层经过隐藏层到输出层逐层计算处理,再给出每个单元的输出值即正向传播,然后在输出层如果不能够得到期望的输出,那么再逐层计算实际输出与期望输出之间的误差,再根据它们之间的误差对各个单元的权值进行调整,实现企业数据仓库中的原始数据转化为简明扼要的商业数据信息,可以帮企业用户了解市场变化。

(1)需求分析确定挖掘对象。进行数据挖掘之前必须先进行确定挖掘对象,通过市场营销策略的调查分析、市场库存量的分析、市场采购分析、市场客户的关系分析等。每次分析之前,首先要明白分析的对象及要解决的问题和要达到的具体要求等。

(2)构建市场策略的E-R模型。对收集到的资料认真进行审核以保证数据的真实准确性,接着再对收集到的市场资料进行分析等,同时去除与策略不相符的一些数据,从中找出市场发展的统计规律并构建市场策略的E-R模型,由于数据信息的正确是保证市场策略制定正确的前提条件,而统计的数据信息的偏差经常会导致决策分析的偏差,因此建立模型是十分重要的。

(3)构造数据事实表模型。通过构建市场策略的E-R模型后再构造数据事实表模型,一般来说有多种分析模型,但必须选择合适的分析模型,此时可以根据分析的要求和企业事物本身的特点进行恰当选择,同进必须要正确选择适当的分析方法进行估计模型参数值。分析模型可以有不同的估计方法,一个分析方法也适用于不同的分析模型,应该根据分析的目的和分析资料的数量及可靠性程度、分析精度要求等选择恰当的分析模型和分析方法。

(4)分析处理。依据以上选定模型,采用选定的分析方法计算出参数后,就可以得出分析公式,然后就可以根据分析公式对数据进行分析。

(5)误差分析。进行统计分析的目的是得出对未来情况的估计值,因为在分析模型的初步解释和假设中存在考虑定量因素不完整的情况,加上客观现象的变化,导致数据与所构造的数据模型过分适应,往往造成所发现的模式精确性很差,并且不能满足企业实际的需要。在分析过程中出现一些误差是无法避免的,即分析出来的值的实际值肯定存在一些差异,分析模型建立并获得分析结果后一般要经过误差分析,采用选定的分析方法计算出参数当然,如果误差太大,则要从各个方面进行误差原因的分析,最后再进行模型或参数的修正,以建立可靠的分析公式。

三、结论

合理利用数据挖掘技术可以很好的帮助企业借助过去发生的事情来预测市场未来的走势并制定相应的市场策略并解决一系列的正确决策问题,应用前景是十分广阔的。当然,还可以对制定市场策略的信息库做关联规则的挖掘研究,在应用数据挖掘技术制定市场营销策略中如果能够做到更有针对性和准确性,那么,数据挖掘对市场营销策略的发展将有更大的推动作用。

参考文献:

篇6

关键词:经济预测与决策;教学改革;应用型人才

中图分类号:G642 文献标识码:A

近年来,我国高等院校招生规模不断扩大,高等教育正在由“精英”教育培养模式向“大众化”教育培养模式发展。独立学院作为教育市场竞争的产物,顺应当今社会发展的要求,将自己的办学目标定位于建设应用型大学和培养应用型人才。应用型人才的主要特征是具有比较强的实践能力和创新能力,毕业以后能很快地适应职业的要求。例如应用型统计学专业人才应具有较扎实的数学基础和良好的经济学素养,比较熟练地掌握统计学及金融、管理等方面的基本理论与方法,能较熟练地运用计算机分析和处理各种数据,能在企、事业单位和各经、管部门从事统计调查、统计信息管理、统计数据管理与分析和统计研究工作的应用型人才。“经济预测与决策”这门课旨在运用专门的统计知识研究经济问题,实用性很强,例如可以建立回归方程拟合经济模型,利用时间序列方法对股票收益进行预测等。同时这门课的理论基础涉及数学分析、高等代数、统计学原理三门课的内容,这三门理论基础课比较抽象、难懂,独立学院的学生数学基础本来就比较差,理解、掌握理论知识就更加困难,在学习经济预测与决策这门课程时遇到的困难有很多。因此,独立学院有必要对经济决策与预测这门课的教学进行深入地研究。

1、教学中存在的问题

1.1教材难易很难适中

目前,还没有专门为独立学院学生编写适合他们使用的经济预测与决策这门课的教材,独立学院基本都使用母体学校的教材上这门课,母体学校偏重理论教学,而独立学院以培养应用型人才为目标,注重实际应用能力,并且独立学院学生的基础比较差,他们在学习的过程中常常会感到很吃力。但如果仅仅按照统计工具书的步骤讲解。学生会感到困惑,不知道那些统计量是什么意思,最后的输出结果说明了什么问题等。因此,只使用母体学校的教材和只使用统计工具书学习经济预测与决策这门课是不行的。

1.2教学形式呆板

目前高校经济预测与决策教学,大多采用以教师讲授为主的传统教学方式。教师普遍仍局限于课堂讲授的单向灌输式教学方式,属于重知识传授、轻能力培养,重书本理论、轻实践活动的“注入式”教学模式。教学中,教师注重基本原理和方法的介绍,很少做到把原理与统计分析方法在实际中的运用结合起来讲解,运用知识的能力未得到锻炼、提高。实际操作能力和使用统计软件的能力相当缺乏。学生对这种教学方式比较反感,因而失去学习的兴趣。

1.3考试内容和形式单一

考试是检验学生学习情况的主要途径,也是评估教学质量的主要手段。现在大多数的课程依然沿用传统闭卷笔试的方式,考试的题型主要有填空题、选择题、计算题、证明题、论述题等。这种考试方式注重考察学生掌握基本理论和基本技能的情况,但试卷上的题目毕竟是理想化的,学生为了应付考试,不得不死记硬背公式、定理,导致有的学生虽然考分很高,但运用知识解决实际问题的能力却很差,这样很难考察出学生分析实际问题的能力,从而不能满足独立学院培养应用型人才的要求,而经济预测与决策是一门实用性很强的课程,采用传统的考试形式,显然是不合适的。

2、经济决策与预测课程改革措施

2.1选择合适的教材

适合于应用型人才培养的经济与决策教材是比较少的,而适合独立学院经济统计专业使用的教材就更加少了,独立学院母体学校本科教材存在难度偏大、理论内容偏多、实践技能操作偏少的弊端,这类教材更适合培养研究型人才使用。对于数学基础普遍较弱的独立学院的学生来说,用现有的教材进行教学,学生学习起来困难比较大。根据独立学院学生基础较差的特点,不宜选取理论性太强的教材,要选择简单介绍基本理论,又通过例题讲解计算步骤和如何使用软件解决实际问题的教材,但是实际中满足以上要求的教材很难找到,短期内可以解决的办法就是选一本理论性较强的教材,然后任课老师再选一本统计软件教材教学生使用软件解决实际问题。这样做可以将理论结合实际,但任课老师要注意教学进度,对于独立学院的学生,要通过例题讲解理论知识。在长期教学中,最好的解决方法就是结合独立学生的特点,编写一本适合他们学习的教材,这也是根本解决独立学院经济决策与预测课程教材难选问题的办法。不论是选取教材还是编写教材,对教材的具体要求是:

(1)教材应能系统地介绍理论方法,为学生学习其他专业课程提供分析方法和理论基础;(2)教材应着重介绍各种模型在经济、管理领域的实际应用,在案例选择、编排上要尽量符合社会实际需要,也可以考虑将其他专业课程介绍的方法与这门课程的方法相结合解决实际问题。

2.2针对具体情况采用不同的教学模式

在理论方面,弱化传统的数理逻辑的推证教学方式,强化对模型适用性的识别能力以及利用这些模型分析经济数据能力的训练;注意以我国经济运行真实数据编写案例,结合社会经济的热点问题开展案例教学,积极开展实验,将理论方法的教学与计算软件相结合,克服理论方法和计算机教学相分离的现象,例如在讲非平稳序列的随机分析时,可以以我国每日上证指数数据为实例,运用EVIEWS软件讲解GARCH模型在解决异方差性时的优越性。笔者在教经济预测与决策这门课程时,重点讲的内容是时间序列分析,而教材里提到的其它计量内容,比如回归分析的内容,等专门讲计量经济学课程时再给学生详细介绍。为了让学生学会使用更多的统计软件,在上《经济预测与决策》课程时,使用EVIEWS进行教学,在上《计量经济学》课程时。使用SPSS进行教学,在给学生上《试验设计》课程时,使用EXCEL进行教学。在一个班学生人数较多的情况下,可以采用分组讨论的方式,将学生分成若干小组,并给每个小组指定一名组长,明确各个小组长的职责。如:组长负责组织本组成员按老师的要求开展讨论活动,对组内成员进行工作分工。督促本组成员按时完成工作并对本组成员的工作表现进行评价。除了正常上课外,可以给每个组布置1-2道题目进行讨论,然后从每个组抽同学上讲台说明解题思路,并当场演示计算过程和结果。在一个班学生人数较少的情况下,最好能选择在机房上课,这样更能合理分配讲理论知识内容和实际操作内容的时间,而且可以让每个同学都现场操作软件,采用这种方式既检验了学生平时的学习情况又锻炼了他们展现自我的能力。其次应该多采用案例教学,通过案例讲解理论知识,以案例为起点,教师通过对案例的分析,说明教学的主要内容,介绍课程的基本理论,使案例与课程的基本理论成为一个整体,构成完整的课程内容体系。在开始学习新的课程内容时,学生会感到新的理论知识理解起来比 较困难。因此案例引导法可以在学习新的一章内容时运用。通过案例的引导,可以极大地激发学生的学习兴趣和积极性,使新的教学内容理解起来非常容易。通过案例教学生实际操作,这样既能使学生学起来轻松,又能使学生对知识掌握得更牢固。最后,教师应该向学生详细介绍本课程的前沿性知识和有待解决的问题,启发学生积极思考这些问题,培养学生的自主创新能力。当今时代以知识经济和信息为主题,科学技术的不断创新,是一个国家繁荣昌盛的重要因素之一。平时要加强对学生自主创新能力的培养,让学生自己多思考。要真正培养学生分析、解决问题的能力,仅靠老师课堂教学是不够的,必须让学生经过社会实践的磨练。通过社会实践,既可以巩固课堂教学的成果,还可以为学校相关部门提供有用的决策信息。在上课的过程中与学生互动是非常重要的,通过互动,学生的积极性被充分调动,可以很快得扭转学生被动学习,教师强制“灌输”的局面。

2.3考试形式的多样化

绝大多数课程的学习要求学生掌握以下三个方面的内容:(1)基本知识、基本理论以及基本技能,这些基本内容是进一步深入学习的保证;(2)解决实际问题的能力,这是学习课程的基本目标;(3)自主创新的能力。

由于长期受到传统教育理念的影响,目前的考试形式已经越来越不适合综合考察学生学习知识、能力的现状,因此需要对经济预测与决策课程的考试模式进行改革。在考试内容上,要将理论知识考核和创新能力考核结合起来。用来考核的每一道题目,尽量做到在考察基础知识的同时也能考察到学生的发散思维能力,也就是题目不能太“直白”。要鼓励学生自己独立思考,在考试内容上要尽量将一些社会经济问题适当抽象化使之成为一种创新题型,通过这种“实战”激发学生的创新思维,从而才能真正起到综合考察学生知识、能力、素质的作用;在考试形式上,对经济预测与决策课程而言,可以采用以下一些考试方式:

(1)读书报告。通过写读书报告来考核学生理论基础,要求学生写出每一章的知识点有哪些,重点是什么,报告中还要写学完这门课程后有什么感想等。

(2)课程论文。这种考试形式是以学生写的调查分析报告、预测决策分析报告和实证分析报告等为依据,主要考察学生运用知识解决实际问题的能力和专业写作能力。在经济预测与决策课程中,完全可以让学生对股票、期货进行实证等分析,实践证明这有利于提高学生综合分析问题和解决问题的能力,同时可以起到使学生更加熟练地掌握统计软件的目的。

(3)多种考试形式相结合的综合性考试。这种考试形式是将两种或两种以上的考试形式结合起来进行综合性考核,以评定学生的课程最终成绩,由于教学时间的限制,综合考试形式要求教师在平时授课过程中就要完成大部分的考核内容。如读书报告与分析报告相结合、课程论文与平时成绩相结合等。对学生的考核,不能只在期末或者期中进行,要定期地抽查学生的学习情况,要及时地了解学生掌握实践能力,从而有针对性地改变教学方式。

总之,经济预测与决策对于培养统计学专业学生系统分析问题的思维方式、提高解决实际问题的能力具有重要的影响,因而必须深入探讨经济统计学专业经济预测与决策教学和实践模式,完善课程设置,提高经济预测与决策课程设置的合理性,突出统计专业应用性比较强的特点。同时也可以进一步完善教学的案例数据库建设,提高学生运用经济统计方法的应用能力和解决实际问题的能力。

参考文献:

[1]郑葵,独立学院经济管理专业统计学课程教学改革探讨[J],教书育人・高教论坛,2010,6

[2]曾五一。肖红叶等,经济管理类统计学专业教学体系的改革与创新[J],统计研究,2010,2

[3]曾守桢,岑仲迪,应用型统计学人才培养模式探究[J],教育与职业,2009,5

[4]莫生红,高校统计学课程教学改革探讨[J],新西部,2009,2

篇7

关键词:数理统计;大数据;企业管理

随着科技的发展和信息传播速度的增加,人们处于信息爆炸的时代。与传统的数据相比,在大数据时代,数据具有哪些变化?传统的数理统计方法将会发生怎样的变革?数据处理方式的变化以及数据传播速度的增快将会对企业管理产生怎样的影响?本文重点分析了数理统计方法在大数据时代下企业管理中的运用,从而促进企业不断适应变化,实现长远发展。

一、数理统计的概念与特点

运用数理统计的方法分析生活中的各种数据逐渐成为科学研究的一种趋势,在相关数据的基础之上,通过运用数理统计的方法,可以判断事物发展的趋势,从而归纳出一些客观规律来指导我们的生活,提高生活质量。所谓的数理统计是指运用定量描述的方法分析随机变量之间的关系,通过有限次的观察实验得到数据,发现数据之间的内在规律,并判断整体的数据规律性。基本特点是以实验观察为基本出发点,以概率论作为基础,选择数学模型并进行验证。正确运用充数理统计的方法的前提是掌握数理统计的基本概念和基本思想,而总体和样本是数理统计的基本概念,总体是研究对象的全体,样本是研究对象的一部分。通过样本的信息对总体进行推断是数理统计的基本思想。

二、大数据的概念与特点

目前,学者们对于大数据没有达成统一的定义。一般来说,大数据是指数据资料非常庞大,无法运用目前的软件在短时间内进行数据的分析与处理。它是对大规模数据管理和技术平台的泛称,与传统的大规模数据不同,它除了数据的爆炸性增长之外,还包括对于数据的分析、处理和应用,最终实现挖掘大数据潜在价值的目的。大数据具有数据庞大、种类较多、价值性、处理速度快的特点。与传统的数据不同,在大数据时代,我们分析的数据总量巨大,并不再仅仅依靠传统的随机抽样的方法,除外,由于数据总量庞大,有着多样性和丰富性的特点,使得我们无法确定数据的使用目的。在大数据时代,仅仅依靠传统的几种工具无法实现对于数据的处理和分析,而是运用强大的云计算能力进行数据的处理与分析。

三、大数据时代对于数理统计的影响

统计学是一门具有三百多年历史的学科,在长期的发展过程中,不断吸纳各家之长,使得统计学的发展充满生机与活力。大数据时代的到来,为统计学的发展带来发展机遇的同时又带来巨大的挑战。具体如下:1.大数据对于样本和总体的影响众所周知,数理统计是通过具有代表性的样本推断总体的基本情况,从而对于社会经济发展的总体趋势做出判断。而具有代表性的样本是通过抽样的方式实现的,然而,在大数据时代,虽然信息量庞大,数据类型多样,但是大数据也存在着样本缺乏代表性、噪声等问题,因此,通过抽样的方法对于数据进行分析可能会存在一定的偏差。传统的数理统计方法收集到的数据具有结构化的特点,然而,在大数据时代,数据类型多种多样,容量超大,因此,样本数据与大数据存在很大的不同。样本数据有着特定的研究目的,运用抽样的方法获得数据,具有数据有限的特点。基于样本数据的特点,它的应用空间十分有限,通常无法满足多层次、多样化的需求特点,在抽样过程中出现偏离方案的现象时,抽样便无法进行,因此,样本数据分析的方法无法得到广泛推广。而大数据不仅包含的信息量巨大,而且不受各种限制即可以接纳各种各样的数据类型。与样本数据相比,大数据的优点是数据选择空间巨大,可进行多角度、多方面的数据分析。更为重要的是由于样本数据有限,可能无法判断出数据的某些规律,而通过大数据,某些规律可能会十分清晰。样本数据中无法发现的弱小信息,在大数据中可以找到。在样本数据中被认为是异常的值,在大数据中可能会被接受。因此,在大数据时代背景下,我们认识事物的能力大大提高,充分发掘有用的信息,抓住很多决策分析的机会,促进对于各种社会现象的理解和认识。综上所述,在大数据时代背景下,既可以作为总体也可以作为样本。随着社会的进步、互联网技术的发展,人们处理各种复杂信息的能力大大加强,从多样化的数据中获取有价值的信息越来越多,社会迅速进入大数据时代。在大数据时代,不仅人们的生产方式和生活方式发生巨大变化,企业管理也面临着新的机遇和挑战。2.相关分析发生变化大数据时代的到来使得相关分析发生变化,弥补了传统数据分析中的不足。首先,大数据时代的相关分析必须满足“通用性”和“均等性”的准则,并且结果不受变量间形式的影响。近年来,随着大数据的影响力逐渐增加,国外诸多专家和学者充分认识到大数据的相关分析的重要意义,并且对于改进大数据的相关分析进行了深入的研究。以Reshef(2011)等代表的学者提出了最大信息系数的研究方法,从而有效识别变量间的非函数相关关系。在此基础之上,一些学者提出了随机相关系数和最大相关分析的研究方法1。总之,新的相关分析方法涌现说明国内外学者发现传统的相关分析中存在的缺陷,无法满足大数据时代数据分析的要求,与此同时,他们也认识到大数据时代相关分析的重要性。因此,当务之急是统计分析方法顺应大数据发展的要求。

四、数理统计方法在大数据时代下企业管理中的运用

1.大数据推动企业变革大数据对于企业管理方式产生十分深远甚至是颠覆式的影响,例如:营销方式的变化,商业模式的改变等等。在大数据时代,一个核心问题是数据的预测,大数据意味着一切以数据化的形式存在,也就意味着透明化。除外,数据也不再像过去那样被认为是陈旧的和静止的,在相关数据收集收集完毕后便不再具有价值。大数据时代,通过对原来的数据进行挖掘,可能会发现有用的信息。而对于企业来说,大数据时代要做到运用数理统计的方法做到决策的数据化,实现由过去依靠感觉进行决策向利用数据进行决策的转变。即使过去部分企业认识到数据的重要性也仅仅关注过去的、已经发生的数据,而这些数据存在着滞后的缺陷,管理者依靠主观经验进行决策,那么决策的风险较大。而在大数据时代,管理者充分运用数理统计的方法分析过去、正在发生的全部数据,充分挖掘各种有用的信息,以制定科学合理的决策,从而促进企业的发展。2.进一步提升企业的人力资源价值众所周知,人力资源在企业的成长和发展过程中发挥着至关重要的作用。大数据具有及时性、高处理速度的特点,充分保证数据的真实性和有效性,有利于企业进行科学决策,发现适合企业发展的优秀人才。传统的企业人才招聘方式为结合企业的战略目标、岗位分析等设定相关标准,然后依据这些标准对简历进行筛选,那么与企业战略目标和岗位分析标准契合度较高的候选者即为企业需要的人才。然而,首先各类标准的制定可能是片面的,因此,招聘到的人才可能不符合企业的要求。除外,面试是一个依靠情商和智商综合判断的过程,及时设定了各种硬性指标,在实际的面试中,HR可能受多种综合因素的影响,难以做出正确的决策。而在大数据时代背景下,可以减少这种不确定性的影响。通过数理统计的方法,对于收集到的各种数据进行收集、处理和综合分析,发现求职者的各种素质和企业招聘人才之间的关联性,找到真正适合企业发展的人才。并且随着企业收集到的信息越来越多,发现适合企业的优秀人才的概率会越来越大。通过这种招聘方式,不仅可以大幅度降低招聘成本,而且能够拓宽企业招聘渠道,丰富企业招聘形式,提高企业招聘的精确度,促进企业的长远发展。随着数据处理方式的不断改进,人们对于大数据挖掘到的信息必将越来越丰富,这有利于提高企业决策的科学性,推动企业的长远发展。

参考文献:

[1]程鑫,石洪波.大数据时代传统相关分析的局限性与拓展[J].统计与决策,2015,05,;73-74.

[2]邱东.大数据时代对统计学的挑战[J].统计研究,2014,31(1):16-17.

篇8

【关键词】数据挖掘;会计管理;计算机技术

一、数据挖掘

数据挖掘是从数据当中发现趋势和模式的过程,它融合了现代统计学、知识信息系统、机器学习、决策理论和数据库管理等多学科的知识。它能有效地从大量的、不完全的、模糊的实际应用数据中,提取隐含在其中的潜在有用的信息和知识,揭示出大量数据中复杂的和隐藏的关系,为决策提供有用的参考。数据挖掘是从数据当中发现趋势和模式的过程,它融合了现代统计学、知识信息系统、机器学习、决策理论和数据库管理等多学科的知识。它能有效地从大量的、不完全的、模糊的实际应用数据中,提取隐含在其中的潜存有用的信息和知识,揭示出大量数据中复杂的和隐藏的关系,为决策提供有用的参考。

二、数据挖掘的现代最新方法介绍

常用的数据挖掘方法主要有决策树(decision tree)、遗传算法(genetic algorithms)、关联分析(association analysis).聚类分析(c~smr analysis)、序列模式分析(sequential pattern)以及神经网络(neural networks)等。

三、数据挖掘的实际应用

由于数据挖掘市场还处于起步的阶段,但是发展很快。在国外有一些著名的大公司对数据挖掘系统进行了开发。

1.intelligent miner这是ibm公司的数据挖掘产品,它提供了很多数据挖掘算法,包括关联、分类、回归、预测模型、偏离检测、序列模式分析和聚类。有2个特点:一是它的数据挖掘算法的可伸缩性;二是它与ibm/db/2关系数据库系统紧密地结合在一起。

2.eineset是由sgi公司开发的,它也提供了多种数据挖掘方法,包括关联分析和分类以及高级统计和可视化工具。特色是它具有的强大的图形工具,包括规则可视化工具、树可视化工具、地图可视化工具和多维数据分散可视化工具,它们用于实现数据和数据挖掘结果的可视化。

3.clementine是由isl公司开发的,它为终端用户和开发者提供提供了一个集成的数据挖掘开发环境。

4.dbminer是由dbminer technology公司开发的,它提供多种数据挖掘算法,包括发现驱动的olap分析、关联、分类和聚类。特色是它的基于数据立方体的联机分析挖掘,它包含多种有效的频繁模式挖掘功能和集成的可视化分类方法。

四、数据挖掘与管理会计

1.提供有力的决策支持

面对日益激烈的竞争环境,企业管理者对决策信息的需求也越来越高。管理会计作为企业决策支持系统的重要组成部分,提供更多、更有效的有用信息责无旁贷。因此,从海量数据中挖掘和寻求知识和信息,为决策提供有力支持成为管理会计师使用数据挖掘的强大动力。例如,数据挖掘可以帮助企业加强成本管理,改进产品和服务质量,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。

2.赢得战略竞争优势的有力武器

实践证明数据挖掘不仅能明显改善企业内部流程,而且能够从战略的高度对企业的竞争环境、市场、顾客和供应商进行分析,以获得有价值的商业情报,保持和提高企业持续竞争优势。如,对顾客价值分析能够将为企业创造80%价值的20%的顾客区分出来,对其提供更优质的服务,以保持这部分顾客。

3.预防和控制财务风险

利用数据挖掘技术可以建立企业财务风险预警模型。企业财务风险的发生并非一蹴而就,而是一个积累的、渐进的过程,通过建立财务风险预警模型,可以随时监控企业财务状况,防范财务危机的发生。另外,也可以利用数据挖掘技术,对企业筹资和投资过程中的行为进行监控,防止恶意的商业欺诈行为,维护企业利益。尤其是在金融企业,通过数据挖掘,可以解决银行业面临的如信用卡的恶意透支及可疑的信用卡交易等欺诈行为。根据sec的报告,美国银行、美国第一银行、联邦住房贷款抵押公司等数家银行已采用了数据挖掘技术。

五、数据挖掘在管理会计中的应用

1.作业成本和价值链分析

作业成本法以其对成本的精确计算和对资源的充分利用引起了人们的极大兴趣,但其复杂的操作使得很多管理者望而却步。利用数据挖掘中的回归分析、分类分析等方法能帮助管理会计师确定成本动因,更加准确计算成本。同时,也可以通过分析作业与价值之间的关系,确定增值作业和非增值作业,持续改进和优化企业价值链。在thomas g,john j和il-woon kim的调查中,数据挖掘被用在作业成本管理中仅占3%。

2.预测分析

管理会计师在很多情况下需要对未来进行预测,而预测是建立在大量的历史数据和适当的模型基础上的。数据挖掘自动在大型数据库中寻找预测性信息,利用趋势分析、时间序列分析等方法,建立对如销售、成本、资金等的预测模型,科学准确的预测企业各项指标,作为决策的依据。例如对市场调查数据的分析可以帮助预测销售;根据历史资料建立销售预测模型等。

3.投资决策分析

投资决策分析本身就是一个非常复杂的过程,往往要借助一些工具和模型。数据挖掘技术提供了有效的工具。从公司的财务报告、宏观的经济环境以及行业基本状况等大量的数据资料中挖掘出与决策相关的实质性的信息,保证投资决策的正确性和有效性。如利用时间序列分析模型预测股票价格进行投资;用联机分析处理技术分析公司的信用等级,以预防投资风险等。

4.产品和市场预测与分析

品种优化是选择适当的产品组合以实现最大的利益的过程,这些利益可以是短期利润,也可以是长期市场占有率,还可以是构建长期客户群及其综合体。为了达到这些目标,管理会计师不仅仅需要价格和成本数据,有时还需要知道替代品的情况,以及在某一市场段位上它们与原产品竞争的状况。另外企业也需要了解一个产品是如何刺激另一些产品的销量的等等。例如,非盈利性产品本身是没有利润可言的,但是,如果它带来了可观的客户流量,并刺激了高利润产品的销售,那么,这种产品就非常有利可图,就应该包括在产品清单中。这些信息可根据实际数据,通过关联分析等技术来得到。

5.财务风险预测与评估

管理会计师可以利用数据挖掘工具来评价企业的财务风险,建立企业财务危机预警模型,进行破产预测。破产预测或称财务危机预警模型能够帮助管理者及时了解企业的财务风险,提前采取风险防范措施,避免破产。另外,破产预测模型还能帮助分析破产原因,对企业管理者意义重大。,数据挖掘技术包括多维判别式分析、逻辑回归分析、遗传算法、神经网络以及决策树等方法在管理会计中得到了广泛的应用。

六、结论

篇9

关键词:大数据;统计学;教学体系改革

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)04-0110-02

一、大数据时代统计学专业发展的新特点

(一)数据化的信息收集

传统的统计研究主要是对已收集的数据进行各种技术分析,包括描述性分析、推断性分析、截面分析、时间序列分析等,侧重点在于技术分析手段的使用上。然而大数据时代,关注的是信息本身。现代信息系统的使用使大数据成为可能,文字、地理方位、沟通等,任何事物都可以量化,一切现象都可以用数据或表格来诠释。因此,大数据背景下世界是由各种信息和数据所构成的。

(二)全数据模式的研究对象

在信息处理能力受限制的过去,人们缺少用来分析所收集数据的工具,因此产生了随机抽样。随机抽样法的目的是用最少的数据获得最多的关于总体的信息,从而使用样本对总体进行推断。然而,在大数据时代,数据处理的方式和技术发生了巨大的改变,人们可以通过互联网、数据库以及各种通讯工具获得海量数据,这时随机抽样就失去了它原来的意义。简单廉价的数据收集方法,足够的数据处理和存储能力,使得全数据模式成为可能。因此,大数据背景下样本即为总体。放弃随机抽样分析的捷径,采用所有数据的方法,可以发现一些隐藏在海量数据下的细节。

(三)混杂性的数据处理思维

传统的统计学处理数据的步骤是首先对数据进行整理和清洗,剔除不完整的或者异常值,然后再利用样本信息,在允许的误差范围内对总体进行推断和分析,即通过调整精确度的大小来对总体进行研究和分析。然而,在大数据背景下,来自各个时间和空间的数据来源纷杂,格式广泛,在萃取或处理数据的时候,很难做到把所有的数据都进行仔细地清洗。这种情况下,必须接受数据的混乱和不确定性,因为数据多比少好,因此更多的数据信息比更加智能、更加精确的算法系统还重要。当拥有大量数据的时候,可以忽略一部分精确性,但并不是说不需要精确性,而是数据规模不断扩大时,确切的数量已经不再那么重要了,可以通过大规模的数据来发现事物背后的规律。

(四)相关关系的基础分析方法

传统的统计中,大部分相关关系分析仅限于寻求线性关系,或是在建立假设的基础上揭示数据相互之间的因果关系,例如Granger检验就是依据时间序列数据对变量之间的因果关系进行的判断,但往往会产生一些虚假的因果关系。这是因为统计关系并没有蕴含多少真实的因果关系。在大数据背景下,数据点以数量级方式增长,用数据驱动的相关关系分析不再需要建立在假设的基础上,所以相关关系分析不容易受偏见的影响而发生错误。大数据时代相关关系通过回答“是什么”的问题,为人们认识世界提供了一种新的视角。因此,相关关系统计分析是大数据预测的基础。

二、统计学专业教学体系中存在的问题

大数据背景下传统的统计学专业教学体系存在的问题凸显,具体体现在以下几个方面。

(一)培养目标无法适应大数据时代的社会需求

传统的统计学专业教学体系的培养目标是通过统计专业核心课程内容的介绍,锻炼学生收集、整理和分析数据的能力,培养“应用型”统计专业人才。然而,大数据的出现,使得通过数据分析获得知识、商机和社会服务的能力,从以往局限于少数的学术精英圈子扩大到了普通的社会机构、企业和政府部门,各行各业对统计数据、统计分析的需要使得统计学专业受到了前所未有的关注。大数据背景下,要求统计学作为一种分析工具,能够与其他专业相互衔接,相互服务,培养“复合型”专业人才。因此,传统的统计学专业教学体系培养目标存在两个方面的挑战:第一,如何协调统计与其他专业之间的关系;第二,如何从“应用型”向“复合型”人才进行转变。

(二)忽视数据的收集和创新

传统的统计学专业教学体系重视数据的分析技术,更多的课程设置是围绕着数据分析方法和技术展开的,例如多元统计分析、时间序列分析、统计预测与决策分析等。基础的数据收集部分只在统计学原理中有一章的内容介绍,而且是作为非重点一带而过的。大数据以海量的数据为分析研究的对象,将一切社会经济现象进行量化,重视的是信息的收集和数据的创新,包括数据的再利用,数据的重组,数据的扩展,数据的折旧以及数据的开放等各个方面。这些内容在原有的教学体系中是没有体现的。

(三)与大数据时代脱节的教学内容

传统的统计学专业教学体系仍然固守着原有的教学内容,在近二十年内变化不大。专业的主干课程有统计学原理、国民经济核算、计量经济学、抽样技术与方法等。而在大数据背景下,教学内容以全数据模式为研究对象,强调对所有的数据进行分析,而不是开展随机抽样;允许不精确的存在,而不是在给定的精确程度下对总体进行推断和分析;关注海量数据之间的相关关系,而不是强调数据之间的因果联系。这些内容都无法在现有的教学体系中体现,因此,传统的专业教学体系与大数据时代是脱节的。

(四)实践教学环节薄弱

随着“应用型”统计专业人才培养目标的提出,学校对实践教学的重视增强,与过去相比,现有的专业教学体系中已经增加了实践教学环节。但是,在大数据背景下,实践教学仍然是统计学专业教学体系中的薄弱环节。主要表现在两个方面:(1)以模型驱动为主的实践教学模式已不适应大数据时代的要求。现有的实践教学内容并不是从数据出发,而是通过寻求一些适合模型的数据来“证明”这个模型的确有意义。这种思维方式与大数据时代的要求是不适应的,因为创造模型的目的是适应现实数据,而不是由模型驱动。(2)以SPSS、Eviews为主的软件教学已无法处理大数据。现有的实践教学中,主要讲授的是传统的统计分析软件SPSS和Eviews,因为这两种软件发展成熟,操作简单,可以处理一般的计量模型和时间序列。但是,大数据时代数据是海量的、复杂的,用简单的软件已无法处理和实施。

三、统计学专业教学体系改革的方向

根据以上分析,时代的发展对统计学专业提出了更高的要求,现有的教学体系中存在的各种问题即为统计学专业教学体系改革的方向。

(一)准确定位统计学专业的人才培养目标,重新设计主干课程的教学内容

大数据时代要求培养“复合型”统计专业人才,因此教学体系的培养目标要从简单的“应用型”向“复合型”转变。“复合型”统计专业人才要求学生除了具备数据收集、处理和分析的能力外,还要对统计学应用领域的背景知识有一定的了解。因此,按这个培养目标,需要对现有教学体系中的主干课程重新进行调整和设计。专业主干课程分为方法和应用两个方面。方法类的课程除了原有的计量经济学、时间序列分析、多元统计分析等外,又增加了机器学习、模拟算法、数据挖掘、R软件分析(或SAS软件分析)等处理复杂大数据的方法的课程。应用类课程在保留原有的国民经济核算,金融统计,证券投资,会计学基础外,增加一些统计学应用领域的基础知识课程,例如商业统计、生物统计、保险与精算统计等。此外,适当调整各专业主干课程的课时,一些课程可以增加课时,如软件分析、数据挖掘等,一些课程可以缩减课时,仅作一些简单的介绍,如抽样技术等。

(二)转变固有的思维方式,在大数据背景下积极推进教学改革

大数据时代,数据更多、更杂,传统统计学思维方式受到了极大的挑战。因此,以大数据为背景,转变固有的思维方式,从以统计技术方法为中心转换到以信息数据为中心,推进统计学专业教学改革十分重要。具体来说,可以弱化传统的推理论证的教学模式,强化数据收集、数据处理和数据分析的能力培养;强调数据本身的价值,让数据说话,用简单的方法了解数据背后所隐藏的信息和规律;使用项目式训练,让学生从项目中真正体验数据化处理的整个过程,达到理论和方法的结合;加强课堂教学与实验教学的统一和贯通,如在传统的教学过程中,将统计学原理、多元统计分析结合SPSS软件介绍,而时间序列分析又采用Eviews进行介绍,造成学生疲于学习各种软件,实际上SAS、R等统计软件可以实现所有的功能,用一种软件与课堂教学融合贯通能帮助学生更好更深地掌握软件的使用。

(三)创新实践教学模式,加强实践教学的开展

从以模型驱动的实践教学模式转变为以数据驱动的教学模式,构造课堂案例教学、实验教学、课后项目式训练、校外实习基地锻炼四位一体的创新型实践教学模式。计算机快速发展的今天使得大数据成为现实,在处理数据的时候,根据数据的特征创造出新的计算方法来满足实际需要,这就是数据驱动模式。在实践教学的过程中,要强调统计数据、计算机编程以及统计分析软件的结合。目前,R软件和SAS软件显示出了强大的数据处理和数据分析功能,实践教学环节中可以把这两种中的一种融入到专业课程中去,将计算机软件与课堂教学结合起来。此外,课后的项目式训练和校外实习可以带动学生了解和掌握整个数据分析实践的流程,激发学生学习的兴趣,在实践教学的过程中要多鼓励、多开展。

参考文献:

[1]曾五一,等.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2010,(2).

[2]陈倩.大数据背景下对统计学课程教学模式的思考[J].科技资讯,2013,(21).

篇10

关键词:节约集约利用;模糊综合评判法;建设用地;长春市

中图分类号:F301.5 文献标识码:A 文章编号:0439-8114(2017)06-1173-03

DOI:10.14088/ki.issn0439-8114.2017.06.045

Abstract: Based on fuzzy comprehensive evaluation method, the economical and intensive index system of construction land in Changchun was studied, and the economical and intensive utilization degree of the regional construction land was evaluated. The results showed that, the intensive degree in Nanguan and Chaoyang district belong to level 1. Yushu city and Lvyuan district were at level 2. Dehui city and Shuangyang district belong to level 3. Jiutai city, Nong'an county, Erdao district and Kuancheng district were at level 4.

Key words: economical and intensive utilization; fuzzy comprehensive evaluation method; Changchun city

很长时间以来,中国经济的快速发展在很大程度上是以消耗土地资源为前提的,中国工业化程度不断提高,城市化快速发展,仅仅凭借存量建设用地难以满足工业化、城市化对土地日益增长的需求,大城市普遍出现了“摊大饼”的发展势态,建设用地的巨大需求与可供土地的严重短缺之间的矛盾日益突出。中国面临着前所未有的紧张态势:耕地相对数量少、质量低、后备资源不足;建设用地利用效率低,结构不合理、闲置严重且迅猛发展。土地资源的瓶颈、外向型经济模式的风险和“人口红利”的消退都已经警示我们:粗放的经济发展模式已经在中国难以持续下去。

当前长春市新型工业化、城镇化和农业现代化进程步入加速发展阶段,在粮食安全和生态建设双重制约下,建设用地的巨大需求与可供土地的严重短缺矛盾日益突显,因此长春市工业化、城镇化和农业现代化必须走节约集s用地之路。

1 研究区概况

长春市是吉林省省会,位于北半球中纬地带,欧亚大陆东岸的东北松辽平原腹地。西北与松原市毗邻,西南和四平市相连,东南与吉林市相依,东北同黑龙江省接壤。总面积20 594.86 km2。长春市现辖朝阳区、南关区、宽城区、绿园区、二道区、双阳区、榆树市、九台市、德惠市和农安县10个区、县(市),2006-2011年,长春市地区生产总值持续保持高速增长,年均增长率为15.10%,2011年,长春市常住人口为762.69万人,人口密度为每平方千米370人[1]。

2 数据来源与研究方法

2.1 数据来源

本研究数据来源于长春市第二次土地变更调查、第六次人口普查数据及第二次经济普查数据,城市规划图件来源于长春市规划局,其他数据来源于长春市统计年鉴。

2.2 研究方法

2.2.1 层次分析法(AHP) 层次分析法是一种将定性与定量分析方法相结合的多目标决策分析方法[2],该方法的主要思想是将一个复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。

为了更准确地确定权重,减小主观因素的影响,先基于SPSS软件判别是否适合主成分分析法,检验结果见表1。按照统计学家Kaiser给出的标准,若KMO>0.60且相伴性概率小于显著水平0.05,则认为基础数据适合主成分分析。由表1可知,KMO=0.537

基于MATLAB软件平台,依据层次分析法得出评价指标权重值,见表2。

2.2.2 模糊综合评判法 模糊综合评判法是指对受到多个因素影响的事物做出全面评价的一种有效的多因素决策方法,所以又称为模糊综合决策或者模糊多元决策[3]。在模糊综合评判法中,评价指标隶属函数对单项因素因子的评价结果起决定性作用,根据评价因素因子对评价对象的影响方式的不同,常用的隶属度函数一般可以分为线性衰减、抛物线衰减、峰值型等函数模型。长春市建设用地节约集约的11个指标基本呈现出线性衰减或者下降趋势[4],所以隶属函数的选择为:评价指标与土地利用节约集约程度呈线性衰减。

U(x)一= 1 (x≤a)■x+■ (a

U(x)二= 0 (x≤a)■x-■ (a