数据统计分析的目的范文

时间:2024-02-18 17:57:00

导语:如何才能写好一篇数据统计分析的目的,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

数据统计分析的目的

篇1

关键词:建设项目风险分析;数据挖掘;数据仓库;信息系统

中图分类号:F27文献标识码:A

一、引言

建设项目风险分析过程中需要考虑大量的风险因素,如自然条件因素、材料因素、技术因素、合同因素、管理因素、信息因素等,在多数的工程风险管理实例中最常用的风险分析和分析方法是依靠专家和有经验的工程师通过感性认识和经验进行判断,如果风险分析不合理,则可能导致风险控制不力,出现工程拖期、资源和成本投入增加、甚至重大损失的情况。与此同时,建设企业在不断增多的承接项目中积累了大量的工程资料,这些工程资料承载的项目运营的经验和教训,蕴含着丰富的风险知识和信息。然而,这些信息往往受制于技术手段的影响而无法得到有效的利用。因此,如何利用海量的建设工程资料为建设项目风险管理提供决策服务成为工程信息管理领域的重要课题。目前,随着数据仓库、数据挖掘技术的快速发展,为这一问题的有效解决创造了条件。本文将数据仓库、联机分析处理(OLAP)、数据挖掘技术引入建设项目风险分析领域,提出一种建设项目风险信息挖掘系统。以数据仓库为基础建立数据模型,以建设项目信息管理系统(PIMS)为平台,以联机分析处理(OLAP)、数据挖掘技术为基础建立建设项目风险信息挖掘架构。

二、建设项目风险分析过程及特点

建设项目风险分析由风险识别、风险估计和风险评价三个环节组成。风险识别是指识别出对建设项目可能构成危害的所有风险因素,并将其统计归类。风险识别有助于工程风险管理组织及时发现风险,减少风险事故的发生。风险估计在风险识别的基础上通过对大量的、过去的损失资料的定量和定性分析,估计出工程风险发生的概率和造成损失的程度,并尽可能找出这些风险因素之间的关系以确定它们之间的相关度。最后评价这些风险因素对建设项目各指标的影响,确定它们的重要性,从节省成本的角度考虑,在实际建设项目进行中,应仅对重要的风险因素进行有效的监控及管理。

显而易见,风险分析是一项无论从管理还是技术上都极具复杂程度的工作,它有以下两个特点:第一,在风险识别中,要正确识别出风险因素,风险分析人员必须对即将开始的建设项目本身和相关的外部环境做大量的信息调查研究及有较深入的理解,正确的风险因素的识别是风险分析后续工作的前提和基础;第二,建设风险估计通常来源于两个渠道:一是根据个人建设风险主观判断而得出的结果;二是利用对长期工程实践资料的观察和统计出的结论。通过主观判断的风险大小在很多情况下往往不准确,而对历史资料的统计会耗费大量时间经历。一旦风险分析不准确,就会给整个建设项目带来损失。(图1)

风险分析的目的是为了准确获得建设过程中的风险因素和这些风险因素带来的影响程度,从而为制定风险计划、采取风险措施提供依据。因此,如何提高风险因素的识别准确性,如何定性分析和定量分析风险因素分布概率和评价是风险分析信息支持系统的必要工作。开发建设项目风险信息挖掘系统的目的就是利用数据仓库系统识别风险,对风险进行定性和定量的分析,并基于此给出风险控制及管理的计划或建议。

三、数据仓库的总体设计

在本系统中,数据仓库集成和存储的信息来源选取为已经应用较为成熟的建设工程管理信息系统(PMIS),而该系统本身就是规模庞大且资源异质的数据库。风险信息挖掘系统总体建模方法如图2 所示。(图2)首先对对应主题数据的存储和综合,从源数据库的不同结构中抽取数据,包括成本、进度、质量、合同各项建设信息管理子系统中取得的文本、数据、图像、图纸以及评价规则等,然后对其进行清理、集成与转换,目的是消除数据的属性特征等差异后,将他们按照一定的粒度和尺度进行规范化纠正,使得各种数据类型能够在定义域空间中叠加,以提供面向全局的数据视图。这些经过净化和集成处理过的数据,具有较高的质量和统一性。由于在建设工程信息管理系统中存在大量的非结构化数据信息,如各种工程联系单、工程报告、设计任务书和相关图纸等,因此把相关非结构化信息颗粒通过关联算法和规则筛选整理成结构化数据的工作就显得尤为重要。

数据仓库形成后,把OLAP集中用于数据的分析,数据挖掘则致力于知识的自动发现,从数据中获取有用的知识。将三者分别应用到决策支持系统的设计和实现中,提高了相应部分的处理能力。联机分析处理实现多维数据分析,它从集成的数据仓库中的数据出发,通过构建多维的数据模型对信息从多种可能的角度进行快速、一致、交互性地存取,进而实现对数据进行深入的分析。数据挖掘自动地挖掘出数据中隐藏的模式和信息,预测未来的趋势,并可以直接用于指导联机分析处理。专家系统可以利用知识推理进行定性分析。它们集成的综合支持系统,将相互补充和依赖,发挥各自的辅助风险决策优势,实现更有效的辅助支持。

四、数据仓库模型设计

本文使用最常用的E-R模型方法作为概念模型组建数据仓库,在模型中采用了常用的星形结构,其优点是建模方便,易于用户理解,并能支持用户从多个维度对数据进行分析。

根据主题中涉及到的决策需求,对数据进行初步整理,最终创建了建设项目风险信息事实表,并建立了与之相关的时间、作业运行状态、环境参数、人员参数、技术参数、机械材料运行参数等维表,而维表可用于这些信息的扩展。结构如图3所示。(图3)

五、建立建设项目风险信息挖掘系统

1、OLAP模块。利用Microsoft OLAP Analysis Services服务端组件,根据数据仓库中的事实表和维表,对数据仓库中的数据进行多维化表示。采用的分析方法是对多维数据进行切片、切块、聚合、钻取和旋转等操作,以求从多个维度、多个侧面、多种数据综合度提取有关数据,从而了解数据背后蕴含的规律。利用OLAP模块完成对作业ID维、作业运行状态维、各项风险因素的数据分析,并展现出分析结果,以容易理解的方式呈现,如报表、图表等。通过数据透视表服务提供的接口,采用MDX语句来完成对生成的多维数据集的查询。

2、数据挖掘模块。Analysis Services 通过API-OLE DB for Data Mining实现了数据挖掘的功能,这是一个为方便各种应用程序使用数据挖掘功能而设计的编程接口。通过API,利用各种挖掘算法,建立各种模型来完成挖掘任务。

(1)作业状态与风险因素关联性分析模块。数据关联是数据中存在的一类重要的可被发现的知识,用关联规则算法可以发现项目事故原因。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联分析的目的是找出数据中隐藏的关联网。在此决策支持系统中,根据风险发生的经验知识,利用Apriori算法,挖掘在某特定时间段内风险因素与某些作业运行状态之间的关联规则。

(2)趋势分析与预测模块。通过作业状态与风险因素关联性分析模块分析已有的风险发生数据,得到风险发生规则,可以用来对正在或将要开工项目的风险因素进行预测,项目管理人员可以由此采取相应风险控制措施,以降低事故发生的可能性。

3、系统结构。系统采用客户机/服务器三层结构。由客户机、应用服务器和数据库服务器构成。在客户端基于Visual C++实现用户界面部分,OLAP和数据挖掘在应用服务器中实现,底层数据仓库在数据库服务器端实现。客户端用来向用户提交返回结果,应用服务器处理应用逻辑,必要时从数据库服务器获取数据,再向客户端返回结果。数据库服务器还要处理数据仓库的更新维护。

六、结语

本文对数据仓库、联机分析处理(OLAP)数据挖掘技术在建设项目风险分析支持系统中的应用进行了初步尝试,结合建设项目风险分析流程的特点,设计出系统中数据仓库的总体结构和数据存储结构,并在此基础上利用挖掘方法可以找到有关风险分析的新知识,包括重要的风险因素模型,各风险因素之间的联系,事故产生条件等内容。相信随着数据仓库技术、联机分析处理技术、数据挖掘技术的不断发展和完善,建设项目风险分析支持系统必然有更广阔的应用前景。

(作者单位:重庆大学建设管理与房地产学院)

主要参考文献:

[1]Inmon W H.Building the data warehouse(Third Edition)[M].John Wiley&Sons,2002.

[2]Han Jiawei,Kamber.Data Mining:Concepts and Technique[M].Morgan Kaufmann,2000.

篇2

【关键词】《数据统计分析》;教学内容;教学方法;考核方式

一、引言

随着信息技术的发展,在经济管理中会出现越来越多的数据,如何挖掘这些庞大的数据,发现有用的信息已成为管理中迫切需要解决的问题。如在网上营销中,我们急需知道哪一类人需求某一种商品,从而使营销能够有的放矢,最大限度地扩大销售量。而《数据统计分析》正是讲述如何收集数据,整理数据,分析与解释数据,研究如何在浩瀚的数据中发现信息并指导我们的经营管理。因此《数据统计分析》成为财经学院的学科基础课,成为该类学校各专业的必修课。希望该门课程的讲授能够让学生掌握基本的统计分析方法,并能够运用这些统计方法解决实际问题。

笔者通过这几年对这门课的讲授与学生的交流,发现学生在学习这门课的过程中普遍存在如下几个问题。

第一,该门课程涉及深奥的概率知识与统计理论以及复杂的推导,学生普遍感觉该门课程的理论很难以掌握。

第二,虽然通过统计软件操作出结果,但对结果的解读不一定正确。

第三,学生普遍对这门课很有兴趣,但在学习过程中总感觉内容太多,学过易忘。

对于这些问题,作为教师该如何调整教学,使学生能够克服以上问题?本文从以下几个方面进行了教学改革,提高了教学质量,激发了学生兴趣。

二、《数据统计分析》教学内容调整

对于财经学院的学生来说,学习这门课以前,普遍学习了《高等数学》《线性代数与概率统计》,但学得不一定深,学生对于统计分析所要求的各种分布性质、矩阵与向量的计算等理论推导很头疼。因此,教师应该以“学以致用”为原则,坚持理论与实践相结合,理论适可而止,重点在于应用与实践。根据这些原则构建“基础理论-统计软件-实践教学”授课体系,首先浅显地讲述理论,然后在统计软件中进行操作,对得出的结果进行详细的分析,结合实际案例进一步加深对理论的理解以及结果的解读。因此教师在本课程教学中应以实践为主,可以开设为全实验课程。

授课内容的选取与教材有关。本课程选取了薛薇主编的《SPSS统计分析方法及应用》,该书是北京市高等教育精品教材。重点教授内容为与经济管理相关的数据文件建立、数据预处理、数据的描述统计、参数检验、非参数检验、回归分析、聚类分析、因子分析、信度分析和时间序列分析。与统计分析相关的统计软件有Matlab、SAS、SPSS、R、Eviews、STATISTICA等,而SPSS全部是界面式操作,对于不是计算机与统计相关专业的学生来说是最容易上手的。而且SPSS软件包含了统计分析方法的所有功能和强大的图形输出功能,可以输出简洁漂亮的y计分析图表。运用SPSS 软件,可以使理论概念变得直观、准确、具体、形象,将理论知识融入实践中来,增强学生对概念的理解和对数据处理方法的运用[1]。而在该教材中,对于SPSS操作讲解非常详尽,每种统计方法结合具体案例都有详细的讲解。

三、《数据统计分析》教学方法与手段革新

从以上分析可知,该门课程应用实践性很强。在教学中如何避免复杂的理论记忆而掌握各种统计方法,并能学以致用呢?本文从以下几个方面进行阐述。

(一)运用以“统计思想”为中心的“黑箱”教学方法

什么是统计思想?统计思想是关于“为何统计,统计什么,如何统计”的思想,就是关于统计的世界观和方法论[2]。《数据统计分析》有很多统计方法,每种统计方法都有复杂的统计理论及推导。对于经济管理类学生来说,掌握所有的理论推导有一定的难度,但可以理解相应的统计思想。在统计教育中,掌握了统计思想,就慢慢培养了看问题的统计思维方式和思维习惯,统计思想教育应重于统计方法教育[3]。因此,教师在教学中应使每种统计方法的理论讲解浅显易懂,重点讲清楚统计思想。所谓“黑箱”教学方法就是从综合的角度提供了一条人们认识事物的重要途径,尤其对某些内部结构比较复杂的系统,它是从系统的观点出发,强调在整体与部分之间、整体与周围环境的相互联系中认识事物,而不去深究其内部结构和局部细节[4]。所以教师在统计理论的讲解中,应把学生从复杂的统计理论与推导中解脱出来,把这些当作“黑箱”,只需在学生头脑中建立起某种统计方法的统计思想,然后随着授课进度的深入,结合具体的案例再讲解这些理论与方法。例如对于非参数统计,可以借助已学过的参数检验,讲解非参数统计的统计思想也是“提出假设-建立统计量-计算概率-是否拒绝原假设”,只是参数检验是在数据符合正态分布的条件下,推断检验数据的均值与标准差是否相等,而非参数检验是小样本统计推断下,判断各数据是否来自同一分布。学生理解非参数统计思想后,再打开“黑箱子”,阐明非参数检验各种情况下统计量的来源及计算方法。

(二)以“案例”为导向讲述统计的理论与方法

《数据统计分析》这门课理论复杂,只有与实践相结合,统计的理论与方法才能被学生充分理解和接受。案例教学是一种通过模拟或者重现现实生活中的一些场景,让学生把自己纳入案例场景中,通过讨论或者研讨的方式来进行学习的教学方法[5]。学生在教师的指导下,对案例进行思考,分析与讨论,从而在案例中掌握所授课的内容。例如讲述“因子分析时”,可以先阐述因子分析的统计思想就是降维以及相关的适用条件、因子的抽取、因子的命名解释等,然后以某一行业上市公司的盈利能力指标为例让学生进行因子分析。在案例讨论分析时,教师首先引导学生分析数据是否适用于因子分析,然后让学生考虑应该抽取几个因子,每一个因子包含哪些盈利指标,每一个公司在新因子的得分情况如何,最后让学生分析如何对所有公司的盈利能力进行综合排名。在这样一个案例讨论中,通过教师循序渐进的引导,学生不断加深对该方法的理解,而且对一些晦涩的概念如方差贡献率、载荷矩阵、因子得分等有了感性认识,增强了学习兴趣。

(三)加强学生上机实验的体验式教学模式

所谓体验式教学模式,主要是组织体验和引导反思,让学生在经历和实践中实现自我领悟,在反思中重构自己的经验,形成自己的行动策略和方式,从而习得相关知识[6]。为了使学生掌握相关的统计知识,可以让学生亲身运用SPSS体验某种统计分析方法。这样教授每部分内容时,必须准备好相应的实验指导书与实验报告。在实验指导书中简单阐述相P的理论、实验内容以及相关的SPSS操作步骤与结果。学生根据实验指导书完成实验报告中的新内容,并撰写实验分析报告,实验报告主要是实验结果以及对结果用规范的统计语言进行描述,分析与解释。学生做完实验报告后,教师根据实验情况进行讲解与分析,验证实验结果。每部分授课内容通过这样的体验式教学,学生就会懂得相关的统计分析方法、操作与结果分析,达到教学目的。

(四)充分利用信息技术,构筑立体化教学模式

对于该门课程,教师在课堂教学中可以充分利用多媒体技术制作一些动画与视频,吸引学生的兴趣。课堂教学以外,可以构建该课程的网络教学平台,提供上课视频、课件、实验指导书、实验报告等,让学生可以对课堂内容进行复习和自主学习。对于该课程的拓展及补充内容,制作一些微课,进一步拓宽学生的知识视野,提高学生的自主学习能力;还可以开设网上答疑和学习讨论空间,对学生提供在线答疑。

四、《数据统计分析》考核方式改革

在每门课程中,学生最关心的是考试,但一次理论考试根本不足以评价学生的学习情况。该门课程又是一门实践性较强的课程,因此应改革考核方式,变为如下图的综合考核体系。

在该门课程考核中,根据课堂表现和实验报告考核学生上课情况。在教学中把教学内容分为两部分进行阶段化理论考核:第一部分包括数据预处理、基本描述性统计、统计推断;第二部分包括相关分析、线性回归分析、聚类分析、因子分析、时间序列分析等。对于期末大作业,让学生收集感兴趣的三套数据,运用学过的方法进行分析与评价,这样可以充分考核学生对已学知识的实践应用能力。在这样一个综合考核体系中,学生在每部分阶段考核中,为了通过考核,必然会对这部分内容进行复习,而不是累积到期末再复习,这样就不会感觉要学的内容繁杂,学了后面忘前面。该评价体系不仅考核了学生是否掌握理论知识,而且进一步考核了学生应用知识的能力,从而提高了学生的分析能力。

五、结束语

综上所述,《数据统计分析》是一门应用性很强的课程,随着信息技术的发展,它在经济管理中的应用越来越广泛,这门课会在更多专业开设。作为这门课的教师,应该根据时代的要求,不断调整教学内容,创新教学方法与手段,改革考核方式,提高教学质量,增强学生的学习兴趣。

【参考文献】

[1]刘凤艳.SPSS 软件在多元统计分析课程教学中的应用杂谈[J].赤峰学院学报(自然科学版), 2016(03):255-256.

[2]李金昌.关于统计思想若干问题的探讨[J], 统计研究,2006(03): 31-38.

[3]马艳梅,汪冬华.经济管理类专业多元统计分析教学探讨[J].教学研究, 2013 (05):79-82.

[4]葛仁华,杨元妍.论黑箱理论在电子专业教学中的巧妙应用[J].桂林航天工业高等专科学校学报, 2009(03):366-367.

篇3

关键词:VBA,地铁车站,基坑监测,数据统计分析

中图分类号: U231 文献标识码: A

Application of VBA technology in subway station monitoring data analysis and treatment

Yao Shengfeng, Zhang Peng

(Anhui urban construction detection technology Co,LTD, He Fei,230088)

Abstract:This paper compiles various paragraph macro-procedures with VBA technique,solves complicated data statistical analysis problems,improves the data processing efficiency,and avoids data errors and data omission owing to artificial statistic,plays an important role in processing weekly data and studying the data index system of foundation pit of subway station, which is worth further promoting.

Keywords: VBA, subway station, foundation monitoring, data statistical analysis

1引言

我国大力发展城市轨道交通,地铁建设规模及发展速度居世界第一。据相关规划,2010年到2015年已规划的地铁里程将新增1506个地铁站,施工监测技术是地铁车站基坑施工的三大安全保证要素之一,在城市轨道交通车站施工中占有非常重要的位置。一方面通过对监测数据分析,及时有效地监控、分析、处理基坑开挖中的变形、围护结构内力,保证基坑本身及周边重要建、构筑物及管线在基坑开挖过程中的安全,对施工安全起着至关重要的作用;另一方面,待车站完工,统计分析各监测项目庞大的数据,从中提取隐含其中、潜在的有用信息及知识,对以后车站的设计、监测指标修正具有指导意义。通过Excel进行监控量测数据处理,是业界公认的和使用最广泛的方法,对城市地铁基坑的复杂化、数据海量化的监测项目来说,人工统计就存在很大的局限性,统计周期长、统计错误率高、成果汇总不完善等。本文应用VBA技术编写各种宏程序,不仅大大提高了数据处理的效率,而且避免了人工统计时出现的数据遗漏和数据错误。

2VBA简介

Visual Basic for Applications(简称VBA)是新一代标准宏语言,提供了面向对象的程序设计方法,提供了相当完整的程序设计语言。VBA不仅可以共享excel、word、access、AutoCAD等各种软件,而且可以将用VBA编写的程序复制到Visual Basic中调试并运行,从而实现用Visual Basic来控制有关的应用程序。VBA提供的大量内部函数大大简化了用户的操作,而且易于学习掌握,用户既可以使用宏记录器记录用户的各种操作并将其转换为VBA程序代码,也可以运用VBA编译器直接进行程序编写。

3实现功能

本次运用VBA编写宏程序对监测数据报表中的各监测项目数据进行统计分析,主要实现以下功能:

周报编写过程中,主要统计分析:

(1)任意给出起始时间节点、结束时间节点,查找各监测项目,统计:

1)最大累计变化量(起始节点至结束节点,各监测项目累计值的最大变化量)、及其对应的测点编号和对应日期;

2)最大变化速率、及其对应的测点编号和对应日期;最大累计变化率;

3)绘制最大变形速率及最大累计值的测点~日期变化曲线;

(2)车站完工,针对地铁车站所在的地质条件,对大量的监测数据进行统计分析,分析监测数据中潜在的有价值的信息知识,研究地铁基坑各监测项目的控制指标,指定施工工况(起始、结束时间节点,工况对应的监测项目、测点):

1)计算各工况下保证率对应的监测值,例如统计测斜速率10%~95%保证率对应的监测数值。

2)给出监测值,计算监测数据小于(或大于)此数值的数据在总数中的百分比,例如给出地表沉降速率2mm/d,计算小于此速率的百分比;

3)计算此工况下的绝对值最大值、最小值、平均值。

4运算原理

本算法是运用VBA编写宏程序对监控量测数据报表中的数据进行直接处理,对工作表的指定数据区域进行进一步计算处理,宏程序总体流程见图1。

图1 程序总体流程图

4.1周报数据处理

周报数据处理中,主要统计出所如下结果:最大累计变化量、及其对应的测点编号和对应日期,最大变化速率及其对应的测点编号和对应日期,最大累计变化率。最大值的程序流程图如图2所示,周报数据处理成果如图3所示。

图2 最大值统计程序流程图

图3 各监测项目周报数据处理成果

4.2监测项目统计分析

对大量的监测数据进行统计分析,针对地铁车站所在的地质条件,分析各保证率对应的监测项目数值和当前各监测项目控制值在监控量测数据中所占的百分比之间的内在规律,研究地铁基坑各监测项目的控制指标。统计各工况最大值、最小值、平均值及保证率对应的监测值,如测斜项目的流程图如图4所示,测斜项目速率统计结果如图5所示。

图4 测斜项目统计程序流程图

图5 各工况保证率对应的监测值统计结果(测斜速率)

5结语

在信息化要求高和复杂的地铁基坑的施工过程中,基坑监测项目数据报表的统计是一个大量的重复的繁琐的工作。一条地铁线,基坑车站20~30座,一般一期周报数据报表处理约5000张,数据约10万组,一期周报需要6个人统计1~2d。但使用了本文中的VBA程序以后2个人只需要统计1h~2h就可以完成工作,能快捷的分析数据,及时反馈基坑所处状态,大大提高了工作效率;对每一个完工的站点监测数据分析时,此VBA宏程序更是大大减少了统计时间。而在人工统计过程中,出现错误的概率是很高的,通过VBA程序技术来进行统计分析计算出现错误概率的可能性大大降低。因此,应用宏程序对大容量繁杂的数据报表进行数据统计分析,不仅可以提高统计效率,节省了工作时间,更重要的是避免了很多由于人工统计工作中出现的偶然错误

本VBA程序适用于大部分基坑监测项目的报表统计分析,但特殊的报表需要对原始程序进行重新编译。

参考文献:

[1]张开伟,王世淼.VBA 技术在基坑监测数据分析处理方面的应用[J].山西建筑,2011,37(27):74~75.

[2]GB 50497- 2009,建筑基坑工程监测技术规范[S].

[3]刘建航,侯学渊.基坑工程手册[M].北京:中国建筑工业出版社,1997.

[4]伍云辉.Excel VBA办公应用开发详解[M].北京:电子工业出版社,2007.

篇4

【关键词】 PTN 流量 系统

PTN网络资源统计系统是湖北公司首批在全国范围内引进的基于传输网流量分析的信息化系统。分别通过华为公司和烽火公司研发的信息化平台在襄阳移动和咸宁移动城域传送网内试验运行。经过一段时间的,平台各项功能基本能够满足系统初期的设计需求。

一、技术简介

1.1 系统结构

PTN资源统计分析系统可实现PTN网络的物理和逻辑资源分析,主要包括四大功能:已使用和剩余资源的统计分析、资源配置合理性评估、优化建议、资源预警。

1.2 功能实现过程

(1)通过界面ICE接口访问模块进入PTN资源统计分析系统。(2)物理资源分析、逻辑资源分析、流量监控及资源预警功能模块通过接口及数据适配模块,从EMS系统API接口访问模块获取所需的数据。(3)各功能模块按照功能要求统计出相应的统计结果,结果提供给资源评估优化模块处理形成综合的统计结果和报告。(4)各模块将处理的结果通过界面ICE接口访问模块返回至界面显示。

1.3 资源分析

PTN资源统计分析系统包括五大功能:批量统计、资源评估优化、实时监控、物理资源统计、逻辑资源统计。

1.4 批量统计功能

批量统计功能可以同时对多个逻辑或物理资源数据统计。根据需展开物理、逻辑资源统计列表,选择需要统计的项目,创建统计任务。批量统计结果可以生成相应项目的统计图或统计表,并以Excel或图片的形式保存至本地。

1.5 资源评估优化

资源评估功能可以对端口资源、环网数量、流量情况进行统计,对异常网元给出异常原因及优化建议。以端口利用率评估为例,根据提前设置的异常条件,系统经过计算输出异常网元明细、不合理原因及并优化建议。

1.6 实时监控

PTN资源统计分析系统可以对全局或指定资源的带宽利用率、流量进行实时监控。根据提前设置的预警、告警门限值,实时发出警告。

二、PTN资源统计分析系统的特点

1、【可视】网络流量、业务质量可视

①支持GIS地图:导入地图, 设备自动搜索、自动定位。②流量可视(带宽/流量/利用率)、质量可视(时延/抖动/丢包)。③流向可视。强大Dashboard自定义:地图、监控设备、指标、门限、分析周期、Hotspot。④一键式导出分析报告,支持离线分析&汇总。

2、【可评】主动E2E业务质量监控不Troubleshooting

①E2E业务主动监控性能TOPO图。②E2E业务丢包、抖动、时延等KPI统计报表,主动业务监控。③E2E业务TOPN统计报表,异常业务主动预警。④E2E异常业务实时性能展示,支撑故障定位。

3、【可预测】容量管理和趋势预测

①基于网元、端口、E2E业务的流量报表,及时掌握网络流量分布,实时利用率数据支撑网络可承载运维。②采集2~8周同一时刻历史数据平均值,与峰值、当前值对比分析,直接判定异常点或 有规律增长。③预测未来将达到的值和所需时间,预测3个月后的值,及到达门限值所需时间,把握扩容最佳时机,预防网络瓶颈及拥塞。

三、PTN资源统计分析系统的应用效果

1、提高了工作效率和管理水平。及时准确掌握PTN现网资源,改变了以前资源统计分析跟不上网络变化的情况。PTN资源统计分析系统建成之前现网资源数据15日更新一次,现在可以做到实时更新。

2、降低了人力成本。PTN资源统计分析系统建成之前需要安排专人做海量数据统计、分析工作且不能确保及时性,现在可以使用系统随时完成这项工作且准确性高。

3、更合理的设置业务带宽。通过本系统能够快速准确掌握业务的实际带宽使用情况,经过分析可以指导业务带宽合理分配,充分发挥PTN统计复用的功能。有效避免业务带宽配置过高而导致大量带宽闲置浪费,或配置带宽过低而影响业务传输。

4、更合理的使用业务带宽。传输网规划设计需要收集大量现网资源使用情况,通过本系统可以快速准确的完成这项工作。避免了对现网资源评估不准确导致盲目扩容而浪费投资,或扩容力度不够影响业务发展。

篇5

一、电子采购平台搭建与应用

(一)实施目标

建立采购流程、定价流程、供应商管理、采购数据库,加强采购信息沟通,扩大供应商范围,实现阳光采购。

(二)实施方案

1、建立采购业务统一运行环境搭建电子统一采购平台,实现超市的采购业务管控、数据统计分析。在采购业务和供应商的管理的基础上,形成采购业务的统一运行环境。通过电子采购平台系统,可以进行采购业务的过程监管,进行过程记录、事后跟踪,规范采购程序、提高采购效率、降低采购成本。2、建立差异化采购流程,多种来源的定价方式(1)招标模块即对同一商品,邀请多家供应商进行投标,并按规定程序选择交易对象的一种市场交易行为,它是一种流程非常标准、完整的物资采购方式。通过电子采购平台进行招标,既可以节约成本费用,又可自由设定交易时间和交易方式,大大地缩短采购周期。

(2)比价模块即对多家供应商提供的报价进行比较,经过多轮磋商对比,选择供应商,完成定价的过程,它是一种高效的价格理念发现机制,是日常采购的利器,既能保证效率,又符合管控的要求。通过电子采购平台实现比价,可以使采购流程灵活,快速便捷,业务效率高,同时易于组织和管理。在与供应商的磋商过程中,提供多次报价流程,对每次报价均有完整数据记录,便于查询、追溯。

3、竞价模块即多家供应商对商品进行多轮次的报价,采购向供应商公开报价或排名,依靠供应商之间的竞争达到定价目的,它是基于市场竞争定价的价格谈判机制。

通过采购平台进行竞价,就是用互联网组织众多卖方同时异地上网,在较短的时间内集中竞价,经过各个卖主之间背靠背降价竞争,形成接近于成本价的最终成交价。4、跟标采购模块即在短期内重复进行的相同物资采购,不再重复与供应商的磋商,直接引用上次采购结果的定价方式。

5、建立供应商准入流程,分类、分级进行管理通过供应商管理模块,完善供应商管理体系,建立供应商准入、过程评价、分类和级别管理、供应商资源优化、供应商绩效评估和供应商管理标准,加强供应商关系管理和动态的管理。

6、建立统计分析,提供决策支持电子采购平台可提供基于供应商、物料及类别、组织、项目等维护,对采购数据进行统计查询,为决策提供数据支撑。数据统计分析模块及菜单包括以下内容:(1)供应商分布、供货类别、供货金额、年度采购额占比等;平台应用情况统计;(2)商品或类别某段时期的采购金额、数量、合格供应商数量、成交供应商数量等;(3)采购组织、批次角度统计采购支出;(4)项目角度统计项目执行及节支情况。

二、小结

篇6

关键词:学生成绩 质量分析 excel 分类统计

        一、设计背景

        学生成绩的统计分析工作由来已久,一般都是一所学校内部分析为校长作决策之用。当数据统计分析扩大范围,涉及几个学校较多班级时,纯手工的成绩统计分析工作就变得复杂而繁多了。成绩统计的内容可分为:分校分年级分班分科平均分及总分平均分、单校分班分科平均分及总分平均分、分校分数段人数统计、前百名学生情况等。为了方便数据的统计与分析,可利用大家常见的办公软件excel来实现,一个工作簿可以有多个工作表,默认为3个sheet,可以根据需要增减工作表。设计此工作簿的目的是为达到录入学生成绩后立即能得到所有的统计数据,可以减少重复而繁杂的统计工作,更能减少因为误操作引起的错误数据,提高工作效率和准确性。本文以实现统计各校各年级各班各科及总分平均分和各分数段人数的统计为例,叙述了excel软件的功能应用。

        二、思路构建

        假设甲校有七、八、九三个年级,每个年级两个班,乙校有七、八、九三个年级,每个年级三个班,丙校有七、八、九三个年级,每个年级四个班,以一校一年级段为单位(方便学校试场的安排以及成绩的录入),放在一个sheet中。制作工作表如下图1: 

         

        为实现统计各校各年级各班各科及总分平均分和各校各年级段分数段的分布情况,制作工作表如下图2: 

          

        “甲七”工作表结构如下图3-1、3-2: 

         

        图3说明:

        假设考试科目为语文、数学、英语、科学等四门,其他年级段工作表的设置依次类推。

        字段设置:①学校,用于不同学校之间的对比;②班级,数字格式,用于实现分班成绩的统计;③考号,用于考试的编排和成绩的录入校对。

        统计项设:①各科及总分的合计,为方便计算所有学校的平均分,以免减少误差;②各科及总分的平均分,即本校年级段平均分;③分班各科及总分的平均分;④学生总数,亦为方便计算所有学校的平均分,以免减少误差。

        “各校各年级各班各科总分平均分”工作表设置如下图4: 

          

        八、九年级的统计依次类推。

        “各校各年级总分的分数段”工作表设置如下图5-1、5-2: 

              

 各分数段的分数值设置可以根据各科总分值进行合理调整。

        三、过程细化

        1、常用函数

        充分利用excel公式函数的功能以实现各类数据的统计,是选择excel软件的最初目的。常用函数有求和函数“sum( )”、平均值函数“average( )”、计数函数“count( )”、最大值函数“max( )”等等。如“甲七”工作表中在计算每个学生总分时用到了求和函数,设置i3单元格的值为“=sum(e3:h3)”,结果显示为431(见图3-1)。

        2、函数嵌套

        excel单元格中很多默认的数字格式在实际应用中都需要进行适当处理。如“甲七”工作表中的e24单元格计算甲校七年级语文成绩的平均分,设置e24的值为“=round(average(e3:e22),2)”,结果显示为94.3(见图3-2),在用average函数进行平均值计算时默认的小数位数不止2位,一般在统计成绩时计算到2位小数即可,因此利用函数“round( )”按指定位数“2”对数值进行“四舍五入”。

        3、巧用数组函数

在“甲七”工作表中记录着甲校七年级所有学生的成绩,现在要得到各班的各科平均分,进行教学质量的分析,为了让计算机能自动筛选并统计出结果,字段设计时增加了“班级”这一项,数字格式,有两个目的,一是用来分班统计,二是用来进行学生人数的统计。在e25单元格中计算七1班语文成绩的平均分,设置e25的值为“=round(sumproduct(($b$3:$b$22=1)*e$3:e$22)/countif($b$3:$b$22,1),2)”,结果显示为90.4(见图3-2),其中用到了数组函数“sumproduct()”,当参数“($b$3:$b$22=1)”为逻辑“真true”时,对e3:e22区域的成绩累计求和,从而实现七1班语文成绩的求和统计,若是统计2班时则参数可修改为“($b$3:$b$22=2)”。

        4、绝对引用和相对引用

        上述e25单元格公式中使用了“$”绝对引用,目的在于公式拖动时不产生变化,因为这些数据区域是固定的,在参数“e$3:e$22”(成绩区域)的e前没有使用“$”拖动公式时就会随公式位置变化相对引用。参数“countif($b$3:$b$22,1)”实现统计1班的学生人数时,区域是固定的,因此使用“$”;同理,统计2班的学生人数可改为“countif($b$3:$b$22,2)”。

        5、表间关联

        为了把三个学校的平均分以及各班的平均分情况汇总分析,在“各校各年级各班各科总分平均分”工作中关联各校各年段工作表计算好的数据,如“各校各年级各班各科总分平均分”工作表中b3单元格的值设为“=甲七!e24”,就可以同步关联“甲七”工作表e24单元格的数值94.3(见图4),c3、……、f3依次类推,同样将b6单元格的值关联“乙七”工作表中相应的单元格,其他单元格也依次类推,这样我们就得到了图4所示的各校各年级各班各科及总分平均分的成绩汇总表。

        6、综合应用

        分数段人数的统计与对比能很好地反映不同学校之间的成绩差异,毋庸置疑也可对一个学校不同班级之间进行对比,这是众多学校领导分析教学质量情况时采用的一个数据量化的方法。文中“各校各年级总分的分数段”工作表要将三个学校三个年级各分数段的人数进行统计,作横向比较,将g3单元格中的值设置为“=countif(甲七!$i$3:$i$22,">=430")”,结果显示为5(见图5-1),表明甲校七年级学生中成绩达到430及以上的人数为5个,在g3单元格的公式中用到了统计函数、绝对引用和表间关联。

        四、应用效果及注意事项

        本文通过excel软件建立的成绩统计表实现了三个学校之间以及各个学校不同班级之间成绩的比较,可以一目了然地看清三所学校之间的差距,对学校领导的管理决策与教学质量分析有一定的参考价值。

篇7

关键词 统计信息 医院 信息建设

统计信息能够全面反映医院科研、设备、财力、医疗及管理各方面的情况,对医院领导层详细了解自身发展运营情况,并做出正确管理决策有着重要的作用。近年来,随着新医改措施的不断推进,我国医院统计信息建设也从封闭性转为开放性,医院统计信息工作从原先单纯的数据统计工作变成了医院综合管理统计工作,在日常管理工作中起到了越来越大的作用,促进了医院整体水平的提高。

一、统计信息在医院整体发展中的作用

目前,随着医疗行业的不断改革,统计信息工作在医院整体发展过程中起到了越来越大的作用,具体表现在以下两个方面:

(1)提供统计数据,充当参谋助手。医院统计信息工作涉及内容多,范围广。统计人员可以通过系统搜集来自医院各科室的手术数据及其他手工数据,从而进行一系列的数据调查研究工作,同时还可以及时和临床科室的相关人员进行深入的沟通,了解各科室工作人员的工作状态、业绩趋势以及各个经济指标的变化情况,并通过计算、汇总的方式,形成一套完整的医院统计资料,帮助医院管理层准确地把握医院的发展动态,为医院管理层的管理决策提供数据参考,充分发挥统计信息工作的参谋助手的作用。

(2)为科研、医疗活动提供必要参考。随着我国公立医院的不断改革,医院科学技术得到了进一步的发展,统计的严谨性在医院医学研究中的应用也在不断地扩大,促进了医院科研技术的稳健发展。同时,统计人员的业务特长可以帮助医务人员进行数据处理工作和课题研究,更好地进行医疗科学活动。因此,医院的统计信息工作,可以为医疗研究人员提供及时准确的统计信息,使统计信息得到最大限度的开发和利用。

二、医院统计信息工作的现状分析

(1)指标体系难以满足统计需求。目前,我国多数医院的统计指标体系无法满足统计的需求。这主要有以下两个方面的原因:一方面是因为医院的统计指标体系只能反映医院疗效质量评价和服务水平方面的内容,体现医院的规模和质量,无法具体体现医院医疗器械的使用效益和真实医疗水平,这严重影响了信息统计的真实性;另一方面,病例项目的数据质量是数据统计的主要依据。因此,一旦病案首页信息录入不准确,将会直接导致统计人员在工作时产生统计归类错误,对病案统计质量和信息的准确性产生严重的影响。同时,由于医院整体大环境中对数据记录的意识不强,医院手术中抢救次数填写不全、手术分级类填写失误的情况时有发生,数据信息不准确,关联数据无法得到衔接等各种数据统计的问题,使医院的统计数据产生严重失真,严重影响了医院整体数据统计的质量。

(2)网络环境下统计工作的不足。目前,我国多数医院对网络系统都没有足够的认识,许多医院仅将网络系统作为普通的数据录入系统,网络系统本身存在较大的技术缺陷,和其他局域网的链接功能较差,无法做到资源共享。其次,网络系统的不稳定可能会造成数据遗失、数据混乱的情况,这就使得在网络环境下,医院的数据统计工作变得更加困难。再次,网络系统在医院数据统计工作中广泛运用的最直接的影响就是统计人员工作量的增加。病案首页的内容需要统计人员直接输入电脑,这些工作繁琐复杂,耗费时间长,许多医院的数据统计工作都需要统计人员牺牲专题调查和数据分析的时间来完成,给医院的统计工作带来了极大的不便。

三、医院统计信息工作的完善策略

(1)简化统计指标,健全统计信息。想要提高医院统计信息工作的质量,医院首先要简化统计指标,健全统计信息。统计人员要先根据数据的关联性和逻辑性的特点,积极利用网络技术,对数据的录入和分析做到实时监控,这种做法可以使医院从科学的角度避免人为性的工作误差,造成较大的数据损失。其次,医院要做好信息指标的解释工作,如报表中出现的“医院的互联网接入宽带”,医院应该在制度中明确医院的网站及宽带如何计算。另外,医院应该取消一些需要估算的指标,这些指标估算难度大,数据模糊不清,没有实际的参考意义,医院取消估算指标可以帮助统计人员减少数据报表的难度,从而促进了医院统计信息的完善。

(2)加大宣传和监督力度。相比较于医院的其他管理监督项目,统计信息工作是一项全新的工作。因此,医院管理层要高度重视统计信息工作,将统计信息作为独立的部门分开,加大统计部门的职能,使统计人员更好地为医院服务。其次,医院要加大宣传力度,使医院各医疗部门认识到统计信息的重要性,更好地配合统计人员的工作,保障统计信息工作的顺利开展。

(3)提高统计分析水平,充分发挥参谋作用。与企业的统计工作相比,医院统计工作具有较强的科学性和专业性,统计人员不仅需要具备一定的医学知识,还要具备良好的统计专业技能。因此,医院的统计人员必须要不断吸取新的知识,全面提高个人素质,提高统计分析水平。具体措施有以下几点:从统计人员的角度来说,统计人员要学会从实际工作中不断总结出经验,充分利用自己的专业技能,帮助医院医疗科室开展课题研究和数据处理工作,从而使统计信息成为医院的一种常态化工作。其次,统计人员要在实际工作中主动承担起医院管理监督的责任,对医院进行多层次、全方位的信息统一工作,为医院管理层的决策提供详细、准确、及时的信息服务,使统计部门真正成为医院管理层的参谋部,充分发挥统计信息工作的监督参谋作用。另外,统计人员对自身的工作要树立严格的标准,定期做好信息的统计分析工作和反馈工作,统计人员要每季、半年、年度做好医院综合性的数据分析,内容要覆盖医院的各个方面,包括门诊和临床科的工作量、医疗质量、护理质量和病人满意度等基本数据。从医院的角度来说,医院要加大对统计信息工作的认识,建立专门的信息统计机构,加大统计机构的职能权限。同时,医院还要配备专门的统计人员,负责医院信息网络的维护和信息分析工作,从而使统计信息更好地为医院服务。另外,医院还要经常组织统计人员进行培训工作,提高统计人员的素质技能和工作责任心,以此提高统计分析水平,促进医院统计工作的发展。

四、结语

医院的统计信息工作对医院的经营决策起着重要的作用,医院管理层在进行决策时,必须要在充分结合医院实际情况的基础上,利用统计信息的数据分析报告。因此,我国医院要积极加快统计信息的发展,利用数据信息系统,更好地为顾客服务,完善医院的内部管理制度,真正实现经济工作的转移。

(作者单位为吉林省梅河口市妇幼保健计划生育服务中心)

参考文献

[1] 王淑娟.医院统计信息对医院财务统计分析的重要作用[J].中国经贸,2014(13).

[2] 董春梅.浅析如何更好地发挥病案在医院信息统计中的作用[J].临床医药文献杂志(电子版),2015(06).

篇8

“数据统计与分析”属于信息技术课程中“信息加工与表达”部分的教学内容,在初中、高中均有涉及。经过多年的教学积淀,信息技术教师已然拥有一些有效的教学经验,但在普遍范围内还存在一些理解不到位的现象,从课堂扫描中可管窥一斑。

问题:课堂中的各种理解不到位的现象

场景1:有教师在课堂上出示用左耳或右耳接听电话的人数统计,要求学生计算相应的比例。这种数据于学生而言缺乏实际意义,统计的结果也不涉及相关处理问题,反映出教师对数据的理解不到位。

场景2:教学中,教师给出一些商品的单价,要求学生统计单价超过5元的商品。统计的缘由没有给出,不过是单纯的筛选技能训练,没有体现统计的必要性及其意义,反映出教师对统计概念的理解不到位。

场景3:教师提供多种饮料,如绿茶、红茶、奶茶、可乐等,要求学生从中选择自己最喜欢喝的三种,再根据全班的选择情况整理数据,列出最受班级欢迎的三种饮料。最后,教师给出专家建议“健康的饮品包括水、纯果汁、奶”,要求学生结合课堂统计的数据结果,在调查报告中表达自己对中学生选择饮料问题的看法和观点。由于此三种饮品没有完全出现在此前供学生选择的范围内,自然没有一个学生的选择与专家建议的健康饮品吻合,于是,学生回答,“不管喝什么,只要健康就好”。数据统计的目的就是为分析、决策提供数据支持,而该场景中数据分析部分与前面的统计结果相互脱节、没有关联,或者联系不够紧密,反映出教师对分析的理解不到位。

上述场景反映出的根本问题是,教师对数据统计与分析的内涵或者核心指向理解不足。“数据统计与分析”属于“信息加工与表达”中表格信息加工与表达部分的教学内容,与数据管理部分的内容具有相似的核心指向,即关注“关系”的挖掘与表达,而关系是隐藏在数据之中的,需要通过相关的操作,如借助公式与函数的计算、排序、筛选等,将数据间的关系挖掘出来,可以借助图表的形式进行直观表达,即通过可视化方式清晰展示。

关于数据统计与分析,信息技术课程教学纲要或者课程标准中都有针对性的要求,譬如,2012年中国教育技术协会信息技术教育专业委员会研制的《基础教育信息技术课程标准2012版》中,初中学段在“模块二:信息加工与表达”中对表格部分的要求如下。

1.能列举1~2种常见表格编辑软件,尝试简单编辑操作,理解二维表格的共同特征。

2.根据需求能在文档中绘制或套用表格,并对其属性能按要求进行调整和设置。

3.能应用电子表格进行简单数据的统计、处理,科学地借助折线图、直方图、饼图等直观表达数据。

4.从不同的角度和立场出发,通过对相同数据做不同的加工,表达不同的观点,或对相同数据做不同的解读,感悟信息加工和利用的选择性、多元性和复杂性特征。

上述4条描述涉及表格中数据的统计、表达、分析,关注到数据间的关系挖掘。

“数据统计与分析”涉及对数据的加工、处理,从中获取信息并加以解读。因此,可以从DIKW金字塔模型获得直接的借鉴。

解决之策:DIKW金字塔的启示

DIKW金字塔是关于数据、信息、知识及智慧的体系,如图1所示。

数据(Data):可以是数字、文字、图像、声音、符号等,属于事实的记录,表达的是没有指定背景和意义的描述。

信息(Information):是经过相关处理的数据,强调的是数据与数据之间的关系。

知识(Knowledge):是有意义的信息,表现为信息和信息之间的关系。由信息到知识的转变过程,是一个对信息判断和确认的过程,需要结合经验、上下文联系、诠释和反省。

智慧(Wisdom):是富有洞察力的知识,是运用知识分析和解决问题的能力,可以简单归纳为正确判断和决定的能力。

显然,DIKW体系同样关注关系的挖掘,即数据之间的关系、信息之间的关系,因而可以用来指导“数据统计与分析”部分的教学。

从问题解答的角度观察,信息层回答的是“是何”的问题,知识层解决的是“如何”的问题,智慧层则涉及“为何”的问题。早期研究中有学者曾指出,信息技术中的技术包含三层内涵:(1)动手做的技术,即基本技能;(2)如何做的技术,即设计和规划的技术;(3)为何做的技术,即技术的思想和价值。[1]三层内涵的观点涉及技术是何、如何、为何的问题,与DIKW模型具有共通之处,这为DIKW模型在数据统计与分析中的应用提供了佐证。

从DIKW的视角来看,数据统计与分析的过程也是追求实现“数据—信息—知识—智慧”持续变化的过程。即从数据开始,以形成智慧为最终目的。具体过程是:借助相关操作对数据进行处理、加工,明确数据之间的关系,提取出有意义的信息,进而将信息组织成知识,促进学生明确“如何去使用”,再进一步,当学生明确应该何时使用及为什么要使用时,便形成了智慧。

据此,数据统计与分析中的几个

关键词 ,即数据、统计、分析,都需要有专门的指向,符合内在的规定性,且数据、统计、分析应当做到前面环节为后续环节奠定基础,后续环节又必须在前面环节的基础上展开。具体来说,数据需要为统计服务,统计是建立在数据提供的基础上;统计的结果是为了进行分析,分析必须依赖于统计结果;分析的目的是为了提供决策的依据。这些关系必须在教学中予以体现,方能体现数据统计与分析的要义。

实践之道:基于DIKW的教学思路

从DIKW的视角,数据统计与分析教学需要经过三个过程:“数据信息”、“信息知识”、“知识智慧”。从关系发掘的角度,即隐性关系显性化、显性关系知识化、知识运用自动化,下文展开具体阐述。

1. 隐性关系显性化

隐性关系显性化,即从数据到信息的过程。数据可以是教师为学生提供的原始资料,或者是收集来自学生的资料。因为需要借此学习相关技能操作,如公式与函数的使用、排序、筛选、图表表示等,因此数据主要是数字形式,如考试成绩、购物费用等,根据需要也可以适当包含文字,如学生的血型、爱好等。

为了从数据中提取有意义的信息进而展开分析,数据需要符合一定的要求:其一,数据最好能够贴近学生,具有真实性。小至与学生个体相关的数据,大至与学校、社区、城市、国家相关的数据。贴近学生生活经验或学习经验的真实数据才能激发学生的兴趣,促进学生通过操作发掘数据之间的关系,形成有意义的信息。从教学实践来看,课堂或者课前收集来自学生的鲜活数据相对容易调动学生的积极性。其二,数据需要具有潜在的意义,即有统计价值,场景1中接听电话用左耳还是右耳的例子之所以失败,就是因为数据不具有统计价值,从数据中无法提取出有意义的信息。其三,数据要具有统计的必要,即数据要达到足够的量,少量数据往往无法体现出用计算机统计的优势。在数据量足够的情况下,可以通过人工计算与计算机统计的对比凸显计算机统计的优势和价值。

在数据有效的基础上,统计承担着从数据中提取信息的功能。为了保证将来从信息到知识的转变,统计所得信息当存在分析的可能、必要及价值,否则统计本身就没有意义。譬如,场景2中让学生统计购买的商品中单价超过5元的商品,数据本身没有问题,但这种统计的结果似乎没有分析的意义及价值,因而统计本身就失去了意义。

从数据到信息的转变需要学生借助一定的技术操作来实现,这个阶段涉及的技术属于动手做的技术,即技术的底层。例如,统计过程可能涉及计算、筛选、排序,统计结果的呈现涉及各种图表的使用。

2. 显性关系知识化

显性关系知识化,是指由信息到知识的转变。美国佛罗里达国际大学豪恩斯坦认为,信息是别人内化的知识,知识是自己内化的信息。[2]所以,如果信息是输入,知识在某种意义上便是输出。这意味着从信息到知识的转变需要学生在认知层面形成理解。这一阶段涉及的技术属于无形的技术。

此阶段是对数据统计结果进行分析的过程。譬如,统计全班学生血型,根据四种血型的统计结果,引导学生明确血型的相关知识。又如,统计不同品牌货物销售情况,从不同角度(商场、品牌负责人、顾客)去分析,得出不同的结论。若收集的数据与学生个人或家庭相关,则分析的结果最好能够凸显因人而异,从而促进学生在体验到分析意义的基础上,树立利用数据统计与分析为自己的学习、生活服务的意识。

譬如,《Excel中数据的处理》[3]中,教师要求学生将自己家庭衣、食、住、行、用等数据输入到碳排放计算工作表中,完成相关计算,并根据数据回答问题:

1.我们家( )方面碳排放最高,( )方面碳排放最低。

2.我们家年人均碳排放( )kg,和全球人均目标碳足迹2000kg比较,我们家是(高碳/低碳)生活。

3.为了应对气候变化,我们家应该从以下方面减少碳的排放。

每个学生获取的数据不同,结论自然就不同。这种差异性体现了一种真实,也帮助学生理解统计与分析的实际意义。

分析在统计与决策之间发挥着承先启后的作用,“承先”是指,分析必须依据统计所得结果来进行,体现两者的紧密联系,以保证分析的价值及统计的意义;“启后”是指,分析需要为后面的选择、决策提供依据与基础,因此需要恰当设计分析的内容,以保证决策得以进行。

譬如,《Excel中数据的处理》中1、2两个问题的分析必须建立在前面数据计算的基础之上,3题的回答又依赖于1、2分析的结果,充分体现出统计分析为决策提供数据支持的功能,促进学生对数据统计分析加深认识与理解。

3. 知识运用自动化

知识运用自动化,即从知识向智慧的转变过程,是指在学生掌握知识之后,借助一定量的知识应用练习,熟悉了知识的应用环境及方法之后,在不需要专门选择知识的情况下无意识地运用知识,达到自动化效果的过程。这一过程显然不是一蹴而就的,需要经历几个状态:在知识应用练习之前,处于“无意识的不用”状态;经过知识应用训练,基本掌握了知识应用场合及方法,但还不够熟练,遇到问题时,需要有意识地思考选择相应的知识,该阶段可以称为“有意识的应用”状态;经过足够的知识应用练习之后,学生对知识的应用形成更深的感悟,可以在无意识中,即自动选择某种知识应用于问题解决中,此时就进入了“无意识的应用”状态,达到此状态,即完成了由掌握知识到生成智慧的转变。

具体到数据统计与分析的教学中,就是根据分析结果进行选择或决策的过程。智慧指向正确判断和决定的能力,因而在数据统计与分析后期,需要引导学生依据分析的结果进行选择、决策。智慧倾向关心未来,含有暗示及滞后影响的意味,与此类似,课堂上的选择抑或决策只能更多发生于认知层面,形成的是决策时的心理倾向,但追求的是持续影响学生并实现将来在现实情境中的外显行为的变化。因而,知识运用自动化在一次课内未必能够实现。

同数据分析类似, 决策可以因人而异。譬如,《Excel中数据的处理》中的问题3。教学中需要引导学生根据实际做出符合需求的决策。譬如,《Excel综合运用》[4]案例中,教师课前安排学生对自己居住小区的人居环境从自然、人文、社会、建筑和支持网络几个方面进行评价,课堂上则围绕用Excel软件对若干个小区的人居环境状况作系统的分析,涉及Excel数据加工技术的综合应用,如排序、筛选、分类汇总等,然后得出结论,哪个区的人居环境综合比较好。最后环节是引导学生的实际应用:

是不是××区的人居环境比较好,我们都要住在那个区?在选购住所的时候,首先应该考虑自己的需求,根据实际需要确定自己的选择。

(1)假如你是一名在南京一中读高一的学生。

需考虑因素:你的父母希望你上学路途中花费的时间比较少,小区居民的整体文化素质比较高。

(2)假如你的爷爷奶奶退休了,考虑给他们选择一处房屋。

需考虑因素:空气新鲜,小区休闲设施齐全,邻里关系和睦,靠近你家现在的住处,方便照顾老人。

该案例是在对真实数据进行统计的基础上,通过分析引导学生明确如何选择、为什么要如此选择,关注学生在掌握知识的前提下生成智慧。学会选择,这就是智慧,影响着将来的选择行为,即根据实际需求进行选择,其实不仅是小区的选择,也包括人生中的其他选择。

知识运用自动化阶段的教学要求:其一,必须为学生提供需要决策的情境,以促进学生在类似情境下的顺利迁移。这一点需要在数据呈现的同时即提供给学生,以促进学生明确数据处理的根本目的。其二,决策需要根据分析的结果来进行,让学生充分体会到分析的目的及价值,即为决策提供依据。

按照上述隐性关系显性化—显性关系知识化—知识运用自动化的思路,教学中引领学生经历数据的收集、整理—处理、加工—分析、表达—选择、决策这一完整过程,促进学生对数据处理形成整体感知与理解。

数据统计与分析的完整过程是从数据收集与录入开始,经过表格规划与修饰、数据处理与统计、图表与分析等,因此,未必在一节课内完成,但整个部分的教学经历完整过程即可。也可以在综合应用或者复习课上,带领学生经历此完整过程,为了在一节课内实现,可以简化部分细节,如使用半成品策略,以凸显整个流程。

结束语

从DIKW金字塔模型的视角观察“数据统计与分析”的教学,意义在于:明确数据统计与分析的教学不能止步于简单的数据收集、整理、加工,其意义主要体现于在此基础上的分析及进一步的决策。即教学中在由数据到信息的转化基础上,关注显性关系的知识化并追求知识运用的自动化。

显然,DIKW模型也适用于信息技术课程中的其他内容,譬如DIKW体系经常应用于信息科学,因此可以应用于搜索技巧及数据挖掘。

注: 本文为江苏省教育科学“ 十二五” 规划课题“ 信息技术课程思想及其应用研究” ( B -b/2013/01/039)的研究成果。

参考文献

[1]李艺.高中课改实验进行时[J].中小学信息技术教育,2005(1).

[2]盛群力.21世纪教育目标新分类[M].杭州:浙江教育出版社,2008:67.

[3]张向红.Excel中数据的处理.2010年全国初中信息技术优质课大赛一等奖.

篇9

 

0 引言

 

新世纪以来,随着互联网及信息技术的飞速发展和应用,使我国的信息化得到前所未有的爆炸式增长,各个行业相继完成信息化改造,极大地提升了人们的生活水平与生产效率。同时,也使各行业进入到信息化发展的轨道上,进一步提升了企业生产效益。正是由于经济的飞速发展,各行业发展都已积累了海量的数据信息。但是传统的数据分析方法和工具仅仅能实现简单的录入、查询、更改、统计、输出等非常低等的功能,无法及时快速地发现数据跟数据之间存在的关系与规则,无法根据已有的海量数据有效预测未来的发展趋势,不能及时为企业决策提供有力的数据支持。

 

数据挖掘技术的出现技术填补了大量企业的这一需求,数据挖掘技术可以高效地挖掘数据背后隐藏的关系跟规则,非常方便地把这些海量信息予以统计、分析及利用成为当前各行业需要解决的首个问题。为企业决策提供及时准确的统计学数据支持,为企业发展壮大提供很好的数据分析工具。而海量数据挖掘技术的出现,保证了海量数据信息的合理利用,同时加快了我国信息化技术的发展。

 

1 数据挖掘技术定义

 

数据挖掘技术起源于情报分析,其过程是一个从大量的、不完整的、有噪声的、模糊的随机数据被从隐含在大量数据中提取的过程,数据挖掘的情报资料是人们事先不知道的,但可能是有用的信息和知识。在大多数情况下,人们利用计算机等信息工具的时候只知道,存储数据,数据被存储的越来越多,但不知道这些海量数据中隐藏着很多重要的规律、规则等信息,数据挖掘技术就是一种可以从大量的数据中挖掘出有用重要信息的一种数据分析工具。如图1所示。

 

2 数据挖掘常用的方法

 

数据统计分析中的数据挖掘技术主要有以下方法:分类法、回归分析法、聚类法、关联规则法、特征法、变化和偏差分析法、Web页挖掘等相关方法,这些方法从不同的角度对数据进行挖掘分析,得出需要的信息数据。

 

3 统计分析和数据挖掘的主要区别

 

从实践应用的角度来看,这个问题并没有很大的意义,正如“不管白猫还是黑猫,抓住老鼠才是好猫”一样,在实际的应用中,数据分析师分析问题时,首先要考虑的是思路,其次才会对与思路匹配的分析挖掘技术惊醒筛选,而不是优先考虑到底是用统计分析方法还是利用数据挖掘技术来解决这个问题。

 

统计分析和数据挖掘的主要的区别在以下几个方面:

 

统计分析在预测中应用常表现为一个或一组函数关系式,而数据挖掘在预测应用中的重点在于预测结果,很多时候并不会从结果中产生明确的函数关系式,有时候甚至不知道到底哪些变量在起作用,又是如何起作用的。最经典的例子就是“神经网络”挖掘技术,它里面的隐藏层就是一个黑箱,没有人能在所有的情况下读懂里面的非线性函数是如何对自变量进行组合的,在实践应用中,这种情况常会让习惯统计分析公式的分析师感到困惑,这也确实影响了模型在实践应用中的课理解性和可接受度。

 

统计分析的基础之一就是概率论,在对数据进行统计时,分析人员常常需要对数据分布和变量之间的关系进行假设,确定用什么概率函数来描述变量之间的关系,以及如何检验参数的统计显著性;但是数据挖掘的应用中,分析人员不需要对数据分布做任何假设,数据挖掘中的算法会自动寻找变量间的关系,因此,相对于海量、杂乱的数据,数据挖掘技术有明显的应用优势。

 

在实践应用中,统计分析常常需要分析人员先做假设或判断,然后利用数据分析技术来验证该假设的正误。但是,在数据挖掘中,分析人员并不需要对数据的内在关系做任何假设,而是会让挖掘工具中的算法自动去寻找数据中隐藏的关系或规律。

 

两者的思维方式并不相同,这给数据挖掘带来了更灵活、更宽广的思路和舞台。

 

4 数据挖掘的一般流程

 

海量数据挖掘技术指的是把海量数据信息有针对性地进行提炼、分类和整理,从而将隐含在最深层次的信息挖掘出,为各行业发展提供可靠的数据信息支持。换言之,海量数据挖掘技术利用当前最先进的数据分析工具从海量数据信息内部挖掘数据信息以及模型间的关系的一种技术统称,更加深入的认识与了解数据模型,并对各自模型件关系的对应关系予以深入分析,从而更好地指导各行业的生产与发展,同时为其提供更多决策性的技术支持。

 

事实上,数据挖掘过程不能够自动生成,必须通过人工建模来实现,因此,人需要完成大部分的工作。其中,主要包含数据采集、数据预处理、数据选择、建立挖掘模型及评估模型等。

 

首先,通常海量数据挖掘技术应用在各行业的生产和发展决策方面,也就是说数据挖掘工作将面临着巨大的数据信息,并且此类数据信息多数为模糊的、无规律的;其次,建立高效、易理解的数据模型有助于实现海量数据挖掘;再次,数据挖掘模型的构建主要目的是帮助用户解决实际存在的问题,在经过对海量数据信息进行挖掘之后,从中找出利用价值高的信息,再对此类信息予以统计、整理和分析,最终用于指导各行业的生产与发展;最后,开展数据挖掘工作主要是为从海量数据信息里找出有价值的数据信息,这并不是单纯的数学性研究,其根本目的是从各行业的海量数据信息中找出有价值的数据信息,它具有相应的约束条件,且面向的是针对性较强的数据挖掘模型。

 

数据挖掘的一般流程如图2所示。

 

5 数据挖掘技术实现

 

现如今,尽管海量数据挖掘属于一种新技术,但由于该技术发展速度较快,因此,已被广泛应用到计算机发展领域当中。近年来,由于数据挖掘理论的逐步趋于完善化,并且在实践中取得了较好成效。其中,最常用的海量数据挖掘技术主要包含以下几种:决策树、神经网络以及统计学模糊。

 

①决策树算法通常应用到分析分类问题当中,同时它也是分类与预测的一主要技术。其中,类别属于因变量,而决策树可从众多预测变量当中,再相关理论的指导下,预测变量的发展趋势及变化关系,同时可对其进行双向分析,即包含正向分析和反推分析,根据最终的结果去寻找问题的原因。

 

②神经网络的建立。事实上,人工神经网络法指的是模拟人脑神经元结构的一种算法。其中,改善神经网络算法的关键在于知识的表达与获取。神经网络可实现并行处理,这是因为神经网络应用的是自适应函数估计器,因此,它的学习能力是极强的,在短时间内能学会新知识,同时它的纠错能力与适应性也是非常可观的。

 

③统计学模糊学习。该方法属于一种预测法,常被应用到谈及机器学习规律当中,而且只可应用到小样本情形中。另外,该方法是对观测数据进行深入的研究,通过对原理的分析,找出其中不予通用的规律。再结合已找出的规律进行更深层次的分析与探究,再结合实践中存在的现象予以预测,这样可提前预测出数据的发展趋势。

 

6 数据挖掘的应用

 

目前数据挖掘的应用领域主要包括以下这些方面:

 

金融、医疗保健、市场业、零售业、制造业、司法、工程和科学、保险业、网络舆情监控系统、企业竞争情报系统、全文检索、企业搜索、数据分析、数据库,可以用在各个需要数据分析的行业。

 

6.1 生物科技

 

在生物科技领域,如人的大脑与机器这一层面上,利用数据挖掘技术可加速发展生化义肢这一产品,很多这方面的专家学者普遍认为利用数据挖掘技术快速发展生化义肢这方面是大有潜力可供挖掘的。

 

6.2 信息科技

 

数位权利管理愈来愈受重视,以便保护知识财产,由全录公司Palo Alto研究中心创出的Content Guard公司,利用加密技术保护知识财产。

 

6.3 商务智能

 

数据挖掘技术可以用来支持广泛的商务智能应用,如顾客分析、定向营销、工作流管理、商店分布和欺诈检测等。数据挖掘还能帮助零售商回答一些重要的商务问题,如“谁是最有价值的顾客?”“什么产品可以交叉销售或提升销售?”“公司明年的收入前景如何?”这些问题催生了一种新的数据分析技术——关联分析。如图3所示。

 

6.4 资料发掘与生物测定学

 

数据挖掘是利用数学演算法,在庞大的资料库中寻找方式,例如目前应用在掌纹、脸孔等图像辨识,或者是语言辨识处理等方面。

 

6.5 塑料芯片

 

塑料芯片是最新的前沿科学,塑料以其价格便宜、容易制造等特点被很多科研机构以及大学所青睐。很多大学科学家及机构在利用数据挖掘技术致力于研究塑料代替硅半导体,如IBM公司、朗讯科技、麻省理工大学、剑桥大学、Penn State大学都在大量研究与开发塑料或有机物质芯片。

 

6.6 微光学技术

 

专家利用可反射光线的水晶、玻璃等物质,让光纤传输资料的速度,不会因为通过路由器、交换器时而降低速度。

 

6.7 司法

 

在司法领域,数据挖掘技术分析的对象一般分为两大类:一类是基于监控对象的系统,它能够帮助分析专家跟踪某个犯罪嫌疑人;另一类是基于行为模式的系统,它可以在多种活动方式中搜寻可疑的可能涉及犯罪的行为,或者可能是犯罪分子才会产生的行为。基于监控对象的数据挖掘技术又称作关联分析法,是司法机构重点开发的技术。这种方法能利用相关数据,在表面上没有关系的人或事件之间建立关联。比如,如果某人是犯罪嫌疑人,那么就可以使用关联软件发现嫌疑人可能正在影响的其他人,从相关人那里获取破案线索。

 

6.8 微应用流体学

 

科学家正试图利用物理原则做实验,只利用极微量的水,加快原本需要费时费金钱的实验。加州理工学院的应用物理学家Stephen Quake,以微应用流体学发展了一套DNA分析装置,比传统的分析装置快。Technology Review的编辑指出,微应用流体学将为生物科技提供巨大的帮助,就像当初电晶体提高了电子产品。

 

7 案例分析

 

基于统计分析的数据挖掘在工程造价管理中的实例应用分析,在工程造价管理系统中,可通过选择工程单方造价指标、造价核减率、竣工结算价、工程结构形式、招标方式、竣工结算审核单位、竣工结算日期等因素等进行数据筛选,通过后台数据库统计分析后选出符合目标值的数据类型。

 

比如,选取出2010年1-7月某市市区竣工结算审定价超过100万元的工程计三十二项。其中,六层以下砖混结构住宅楼七项,六层以下框架混凝土结构住宅楼六项,十八层框剪住宅楼两项,框架综合楼五项,框架厂房三项,内装饰工程五项,外装饰工程两项,普通沥青路两项。

 

经过对建设成本的测算可以清楚,六层及以下的砖混结构住宅楼平均单方造价为801.65元/m2,六层以下框架住宅楼平均单方造价为941.39元/m2,十八层框剪住宅楼平均单方造价为1080.37元/m2,框架综合楼平均单方造价为1326.36元/m2,框架厂房平均单方造价为852.70元/m2,内装平均单方造价为24.58元/m2,外装平均单方造价为824.94元/m2,普通沥青路平均单方造价为354.55元/m2。

 

此市市区2010年1-7月竣工工程单方造价指标如上所示的典型工程造价指标信息,是此市定期的,具有代表性、以审定的工程结算为主的住宅(含经济适用房或廉租房)、公共建筑、市政道路等工程造价实例信息,它为社会和造价管理机构提供可参考的、较详细的实际工程造价经济指标和消耗量指标信息。

 

总的来说,数据分析处理,可以简单快捷地从繁重冗杂的工程造价数据中找出共性或者异性的数据。有效加强了工程造价的全过程动态管理,强化了工程造价的约束机制,为维护有关各方的经济利益,规范价格行为,促进微观效益和宏观效益的统一提供广阔的平台。

 

8 结束语

 

数据挖掘技术的广泛应用彻底解决了海量数据快速处理问题,然而人们对数据挖掘技术的需求水平也越来越高。它可以预测未来的发展趋势,所以今后研究焦点可能会集中到处理非数字数据;寻求数据挖掘过程中的可视化方法,便于在知识发现过程中的人机交互,使计算机真正实现智能化。这可能需要一段时间,需要计算机工作者的不断的研究探索,不久的将来我们将看到数据挖掘据技术很大的进展。

篇10

投资风险是指投资的市场收益与期望市场收益偏离的大小与程度。而风险分析是现代可行性研究的必然要求。根据统计分析,项目前期进行的可行性研究费用只占总投资的2%左右,但对项目生命周期影响占到90%以上[1]。因此,不断提高对投资项目可行性研究工作重要性的认识,认真扎实地做好投资前期的研究论证工作十分必要。

然而,据统计,资源行业的企业在项目投资前期只对个别项目进行风险评估分析的占40%,不进行风险分析的占20%。而每个项目都做风险评估的企业只占到10%[2]。以上数据表明,在资源行业,对投资风险评估的重视度是明显不足的。

对于煤矿企业而言,其生产对象是不可再生的矿产资源,项目投资大,不可预知的因素多,风险损失一旦发生,就无法弥补[3]。因此矿业项目风险分析对煤炭企业是做好矿业项目投资的前提,加强风险投资的风险研究,规避风险,直接关系到项目投资主体的生存和发展。

本文以现有研究为基础,选取净现值评价指标,建立适合煤炭企业自身特点的投资风险评估模型,并采用SPSS软件对投资风险因素做出统计分析。

1研究设计

1.1选取煤炭企业风险评估指标

在进行风险分析或经济评价时,需要通过选择一些指标作为目标函数,然后经过对函数的值域变化范围、期望的大小、方差或标准差大小来确定风险大小。通常选用的指标有投资收益率、等效最大投资周期、现值和净现值、折现现金流通收益率等,本文采用的净现值评价指标。

国内外关于经济评价方面的研究主要是建立在密歇尔的现金流量基础之上,净现值法是判别项目优劣的比较成熟和科学的方法[4],它克服了传统静态经济评价方法的不足,不仅考虑了开发煤炭资源的资金投入与产出,而且考虑了资金的时间价值,在确定净现值的同时还可以作资金的内部收益率、回收周期、盈亏分析及敏感性分析,因而广泛用于资产评估和矿产开发项目的可行性研究,一直以来占据着风险项目投资决策的核心地位。

净现值(NPV)是将项目计算期内各年净现金流量,按照基准收益率折现到建设期初的现值之和,它是反映项目在寿命期内赢利能力的动态评价指标。其表达式根据情况不同有多种计算方式,若以每年年值相同的情况来表示,则计算式为:

(1)

式中CI―年现金流人量;

CO―年现金流出量;

P―期初投资额;

n―寿命期;

i―社会折现率或财务基准收益率(或设定的折现率)。

1.2建立煤炭企业风险分析模型

根据投入、产出关系,煤炭企业项目的特有的技术经济因素,以及根据成本管理中的净现金流的计算,将NCF值经过贴现率折现计算,得到矿产项目投资净现值函数为:

(2)

(3)

n=12Z/(K?A) (4)

(5)

式中:

Q―月产煤数量;P一煤炭单位价格;

C―月产煤成本;F折旧一折旧费用;

a―所得税率;P一期初总投资;

n―矿井服务期限;Z―矿井设计可采储量;

K―储量备用系数;A―矿井设计生产能力;

i―社会折现率或财务基准收益率(或设定的折现率);

2煤炭企业投资风险评估模型应用案例

2.1案例概况

选取陕西某集团某煤矿投资项目的数据。该矿期初投资额898,718,700元,矿井预计服务年限为76.6年(919.20个月),矿井可采储量为4,286,900吨,储量备用系数为1.4,矿井设计生产能力为40,000吨/年,每月折旧费用平均3,174,673.44元,所得税率按33%,社会折现率取10%。

2.2风险因素的选择

考虑到煤炭投资项目中,各风险因素对项目投资收益的影响程度,本文确定煤炭产品的产量(Q)、单位售价(P)及矿井生产成本(C)这三个重要变量作为随机输入变量,进而模拟确定目标变量的指标值。因为无论市场风险、政治风险、生产风险,还是环境保护风险、金融风险等,都会对煤炭产品的产量、售价、成本产生影响。

2.3对月产量、售价、月成本三个风险变量进行分析

本文在统计分析过程中使用统计分析软件SPSS18.0。SPSS是世界上最早的统计分析软件,已有30余年的成长历史。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。

图1 月产量直方图

SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。企业在生产经营中,产生大量的统计数据和检测数据。本文通过对产量、售价、成本三个风险因素的历史值分别做描述性统计、Q-Q图检验以及非参数检验,检测出其风险变量服从的分布特征。

2.3.1 绘制月产量直方图

采用SPSS软件中分析模块,对月产量历史数据做描述统计。绘制月产量直方图,描述其分布特征,如图1所示。

由月产量直方图图形特征判断,月产量大致符合正态分布。则假设月产量服从正态分布,对其做进一步正态分布检验。

2.3.2 对月产量进行正态分布Q-Q图检验

由上述直方图图形特征,已作出月产量服从正态分布假设。在SPSS分析模块中,继续做月产量的描述统计正态Q-Q图检验。检验结果如图2所示。

图2月产量的正态Q-Q图

从图中可得,月产量的各个散点基本分布在累积概率线上,即符合正态分布。

2.3.3 对月产量做K-S检验

为使分析更加精确,本文对月产量数据进一步做非参数检验(K-S检验)。检验结果如表1。

表1K-S检验结果

从结果上看,渐近双侧的显著性达到了0.359,远大于显著性水平0.05,所以原假设成立,认为该项目月产量分布与理论正态分布无显著差异。也就是说月产量数据在0.05水平的显著性下通过了正态性检验。

2.3.4 结论

检验结果表明,月产量Q服从N(292578.088,118121.585)的正态分布。同理对煤炭售价、月生产成本做相关分析,得售价P符合N(366.908,36.189)的正态分布;月成本C符合N(21321842.06,9467248.6)的正态分布。

3结语