excel数据分析范文
时间:2023-04-07 12:10:29
导语:如何才能写好一篇excel数据分析,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
【关键词】 数据分析;描述统计;检验分析;方差分析
1 引言
excel提供了一组强大的数据分析工具,称为“分析工具库”,使用分析工具库可以在用户建立复杂统计或工程分析时节省许多操作步骤。但由于“分析工具库”中的分析工具具有很强的专业性,一般在统计学或工程学的特定领域应用得比较广泛,因此普通的Excel用户对此“分析工具库”工具都采取了一种敬而远之的态度,很少有用户使用Excel的“分析工具库”功能及其提供的内容丰富的函数。其实在Excel的“分析工具库”中包括了许多非常实用的函数,利用这些函数可以帮助我们方便地解决许多Excel实际应用中的难题。
Excel以其简便易学已为大多数研究人员所掌握,其中的“分析工具库”能做一些常用的统计处理,我们只要针对实际问题找到对应的分析工具就可以了。
鉴于Excel具有强大的数据处理与统计功能,而在药学研究中,血药浓度的计算、药动学参数的求解、给药方案的设计、数据设计及组织管理、绘制图表等,需要进行大量而繁琐的数据处理、绘制各式图形。在医学数据的处理上,数据的统计缝隙也是非常重要的。电子表格处理系统Microsoft Excel for Windows是具有强大的数据处理及管理、图表绘制和打印等功能的软件,该系统操作简单,提供数据的动态显示和报告,数据分析工作直观,图表与Word等字处理软件兼容性好,能相互切换,可以方便地用于医学和药学研究的数据处理。
2 数据分析工具的应用
2.1 描述统计 “描述统计”分析工具用于生成源数据区域中数据的单变量统计分析报表,提供有大数据趋中性和离散性的综合信息[1]。
2.1.1 示例 某医院用中药治疗青光眼的试验中一些患者眼压的变化,用“描述分析”对这组数据进行基本的统计分析。
2.1.2 操作步骤 因为改统计分析软件操作界面比较简单直观,只要按照题目的要求填写相应的数据即可得到所需的结果,这里就不再赘述了。输入界面如图1所示。图1 “描述统计”输入操作界面(略) 汇总统计结果可以包含:平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏度、极差(全距)、最小值、最大值、总和、总个数、最大值(#)、最小值(#)和置信度[2]。
2.1.3 结果分析 如图2所示,输出了实验数据所需的各种统计结果,以备医务工作者分析患者的病情。 图2 描述统计分析结果(略)
2.2 t检验 实际工作中,除需要判断某种处理结果与某一已知结果间的差异外,还需比较两种处理的效果,即比较两个样本总体的统一参数的差异。本节将讨论Excel“统计分析”工具包中的t检验。适用于等方差、异方差和成对数据的情况。
2.2.1 t检验 双样本等方差假设。等方差假设这个分析工具可用来确定等方差的两个样本均值是否相等或均值差是否等于给定值。
示例:考察一组成年男女体重的数据进行检验分析。要求用t检验来验证两组体重数据的均值差是否为20。
2.2.2 操作过程 打开t检验工具的对话框,按要求填入相应的检验参数,如图3所示。 图3 t检验:双样本等方差检验(略)
2.2.3 结果分析 统计分析结果如图4所示,从中可以得出分析结果为T统计量(0.020046449)小于双尾临界值(1.972016435),也小于单尾临界值(1.652585979);而相应的双尾概率高达0.984026506,单尾概率也达到0.492013253。所以可以有把握地认为均值差等于给定值20。
2.3 方差分析 方差分析是数理统计中重要的组成部分,在统计实践中也有着广泛的应用。由于方差分析的运算量随着变量的增多呈几何级数增长,如果不使用计算机,很难完成大规模数据的方差分析。在应用统计学的几个主要领域里,方差分析也是惟一无法直接用Excel 2002中的函数完成的科目(当然,如果耐心地对每组数据逐个进行计算,也可以用函数实现,但繁重的运算会使得工作效率变得很低,错误率增大)。
方差分析主要分为单变量方差分析、无重复双变量分析和有重复双变量方差分析。Exce1 2002在“统计分析”工具包中就对应地提供了这三个工具。下面仅介绍单因素方差分析。
单因素方差分析的作用是通过对某一因素的不同水平进行多次观测,然后通过统计分析判断该因素的不同水平对考察指标的影响是否相同。从理论上讲,这实质上是在检验几个等方差正态总体的等均值假设。单因素方差分析的基本假设是各组的均值相等。
2.3.1 示例 进行某化学合成反应时,为了解催化剂对收率是否有影响,分别用5种不同的催化剂独立地在相同条件下进行试验,每种催化剂实验4次,要求用方差分析判断催化剂对收率是否有影响[3]。
这是一个典型的单因素方差分析问题,催化剂是一个因素,而不同的催化剂可以视作该因素的不同水平。
2.3.2 操作过程 将原始数据输入工作表,打开单因素方差分析对话框,按要求填写选项。
转贴于
2.3.3 结果分析 统计分析结果如图6所示,从中可以得出分析结果为
运算结果分成概要和方差分析两部分。
概要:返回每组数据(代表因素的一个水平)的样本数、合计、均值和方差。
方差分析:返回标准的单因素方差分析表,其中包括离差平方和、自由度、均方、F统计量、概率值、F临界值。
分析组内和组间离差平方和在总离差平方和中所占的比重,可以直观地看出各组数据对总体离差的贡献。将F统计量的值与F临界值比较,可以判定是否接受等均值的假设。其中F临界值是用 FINV函数计算得出的。本例中F统计量的值是10.34346,远远大于F临界值3.055568。所以,拒绝等均值假设,即认为5种催化剂的对收率差异有显著性。从显著性分析上也可以看出,概率为0.000317,远远小于0.05。因此也拒绝零假设。
3 讨论
数理统计方面的软件应该说目前为止比较流行的软件也有一些,如SPSS、SASS、STATISTICA等等,但这些软件一是专业性比较强,艰深难懂,操作起来比较麻烦,且基本上是英文版的,对于一般人来讲还使用起来会觉得不方便的,二是软件价格过于昂贵[4]。
Excel是微软公司出品的办公系列软件,是很多人非常愿意使用的软件,所以它的普及程度比较高,即使是人们没有太多的使用Excel的许多高级应用,学习起来也会比其他的专业软件得心应手一些。
Excel中的“数据分析工具”智能地同步引用了多个统计函数对样本数据进行分析,可同时返回所希望的多个分析结果甚至图表,使医药工作者在进行科学研究及实验数据处理时不再忙于繁杂的数据计算过程,而更加专注于试验设计,计算(分析)结果的编辑打印则更便于资料的存档和交流。
本文只引用了几个应用Excel“数据分析工具”进行医药数据统计的实例,其实Excel“数据分析工具”还有好多种统计分析工具,它们能够进行非常复杂的统计计算,这种计算功能非常强大,如果采用人工计算会费时费力,得不偿失,比如,回归分析,方差分析以及各种检验统计分析等等。Excel友好的界面,清晰的统计分析结果,使医药工作者在使用Excel的“数据分析软件”时会感到非常的方便快捷,灵活实用。由于论文篇幅的限制,Excel“数据分析工具”的其他应用实例就不在这里赘述了。
参考文献
1 王晓民.Excel 2002高级应用—数理统计.北京:机械工业出版社,2003,214.
2 徐秉玖.药物统计学.北京:北京医科大学出版社,1999,6-7.
篇2
【关键词】Excel数据分析;项目驱动教学;专业能力培养
一、概述
按照“以就业为导向,以服务为宗旨”的职业教育目标,高职院校培养的学生应当具有解决实际问题,具有自我学习、持续发展的能力,具有创新和创业的能力。其中,“解决实际问题”是高职学生能力培养的第一目标。当今社会,计算机应用能力是信息化社会发展的需要,目前许多高职院校都开设了Mi
crosoft 0ffice办公软件等方面的课程,在于培养学生较基本的计算机应用能力,解决一些日常工作的实际问题。其中,电子表格Excel是日常办公中使用最广、掌握相对较难的一个软件,它具有较强的数据处理与数据分析能力,丰富的图表功能,能够完成财会金融数据处理、人力资源管理或生产管理等等。并且Excel以其友好的操作界面和强大的数据分析功能受到了众多企业和个人的青睐,利用Excel进行管理和决策已成为办公人员日常工作的一部分。许多高职院院校开设了计算机应用基础等类似的课程,这类课程中Excel的学习更注重的是学生Excel的基本应用能力,能够制作表格、能够使用简单函数、能够掌握排序、筛选、分类汇总等Excel基本数据处理工具的使用。利用Excel对企业产品市场销售数据、生产数据等做出快速全面的预算,通过分析、比较这些数据,不断改进原有方案,使企业的生产经营活动始终处于最佳状态,这对提高企业竞争力有着非常重要的现实意义,而学生运用Excel进行数据分析作为管理和决策依据的能力却非常有限。
二、教学内容的设计
职业教育课程的内容必须以职业活动为导向,因此Excel数据分析的教学内容,都应紧紧围绕职业能力目标的实现,取材于职业岗位活动和实际工作流程。Excel作为一个工具,最终目的是为各个职业岗位服务,针对不同的专业,Excel数据分析项目的设计应贴近不同的实际岗位。同时,针对不同专业的学生,应设计不同的授课侧重点、教案,引导学生使用Excel来完成其专业课程任务,使学生在实践中体验成就感,因而产生积极的学习兴趣,达到优良的教学效果。在教学中多采用项目驱动的教学方法。项目驱动教学模式针对不同专业的学生根据课程内容选用不同的项目,这样有利于学生把Excel和专业知识相结合,再将项目分解、结合,学生通过合作讨论来分析项目、搜集资料、确定方案步骤,直到解决问题。这一过程是培养学生解决实际问题的能力的有效途径。例如,医药高职学校学生在用Excel进行医疗数据统计处理时,可采用“配对t检验”这样具体的项目,将Excel数据分析工具库的19个模块以及使用Excel进行数学分析的具体操作等融入项目中;房地产专业可设计项目“抵押物价格评估”,分小组确定不同方案对抵押物进行评估,并进行比较;财务管理专业学生的教学可通过完成“账务管理系统”这样具体的项目,结合Excel的图表数据处理功能,实现完整的财务指标体系分析,培养学生使用Excel数据分析从事财务管理工作的能力。
三、教学组织实施
下面,本文以金融专业中最常见的贷款问题为例,进行“制作适合任何利率的住房贷款分期付款计算器”项目设计与实施。(1)具体项目设计。项目设计的原则具有典型性与可操作性,并尽量贴近实际生活,便于学生的理解并能真正解决实际生活的某些问题。因此设计“制作适合任何利率的住房贷款分期付款计算器”项目。该项目情境引入如下:由于住房贷款分期付款的计算比较复杂,所以购房前的决策难度也较大。制作一款快速计算出不同房屋类型和不同付款方式下的月还款额、总还款额及利息总额的万能计算器,以辅助个人购房贷款决策,具有很强的现实意义。(2)项目的分析。将该项目执行过程按照阶段性进行任务划分,形成“政策背景”、“分期付款分析”、“贷款方式选择”共三个任务,三个任务从简单到复杂,并有密切的关联关系。任务一了解项目的行业背景知识,为项目的执行做好准备;任务二难度相对加大,利用Excel的函数完成月还款额的计算,为任务三的个人决策提供依据。(3)教师的具体引导。按照新职教理念,在教学中应充分体现“教师引导,学生为主体”这一教学模式。引导学生分析问题,进而提出解决问题的思路。教师演示和讲解注意应主要讲解解决问题的思路、整体概念和整体框架。在任何项目执行过程中,均会涉及到专业、行业知识等,因此学生收集资料,准备好项目背景知识是很重要的第一步。在任务“政策背景”中,需要了解目前我国各大银行及金融机构的住房贷款方法,如商业性个人住房贷款、公积金个人住房贷款、等额本息还款、等额本金还款等具体含义及实现的数学模型,为后续任务的具体实现作为铺垫。在该项目的“分期付款分析”任务中,财务函数作为新知识点引入,教师可做适当讲解与演示。对年金函数PMT(是基于固定利率及等额分期付款方式,返回投资或贷款的每期付款额)进行介绍,并对比年金函数PMT学生自主学习现值函数PV(即从该项投资开始计算时已经入帐的款项)、期望值函数Fv(在最后一次付款后希望得到的现金余额)、总投资期函数Nper(即该项投资的付款期总数)等等,因为这一系列函数常用于处理贷款问题,彼此之间关联度较大。在任务“贷款方式选择”中,可让学生分组讨论,得出解决方案。一般该任务学生会采用IF函数多层嵌套与窗体来实现。在学生的讨论与尝试过程中,会有普遍存在的疑问,教师可针对学生的典型问题进行引导。同时,部分学生有比较新颖的方案,可让学生将自己的实现过程与解决方案向同学做介绍,锻炼学生的语言表达能力。该项目的执行过程,充分体现学生为主体与教师的引导,起到对学生综合能力培养的作用。(4)学生考核与评价。考核是相对目标而言的。考核学生使用Excel进行数据分析的能力,解决实际问题的能力,因此应重过程考核,使用“任务”对学生进行考核。例如,该项目中,项目任务的完成进度、小组成员之间的协作情况、学生对项目展示的表达能力等等均可作为考核的内容。
四、主要问题的思考
(1)项目设计的关键性。在学生Excel数据分析能力的培养中,项目的设计是最关键的一步。能力的培养必须在教学中进行,教学时间的分配必须合理,项目过大、过难均会影响到教学时间的掌控,从而影响教学的效果。并且,由于教学的对象是未接触实际项目的学生,因此项目应容易理解并尽量贴近实际生活,能解决实际生活的问题,才能真正体现Excel数据的分析是为管理和决策起指导意义。(2)对教师能力的更高要求。Excel教学的教师一般都是计算机基础课的教师,而在教学过程中要求项目与专业相结合,将Excel作为学生专业学习的工具,这就要求计算机教师能认真了解该专业的基本知识,主动了解该专业的最新动态与技术,关心该专业学生的就业动向与行业规则。对教师的行业知识提出了更高的要求。
五、结语
Excel电子表格,作为基本的工具软件应用越来越广,当Excel与专业相结合时发挥出了巨大优势。因此,高职院校学生能力培养的改革过程中,应遵照“以就业为导向,以服务为宗旨”的职业教育目标,重视学生运用Excel进行数据分析作为管理和决策依据的能力培养。
参 考 文 献
篇3
一、教学前期准备
本案例是北京市海淀区实验教材《信息技术》初中上册中的第二单元―电子表格的起始课。本单元要求学生能够应用电子表格进行数据分析和评估,从确定主题―采集数据―建立表格―数据分析―到得出结论。本课主要任务是了解电子表格的特点,掌握创建表格的方法。
1.学生情况分析
本案例是初一年级第二学期的内容,学生经过中小学合计4年半的课堂学习和课后练习,已经熟练掌握了办公软件中的Word和PPT的基本操作,对Microsoft Office软件环境较为熟悉,并且初步具备了一定的自主学习能力和小组合作学习能力,乐于探索,乐于实践,这些都是课堂教学顺利高效进行的有利因素;但是学生此时也同样具有缺乏耐心、急于求成的特点,这对学生通过探究进行自主学习是个不利因素。根据以往的经验,学生从图像处理单元过渡到电子表格单元时有一定的心理落差,往往学习兴趣不高。
(分析:教师首先分析学生的知识储备,学生已经掌握了办公软件中Word和PPT的基本操作对新软件的学习有正迁移作用,所以教师确立了自主学习的教学模式,让学生能够主动探究和构建知识体系。并且根据学生的心理特点,把如何激发学生学习兴趣确定为本课的基点,从兴趣出发教师设计了一系列的任务案例,使得学生在完成任务的过程中掌握知识与技能。由此可见,教学设计应该在分析教材、学生的基础上,了解并尊重学生的需要,从“学生的需要”出发,确定教学目标,设计教学案例。)
2.教学目标
针对学生情况和本课的教学内容要求,确定如下教学目标:
知识与技能:学会从搜集的素材中,分析、整理、提取有效数据;掌握使用Excel创建表格的方法,合理设置表格标题、表头项目。
过程与方法:在整理从实际生活得到的数据的过程中,体会分析数据关系、提取有效数据的方法;在尝试交流过程中,提升自主学习和小组学习的能力。
情感态度价值观:通过创设“节水视频”的情境,引发关注全球水资源短缺的问题,建立“世界有我,节水由我”的节约环保观念。
教学重点:从搜集的素材中,分析、整理、提取有效数据;根据实际需要创建表格,合理设置表格标题和表头项目。
教学难点:分析整理数据,设置表格标题和表头项目。
(分析:教学目标处于核心地位,教学中的诸多因素都是围绕教学目标,为教学目标服务。在教学中,教师所要做的第一步就是从学生的需要出发,在把握教材的基础上,设定教学目标,明确教学重、难点,使教学活动围绕教学目标展开。
本节课教学目标遵循了新课程标准的三维目标,描述清晰、全面而又富有学科特点。首先,教学目标的表述是以学生为主体,并且阐述了通过整理实际生活中的数据的过程,掌握分析数据关系、提取有效数据的方法。其次,在教学目标的描述上合理运用行为动词,如学会、体会等,便于操作,同时对行为动词的使用条件进行了界定,便于实施和测量,为后期教学策略以及教学评价的选择提供了依据。
由于学生已经掌握了Word和PPT的基本操作,对Excel的基本界面不会陌生,所以本课的教学重点为学会从搜集的素材中,分析整理提取有效数据,以及根据数据合理设置表格标题和表头项目,更注重让学生体验数据处理的过程。)
二、教学过程设计
本案例从世界水资源危机导入,让学生面对一个个问题,在解决问题的过程中学会方法。本案例的教学流程如图1所示:
1.创设情境,引出课题
教师播放有关“水资源危机”的视频文件,并提出问题:在此短片中,引用了大量的什么资料给你留下深刻的印象?使用这种资料来说明水资源危机的好处是什么?
学生观看视频文件,思考何种信息起到了加深印象的作用,并尝试归纳数据的作用。
教师引出课题从这节课开始,我们将学习第三单元――数据处理与分析初步,使用的软件是专门处理数据的,这个软件的名字是Excel,并提出问题Excel作为Office家族中的一员,它的界面和Word有什么相似之处和不同之处?
(分析:教师精心准备了“水资源危机”的视频文件,使学生关注全球水资源短缺的问题,同时也感受到数据更能清楚地表明水资源的现状,激发学生深入研究数据的兴趣。同时借助与Word软件的对比,利用学生已有的知识结构,同化新知识,构建知识体系。)
2.提出问题,合作探究
教师引导学生打开“课堂练习”文件,提示学生使用“工作表导航按钮”(学生可以参考演示文稿上的图示)浏览工作簿中的各张工作表,并给出小组思考题:此文件(工作簿)当中有多少张工作表?这些工作表之间有什么共同之处吗?修改单元格中的数据,图表会有变化吗?
学生打开课堂练习文件,尝试探索“工作表导航按钮”的用法,打开工作簿中包含的各张工作表,初步认识工作簿和工作表,思考教师提出的问题。并且修改数据,观察结果,体会Excel“牵一发动全身”的含义。
教师在学生小组讨论的基础上,适时进行总结:Excel和Word与PPT软件都是Office办公软件,它们界面相似,都用来展示、呈现信息,但是Excel更重要的用途就是能够对数据进行加工、处理和分析(用途)。
(分析:由于大部分学生第一次接触Excel软件,当看到修改数据后,相应的图表发生变化时,会激起学生进一步探究的兴趣。最终学生在操作实例的过程中,逐步熟悉Excel的界面,自主探究Excel的操作方法。学生在尝试探究的过程中,重新构建对Excel的认识,并且通过小组交流、师生互动,得出结论:Excel分析数据、制作图表不仅仅是为了展示和呈现信息,更重要的用途是能对数据进行加工、处理、分析。教师设计的小组交流环节,既鼓励学生大胆尝试,又培养了学生乐于分享的意识,为今后的合作学习打下基础。)
教师进一步提出问题:观察课堂练习中两张工作表,找出共性,如图2所示。思考是否可以在Word中完成?
学生经过组内梳理、交流,逐步清楚找出工作表的共性:都有标题、表头、数据。在Word中尝试后发现,在Word中制表最大的问题是修改数据,图表不会产生相应的变化。
(分析:通过引导学生观察分析两张工作表的共同之处,培养学生仔细认真地学习态度,并且为后续创建表格打基础。通过与Word中制作表格的对比,使学生感受到电子表格的特点和作用。)
3.教师引领,创建表格
教师提出新的问题:既然Excel具有强大的数据处理与分析功能,那么数据从哪里来?学生根据以往经验提出各种数据来源,师生共同归纳总结数据来源:直接或者间接途径:直接途径,第一手资料,例如做些社会调查,直接从社会中了解情况、收集资料和数据。或者从其他途径获得第二手资料。(例如上网查找资料,从新闻、报纸、杂志、文献等渠道获取数据)。这两种方法,大部分情况下是要综合使用的。
(分析:数据的来源非常重要,这直接影响数据分析得出的结论是否真实、准确,关注数据来源对于后续的研究专题的顺利开展来说是个保证。培养学生做学问认真的态度。)
具体案例:前面观看的视频中存在大量的数据,分别从不同方面描述了水资源短缺的现状,方便在一张表中呈现吗?有些我们需要的数据还不完整,怎么办?
教师引领学生从视频中,提取出需要的数据,分析数据之间的关系,确定表格标题,并且按照数据的共性特点设计出表头名称,将标题和表头分别填写到合适的单元格中,如图3所示。
(分析:从素材中分析整理提取有效数据,合理设计标题和表头是本课的重点,但是学生以往这方面经验较少,不足以支撑自主探究。因此教师通过具体实例分析,引领学生学习获取数据、处理数据的方法。)
4.小组合作,自主学习
教师布置探究任务,每个小组根据自己的情况,选择完成一个关于用水情况的电子表格,并分析数据,得出结论,如图4所示。
(分析:由于学生程度参差不齐,教师在安排综合任务时要考虑分层教学。①知识的分层―根据对教材的把握,哪些知识是每个学生需要掌握的保底知识,哪些是提供给有一定能力的学生学习的提高、拓展知识,本课美化工作表就属于提高任务;②学生的分层―根据学生的认知水平和接受能力进行分层,对不同层次学生要求不同。这两个不同方面的分层结合在一起融入到连贯统一的教学情境中,为处于不同能力水平的孩子提供不同的发展空间。)
5.交流小结,评价反馈
本案例的最后一个环节是作品展示交流和评价反馈。教师根据巡视记录的结果,选择2~3组有代表性的作品进行评价和总结。对共性问题做出说明,建议学生翻阅教材解决或者等待教师在后续课程中给予解决。并组织学生利用网络提交表单的形式开展自评和互评,评价表如图5所示。
(分析:设计的评价方式注重将新课改提出的形成性评价与终结性评价相结合、自我评价与他人评价相结合的评价方式;实现了多元化的评价主体,如师评、自评与互评;以及评价内容多样化,教师不仅对学生的任务完成情况以及最终作品进行了评价,而且关注了学生在学习过程中所表现出来的学习态度等方面。并且基于网络提交表单方式的评价方法非常客观、准确、快捷,不仅便于学生再次梳理强化知识,而且帮助教师更加准确客观了解学生学习情况,从整体上看到每个问题的选项情况,从而了解整个班级、整个年级的学习情况,对教师在后续课程中进行有针对性的调整提供了第一手数据资料。)
三、结束语
本案例从学生的需要出发,在分析学生情况和教学内容的基础上制定教学的目标,确定教学的起点,引导学生利用已有的知识、经验,探究新软件的使用方法。在探究学习过程中,使学生经历了提出问题、分析问题、解决问题的过程,掌握解决问题的方法、形成技能,帮助学生把新旧知识经验构建成整体一贯的知识体系,体现了信息素养的培养。
参考文献
[1] 中华人民共和国教育部.关于印发《基础教育课程 改革纲要(试行)》的通知[S].教基[2001]17号
篇4
1 课程设计部分
1.1 课程目标分析
1.1.1 行为目标
1)学会对EXCEL数据进行排序处理;
2)学会对EXCEL数据进行筛选处理;
3)学会对EXCEL数据进行分类汇总;
4)学会对EXCEL数据进行合并计算;
5)学会对EXCEL数据进行透视表处理。
1.1.2 生成性目标
通过对本节课的学习,学会利用书和网络自学、解决疑难问题的能力。
1.2 学习者分析
本课程的学习对象是高职一年级的学生,学习准备知识差异较大,有的学生因为在中学阶段较多地接触过电脑软件,本课程的内容对他们来说比较简单;有的学生上网较多,自认为内容很简单,但是实际的内容并没有掌握,而且还不愿意听课,不能发现自己的问题所在;有的学生虽然学习态度很好,但是学习能力有限,对别人来说很简单的东西也很难学会。
1.3 教学内容的设计
本堂课教学内容的设计有如下特点:
1.3.1 题库式练习题
对学习能力较差的学生来说,教一个例子很难举一反三,而数据处理又是计算机基础中较难理解的部分,所以通过大量的题库式练习题加深他们对数据处理的理解。学习能力差的学生还有一个特点是记忆力也一般,所以多道类似题的重复练习有利于他们掌握数据处理的操作。
所以本课程每个数据处理的知识点都准备了20个相似的例子,供学生上课和课后的学习。
1.3.2 题库难度分级
难度分级适合差异化学习的实现。在基本知识部分学习完之后,学生可以在题库中选择巩固知识部分或者进阶知识部分。
例如排序部分,基本知识部分就是掌握一般的“主要关键字”和“次要关键字”、“升序”和“降序”的选择,进阶知识部分就是掌握按笔画排序。合并计算部分,大家普通反应比较难,基本知识部分就是掌握如何依样画葫芦做出题库中已经设置好的题目,进阶部分就是知道什么样的情况能合并,什么样的情况不能合并等等。
1.3.3 注重趣味性、实用性
这个趣味性不是指花里胡哨的动画情节,不是生硬拼接的其他外在的趣味性,而是追求知识本身内在的让学生觉得有意思的部分。
计算机发展快、计算机教材更新快是计算机教学普遍存在的现实,因而在教材中可能出现一些不严谨的地方。例如教学生在教材中找教材的漏洞、错误,就是一个让学生觉得很有趣的事情。因为中学阶段他们都习惯了教材的完美、严谨,在大学一年级突然有老师告诉他们教材编写的时候也可能漏掉一个步骤,很多学生都很兴奋。然后进阶部分复杂的问题仅仅用书上教的方法做不出来,也需要通过网络去自己寻找答案。
1.4 学习资源的设计
学习资源是指学习者在学习过程中可以利用的一切显现的或潜隐的条件。在本空间教学课程中,学习的呈现主要依靠教师演示以及空间存放两个部分。
1.4.1 结构化学习资源的设计
包括教师的教案、讲义、幻灯片,以及空间中的教学视频。这是常规教学的部分。
1.4.2 非结构化学习资源的设计
学习者在学习过程中,通过与教师和其他学习者之间的交互,会产生大量蕴藏着个人与集体智慧的信息,如同步或异步交流记录、博客、WIFI等,他们是非结构化学习在网络课程中最主要的形式,对于培养学习者的高级认知能力具有不可替代的作用。
非结构化学习资源的设计主要依靠教师空间和学生空间来实现。
1)网络教师 主要靠空间中教师和学生的留言板来实现。
2)学习伙伴 靠学生空间中的群组和留言板来实现。
3)教师空间资源 存放着不仅仅是当次可能的相关教学资源,还有一些扩展学习的资料。
4)学生空间资源 学生可以存放自己的学习笔记。
1.5 教学策略的设计
教学策略是指建立在一定理论基础上,为实现某种教育目的而制定的教学实施总体方案,包括合理选择和组织各种教学内容、材料、建立师生行为程序等内容。
本课程在讲授部分主要采用示范—模仿教学策略。教师演示每种数据处理例题的做法,学生模仿;教师演示如何通过半封闭的空间来进行学习以及小组讨论,学生模仿;教师演示如何通过互联网来寻找答案,学生模仿。
在基础知识讲授结束后,采用分组协作学习策略。学生分组,有继续学习巩固知识部分组合学习进阶知识部分组。布置任务后,通过课堂讨论、竞争、协同、伙伴等多种方式完成协作学习。
1.6 学习评价设计
在学生的空间中建立学习文件夹。内容包括学生个人当天的练习题结果,小组的分组学习结果,学生收集的反应学习过程和学习进步的各类学习成果。
教师在空间中进行诊断性评价。教师不仅在空间中给学生习题的结果打分,还根据学生的学习状况给出对学习过程的分析和评价,从而给出最有效的建议。
2 空间教学在这堂课中起到的作用
2.1 空间教学让个别化学习得以实现
学生基础不一是计算机基础教学中表现的特别明显的问题。有了空间中的教学资源,在学生的基本教学内容结束之后,学生可以在空间中选择适合自己需要的学习内容。当学生按照自己的能力进行学习,积极主动完成课题并体验到成功的快乐,能获得最大的学习成果。
2.2 空间教学让非结构化学习得以实现
根究知识的复杂性,斯皮罗等人将知识划分为结构性知识领域和非结构性知识领域。所谓结构性知识,是指有关某一主题的事实、概念、规则和原理,他们之间是以一定的层次结构组织在一起的。非结构性知识,则是将结构性知识应用于具体问题情境时产生的,即有关概念应用的知识,这意味着,结构性领域的同一个概念应用在各具体实例中,其内涵将表现出一定的差异。
传统的教学模式,因为其封闭性,往往只能侧重结构化知识的学习,而不得不忽略非结构性知识的学习。而空间中丰富、海量的信息,非常有利于非结构性知识的建构。
参考文献:
[1] 何克抗等编著,教学系统设计.北京师范大学出版社,2002.
[2] 武法提.网络教育应用.高等教育出版社,2003.
篇5
关键词:大数据;统计软件;数据分析
中图分类号:TP393.4 文献识别码:A 文章编号:1001-828X(2016)012-000-01
在大数据时代,每个人身边都存在着海量、丰富可深入挖掘的数据,人人生产数据,时时产生数据。大数据一般分为结构化数据、半结构化数据和非结构化数据,大体上,结构化数据占10%、半结构化数据占5%、非结构化数据占85%,包括各种格式的办公文本、图片、报表、音频、视频等。对统计学习而言,最大的考验是如何对这些海量的数据信息进行充分的开发,找出数据之间隐藏的规律与关系。
首先对于结构化的数据,一般基础数据分析用Excel等统计软件,既可满足基础要求;大数据分析用Eviews,SPSS,Stata,SAS,R,Python等,其中R和Python对于半结构化数据和非结构化数据的挖掘和分析有很好的应用。下面对各软件在大数据分析中的特点进行简单介绍:
Excel电子表格是Microsoft公司推出的Office系列产品之一,是一个功能强大的电子表格软件。特点是对表格的管理和统计图制作功能强大,容易操作。Excel的数据分析插件XLSTAT,也能进行数据统计分析,但不足的是运算速度慢,统计方法不全,因此Excel在大数据分析中存在一定的局限性,但适合一些基础的数据处理。
Eviews是美国QMS公司研制的在Windows下专门从事数据分析、回归分析和预测的工具。使用Eviews可以迅速地从数据中寻找出统计关系,并用得到的关系去预测数据的未来值。Eviews处理回归方程是它的长处,能处理一般的回归包括多元回归问题。不过这个软件的劣势在于它的黑箱式的处理过程,出来的结果可能会不够精确,有的人可能会为得到一些结论而伪造一些结果,可信度不是很高。在大数据分析中Eviews只适合时间序列数据的分析。
SPSS由美国斯坦福大学的三位研究生研制。SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形、表格较有方便,输出结果比较直观。SPSS在横截面数据的分析中有很大的优势,适合进行从事社会学调查中的大数据分析处理。另外,值得一提的是,最新版的SPSS采用DAA(Distributed Analysis Architecture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告,使SPSS更加适应大数据的潮流。
Stata统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。特点是采用命令操作,程序容量较小,统计分析方法较齐全,计算结果的输出形式简洁,绘出的图形精美。不足之处是数据的兼容性差,占内存空间较大,数据管理功能需要加强,这使得Stata在大数据分析中处于不利地位,但是相较于Eviews和SPSS,Stata在面板数据分析的优势是毋庸置疑的,Stata更加适合大数据中的面板数据分析。
SAS软件在数据挖掘上具有优势,其板块的独特功能为大数据分析提供了利器。对于不熟悉计算机编程语言的统计学习者可使用SAS。SAS软件的EM模块及sas base拥有强大的数据处理功能。在SAS的EM模块中,包含了数据处理、模型建立、简单算法等丰富的数据处理功能。例如对获取的数据可进行再次抽样,抽样的方式是多种多样的,有:随机抽样、等距抽样、分层抽样、从起始顺序抽样和分类抽样等方式。而且抽样的过程不需要程序运行,只需要建立流程图即可。更加复杂的数据模型如生存分析、神经网络、SVM、决策树、MBR等可以在数据建模中添加节点来进行。在对数据进行分析以后,SAS会导出程序记录和最后结果。尽管SAS有众多优良特性,但其并非脚本语言,所以它在数据运行上占有CPU较高,特别在使用EM模块时,花费的时间相对较长。
Python和R都是开源软件,相较于上述软件,在大数据分析中有着绝对的优势。Python的网络爬虫及R的RCurl包、Rweibo包等都可以进行网络数据和文本挖掘,对非结构性数据亦能进行分析处理。众多的R语言包使得其在数据可视化方面也有着很大的优势。Python和R各有其特点:
R的优势在于有包罗万象的统计函数可以调用,特别是在时间序列分析方面(主要用在金融分析与趋势预测)无论是经典还是前沿的方法都有相应的包直接使用;相比python在这方面贫乏不少。
Python的优势在于其胶水语言的特性,一些底层用C写的算法封装在python包里后性能非常高效(例如:Python的数据挖掘包Orange canve中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。
Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。因此,在大数据分析中,Python更适合对海量数据的处理,而R更适合对数据的统计分析。
目前,最流行的数据分析软件是R。KDnuggets网站每年会做一些数据分析和数据挖掘软件使用的专题问卷调查。据该网站2011年对570个数据挖掘和数据分析的工作者关于过去12个月数据挖掘和数据分析所使用的编程语言的调查显示,R语言排名第一,所占比例近一半(45%)。免费是R流行开来的最大的一个因素,现在还有很多人使用SPSS或SAS,但大都用的是盗版软件。R拥有出色的可视化图形、丰富的统计方法及高效的更新速度,由一个庞大而活跃的全球性社区维护,使用R的人分布在各个研究领域,任何做数据分析的工作者都应该学会使用R。
参考文献:
[1]方匡南,朱建平,姜叶飞.R数据分析:方法与案例详解[M].电子工业出版社,2015.
[2]维克托・迈尔・舍恩伯格,肯尼思・库克耶著,盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].浙江人民出版社.2013.
作者简介:孟雪井(1985-),女,汉族,安徽淮北人,博士,讲师,研究方向:金融统计。
篇6
筛选!
给数据“过筛子”
股市终于大涨啦,郁闷已久的股民终于看到曙光了!在众多被“套牢”的股票、基金中,哪个会最先赢利?赢利超过超过30%的有哪些?今日价排名是怎样的?如果使用Excel进行成绩统计、收支记账的话,这些问题都能轻松解决。这里以一份虚拟的股票列表为例,我们先查查利润高于30%的有哪些。
第1步:首先选中“上涨比例”单元格,然后单击“开始”标签“编辑”组中的“排序和筛选”下拉箭头,在打开的菜单中选择“筛选”命令(见图1)。
小提示:
关于数据分析相关的操作,一般在“数据”标签中都能找到相关操作项,因此此处还可以切换到数据标签中,然后单击“排序和筛选”组中的“筛选”按钮实现和上述命令一样的效果。
第2步:执行“筛选”命令后,“上涨比例”所在行的连续单元格中都出现了一个下拉箭头,单击“上涨比例”所在单元格的下拉箭头,在打开的菜单中依次选择“数字筛选大于”(见图2),在打开的“自定义自动筛选方式”对话框中,在“大于”右侧的框中输入“0.3”,然后单击“确定”按钮完成筛选条件的设置。这时Excel就自动帮我们筛选出了符合条件的记录,将鼠标指针移动筛选条件所在单元格的筛选按钮上,还能看到具体的筛选条件(见图3)。
小提示:
单击“数据”标签的“排序和筛选”组中的“清除”按钮可以取消上一次的筛选结果,但仍然保留所选单元格的筛选状态(即筛选按钮仍然存在),再次单击“筛选”按钮关闭筛选状态(单元格上的筛选按钮也没有了)。
排序,
帮你快速排名次
刚才通过筛选找出了上涨比例大于30%的,现在想找出价格前十名的股票,并且最好是从第一名排到第十名,这样排名次就更方便了。要怎么办呢?利用上面说的筛选再加上排序就可以轻松实现。
第1步:先选中“今日价”单元格,然后单击“筛选”按钮,接下来单击“今日价”单元格的下拉箭头,依次选择“数字筛选10个最大的值”,在打开的对话框中单击“确定”按钮即可。
第2步:单击“排序和筛选”组中的“降序”按钮,这时Excel便自动将“今日价”列按照数字从大到小排列了。
排好序之后发现有今日价一样的,那么今日价一样的要怎么排呢?其实Excel的排序可以实行多重排序。还以这里的事例为例,如果想今日价一样的人再以“数学”为关键字排一下序,也就是“数学”分数高的排在名次的上方,按以下方法即可。
篇7
关键词:信息技术;说课;教学说课
自1987年提出以来,已逐渐成为教研领域的一项重要活动,与备课、上课、听课、评课一起成为学校教研活动的基本形式。[1]笔者有幸参加了南通市职业学校公共“两课”评比,虽然在比赛中取得了一些成绩,但理论知识和实践能力仍有所欠缺,现就本次说课内容、专家点评和比赛心得与大家分享。
一、教材分析
本项目选自马成荣主编,中等职业教育课程改革规划新教材《计算机应用基础》(第3版),本教材以学习项目为载体,以项目展开为主线,以任务实施为主要学习内容。本项目是学习领域四的第5个项目,是在学生学习了Excel中的函数计算之后,转入难度较大的“运用复杂函数和数据操作功能进行数据分析”的学习。根据课程标准,本领域的学习任务是要求学生掌握Excel强大的数据处理功能,此项目是涉及Excel数据处理最复杂的部分,在本领域中占有举足轻重的地位。
二、学情分析
新课程理念要求课堂教学要以学生为主体,立足于学生已有知识和能力,所以我们先要了解学生的基本情况,才能做到因材施教。(一)已有知识和能力分析在之前的项目学习中,学生已经掌握了Excel的数据编辑、管理和格式化等基本操作,能运用Excel公式和函数对数据进行计算。(二)学习兴趣分析通过之前项目的学习,学生见识到Excel强大的数据处理能力,对学习Excel新的函数及其他功能充满兴趣。(三)学习动机分析本项目的教学对象为中职一年级的学生,女生占绝大多数,她们对数字不是很敏感,数据分析能力及意识较弱,但他们对所取得的成绩比较敏感。(四)个体差异分析学生尚处于成长阶段,思维活跃,接受新事物的能力较强,但动手能力、自主学习能力及团队协作能力存在较大差异。
三、教学目标
根据新课程标准,依据学生情况,结合本项目的教学内容,我确定了本项目的教学目标:(一)认知目标:了解COUNT、COUNTIF及RANK等函数功能。(二)技能目标:培养学生熟练运用相关函数进行分析和管理数据的能力。(三)情感目标:通过对学生考试成绩的分析激发学生学习兴趣,增强学生团队协作的意识。
四、教学重难点
(一)重点根据课程标准和教学目标,确定教学重点为:熟练运用COUNT、COUNTIF及RANK函数(二)难点依据学生知识水平、接受能力和教学内容特点确定教学难点为:通过本项目的学习,学生能形成数据分析意识。
五、教学策略
为了更加有效地实现教学目标,突破教学重难点,根据新课程标准的要求,针对学生的实际情况,我将项目分解为三个任务,分别是:任务一:分析考试成绩;任务二:筛选考试成绩;任务三:汇总考试成绩英国的著名教育家斯宾塞曾经说过:“在教育中,应该引导学生自己进行探讨和推论,给他们少讲些,而引导他们去发现的应该更多些。”为了达到更好的教学效果,在本项目的教学过程中,我始终遵循了“发现式教学”的教学理念,以学生为教学主体,在“教法”上综合运用启发式教学,新知演示,情境创设,分层教学等多种教学方法,引导学生采用尝试新知,模仿演练,小组合作,自主探究等多种“学法”来完成任务。
六、教学过程
以项目为载体,采用任务引领的合作探究式来进行教学:
(一)温故引新
学生在上个项目中学习了四个单参数的Excel函数,而这几个函数都可以利用“自动求和按钮”来代替。教师提问:能否统计出“成绩分析表”中的总分和总人数•引领学生利用上堂课学过的Excel函数或“自动求和按钮”算出结果。学生小组合作探究中发现总分可以顺利求出,但在计算总人数过程中遇到一些困难,及时点拨:COUNT函数的参数仅限于数字,即对数字进行计数。通过巩固已学知识,演练新知,提升技能。
(二)任务引领任务
1:数一数(COUNT函数)学生这时候对Excel函数的理解程度还停留在简单的对参数进行计算的层面,为帮助学生了解函数的数据分析功能,对COUNTIF函数进行了拆解:COUNTIF等于COUNT加IF即有限制条件的计数函数。要求学生利用COUNTIF函数统计出成绩在85分以上的人数,这样设计的目的是通过复杂问题简单化启发学生思考,挖掘教学重点,让学生通过该任务在脑中形成数据分析的雏形。任务2:挑一挑(COUNTIF函数)利用COUNTIF函数和公式(注意绝对地址的引用)计算不及格人数、优秀率和及格率。通过让学生自行尝试练习,教师再进行点拨,促进学生形成一定的数据分析意识,从而突破教学难点。任务3:加一加(SUMIF函数)利用SUMIF函数和公式计算男/女生体育平均分,在自我尝试中发现问题,小组合作中解决问题,自主探究中巩固知识。通过相似知识点的迁移,让学生获得技能延伸,促进数据分析意识的形成。任务4:比一比(RANK函数)利用RANK函数分析班级考试成绩总分的排名。学生对成绩的排名普遍比较感兴趣,但看到RANK函数的参数却又望而却步;学生在小组合作探究中发现,要利用RANK函数进行自动填充,需要将第二个参数“排名范围”用绝对地址固定住,否则得到的排名数值是不正确的。由局部到整体,从简单到复杂,让学生在自行尝试的过程中发现问题,通过团队协作解决问题,突破教学难点。
七、教学反思
著名教育学家布鲁纳说过:发现是教育学生的最好方法;在本项目的教学过程中,正是这一思想贯穿始终。在教学过程中,始终以问题引领任务,引发学生思考;充分利用教学资源和学生互动交流,打破时空壁垒;充分发挥学生的主观能动性,让学生先练,教师后讲,提高学生自主探究能力,增强教学效果;充分调动学生的学习积极性,通过分层教学让每个学生都能参与教学过程,在团队合作的过程中获得锻炼。从本质上看,说课是教师将自己的教学设计的思维活动从隐性变为显性的过程,即将自己关于课题设计的个人行为转化为群体性的学术讨论。[2]在新课程背景下,教师应当坚持以生为本,不拘泥于说“课”本身,而应跳出课本,充分发挥学生的主观能动性,把自己的说课更好地应用于实际教学中。授人以鱼不如授人以渔,笔者希望借此寥寥心得,能够给大家在说课方面提供些许参考。
[参考文献]
[1]宋萑.说课与教师知识建构课程•教材•教法,2012-04-0120-05.
篇8
[关键词]EXCEL;数据库;导入;导出;数据分析;数据处理
中图分类号:TM734 文献标识码:A 文章编号:1009-914X(2016)15-0221-01
1 引言
随着配网电力系统规模的不断扩大,电网管理自动化水平的不断提高,电网自动化系统的实用化应用水平不断深入,原有的调度自动化系统管辖的开闭所也由原来的5个开闭所增加到25个。新增的开闭所多为采用微机保护,三遥表数量也越来越多,数据库也越来越庞大,相应也带来了大量的维护工作。
2 EXCEL在数据库维护中的具体应用
对于EXCEL在调度自动化系统的数据库维护中的应用,我们通过对新加厂站的遥信的过程实例来进行讲解:
首先对新三遥表进行数据处理、整理,使三遥表满足数据库参数的要求,以便从表中提取数据库中用到相应遥信的设备描述。
新下发的三遥表如图1,处理后的三遥表如图2 。从图2中的“F列”得到数据库中要用到的遥信的设备描述内容。具体步骤:在图2中的“B列”和“C列”通过复制、填充功能,得到“线路名称”和“开关号”,在图2中的“F2”单元格中输入文本函数“CONCATENATE( )”并设置函数参数“ (B2,C2,D2)” 再对整个字段进行填充,就可以获取到对应数据库中遥信的设备描述内容了。
2.2 导出数据库中的“遥信参数表”
通过系统数据库导入导出命令(DBTOOL)导出数据库中的“遥信参数表”,具体如下:
进行数据库维护导出参数,首先要运行系统数据库导入导出命令(DBTOOL)并要连接数据库,如图3窗口,点击“数据导出”和选择“SCADA”数据库,如图4窗口,再选择“遥信参数表”,点“浏览”选择保存参数表的位置,最后点执行即可。
2.3 对导出数据库中的“遥信参数表”进行数据处理
我们利用EXCEL软件中的“自动筛选”功能,通过“厂站代码”字段筛选出所要的厂站,再将筛选后的全部内容复制到一个新表中,注意,第一条记录也要一同复制。并保存名为“遥信参数表”,保存类型为“*.TXT”(带制表符分隔的文本文件),将图2中“F列”字段内容复制到“遥信参数表”中的“描述”字段中,并在“遥信参数表”中的“A列”字段中填充上相应的保护代码如“Pdf0Pg”,注:“P”代表保护代码。对开关和刀闸要分别填充相应的代码,“K*CB”为开关代码,“K*DDS”为刀闸代码。在EXCEL软件中,结合“自动筛选”及“筛选方式”的选择,很容易完成数据库表的参数修改,具体的不再详述。
2.4 导入数据库中的“遥信参数表”
再次运行系统数据库导入导出命令(DBTOOL)导入数据库中的“遥信参数表”,导入参数表过程同上面的导出参数表一样,只是选导入数据库参数时,要输入系统校验口令如图5窗口,还有在导入参数前要先运行数据库(DBMGR)参数修改命令,在“SCADA”库中,找到“遥信参数表”下的相应的厂站,将其下的所所参数全部删除,之后再进行数据库导入导出命令(DBTOOL)导入 “遥信参数表”。
2.5 EXCEL在数据库维护中的应用的注意事项
⑴在做数据参数时,所有参数都不能以数字“0”开头;
⑵导参数时两台服务器都要导入,不然会出现2台数据库的参数不一致,参数丢失;
⑶对导出参数表的第一条记录,不能删除或更改,此条为库表的结构;
⑷在导入参数表的时,一定要做好备份,确认无误,方可执行;
⑸导入参数表的时,要先在(DBMGR)数据库中先将要导入的厂站的相应参数表删除,再进行导入;
篇9
【关键词】:数据分析;数据管理
数据管理:收集及管理企业内所有类型的数据。包括设计开发的数模图纸,零件清单,数据的审批过程、历史记录等。有目的记录收集数据,是确保数据分析过程有效的基础。
1 定义
数据分析:数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。
2 现状
随着时代的进步,企业已经从传统的人工管理及文件系统管理,发展到数据库管理的阶段。数据库管理的基础提供了数据的完整性,正确性。并且企业已经对数据的安全性有所管理,包括权限控制,文件加密系统的等。数据分析的的工作目前仍比较初级的阶段,当数据分析的水平跟上数据管理发展的水平时,将会大大加快企业发展和进步。
3 意义
数据分析是判断、趋势、多角度发现问题的成熟解决方案,传统企业的大部分业务情况,通过业务经验,有了数据分析即可改善业务。数据的核心是发现价值,而驾驭数据的核心是分析。通过对企业数据的梳理分析,结合业务的理解,找出一些突出问题的关键点,预测未来的趋势,帮助企业更好地进行决策。
4 数据分析的过程
4.1 收集数据
收集数据是数据分析的来源,同时也是数据管理的日常工作。数据收集分为人工输入以及数据库系统的输入。这里提到的人工输入可以是人为判断评价的记录,例如:个人评价/评论/反馈;数据系统的输入可以是企业内部拥有的软件数据库收集的信息,例如:BOM,PDM,PORTAL等。
4.2数据预处理
数据预处理即是去除不必要的信息及明显的错误信息并进行数据转换。不同的数据来源通常会产生不同的格式,这里我们普遍常用的数据分析工具是EXCEL,所以需要将输入的不同格式转化为EXCEL可以方便读取的形式。
4.3 数据分析的方法
数据分析的方法有很多种。这里只是提出比较常用的一些经验方法。
聚类分析、预测建模、关联分析、异常检测。
4.3.1 聚类分析
发现紧密相关的观测值族群,使得同组的相似性越大,不同组的差别越大,已达到较好的聚类效果。根据聚类得到的不同观测值组,做出决策树,为业务部门提供决策支持。
聚类分析简单、直观。
聚类分析主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析;不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解;聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响。研究者在使用聚类分析时应特别注意可能影响结果的各个因素。异常值和特殊的变量对聚类有较大影响。
聚类分析是细分产品市场的有效工具,同时也可用于研究消费者行为,寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。在企业内部数据管理中可以用于用户调研、反馈,进而更好地为企业员工提供适合的服务及帮助。
4.3.2 预测建模
以自变量函数的方式为目标建立模型,预测离散的目标变量;预测连续的目标变量。
根据CAD软件的应用状态判断下一年的需求:
根据图标分析可以预测,明年的软件需求应该和今年差不多,CAD软件保证在400左右基本可以满足需求,CAD软件保证在50左右可以满足需求
4.3.3 关联分析
关联分析就是从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放人其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。关联分析是一种简单、实用的分析技术,就是发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。
例如在零件的数据管理过程中可能发现一些关联零件的规律。
例如:从VDS中找出配置选项的关联,例如配置了前排乘客安全气囊,必定会配置驾驶员安全气囊。
4.3.4 异常分析
顾名思义,当一些较为稳定的数据,发生异常或者一组数据中个别数据异于其他数据时,发现它们,并从中找到原因或者规律。
或者当发现某部门指标长期低于平均值,则需要关注其产生原因,是不是因为开发人员不足造成
4.3.5 对比分析
根据类似数据进行对比分析。在数据管理的工作中找到类似数据,尝试对其对比分析,找出差异点。
4.4 数据分析经验数据库的创建
由于企业的数据分析方法是初步形成的,需要累积和实践验证。在找到合适的数据分析方法时,可以将有效的数据分析成果或者过程记录存档,方便后人的学习和改进。企业的数据管理和数据分析是密不可分的,鼓励更多的人参与数据分析将会提高数据分析经验库的含金量。
5 结语
数据分析在数据管理工作中的应用将直接支持整车研发企业的开发工作,以及产品数据的管理水平的提高。数据分析经验数据库的创建培养和累积足够的。在将面对大数据盛行的时代,企业内部的数据累积是必不可少的,数据分析有助于提高企业管理和运营系统运行的效率。数据的管理与交流往往是检验公司管理决策和经营策略是否正常运作的标志。所以企业管理中可以利用数据分析发现一些问题,及时跟进改善,从而提高公司整体的运营效率,为公司更快更好的发展打下良好基础。
参考文献
[1] 覃雄派, 大数据分析――RDBMS与MapReduce的竞争与共生,软件学报,2012(1)
篇10
Excel单元是信息处理的重要组成部分,内容具有一定的衍生性,在信息科技课程体系中有着承前启后的作用。笔者以Excel单元学习为例,从概念的深度理解、学科思维的培养、知识的迁移应用三个方面展开教学实践研究。
概念深度理解:从技术操作到技术原理
“知道不等于理解”“会操作不等于理解”,学生虽然依靠模仿和训练掌握了Excel的操作技能,但由于对概念没有深度理解,往往在后期迁移和应用时束手无措。Excel单元中的重要概念,教师可以结合生活情境,调动、激活学生的已有知识经验,使他们对学习内容加以解释,重新建构知识的意义,促进知识从“表层符号学习”进入“知识内在的逻辑形式”,使学生以融会贯通的方式对学习内容进行组织,建构他们的知识结构。
例1:在《数据的分类汇总》教学中往往存在这样的现象:学生进行分类汇总时经常忘记或者不能准确对“分类字段”进行排序分类,着重于技术操作,却无法根据实际需求运用技术解决问题。可见学生对“分类汇总”这个概念的技术原理和实际应用意义并没有理解,仅是模仿和套用教师的操作,并通过大量的操作训练实现知识与技能的学习。
【分析】Excel中分类汇总的概念比较抽象,如何深入理解“分类”“汇总”的概念,并将它们联系起来尤为重要。从技术思想方面,“分类汇总”分为两步,第一步是利用数据排序功能进行数据分类,使数据条理化和明确化。第二步是利用Excel数据处理中的函数功能,完成数据汇总。“分类汇总”概念的深度学习可以结合生活中的事例,通过情境类比和多元化学习的方法帮助学生理解技术操作背后的技术原理。
【实践】教学设计――《数据的分类汇总》。
1.创设生活化情境,将抽象的概念形象化
问题情境是启学引思、导学引教的有效载体。笔者结合生活中的情境,在导入环节中向学生展示某快递公司某天即将发往松江各地区的快递,并告知此快递公司共有松江新城、松江老城、松江九亭、松江佘山、松江泗泾五个网点(如下页图1),以问题为引导促进学生对概念的深度理解。
师:面对堆积如山的快递物品,工作人员要做什么?
生:分类。
师:分类完成后,快递公司需要做统计,明确发往各区域的快递物品的数目是多少,这时候要怎么办?
生:求和(求和是汇总的方式之一)。
上述情境创设和设计问题看似简单,却激发了学生的生活经验和思考,实现了对“分类汇总”中“分类”和“汇总”的真实理解。
2.运用技术开展多元化学习,实现可持续性理解
在《数据的分类汇总》一课教学中,笔者采用了微视频技术,以便学生能有选择地学习,进而促进他们个性化的互助学习。整节课的教学流程如下:
环节一:教师通过上述情境类比的方式讲解分类汇总的定义和方法,利用Excel分类汇总的方式求出各地区快递物品的数量是多少。
环节二:自主学习。学生利用微视频进行自主学习。
环节三:互助。由于每位学生的信息技术基础和操作熟练度不一样,导致他们的完成时间不同,这时候可以让优生当小老师,学困生在同伴的帮助下及时跟上学习进度。
环节四:整体反馈。反馈共性问题,师生共同总结巩固新知识。
学生通过自学、互助、交流等进行深度学习,教师也有了更多的时间关注每位学生的动态,及时发现并解决问题,帮助他们深入理解“分类字段”“汇总方式”“汇总项”等概念。
挖掘思维深度,培养学科思想
知识、能力与思想方法是学科学习的三大要素。学科知识是鱼,学科思想是渔,真正对学生以后的学习、生活和工作长期起作用并使其终身受益的是学科思想。Excel单元的深度学习是要把握学科知识的本质联系,特别是注重学科思想的培养,帮助学生形成解决相似问题的思维方法。
例2:在《Excel数据计算》的教学中,教师经常会遇到这样的问题:使用单元格地址进行公式编辑,却总有学生直接使用数值计算,混淆了不同情况下填充柄的使用功能。尤其是在学业考试数据计算量不大的情况下,只要结果正确,这个问题往往就被忽略了。
【分析】在Excel数据计算中,学生要掌握填充柄和相对引用的技术方法,其中“引用”“相对地址”的概念属于新知识,对学生而言难度较大。其实“引用”这种高效解决问题的思想在初中信息科技课程不同的章节中屡见不鲜,但是学生却总是会出错。究其原因,主要是学生对其没有真正地理解,因此必须对这类问题进行深度挖掘、透彻分析。
【实践】教学设计――《Excel数据计算》。
1.以学科思想为主线,揭示技术规律
“引用”不是对对象本身的操作,而是对存储对象的引用。学生理解和类比几种“引用”思想的运用,深度挖掘“引用”的技术思维,能够培养学科思想,实现信息的高效管理。以下笔者将结合具体教学内容进行阐述。
(1)“引用”思想在信息搜索方面的表现:优化存储,提高阅读效率。在《信息搜索》的教学设计中,教师提出相关问题,请学生观察搜索引擎中的搜索结果。学生通过观察和讨论发现搜索结果的呈现方式是相关的地址链接,并没有加载具体的内容,通过引用“超链接”这种常见的技术呈现出来,目的是快速提供多样化的内容供搜索者进一步筛选。
(2)“引用”思想在信息管理方面的表现:使用简单,提高打开效率。计算机中不仅可以存储具体内容,还可以存储内容存放的地址。在《文件与文件夹的管理》教学中,笔者设计了讨论“‘快捷方式’高效管理程序的意义”的活动,加深了学生对快捷图标也即“引用”思想体现的认识。
(3)“引用”思想在单元格地址引用中的表现:灵活智能,提高了使用效率。在《Excel数据计算》教学中,学生通过迁移和类比的方法,可以很好地理解“相对引用”的思想和意义,即单元格地址引用实际上是引用了单元格内容。“引用”方法是高效解决问题的思维方式,是学科思想的一种体现。
2.设置技术过渡区,深度理解学科思想
为了更好地理解“引用”思想在Excel单元的应用,在《家庭用水情况数据统计》教学中(上海市居民用水每立方米自来水价格为1.63元,排水费为1.30元,水费=自来水费+排水费×90%),笔者做了如下教学设计。
活动一:在C3单元格中输入公式,计算该用户本月家庭用水情况(B列表示本月用水量)。
在计算过程中,笔者发现有两种不同的计算方法,有的学生输入的是数值,有的学生输入了引用单元格地址,如下所示:
①在C3单元格中输入公式:=1.63*18+1.30*18*0.9(B3中的值为18)。
②在C3单元格中输入公式:=1.63*B3+1.30*B3*0.9。
师:因B3单元格中的数据录入有误,现在重新输入数据,观察并讨论上述两种方法C3单元格中的数据有哪些变化?为什么?
生:第一种方法C3单元格不变,第二种方法C3单元格跟随B3单元格值的变化而变化。
师:当在公式中引用某单元格数据时,你认为应该引用数值还是引用单元格的地址?为什么?
生:引用单元格地址,便于数据的后续管理。
活动二:设置技术过渡环节,使用相对引用的方法,计算出数据表内C3单元格后两个用户的水费。
在C4单元格中输入公式:=1.63*B4+1.30*B4*0.9。
在C5单元格中输入公式:=1.63*B5+1.30*B5*0.9。
设计意图:巩固地址和引用的概念,并让学生意识到重复输入公式很低效、繁琐,思考是否有更加便捷的方法,为后面“填充柄”和“相对地址”学习做铺垫。
活动三:以上三个用户水费计算公式有什么不同?变化的区域有什么规律?能否推断出Cn单元格中的公式是什么?
推测得出Cn单元格中的公式:=1.63*Cn+1.30*Cn*0.9。
设计意图:借助层次递进的问题,引导学生从现象入手探究规律。
活动四:学习新技术――填充柄。
学生通过上述实验推测的方法,在了解技术原理的基础上学习使用填充柄,巩固了用“引用”来高效解决问题的学科思想,将学习从浅表的知识学习和技巧训练提升到深层思想方法的学习。
从理解到实践:实现知识的迁移应用
叶圣陶先生曾说过,“教是为了不教”。这句话既道出了教学的目的,又道出了学生掌握知识和方法后,应能迁移和应用原有知识,用以分析问题和解决问题。Excel单元深度学习的一个重要特点就是实现数据统计知识与技能的灵活应用。
例3:在初中信息科技课堂上,学生跟随教师的讲解,不断地演练着Excel中数据统计等基本操作。教师讲学生练,经历了大量的训练,但学生却不知道计算这些数据有什么实际作用,无法很好地读数据、找不到规律或无法发现有用信息的现象层出不穷。任务中缺乏问题产生的土壤,容易导致学生的知识只是在某种情境下应用,而不能学以致用。
【分析】例3呈现的是初中信息科技课程教学现场经常出现的现象。机械技能僵化训练看似方便学生操作,但课堂变得机械、枯燥、乏味,学生不知道为什么学,简单的技能训练并没有提升学生综合应用技术的能力。信息科技学习的本质是如何利用它分析和解决问题,为了把理论教学与实践活动有机地结合起来,项目活动成为达成信息科技课程目标的有效途径。
1.挖掘数据规律,深度理解技术意义
【实践】教学设计――《慧眼读数据――数据分析》。
在大数据时代,对数据进行统计和深入分析,发现其背后蕴含的规律,并加以开发利用是一项非常有价值的工作,这也是学习Excel的意义所在。数据统计是一种技术,也是解决问题的方法。理解数据统计的意义,是学生实现深度学习的动力之一。为提升学生“读”数据的意识和能力,总结分析方法,并对实际生活产生指导作用,笔者本节课的教学设计如下:
环节一:故事激趣,概念导入。引入“数据挖掘技术在沃尔玛的运用”的趣味故事,学生在故事中体会数据分析是有用的,激发学习兴趣。
环节二:数据分析。学生观看视频《足球场上的神秘纸条》,思考数据分析的意义。说一说,数据分析在家庭生活中的应用。
环节三:热身活动。笔者出示某旅游景点历年接待游客的情况:2010年迎接游客约100万人次,2011年迎接游客约200万人次,2012年迎接游客约300万人次,2013年迎接游客约350万人次,2014年迎接游客约380万人次,2015年迎接游客约400万人次。
师:请同学们预测一下2016年的游览人数是多少?得到的数据对人们有什么帮助?
生:可能是410万人。经过数据分析,作为游客,可以判断景区的游览舒适度;作为景区的工作人员,可以做好迎接游客的准备。
以问题为引导培养学生“读”数据的能力,体会数据分析的过程,尝试总结数据分析的方法(如图2):
①整理数据――从各种数据源中选取和集成用于数据分析的数据;
②分析数据――用某种技术方法将数据中的规律找出来;
③推测结论――分析原因,给出建议或推测。
环节四:任务驱动,步步为营。笔者提供网购书籍的真实情境,根据各大电商的销售数据选购本月热门图书,并整理和分析历年的书籍销售数据,用数据说话,结合物流等综合因素,验证“双十一”购买书籍是否划算。
教学以数据分析为切入点,学生巩固了电子表格中数据统计的方法,学习从熟练操作技能逐渐转向对数据的整理和分析,理解技术的意义。
2.开展项目活动,提升综合应用能力
【实践】项目活动――雾霾知多少。
美国国家研究理事会(NRC)研究概括出深度学习的本质,即个体能够将其在一个情境中所学的知识运用于新情境的过程。为了让学生能够灵活运用知识,加强他们在实际生活中解决问题的能力,笔者在教学实践中,设计并开展了主题为“雾霾知多少”的项目活动。
“雾霾”与学生生活息息相关,围绕主题,学生通过自主探究、互相交流、选择问题、解决问题等途径展开深度学习。
在项目活动的初始阶段,学生通过网络搜索了解了雾霾的基本定义、危害物及主要成分、起因、危害物种类的等级等,形成对雾霾的基本认识。
为了更清晰地了解雾霾到底对我们生活有多大影响,还需要用数据来说话,这就需要学生迁移已有的数据统计知识和技能,运用数据计算、多角度分析数据表、制作图表的方法,对数据进行分析,取得想要的结果并展开交流,总结活动经验,提出切实可行的对策。