数据分析范文
时间:2023-04-10 09:17:25
导语:如何才能写好一篇数据分析,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
不久前,我与业务部的人员在茶歇闲聊中,谈及到公司销售状况的时候,发现了很奇怪的现象。为什么不同人对同一结构的数据分析出的结论却大相径庭。一个人说公司最近销售情况震荡严重,而另一个人却说销售情况没有明显波动。于是为了探其究竟,我认真聆听了他们两人的分析方法和参数设定。
结果发现原来两个人,在横轴时间参数不发生变化的情况下,一个人以万级金额为纵轴参数,一个人以十万级金额为纵轴参数。纵轴以不同的销售数值区间出现,图表形态以及曲线平滑度就变得完全不一样了。这两个的方法和分析结果虽然都正确,但是他们都没有考虑到日销售量范围和实际经营情况,如果企业日经营规模通常或者绝大时间都在万级单位上,那么前一个人指出的“销售起伏较大”的结论自然是有价值的,需要我们进一步的分析找寻原因,反之同理。从这个简单的事情不难看出不客观的分析数据而产生的图表是会让我们产生“心理错觉”。企业结论性的数据分析是源于对基本数据的加工处理,当我们在设计分析模型的时候是需要剥离我们的主观意识,要一切从客观事实出发,设定科学符合实际的变量参数,合理的划分区间,不要让我们被华丽的图表而迷惑。
刚刚讲的对业务数据的准确把握需要遵循客观的经济行为和需求,这样才能让我们的数据结论更客观,但是数据分析很多情况的误读并非是我们故意的,这和经验和技能是密不可分的,我们需要掌握更多的技能和经验,没有这些技能和经验即便你对业务有很好的感觉和清晰的头脑,我们也同样得不到好的结果。所以我们不要盲目地崇拜某种数据分析方法,不要夸大数据分析模型的作用,更不要夸大数据分析案例的作用。只有适合、实用、准确才是硬道理。
“啤酒与尿布”是大家耳熟能详的数据分析案例,有人根据此案例设计更多的购物篮分析算法,也有人利用此案例进行宣讲数据分析的重要。而却忽视“啤酒与尿布”的本来。“啤酒与尿布”是在特定的时间,店内人员发现后再经过科学的数据分析才发现的。而并非被“自动数据挖掘工具”给挖掘出来。
“啤酒与尿布”是典型的购物篮分析,而购物篮分析是高端应用,高端应用往往意味着高投入,高投入就必须有高回报,仅凭一个从海量的交易数据中挖掘出销售额占比微不足道的“啤酒与尿布”的案例,就像我们从顾客的消费中去寻找哪种品牌的牙膏和哪种品牌的牙刷有关联一样,“只要有力气拿得起牙刷的人就一定会用到牙膏”也是勿庸置疑的常识!问题很可能会出在:购物小票上用来分析的牙膏和牙刷是两种商品(单品),而陈列在货架上的牙膏和牙刷却是两个颇有规模的商品群;数十种品牌、系列、口味、功效、不同的包装规格、不同的消耗周期、不同的单次购买数量、越来越快的产品更新换代、甚至在牙膏包装中赠送牙刷,这么多种因素的综合交错会大幅度地稀释牙膏牙刷在单品层面形成“同时并且重复购买的组合”的概率,对购物小票进行遍历分析后,很有可能会得出反常识的结论:牙膏、牙刷这两种商品之间没有关联性!这样的数据分析即使是准确的,也毫无意义。打动不了追求投资回报的企业决策者。
篇2
将医院、医疗保健组织等数字化的医疗数据以特定的格式、协议发送到医疗数据分析模块进行分析与疾病预测.医疗数据提取模块:该模块由医院电子病历系统负责实现,我们使用openEHR系统作为医院电子病历系统,并在openEHR中实现医疗数据的提取功能.openEHR系统是一个开源、灵活的电子病历系统,支持HL7卫生信息交换标准.很多医疗健康组织、政府和学术科研单位都使用openEHR进行开发和科研工作.如一种基于openEHR的患者病历数据管理模型、openEHR等许多开源的电子病历平台的对比与评估和基于openEHR的档案建模等.数据交换模块:基于Web服务的数据交换模块使用医疗数据通信协议实现医疗数据分析模块与医疗数据提取模块的数据交换.Web服务是一个平立、松耦合的Web应用程序.由于Web服务的跨平台特性,许多模型与框架是基于Web服务构建的,如基于Web服务集成分布式资源和数据流分析测试等.在本文提出的医疗数据分析模型中,使用Web服务来连接医疗数据分析模块和医疗数据提取模块.医疗数据提取模块作为Web服务的服务端,实现的方法包括存取数据、数据预处理、序列化等,改进后的模型要求实现指定维度,指定属性数据的读取.本文提出的医疗数据分析模块作为Web服务的客户端,通过HTTP服务向数据提取模块请求获取数据,并对数据进行预处理.医疗数据分析模块:我们使用Caisis开源平台作为医疗数据分析与疾病预测系统实现这一模块.Caisis是基于Web的开源癌症数据管理系统,一些临床医学研究使用Caisis系统管理和归档数字显微图像,通过向Caisis系统中添加特征选择和SVM算法,使用SVM算法对医疗数据进行分析和疾病预测,因此使用的特征选择算法需要基于SVM,可以提高数据分析和疾病预测过程的效率和准确度.
2数据分析模块与算法
2.1SVM算法SVM算法最初是由Vapnik等人在1995年提出的一种可训练的机器学习算法.依据统计学习理论、VC维理论和结构风险最小化理论,从一定数目的样本信息在学习能力和复杂度(对训练样本的学习程度)中找到最佳折中,以期望获得最好的推广能力(或称泛化能力).
2.2基于SVM的医疗数据分析模块将SVM分类算法应用到医疗数据分析模块中,进行疾病预测.基于SVM的医疗数据分析模块,通过数据交换模块获取原始组数据(患病病人医疗数据和对照组病人数据).通过特征选择过程输入到SVM分类器中进行训练,训练后可以对新的医疗数据进行分析预测.
3改进的医疗数据交换模块
3.1医疗数据交换模块在原始的医疗数据交换模块中,数据请求原语只由4条通信原语组成.由原始医疗数据分析模型的3个模块构建,其中在医疗数据分析模块与医疗数据提取模块之间的4条通信原语包括2条请求和2条应答.由于医疗数据的维度极大,属性很多,但是在预测某个疾病时,只有很少的一部分属性会对分类预测产生影响.这样的全部维度的数据都需要传输,浪费了时间,降低了数据传输效率,影响了医疗数据分析模块的算法效率.
3.2改进的医疗数据交换模块在改进的医疗数据交换模块中,在数据传输协议中增加了4条原语.在每条原语中不仅有医疗记录条数的要求,还包括对所请求医疗数据维度和属性的具体说明.医疗数据分析模块先请求一小部分全部维度的数据,对这小部分数据进行特征选择.然后医疗数据分析模块只请求特征选择出来的对预测相关的属性的剩余所有医疗数据.最后通过SVM分类算法进行训练和预测.在新的医疗数据交换模块中,大部分数据中只有小部分相关属性被传输到数据分析模块,极大地减少了数据传输总量,也同时增加了分析模块预测算法的效率.
4原始模型与改进模型的对比结果
篇3
关键词:实践教学 Crystal Reports 数据分析 应用型人才
中图分类号:G642.41 文献标识码:C DOI:10.3969/j.issn.1672-8181.2013.19.087
1 实践教学的分类
目前,高校人才培养目标正在向应用型人才方向转移,比如:独立学院、职业学院以及高职高专都明确提出他们的人才培养目标就是满足社会需要的实用型人才,而实用型人才培养的重要环节是加强实践教学,学生通过大量的实验活动提升自己的理论与实际操作水平。
一般认为,实践教学由基础型、设计型和综合应用创新型等三类各具特色并逐层深化的实践教育方式构成一个完整的体系。
1.1 基础型实践教学
基础型实践教学由基础课及专业基础课中包含的演示型、基础型和设计型实验环节组成,目标在于巩固和提高学生学习的理论知识。
1.2 设计型实践教学
设计型实践教学由专业课中的综合型试验或独立实践课程组成,目的在于进一步提高学生的动手能力、理论联系实践的能力及创新能力。该类实验采用在教师指导下,学生自主选题、自主设计、集体交流,鼓励创新和团队协作等新型实验教学方法,使学生的实践能力有跨越性的突破。
1.3 综合应用与创新型实践教学
综合应用与创新型实践教学以学生参与各项校内外社会活动为主,学生可随不同的指导老师,按兴趣分组,按能力分工,着眼于学生实践能力的综合培养,着眼于潜力个性开拓,着眼于创新精神的激励。努力培养学生掌握企业管理和工程设计的基本方法,实现学生从具备一定实验能力到具有较高实战能力的跨越。
2 Crystal Reports 系统
2.1 Crystal Reports简介
Crystal Reports 是SAP公司开发的、功能强大、动态和可操作的报表解决方案,它能读取多种数据源,在网络环境下设计、开发可视化报表,嵌入到企业ERP系统或普通应用系统中。在Crystal Reports的帮助下,用户能够制作企业OLAP在线分析,进行企业业务,比如财务、生产和销售管理的在线分析,以便指导企业经营工作,全球很多大公司都在选用这个软件。
2.2 Crystal Reports特点
2.2.1 丰富的呈现形式
多种报表样式:普通报表、交叉表和多维报表;
20多种图形:条形图、饼图、曲线图、甘特图、雷达图等,另外提供常用的报表模板。
2.2.2 广泛的数据源连接
提供超过35个数据驱动用于访问任何相关数据源,支持在一份报表中整合多个数据源的能力,包括:ODBC、ADO等数据存储方式。
2.2.3 可视化设计环境
通过拖放元素组成报表,设置标题,自定义变量,整合数据库字段等,有排序专家、分组专家、汇总专家和图标专家等向导。还有强大的公式语言:160多个系统函数,也可以自定义需要的函数。如图1所示。
图1 Crystal Reports的可视化设计界面
2.2.4 多种文件导出格式
如:Word、Excel、HTML、XML、PDF、RTF、CSV、TXT等,方便将信息递交给不同需求的用户。
2.3 学习Crystal Reports软件的好处
对于信管专业的学生,培养目标包括三个方面:第一,掌握计算机科学和管理学的基本知识和技能;第二,具备进行信息系统分析、设计的能力;第三,能进行计算机知识和管理知识的交叉复合应用,能够在专业应用上有所创新。根据专业培养目标,要求信管专业的学生成为进行软件开发,进行OLTP在线事务处理和OLAP在线分析处理的应用型人才。
在企事业单位的数据处理过程中,通常利用大型数据库和大型软件系统来完成相关任务,同时需要进行应用软件的二次开发,比如ERP软件SAP、Oracle应用于企业后需要定制各种财务、生产和销售分析报表,SAP、Oracle的ERP系统本身自带的报表不可能满足所有用户的所有需求,因此这些大型的标准化软件需要系统实施人员进行再开发,而Crystal Reports由于具有上述优点而成为最好的开发工具,所以可以选择Crystal Reports对信息管理和电子商务专业的同学进行相关的系统训练以适应社会发展的需要。
3 利用Crystal Reports 进行实践教学的方法
Crystal Reports既是一个在线分析软件也是一个报表开发工具,因此,可认为属于程序设计科目,我们把它作为理论课程《数据分析与挖掘》的实验部分介绍给信息管理和电子商务专业的学生是因为这门课程的主要内容是介绍数据库的OLAP在线分析和数据仓库的数据挖掘,在进行OLAP分析中,需要利用多维报表工具,而Crystal Reports可以制作多维报表。
从Crystal Reports的特点以及它的应用范围来看,可以把利用它进行的实践活动归类为设计型实践和综合应用与创新型实践相结合的实验项目,所以对同学们要求按照“规范设计,鼓励创新”的原则进行实验活动。
由于《数据分析与挖掘》课程的理论性强、内容多、难度大,所以相关实验采取学生分组进行,每个小组2-3人,明确小组中每人的职责,比如:数据收集、OLAP报表制作、结果分析、报告撰写等工作内容,要求他们齐心协力、通力合作,首先把实验内容和分工情况汇报给实验指导老师,经过实验老师的确认同意后,学生才能继续后面的实验。实验时间除了学院实验室安排的课时(一般在实验专周中的15学时),还可以在实验课后用自己的电脑完成,完成后撰写5000字左右的实验报告,把实验过程完整地记录下来,并对实验提出自己的建议,以便实验老师不断完善实验模式、改善实验指导,使之更符合社会发展和培养目标的需要。
由于Crystal Reports是《数据分析与挖掘》课程的实验项目,所以让同学们接触实际应用案例是首先必须考虑的问题,我们采取鼓励同学广开门路,挖掘数据来源,实行一个案例一个小组,找不到合适数据源的小组可以共享其他小组数据的方法解决数据源和案例问题,经过同学们的努力,收集了10多个企业实际运行数据,由于数据和信息是企业的生命,也是企业严加保护的资源,一般企业不愿提供,因此我们只要求企业过去10年至过去5年的部分数据,并对数据加以删减修改变更,保证企业的数据不泄密,同学们收集到的数据类型主要有Excel、Access、SQL Server以及Oracle等,这些类型的数据都可以被Crystal Reports读取,但是读取之前必须进行ETL的操作,即对数据进行抽取、转换和载入数据库,以规范数据格式,完成数据标准化操作。
实验教师在整个实验活动中除了在实验室向同学们演示Crystal Reports的使用方法外,还必须跟踪同学们的实验进度,加强对实验过程的管理,要求同学们分组用PPT演示稿上台介绍自己的实验情况,让全体同学分享他们的成果,实验老师对同学们完成的实验报告要进行点评,让他们知道自己那些地方做得好,那些地方有欠缺,以便今后改进提高。
4 取得的成果及对实验教学的思考
在经过实验专周的活动后,同学们完成了基于企业经营业务的在线分析OLAP实验,分组提交了各种报告,如图2所示。
图2 学生的OLAP实验报告
从这些报告中,我们可以看出大部分同学完成情况良好,制作的图表美观大方,文本格式标准规范,大家通过实验理解了数据分析与挖掘的基本概念,学会了Crystal Reports的操作方法,能够利用软件工具读取各种数据源,进行数据的OLAP在线分析,按照需要制作标准报表、交叉报表和多维报表,这个过程相当于对应用软件系统进行了二次开发,开发的结果为企业的经营决策提供重要的参考意见,达到了预期目标。
通过这些实验项目的实施,我们感觉到在实验教学应该注意如下几点:
第一,教学思想具备理念新颖性。
教学模式的构建受教学思想的支配,教学思想是教学模式的灵魂和核心,好的教学模式必须以先进的教学思想为指导,体现先进的教学理念。实施新颖的教学思想可以通过向同学们开出现代的、先进的学习科目来实现,比如:数据仓库、数据挖掘等。
第二,教学目标强调技术实用性。
在当今信息技术条件下,应用性人才必须能够将信息技术直接应用于工作实践中。实践教学的目的就是培养学生具备这样的应用能力,而不是简单地对理论的验证或对技术的一般了解,我们向同学们介绍Crystal Reports就是出于提高他们技术能力的需要。
第三,教学内容充分考虑社会适应性。
应用型人才培养是以某一技术领域或职业岗位的能力培养为核心。因此,实践教学的内容必须满足社会适应性的能力要求,同时还要提供适应学生可持续发展需要的能力和素质。在内容体系的组织上,实践教学与理论教学必须相互渗透,理论知识需要通过实践再认识,并通过实践课程来实现。
第四,教学手段突出技术先进性。
当代电子信息技术的快速发展,使得教育技术手段得到极大的提高,先进的教学技术对教学模式的改革起到了直接的推动作用,多媒体技术的普及,使仿真训练等更多地应用于实践教学。比如Cisco公司的Packet Tracer网络模拟仿真软件就是一个非常好的例子,在我们的教学过程中,我们也采用了这个软件向同学们介绍计算机网络知识,效果非常显著。
总之,实践教学需要走不断改革创新之路,满足社会对应用型人才的需求,开辟实践教学的新途径,找出新办法,培养合格的社会需要、国家需要的应用型、复合型人才。
篇4
1. 行业资金流向
分析:今天只有白色家电、有色冶炼加工、房地产开发和医药商业四个行业呈现出资金净流入状态,以二三线的蓝筹股和白马股为主。在早盘上证指数冲高的过程中,起到了一定的引领作用,但受制于整体市场情绪的低迷,下午短线资金纷纷出逃,最终只有白色家电板块的净流入量超过了1亿。
今天资金流出前五的分别是半导体及元件、光学光电子、通信设备、计算机应用和证券板块,其中半导体板块连续两天成为资金流出最多的板块,表明前期获利资金在持续性地进行获利了结。而通信设备板块则是受到消息面上的影响,苹果下修明年首季销量预估,减幅超预期,从而使得苹果产业链相关个股普遍被资金抛售。
2. 港资动向
因圣诞假期,香港股市今天休市,港资无交易
3. 赚钱效应
分析:今日上涨家数720家,下跌家数2422家,涨跌比为0.30。涨停板家数25家,扣除5家未开板新股后,自然涨停板家数20家,其中医药类次新股5家,非医药类次新股5家,细胞免疫治疗概念1家,其他类9家。
从中可以看出,具有板块性效应的主要是医药股和次新股,尤其是其中的叠加品种,这与上周五次新+天然气的模式可谓是如出一辙,在目前相对弱势的情况下,资金还是更青睐一些叠加热点概念的小盘次新股。
昨日涨停板溢价为2.38%,与上个交易日基本持平,强势股的持续性还是很一般,但由于个股涨跌比出现了明显的下降,所以整体的赚钱效应是降低的,操作难度则是相对的有所提升。
篇5
不可否认,现在已经是大数据的时代了,最近几年,大数据发展趋势蓬勃向上,吸引了社会各界的眼光,大家都看好大数据,想从大数据中获得商机和财富。大数据也没让大家失望,在科研、教育、医疗、政府、经济等领域都产生了深远影响。据统计,目前大数据所形成的市场规模在51亿美元左右,而到2017年,此数据预计会上涨到530亿美元。
人们通过收集、整理相关领域方方面面的数据,并对其进行分析挖掘,找到凌乱纷繁的数据背后的联系,进而从中获得有价值的信息,最终衍化出一种新的商业模式。
但是,面对纷繁复杂的数据,不是所有人都能有效地对其进行分析,并获取其背后信息所代表的价值的。那么,有没有什么办法让普通人也能轻易读懂并使用大数据呢?
需求决定市场,随着非科研人员对大数据需求的增大,很多大数据领域的创业公司不断涌现,他们致力于将大数据以一种简单直观地方式呈现给用户,让用户能更好地“消化”这些数据。
Origami Logic就是这样一家基于大数据的创业公司,它面向营销人员,主要通过数据可视化、自助分析等方式,将大数据“简单化”,让即使不了解大数据的营销人员也能根据OrigamiLogic提供的分析结果做出更有效的营销策略。
可视化是大数据简单化的有效方式,也是创业公司常用方法。《数据可视化之美》一书中指出,可视化是将数据以图形表示,能够一目了然地揭示数据中的复杂信息,同时通过对细节的翔实展示,能够使受众有效地产生对数据的洞察和新的理解。可视化可以帮助人们突破大数据技术中人的瓶颈。
通过Origami Logic,营销人员可以通过将CRM、社交媒体、邮件营销和调查报告等不同平台的数据汇合整理在一起,并将冗杂的数据(包括邮件、文档、图片、音频等)进行有效分析处理,使其简单化、直观化、视觉化,让它变成普通的用户都能看得懂的东西,然后依据这些统计分析结果来衡量整个营销效果,并做进一步的营销活动规划。Origami Logic把“大数据”真正变成一盘生意。
“当今的营销人员要根据社交网络、移动平台、搜索引擎和电子邮件等方方面面进行汇总分析,从而再制定相关的营销策略。他们对这些数据都是非常陌生的,而且难以捕捉数据背后的含义。”Origami Logic联合创始人兼CEO Opher Kahane表示,“Origami Logic能够帮助他们改善这种状况,从而提高他们的营销能力。并且这个平台能够让营销人员将尽可能多的营销工具整合到一起,并把不同营销工具所提供的数据变成自家平台的资源中心,从而达到取代它们的目的。”
篇6
汽车制动性能直接关系到交通安全,重大交通事故往往与汽车制动性能差有关。制动距离长,制动侧滑,制动跑偏等都会造成交通事故。汽车在制动过程中人为地使汽车受到一个与其行驶方面相反的外力,汽车在这一外力作用下迅速地降低车速以至停车,这个外力称为汽车的制动力。制动力是评价汽车制动性能的基本因素,制动力测量是机动车安全性能检测的重要组成部分。制动力便于在制动试验台上测量,通过制动力检测不仅可以测得各车轮制动力的大小,还可以了解汽车前、后轴制动力合理分配,以及各轴两侧车轮制动力平衡状况。并同时测得制动协调时间,能较全面地控测车辆的制动性能。
一、汽车制动性能检验方式及检验参数
在国标(GB7258机动车运行安全技术条件)及(GB18565营运车辆综合性能要求和检验方法)中,对汽车制动系提出了系统的技术要求,并规定了汽车制动性能的检测项目、检测方法及评价标准。汽车性能检测站在进行汽车制动性能检测时,主要检测汽车的制动效能和制动时的方向稳定性。根据检验参数和检验方式的不同,制动性能检验可分为台试和路试两种。台试主要检测行车制动力、制动力平衡、车轮阻滞力、驻车制动力、制动协调时间;路试主要检测制动距离、制动减速度、制动协调时间、制动时的方向稳定性以及驻车制动。汽车制动试验台根据其结构型式不同,可分为滚筒式汽车制动试验台和平板式汽车制动试验台。由于具有占地面积小,使用安全性高等优点目前汽车检测站广泛采用滚筒反力式汽车制动试验台。
通过汽车制动试验台进行制动性能检测不仅可以测得各车轮的制动力大小,还可以了解汽车前、后轴制动力的分配情况,以及同一轴两侧车轮的制动力平衡状况。根据制动力的大小,可评价车辆的制动效能;根据左、右车轮制动力的平衡情况,可衡量车辆制动时的方向稳定性。在实际检测过程中,我们发现,经常出现从检测滚筒中“爬出”的现象。当在非检测轴车轮后加楔块给车辆一定的纵向约束时,这种现象消失或程度减轻,这时制动力实测值增大(接近实际情况)。上述现象说明:用目前的反力式制动试验台检测车辆制动力时,特别是轻型车辆制动力检测时,因对非测试轮不施加水平约束(忽略滚动阻力的影响),测试时使汽车以较快的速度从滚筒中后退,或因滚筒与被测轮轮胎间的附着力过小而使车轮滑转,结果造成能够测得的制动力偏低。且车辆为静态,未能反映车辆动态轴荷的变化,不能如实的反映车辆真实的制动水平。
原因分析
一、根据滚筒式制动力检测台的工作原理及特点分析;
1.安置角影响检测结果,同一汽车在具有不同滚筒直径和滚筒心距的检测设备上检测时,检测数据会产生较大差异。
2.滚筒与轮胎之间的附着系数沪对检测结果影响很大。当附着系数低时,将测不出车轮可以达标的制动能力。
3.车轴所受的水平约束力,直接影响检测的结果。
4.车位不正对检测结果的影响,车位不正时,在进行制动检测过程中,必然会使左右车轮的安置角产生差异,产生附加的左、右轮制动力之差,使汽车制动方向稳定性的判断失真。
5.其它车轮制动效能对被测车轮亦有影响。
6.由于轮胎与滚筒之间的弹性变形、悬架等的弹性变形等大大影响了制动力的增长速率,加之制动力在向检测传感器传递过程中滞后的影响,使测得制动协调时间远大于被测车轮的实际制动协调时间。因此,目前用滚筒试验台无法准确地测出制动协调时间。
二、汽车制动性能检测中存在的问题
1.检测设备的局限性
不同的制动性能检测设备各有其特点,且存在一定的局限性。以平板式制动试验台和滚筒式制动试验台为例加以说明。
1. 1 整车的运动状态不一致
行驶的车辆在制动过程中做减速运动,因而汽车的质量会发生向前轴转移,而在滚筒制动试验台上车辆是静止不动的,车辆质量转移的现象不会出现,这样会形成静态检测与动态实际制动之间的差异性。平板制动试验台是凭借汽车在测试平板上实施紧急制动过程来测定汽车前后制动力的,是动态检测,因而符合汽车制动的实际过程,容易获得汽车真实制动检测结果。特别是对装有ABS防抱死制动系统的车辆检测更为有效。
1. 2 车轮的受力状况不一致
车轮在路面运行中,只是轮心下方的一小块面积与地面接触,而在滚筒试验台上的车轮由于轮胎气压、外径尺寸等问题,导致车轮受力状况与实际制动时的受力状况不一致,直接影响检测结果。平板式制动检测设备不存在“安置角”问题,测试时车轮的受力状况接近于实际制动时的受力状况。
1. 3 测试时机不一致
车辆在制动过程中前后桥是几乎同时作用的,但滚筒式制动试验台必须分别对前后桥进行制动测试。这样的测试结果能反映前后桥的同步情况与制动力的分配,对装有比例阀车轮的制动测试更为适用。
2 滚筒制动试验台检测常见问题
2. 1 被测车轮抱死滑磨
被测车轮停在滚筒上,滚筒带动车轮旋转,当对被测车轮采取制动时,车辆的制动力便传递给滚筒。随着制动力的增大,当达到车轮与滚筒间的附着力时,车轮就会抱死在滚筒上打滑,测试到的制动力达到最大。车轮制动力再增大,测试到的制动力不变。由此可见,所能检测到的最大制动力与轴荷、设备结构和附着系数有关。
篇7
关键词:大数据;数据仓库;数据分析;校园卡;教务
中图分类号:G434 文献标志码:B 文章编号:1673-8454(2015)10-0013-03
随着大数据时代的到来,各行各业都在利用大数据推动本领域的发展。常熟理工学院自2009年开展教育信息化建设以来,在数据分析方面进行了不断地探索与实践,目前广泛应用于教学和管理中。
一、数据分析的必要性和可行性
高校内部一般都建有:教务系统、科研系统、学工管理系统、人事管理系统、资产管理系统等独立业务系统。这些系统都各自记录着学校方方面面的数据,却都静静地躺在服务器硬盘里,犹如埋藏在地下的金矿,不能为高校全局决策提供支撑。
数据分析的目的就是要让数据发声,通过直观的数据图表来为高校管理提供辅助决策。例如:对教师的专业与学校开设专业的统计分析可以为人才引进提供参考;对学生的校园卡使用记录和校内上网认证记录结合起来,可以为判断学生的行为指明方向;对各二级学院的资产数据统计分析有助于学校对二级学院进行成本核算。
二、数据仓库的建立
数据库是数据分析的源头,数据仓库的建立是数据分析的基础。
建设过程中,首先要统一数据标准,只有准确的数据才是有价值的,如果各系统的数据标准不统一,就会造成不准确的数据分析结果,也就无法为高校管理提供真实有效的统计数据;
其次要建立公共数据平台,公共数据平台是指实现校园内各种信息系统的互通互连和数据共享,包括多个系统业务数据集中存储、备份、数据共享和数据管理的公共平台,为学校各应用系统提供基础数据;
三是要规范数据流程,把各业务系统中形形的数据按标准定期抽取到学校公共数据平台中。确保任何业务系统的添加和修改不影响其他系统的正常运行,同时新建应用系统应建立在统一的数据规范基础和统一身份认证基础上,调用公共数据平台的基础数据(如部门、教工、学生等基础信息),应用系统产生的数据也应成为公共数据平台的基础数据,可供数据平台共享访问。确保提供反映学校全面情况的数据信息,为整个学校提供决策支持所需的数据信息,为今后应用系统的建设和信息服务奠定良好的数据基础。
图1为数据架构图,最底层的是各业务系统,他们产生的数据按编码标准经过抽取、转换、加载到数据中心,数据中心再按需要把相关数据同步给相应的应用数据库或各数据集市,最后形成各类主题数据分析或综合决策系统。
三、基于数据仓库的数据分析
在统一数据仓库的基础上,我们利用数据仓库技术(ETL、OLAP、REPORT)和数据挖掘技术,对多种数据集市进行数据分析,建立了校情综合统计分析系统。该系统从学校基本情况、教职工信息、学生信息、教学信息、科研信息、资产与设备信息、图书资料信息与师生消费等方面进行统计分析,为学校管理提供辅助决策支撑数据。
该系统从学校全局出发,通过多元主题展开分析,以文字、报表、图表等多种形式展现分析成果。
该系统的推出实现了教学质量、学生学习、生活行为等各种信息的监控与分析,对高校资源配置优化、提高高校管理科学化等方面具有不可估量的重要意义。这里笔者将以校园卡和教务数据分析功能为例进行阐述。随着校园卡在校园生活中使用范围的日益扩大,在应用过程中产生了大量数据。校园卡仅仅一年的交易数据就有大约1000万条记录。
校园卡数据分析主要实现以下五大类的分析功能:
(1)各时间段消费情况分析
①从“月、季度、半年、年”的角度来查询消费总额、消费用户数和人均消费等,反映出用户消费支出的趋势,也可反映出物价的变化情况。
②从“几点几分”的角度查询消费人数可反映用户在时间点上的消费习惯,对于各营业部门来说可以合理地调整工作时间、工作人员等,以加强服务。还可根据教职工就餐时间点来分析他们是否严格遵守学校作息时间。
③从“早、中、晚”的角度统计分析学生早餐、中餐、晚餐的就餐率。
(2)各类消费人群消费情况分析
①对于学生工作管理层来说,从“个人、班级、院系”的角度来查询消费金额作为发放贫困补助的依据。
②通过查询一个时间周期内(三天)学生消费人数,起到了解学生是否在校的危机预警作用。
③从学生所属院系、专业、年级等角度来查询消费人数、消费金额和分布情况。
④从学生性别、来源地区(省、市、区)、年龄等人的自然属性来查询消费人数、消费金额和分布情况。
⑤分析教职工的消费水平。
(3)各营业单位消费情况分析
从各个营业单位角度来查询校园用户消费人数,消费金额和分布情况。
(4)各交易类型消费情况
从消费类型角度来查询用餐、购物、上网、上机、水电消费等情况。
(5)工作站、终端个数统计
为直观反映上述消费数据,我们除用表格形式将分析结果展现在用户终端外,还提供了柱状图、饼图、曲线图、点图等形式来展现。图2展示了我校2010年至2014年学生早、中、晚三餐平均价格,呈逐年稳步上升状态,这给餐饮部门提供准确统计数据的同时,也稳定了学生就餐消费水平的承受心理。
高校教学信息化建设积累了丰富的业务数据,根据需求,教务数据分析功能主要包括三大类:教学任务、学生成绩和教学评价。图3为教务数据分析数据源视图,围绕教师的教学工作量、学生取得的成绩以及学生对教师的评价等,我们做了一系列的报表。例如:教学场地信息、学生情况、任课教师情况、各学期教学任务情况、成绩信息、教学评价、历年各专业招生人数、各学院历年教学情况、各学院历年学生对教师评价。
另外,为满足各二级学院要求,做了学业预警方面相关报表,各二级学院可根据年级、专业,通过总学分排行、课程门数排行来关注排在后面的学生情况。
数据分析表明,教师平均教学任务逐年增多,教师总体比较年轻,平均年龄男教师比女教师高,年龄在30-39之间的教师平均课时最多。管理学院历年招生数比其它学院明显高出很多,其中财务管理专业的学生数百分比最高。我校学生的成绩也完全符合正态分布曲线要求。
四、结束语
大数据分析是一种发展趋势,我们目前也仅仅就单项主题进行了逐个分析,如果把这些主题串起来,进行关联分析,将会得出更有趣更有价值的结果,这也是将来我们努力的方向。
参考文献:
[1]戴红芳,冯翔,先晓兵等.商业智能在校园一卡通中的研究与实践[J].微电子学与计算机,2012,29(7):175-179.
[2]戴红芳.基于多维数据模型的校园卡数据分析[D].上海:华东理工大学,2011.
篇8
关键词:告警数据 Hadoop Spark
1 引言
随着电信网络的不断演进,全省数据网、交换网、接入网设备单月产生告警原始日志近亿条。以上告警通过网元网管、专业综合网管、智能网管系统[1]三层收敛,监控人员每月需处理影响业务或网络质量的告警事件为20万条,但一些对网络可能造成隐患的告警信息被过滤掉。如何从海量告警数据中获取与网络性能指标、运维效率相关的有价值的数据,对于传统的关系型数据库架构而言,似乎是一个不可能完成的任务。
在一般告警量情况下,ORACLE数据处理能力基本可以满足分析需求,但当告警分析量上升到亿级,如果采用传统的数据存储和计算方式,一方面数据量过大,表的管理、维护开销过大,要做到每个字段建索引,存储浪费巨大;另一方面计算分析过程耗时过长,无法满足实时和准实时分析需求。因此必须采用新的技术架构来分析处理海量告警信息,支撑主动维护工作显得尤为必要,为此我们引入了大数据技术。
2 分析目标
(1)数据源:电信运营商网络设备告警日志数据,每天50 G。
(2)数据分析目标:完成高频翻转类(瞬断)告警分析;完成自定义网元、自定义告警等可定制告警分析;完成被过滤掉的告警分析、TOPN告警分析;核心设备和重要业务监控。
(3)分析平台硬件配置:云计算平台分配8台虚拟机,每台虚机配置CPU16核;内存32 G;硬盘2 T。
3 制定方案
进入大数据时代,行业内涌现了大量的数据挖掘技术,数据处理和分析更高效、更有价值。Google、Facebook等公司提供可行的思路是通过类似Hadoop[2]的分布式计算、MapReduce[3]、Spark[4]算法等构造而成的新型架构,挖掘有价值信息。
Hadoop是Apache基金会用JAVA语言开发的分布式框架,通过利用计算机集群对大规模数据进行分布式计算分析。Hadoop框架最重要的两个核心是HDFS和MapReduce,HDFS用于分布式存储,MapReduce则实现分布式任务计算。
一个HDFS集群包含元数据节点(NameNode)、若干数据节点(DataNode)和客户端(Client)。NameNode管理HDFS的文件系统,DataNode存储数据块文件。HDFS将一个文件划分成若干个数据块,这些数据块存储DataNode节点上。
MapReduce是Google公司提出的针对大数据的编程模型。核心思想是将计算过程分解成Map(映射)和Reduce(归约)两个过程,也就是将一个大的计算任务拆分为多个小任务,MapReduce框架化繁为简,轻松地解决了数据分布式存储的计算问题,让不熟悉并行编程的程序员也能轻松写出分布式计算程序。MapReduce最大的不足则在于Map和Reduce都是以进程为单位调度、运行、结束的,磁盘I/O开销大、效率低,无法满足实时计算需求。
Spark是由加州伯克利大学AMP实验室开发的类Hadoop MapReduce的分布式并行计算框架,主要特点是弹性分布式数据集RDD[5],中间输出结果可以保存在内存中,节省了大量的磁盘I/O操作。Spark除拥有Hadoop MapReduce所具有的优点外,还支持多次迭代计算,特别适合流计算和图计算。
基于成本、效率、复杂性等因素,我们选择了HDFS+Spark实现对告警数据的挖掘分析。
4 分析平台设计
4.1 Hadoop集群搭建
基于CentOS-6.5系统环境搭建Hadoop集群,配置如表1所示。
4.2 Spark参数设置[6]
Spark参数设置如表2所示。
4.3 数据采集层
数据采集:由于需采集的告警设备种类繁多,故采取分布式的告警采集,数据网设备、交换网设备、接入网设备分别通过IP综合网管、天元综合网管、PON综合网管进行采集,采集周期5分钟一次。采集机先将采集到的告警日志文件,通过FTP接口上传到智能网管系统文件服务器上,再对文件进行校验,通过Sqoop推送到Hadoop集群上。
4.4 逻辑处理层
(1)建立高频翻转告警监控工作流程
先将海量告警进行初步删选,通过数量、位置和时间三个维度的分析,得出高频翻转类告警清单列表,最后由专业工程师甄别确认,对某类告警进行重点关注和监控。
(2)差异化定制方案
按组网架构细分,针对核心重要节点的所有告警均纳入实时监控方案;
按业务网络细分,针对不同业务网络设计个性化的监控方案;
按客户业务细分,针对客户数字出租电路设计个性化的监控方案。
4.5 数据分析层
Spark读取Hive[7]表的告警数据,然后在Spark引擎中进行SQL统计分析。Spark SQL模K在进行分析时,将外部告警数据源转化为DataFrame[8],并像操作RDD或者将其注册为临时表的方式处理和分析这些数据。一旦将DataFrame注册成临时表,就可以使用类SQL的方式操作查询分析告警数据。表3是利用Spark SQL对告警工单做的一个简单分析:
5 平台实践应用
探索运维数据分析的新方法,利用大数据分析技术,分析可能影响业务/设备整体性能的设备告警,结合网络性能数据,找到网络隐患,实现主动维护的工作目标。
5.1 高频翻转类告警监控
首先制定了高频翻转类告警分析规则,将连续7天每天原始告警发生24次以上定义为高频翻转类告警,并基于大数据平台开发了相应的分析脚本,目前已实现全专业所有告警类型的分析。表4是全省高频翻转类TOP10排名。
5.2 核心设备和重要业务监控
目前以设备厂商或专家经验评定告警监控级别往往会与实际形成偏差,主要表现在以下几个方面:监控级别的差异化设定基于已知的告警类型,一旦网络重大故障上报未知的告警类型就无法在第一时间有效监控到;同一类型的故障告警出现在不同网络层面可能影响业务的程度是完全不同的;不同保障级别的客户对故障告警监控的实时性要求也是不同的。
通过大数据分析平台对差异化监控提供了灵活的定制手段,可根据告警关键字,分专业、地市、网管、机房、告警频次等维度自主定制需要的告警数据,实现日、周、月、某个时间区等统计分析。
应用案例:省NOC通过大数据分析出一条编号为CTVPN80113的中国平安大客户电路在一段时间内频繁产生线路劣化告警,但用户未申告,省NOC随即预警给政企支撑工程师,政支工程师与用户沟通后,派维护人员至现场处理,发现线路接头松动,紧急处理后告警消除、业务恢复。
5.3 被过滤告警分析
全省每天网络告警数据300万条~500万条,其中99%都会根据告警过滤规则进行过滤筛选,把过滤后的告警呈现给网络监控人员。过滤规则的准确性直接影响告警数据的质量。一般来说告警过滤规则可以从具有丰富运维经验的网络维护人员获得,但是这个过程非常繁琐,而且通过人工途径获得的告警过滤规则在不同的应用环境可能存在差异,无法满足网络维护的整体需要。采用大数据技术对被过滤的告警进行分析可以很好地完善过滤规则,让真正急迫需要处理的告警优先呈现给维护人员及时处理,真正做到先于客户发现故障。表5是动环专业被过滤的告警情况分布。
5.4 动环深放电分析
动环网管通过C接口采集蓄电池电压数据,在停电告警产生之后,电压数据首次下降到45 V,表示该局站电池出现深放电现象,通过计算这一放电过程的持续时间,记为深放电时长,该时长可以初步反映电池的放电性能。一个局站每天产生几十万条电压等动环实时数据。
在告警数据分析的基础上,实现对蓄电池电压变化数据的分析,提醒分公司关注那些深放电次数过多和放电时长过短的局站,核查蓄电池、油机配置、发电安排等,并进行整治。利用Spark SQL统计了一个月内抚州、赣州、吉安三分公司几十亿条动环数据,分析了其中深放电的情况如表6所示。
6 结论
本文利用HDFS+Spark技术,实验性地解决告警数据存储和分析等相关问题:一是通过数据分析,从海量告警数据中发现潜在的网络隐患;二是结合资源信息和不同专业的告警,最终为用户提供综合预警;三是转变网络监控思路和方式,通过数据汇聚、数据相关性分析、数据可视化展示,提高了网络监控效率;最后还扩展到对动环实时数据、信令数据进行分析。
从实际运行效果来看,HDFS和Spark完全可以取代传统的数据存储和计算方式,满足电信运营商主动运维的需求。
参考文献:
[1] 中国电信股份有限公司. 中国电信智能网管技术规范-总体分册[Z]. 2015.
[2] Tom white. Hadoop权威指南[M]. 4版. 南京: 东南大学出版社, 2015.
[3] RP Raji. MapReduce: Simplified Data Processing on Large Clusters[Z]. 2004.
[4] Spark. Apache Spark?[EB/OL]. [2016-11-27]. http:///.
[5] Matei Zaharia, Mosharaf Chowdhury, Tathagata Das, et al. Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing[J]. Usenix Conference on Networked Systems Design & Implementation, 2012,70(2): 141-146.
[6] S鹏. Apache Spark源码剖析[M]. 北京: 电子工业出版社, 2015.
[7] Hive. Apache HiveTM[EB/OL]. [2016-11-27]. http:///.
[8] Holden Karau, Andy Konwinski, Patrick Wendell, et al. Learning Spark: Lightning-Fast Big Data Analysis[M]. Oreilly & Associates Inc, 2015.
[9] 员建厦. 基于动态存储策略的数据管理系统[J]. 无线电工程, 2014,44(11): 52-54.
篇9
[关键词]数据挖掘;技术;电信技术
中图分类号:TP393.01 文献标识码:A 文章编号:1009-914X(2014)29-0355-01
0.前言
我国电信行业一直以来呈现出中国移动、中国联通、中国电信三足鼎立的状态,但是,随着市场经济的进一步完善,我国政府逐渐放开了对电信行业的准入管制,越来越多的国外电信运营商进入中国市场,这使得国内电信市场的竞争压力不断增加,另外,随着我国消费者的日趋成熟,对电信运营商的服务质量要求逐渐提高,这一切都使得我国电信运营商面临巨大挑战,具体来看主要是成本增加、顾客流失、资源浪费,传统的管理方法已经不能适应形势发展的要求,为了有效整合和利用资源,要求电信运营商借助信息化管理模式处理大量客户信息和消费数据,从中挖掘有价值的商业信息,从而制定出符合消费者期望的优质服务策略。数据挖掘技术正好符合了电信行业发展的要求。
1.数据挖掘的概念
数据挖掘指的是从这些混乱的、无序的、模糊的、随机的、不完全的数据当中找出人们事先不知道但是具有潜在价值的信息和知识。从本质上说,数据挖掘是一种深层次的数据分析方法。人们根据数据挖掘任务的不同,把数据挖掘分为不同的类型,例如分类和预测模型发现,序列模式发现,数据归类、聚类、关联规则发现,依赖关系和依赖模型发现等等[1]。根据挖掘方法可以认为统计学方法、机器学方法、数据库方法以及神经网络方法.
2.数据挖掘的功能
总的来说,数据挖掘具有五大功能,即分类功能、聚类功能、预测功能、偏差检验功能以及关联规则和序列模式发现功能。分类功能就是按照研究的对象的属性建立不同的组类来描述对象。聚类功能就是把数据集合分组为由相似的对象组成的多个类别当中,即通过间接相似度把类之间的差异识别出来,并挑选类之中的相似样本。预测功能就是根据数据属性特征等对数据进行评估分析,从而预测其他未知属性。常用的预测方法有回归分析算法、神经网络算法等。偏差检测功能是对数据库中存在的异常记录进行排除,从而确保数据库的安全稳定,降低风险。关联规则和序列模式发现功能关联分析就是找出数据库中各种隐藏的关联性。
3.基于数据挖掘的电信数据分析
将数据挖掘引入电信数据分析,其目的就是深入挖掘顾客的消费行为,探明客户的特征、行为方式、理解客户的价值,从而为电信运营商制定市场营销策略提供科学的依据。
3.1 电信业务下滑客户分析
随着市场竞争堵塞加剧,电信顾客的流动性增大,因此,要想增强企业的竞争力,首先必须保持稳定的客户,防治客户的流失,并在此基础上吸引新的客户。首先建立电信业务下滑客户聚类模型,对客户数据进行聚类,先确立不同的聚类标准作为节点,对用户进行聚类分析,然后表节点把非业务下滑客户列出来。把那些消费波动较大的用户作为业务流失或退订的客户群。最后用表节点把业务下滑的客户数据用表列出来。其次,电信客户业务下滑原因分析。这是在前面的基础上进一步分析客户业务下滑客户的特征和原因,这里首先需要构建数据训练集,把先前聚类的业务下滑客户挑选出来,为了充分表现出业务下滑客户与非业务下滑客户的特征,将它们的比例设为1:1,然后建立决策树,从客户的在网时长、长途费用、客户使用的服务品牌这三方面的具体信息出发,做出有针对性的商业决策[2]。
3.2 电信用户GPRS业务关联分析
GPRS业务关联分析模型主要有商业需求分析、数据预处理、数据集、高价值客户聚类、高价值客户数据集、GPRS业务关联分析、模型评估、模型等环节。首先商业需求分析。通过运用数据挖掘技术分析GPRS业务用户的特征、潜在用户、用户偏好、消费潜力等,建立GPRS业务关联模型进行分析研究,发现其中的规律,由此预测出业务的潜在客户群,协助企业扩大用户规模、获得更大利润。其次是数据处理。先根据客户性质,将其划分为多个群,找出最有价值的客户群。再利用关联性原则分析客户偏好,进而进行相应产品和服务的研究。其次,挖掘电信GPRS业务高价值客户群。为了建立有效模型,首先要进行聚类分析。按照客户消费金额分为几种不同的类型。以其中一个点为高价值客户的最低要求。从而找出高价值客户群。第三电信客户GPRS业务关联分析。该环节的目的是要找出关联大的业务。然后根据分析结果进行业务销售。
3.3 电信非绑定GPRS业务客户预测
电信非绑定GPRS业务客户预测模型与分析流程主要有商业需求分析、数据预处理、数据集、训练集、模型训练、GPRS业务客户预测模型、模型评估、模型等。第一,商业需求分析。首先针对客户使用情况,分析客户消费行为特征,然后对具有这些统计特征而未使用这套组合业务的客户进行推荐,由于运营商需要对客户属性和消费行为进行预测,因此还需要借助于决策树建立分析模型。第二,数据处理,把无关数据排除,同时收集相关数据,并构建模型。第三,电信非绑定GPRS业务客户预测模型构建。建立预测模型时要对模型有效性进行测试,选择合适的预测模型。在实际商业应用中,根据模型分析结果对符合规则的目标客户推荐业务。
4.小结
本文以中国移动某分公司的研究项目“某移动业务精确营销模型研究及推广”为背景,在数据挖掘理论和技术的基础上,将数据挖掘技术的聚类分析算法、关联规则算法、决策树算法应用于电信数据分析。
参考文献
[1] 舒正渝.浅谈数据挖掘技术及其应用[J].中国西部科技,2010,9(5):38-39.
[2] 巩建光.面向电信领域的数据挖掘关键技术研究[D].哈尔滨工程大学,2012:38-39.
篇10
福建省高速公路有限公司运用微软大数据解决方案,对视频图像、交通流、交通环境等结构和非结构数据进行管理,对数据中包含的车辆、车主、收费站、地理位置等关联信息进行分析,改善道路管理效率和用户出行体验……
10月18日,在微软公司大数据媒体日活动现场,微软分享了其在大数据领域的最新研究成果和解决方案,来自国内的银行、汽车、交通运输、医疗卫生和零售业用户分享了其应用体验。
大掌控、大智汇、大洞察
在大数据成为流行词之前,微软便已着手于大数据的应用与研发,例如微软Bing的高质量搜索结果,便是通过分析超过100PB的数据得到的。微软大数据解决方案的目标,是让所有用户都能获得来自任何数据有价值的洞察力。
微软大中华区副总裁兼市场战略部副总经理、大中华区首席云战略官谢恩伟介绍,为了实现这一目标,微软为大数据解决方案制定了全面的战略——大掌控、大智汇、大洞察。
大掌控,即“支持所有数据类型的现代化的管理层”。微软大数据解决方案的数据管理平台可以无缝地存储和处理包括结构化、非结构化和实时数据在内的所有类型的数据。微软推出的HDInsight是一种适合企业使用的、基于HDP的Hadoop服务,它将Windows的简易性和可管理性带给Hadoop,提供了结合Hadoop的扩展平台,并为大数据提供了灵活且可扩展的云。
大智汇,即“搜索并结合广泛数据,进行先进分析与精炼,从而提高数据价值的富集层”。微软大数据解决方案,通过将数据和模型与公开的数据服务相结合,实现了突破性的数据发现,例如自动发现与共享防火墙外部的和第三方的数据源等。
大洞察,即“用户熟悉的工具可为用户提供具有直观洞察力的洞悉层”。微软大数据解决方案可以使客户通过熟悉的由Hive add-in for Excel生成的Excel界面,从Hadoop功能中获取有价值的洞察力,也可经由企业熟悉的BI工具,如SQL Server 分析服务、PowerPivot和通过Hive Open Database Connectivity 驱动生成的Power View来分析Hadoop中的非结构化数据。
数据分析结果要“傻瓜化”
“我们要将挖掘与分析的结果直观呈现,转换为用户真正需要的有价值的洞察力。” 微软全球高级副总裁、大中华区董事长兼首席执行官贺乐赋说。
贺乐赋说,微软大数据解决方案通过智能化的、甚至是基于云端的平台和服务去管理和分析数据,从中获取有价值的洞察信息,再以用户最熟悉、最直观的形式表现出来,从而帮助用户做出决策。