设备投资决策数据挖掘策略
时间:2022-05-29 11:07:00
导语:设备投资决策数据挖掘策略一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。
由于目前我国大多数货运中心、货运企业对企业设备的投资管理缺乏实用的全面综合的决策评价体系和强有力的手段,因而使得企业对设备的投资决策仅仅停留在设备的技术性能和价格上,而完全没有充分考虑设备寿命期内的综合性能。企业对设备的投资管理关系到设备在寿命期内的实际利用效率和产生的经济效益,是设备管理的基础,投资管理的质量和决策水平也就关系到了整个企业的经济效益。而企业在进行投资管理决策时所使用的数据也很少具备直接实用性,因此,引进其他行业相对较成熟的方法对本企业现有条件、数据进行处理、挖掘就显得尤为重要。
1数据挖掘
CRM(CustomerRelationshipManagement,客户关系管理)数据挖掘为各投资行业的中长期发展提供战略性、决策性的技术支持;为企业的客户(设备)管理、降低成本、增加收入、业务发展、增强国际国内的竞争力等各方面都起到举足轻重的作用。CRM是由美国的计算机技术咨询和评估集团GartnerGroup提出的。从管理功能上来说,主要是通过采用信息技术等手段,使企业在市场营销、客户服务与支持等经营流程信息化,实现客户资源有效利用的管理思想。其核心是以“客户为中心”。目前,CRM系统已普遍运用于银行、保险、证券等各类投资行业中。拥有大量的客户数据,如何有效地利用这些数据,分析出对于行业有用的知识,进而采取有效的市场行为来实现利润的最大化,则是每个投资行业所面临的问题。在大型物流运输企业同样面临这样的问题。数据挖掘(DataMining)数据挖掘是一类深层次的数据分析方法。就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识的过程。对现代企业来说,数据挖掘是一种新的现代信息处理技术,通过对企业数据库中的大量业务数据进行简化、分类、抽取、转换等技术分析处理,从中提取辅助商业企业决策的关键性数据。也可定义为为:按企业既定的业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证的规律性,并进一步将其模型化的先进有效的方法。
2数据挖掘的步骤
Step1:数据准备阶段。具体包括:数据选取、数据预处理和数据变换。数据选取:是根据企业用户的挖掘目的从数据源中提取与挖掘相关的数据。数据预处理:是对选取出的数据进行初加工,主要包括检查数据的完整性及数据的一致性,对其中噪音数据进行处理,消除重复的记录,从而达到初步简化数据库。数据变换:通过投影或数据库的其它操作来降低数据的维数,从而减少数据挖掘时数据的数量。提高挖掘算法效率。Step2:数据挖掘数据挖掘阶段首先确定挖掘的任务和目的,其次是根据数据集的特征,选定合适的数据挖掘算法进行数据挖掘。数据挖掘算法是整个数据挖掘系统的核心部分,也是数据挖掘效果和质量的保证。Step3:挖掘结果的表述和评价结果表述:数据挖掘的结果要用企业用户能够理解和接受的方式呈现给企业用户。结果评价:对数据挖掘所获得的结果和模型进行解释,对决策支持信息的适用性做出评价,从而对样本数据和模型进行检验,确定是否有必要重新进行挖掘,直到用户满意为止。
3数据挖掘的方法
数据挖掘技术的方法主要有:聚类分析、决策树、神经网络、粗糙集数据挖掘等方法。聚类分析(clusteringanalysis)数据挖掘方法聚类是将所研究的数据划分为若干组或类,在同一个类中的数据之间具有较高的相似度,而不同的类中的对象差别较大。在进行聚类分析时,不仅要考虑对象之间的距离,同时还要考虑划分结果的现实意义。聚类分析主要集中在基于距离的聚类分析,可细分为划分方法、层次方法、网格方法和密度方法等。决策树(Decisiontree)数据挖掘方法决策树方法是用来表示决策规则的树的结构,是一种由内部结点、分叉及叶结点构成的。其中,内部结点表示某种检验属性,分叉表示检验的结果,叶结点表示类或某一类的分类,而顶点称为根结点。通过构造决策树来发现训练集中分类知识的数据挖掘方法。决策树的算法包括树的构造和剪枝。通常可分为回归决策树和分类决策树。
神经网络方法(NeuralNetwork,NN)数据挖掘方法神经网络即人工神经网络是一种复杂的分类和回归方法,1943年,美国心理学家W.S.Mcculloh与数学家W.H.Pirst合作,用逻辑数学工具研究客观事件在形成神经网络中的数学模型表达,从此开创了对神经网络的理论研究。神经网络主要是由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统,它反映人脑功能的许多基本特性,是一个高度复杂的非线性动力系统。它适应处理需要同时考虑许多因素和条件的、精确和模糊的信息处理问题。粗糙集(RoughsetRS)数据挖掘数据挖掘方法粗糙集理论是波兰数学家Z.Pawlak在1982年提出的一种分析数据、处理模糊和不确定性问题的新型数学工具。其主要思想是在保持分类能力不变的前提下,通过知识约简,删除其中冗余或不重要的知识信息,导出问题的决策或分类规则,达到提高对有效数据的处理分析的速度和准确度。在数据挖掘中,主要利用粗糙集来实现数据的分类、简化、规则提取。利用粗糙集理论来进行数据挖掘有着较传统数据挖掘工具所不具有的优点。粗糙集理论处理数据不需要对数据的了解,也就是说不需要数据的先验信息,比如统计学中的概率分布、模糊集理论中的隶属度或概率值等。粗集的这一优点对于现资行业,这种处理数据的客观性非常重要,因为随着信息技术的飞速发展、经济的快速增长、国内国际竞争日趋激烈,客户的不确定性、模糊性特点显著增强,无法找到有价值或价值长久的先验信息。粗集数据挖掘技术可以帮助企业管理客户(设备)生命周期的各个阶段。利用粗糙集理论不仅可以从大量的客户(设备)数据中,挖掘出潜在的,有价值的知识,对海量数据进化简化;而且还可以挖掘数据间的内在规律,得到数据的最简规则表达,帮助企业业确定客户(设备)的特点,进而能为客户(设备)提供针对性的服务。
粗糙集理论具有以下几个鲜明特点:具有很强的客观性:用粗集处理不确定信息不需要提供任何先验知识,具有很强的客观性,从信息库本身就可以挖掘数据之间的联系,如权重系数,粗糙隶属函数等,而其他处理不确定信息的理论工具如模糊集和概率统计方法等都需要提供一些数据以外的附加信息或先验知识,具有一定的主观性。具有很强的数据挖掘处理能力:粗集能表达和处理不完备信息;通过知识约简,在能保留关键信息的前提下对海量数据进行挖掘得到知识的最小表达;能识别评估数据之间的依赖关系、权重系数;能得到易于证实的决策规则。
- 上一篇:书记在教育交流会讲话
- 下一篇:区街道平安建设年度工作要点