数据挖掘在商业领域的运用

时间:2022-12-31 09:27:18

导语:数据挖掘在商业领域的运用一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

数据挖掘在商业领域的运用

1数据挖掘的过程

数据挖掘的过程可以理解为以下几个步骤。第一步,数据清理,解决数据的不一致问题、平滑噪声、补充缺失数据、识别并删除离群点。第二步,数据集成,把来自多个文件、数据立方或者数据库中的数据组合在一起。第三步,数据选择、分析、提取数据库中与任务相关的数据。第四步,数据变换,通过数据平滑、汇总、聚集、泛化、规范化、属性构造等操作提高对高维数据的理解,把数据变换统一成适合进行数据挖掘的形式。第五步,数据挖掘,选择合适的数据挖掘算法智能的提取出有用的信息或模式。数据挖掘在于发现有价值的模式,总体来说,数据挖掘的目的可以分为两类:描述性和预测性。描述性挖掘任务用于表示目标数据中数据的一般性质,包括分类、聚类、关联分析、异常检测等,预测性任务在汇总后的数据上进行归纳,作出预测,包括回归、分类等。第六步,模式评估,根据某种度量确定出某些有趣的模式,或由专家来评定其价值和正确性。第七步,知识表示,使用可视化等信息表示方法,向用户展示挖掘出的有用信息和结果分析。以上的步骤是进行数据挖掘的一般过程,对于不同的应用分析过程也不尽相同,在商业领域中,面对来自商业的各种不同的分析任务,首先应该理解该应用领域,对数据分析的背景有一个很好的理解,然后尽可能的按照所需信息进行信息的收集工作。

2数据挖掘在商业领域中的重要应用及分析

零售业是非常适合的数据挖掘的商业领域之一,因为它包含了大量的销售记录、顾客购买记录、货物运输记录等大量的原始信息,为数据挖掘提供了丰富的资源。分类和预测技术在市场分析、供应和销售方面为商务智能提供预测分析;聚类可以在客户关系管理方面,根据顾客的相似性把顾客进行分组以便进行更多的后续分析。数据挖掘在商业上的应用具体在以下几个方面:第一,帮助设计和构造数据仓库,由于商业领域中信息范围太大,数据库的设计也存在许多方式,我们可以使用数据挖掘演练结果指导数据库的设计方便以后的使用和后续分析处理。第二,对顾客需求、产品销售、趋势等构造复杂的数据立方体,提供多维分析和可视化工具。第三,根据顾客购买记录,使用序列模式挖掘顾客的消费变化,分析顾客的忠诚程度。第四,产品推荐和商品的交叉推荐,通过销售记录挖掘关联信息,这类信息可以形成产品推荐,也可以根据其他顾客的购买意愿产生个性化购买服务。第五,通过多维分析、聚类分析和林群点分析可以识别可能的欺骗者和他们的习惯模式,检测通过欺骗进入或未经授权访问个人或组织的账户企图,发现可能需要特别注意的不寻常模式。使用数据挖掘技术,可以更好的理解每组顾客的行为特征,开发制定销售计划。

3数据挖掘的典型分析方法

3.1特征化和区分

数据特征化就是简洁的汇总目标数据的一般特征。在商业活动中,公司为保证自己的正常运营和经济效益要保证有一定的客户源。包括不断发展新客户,对已有客户的消费行为和基础信息作为基础综合考虑客户的行为特征,对可能的客户源加强推荐工作。

3.2频繁模式和关联规则

挖掘频繁模式能找出大部分人的喜好,找出适用范围更广的有趣模式的关联性和相关性。关联规则若能同时满足最小支持度阈值和最小置信度阈值,进一步发现关联的属性-值对之间的有趣的统计相关。关联规则最早是用于解决购物篮分析问题,从购物篮数据中发现顾客的购买规律决定商品的摆放位置。还用于医疗中发现某些症状与某些疾病之间的关联,为诊断提供更多依据。

3.3分类与回归

分类可以找出描述和区分数据类的模型,以便接下来实现模型预测类标号以及预测位置类别的数据元素。决策树、神经网络是比较常见的用于分类的方法。相关分析是在分类和回归之前进行,识别出显著相关的属性,其他不想管的属性可以暂时不考虑。分类方法用于金融市场营销、市场预测、信用评估、医疗诊断等方面。分类器还可用于预测某些产品的销售情况、广告的投放区域,以及保险业中评估客户的信用等级。

3.4聚类(cluster)

与分类不同的是,分类需要一个类别属性,而聚类不需要,它是将数据集划分为由若干相似实例组成簇的过程,使得在同一个簇中数据相似程度最大化,簇间数据相异程度最高。是一种无监督的机器学习方法。涉及到的主要算法有K-means,EM算法和DBSCAN算法。聚类分析可以详细的划分市场,比如,基于客户特征把客户群进行划分,房地产行业中对住宅户型、地理位置等特征来鉴定一个城市的房产分组。

3.5离群点分析

前面讨论的聚类、分类、关联分析等方法的重点在于发现大多数数据所适用的常规模式。数据集中的数据中可能包含一些与其他数据一般行为不一致的点,这些数据就称为离群点,大部分的离群点在一些有趣模式的挖掘过程中被丢弃,然而,在一些其他方面,可以直接将离群点单独拿出来做分析。比如应用于灾害气象预报、欺诈检测、药物异常反应、网络安全入侵检测等领域。

4数据挖掘的分析软件和展示工具

无论是数据分析、数据挖掘还是商业智能,在以后的应用中我们都有必要掌握几种高效的软件工具。对于商业领域中数据挖掘工作不仅要收集数据进行挖掘还要将结果以报表的形式展现给客户。数据挖掘的工具可按应用分为几个层次。数据存储层:首先,我们需要存储数据,能够理解数据的存储和数据的基本结构和数据类型以及SQL语句的基本结构和读取等,常见的数据库有Access、MySQL、SQLserver、DB2、oracle。报表层:数据存储以后,我们要制作让大部分人都能报表。比如CrystalReport水晶报表、Bill报表、Tableau报表。数据分析层:从长我们用的统计分析和数据挖掘工具,包括Excel、SPSS、Modeler、SAS、JMP分析。表现层:对分析挖掘以后的结果展现给客户,即使非专业人员也可以明白,这样的表现形式更加有价值,这个领域的软件或工具非常有价值比如PowerPoint、Visio、SwiffChart、ColorWheel等。

5结语

数据挖掘用途广泛,随着近些年学术领域上进一步的研究,在商业活动和社会也在不断应用和发展。在商业领域中,数据挖掘可以帮助我们更好的理解顾客、市场、供应和竞争对手等可以使得决策者进行有效的市场分析,做出明智的商务决策。

作者:赵凯 仁庆道尔吉 单位:内蒙古工业大学信息工程学院