电信客户流失数据挖掘论文

时间:2022-06-24 09:51:05

导语:电信客户流失数据挖掘论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

电信客户流失数据挖掘论文

1数据挖掘概述

数据挖掘(DataMining)是一种决策支持的过程,是从看似杂乱无章的海量数据中,利用人工智能、模式识别、机器学习、数据库、统计学等技术高效的分析企业庞大的数据库,从中找出有价值的事件,进行合理的归纳性推理,挖掘出潜在的模式,帮助决策者做出正确的决策。

2客户流失的概述

2.1客户流失的理解

流失的客户分为主动流失和被动流失。主动流失是因为客户自身的原因导致的流失,例如各个运营商之间的竞争,客户的搬迁、学生毕业等因素。被动流失是指客户由于欠费时间较长或者与运营商签订的合同到期后不再续约等因素,从而运营商终止向客户提供服务的行为。对于铜川联通公司,把用户状态为“锁定期”、“强拆销号”、“退网停机”、“预登录停机”、“欠费服务暂停”等定义为流失的客户或即将流失的客户。数据挖掘的目标是通过挖掘出来的结果降低客户流失率,分析各项因素对客户流失的影响,用最小的成本最大程度的挽留客户。

2.2电信客户流失分析的特点

(1)电信客户的数据量大、实时性强、逻辑复杂,使用历史数据来进行数据挖掘,结果往往会存在较大的偏差。(2)数据预处理工作需要收集大量杂乱无章的原始数据来进行处理,工作量非常大,通常需要花费一个项目大多数的时间。(3)国内电信企业的客户流失率大约在1%~3%左右,不适合直接采用某种模型,而需要增加流失客户的比例,但这样就会存在抽样过度的风险。(4)需要考虑到多方面的平衡:首先,预测的准确性,并兼顾可理解性;其次,营销成本的收益问题和客户挽留的价值。

3电信企业客户流失分析的数据挖掘过程

3.1数据挖掘的模型选择

在实践应用中,神经网络算法和决策树算法在客户流失预测的问题上都具有较高的精确度和准确性。

3.1.1决策树算法

决策树的优点:能够形成容易理解的规则并且能很好的进行归纳分类;缺点:预处理较多,对于数据信息不能充分利用,在数据类别较多的情况下,错误率也高。

3.1.2神经网络算法

神经网络的优点:在自适应、自组织、自学习等能力较强,抗干扰能力和互补性也较强。缺点:解释性差。决策树算法和神经网络算法各有特点,但对于解决客户流失的问题而言,决策树算法更容易被人们理解和接受,但在预测结果的准确性和精确度较差,而神经网络算法可以弥补这一缺点,提高预测模型的准确度。因此,在实践当中,如果将两种算法结合起来应用,那么会对预测客户流失的实际效果方面起到更大的作用。

3.2数据准备

数据挖掘项目中,数据准备阶段及其重要,在整个挖掘坏境中也工作量最大。本次研究中,采取的是陕西铜川联通公司2013年11月的数据,数据量庞大,主要来自计费系统,其中包括客户基本信息、消费行为特征、通话行为特征,欠费等。

4结束语

要在庞大的数据中找出有流失倾向和流失的客户几乎是不可能的事,在使用SPSS/Clementine进行数据挖掘建模后,客户挖掘的准确率达到98%,为电信企业做出决策起到很大的作用,从而可以制定相应措施挽留一些有价值的客户。数据挖掘技术在电信行业的广泛应用将会使更多的电信企业从源头上缓解客户流失所带来的损失,能在很大程度上避免许多损失,在激烈的市场竞争中立于不败之地。

作者:杨逸凡 赵夏 单位:兰州财经大学