数据挖掘提取知识及有用信息论文

时间:2022-05-15 06:41:00

导语:数据挖掘提取知识及有用信息论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

数据挖掘提取知识及有用信息论文

编者按:本文主要从前言;数据挖掘方法在商业信息中应用的规则;数据挖掘技术在商业信息中的应用;结束语进行论述。其中,主要包括:商业信息的增长速度呈现指数上升、数据挖掘技术在商业中的应用主要基于AI、机器学习、统计学等技术、商业信息泛化、简约和特征提取规则、商业信息分类技术规则、商业信息的聚类规则、商业信息的关联规则、数据挖掘技术在电子商务网站数据中的应用、数据挖掘技术可以用在金融领域的应用、数据挖掘技术在企业市场营销中的应用、电信业交叉销售和提升销售解决方案、预测哪些客户最具有流失的倾向以及影响客户流失的关键因素等,具体请详见。

0前言

随着现代商业经济和信息技术的发展,商业信息的增长速度呈现指数上升,积累了海量的、以不同形式存储的商业数据资料,原有的决策支持系统(DSS)和领导执行系统(EIS)已不能满足需要,这时出现数据挖掘技术,它能够去粗存精、去伪存真,从海量的商业信息中提取知识有用信息的技术。现代信息技术处理商业信息经过一定的发展,逐步形成现在的商业数据挖掘技术。

1.数据挖掘方法在商业信息中应用的规则

数据挖掘技术在商业中的应用主要基于AI、机器学习、统计学等技术,高度自动化地分析商业原始数据,做出归纳性的推理,从中挖掘出潜在的模式,预测客户的行为,帮助商业决策者调整市场策略,减少风险,做出正确的决策,体现一种决策支持过程。

1.1商业信息泛化、简约和特征提取规则。商业信息泛化是为了商业数据更好的理解和掌握,将其具体一般的数据信息抽象到较高层次的过程;商业信息简约是为了采用一定的手段对信息进行描述;商业信息特征是找出这些信息的共同特征,寻找信息的通用性特征式。

1.2商业信息分类技术规则。商业信息分类是按照一组商业信息对象的特征给出信息对象划分的过程。其目的是学会一个分类函数或分类模型,该模型能把数据库的数据信息项映射到给定类别中的某一个。

1.3商业信息的聚类规则。聚类规则是识别一组信息对象的内在规则,从而将对象分组,构成相似的对象类,从而找出数据信息的分布规律,并进一步去发现隐含在一组混杂的数据信息集里的分类规则。聚类是把一组个体按照相似性归类,即"物以类聚"。使属于同一类别的个体之间的距离尽可能小,而不同类别的个体间的距离尽可能大。

1.4商业信息的关联规则。关联规则的商业数据挖掘已经从单一概念层次的关联规则发展到多概念层次的关联规则的发现。关联规则是如下的一种规则:"我们在研究大型商场的顾客在购买上衣和裤子的时候,发现其中在这些顾客中有10%的顾客同时买了帽子(上衣+裤子+帽子),这就形成简单的关联规则。除了具有上述关联规律,还有时间或序列上的规律,在不同的时间(春夏秋冬)所购的衣服、裤子以及帽子是不相同的,并且不同层次或者不同年龄的人所购商品又有一定的规律性。

2.数据挖掘技术在商业信息中的应用

数据挖掘技术是目前在商业信息处理中应用的比较多的一项技术,为了在商业领域中对海量数据库和大量复杂信息中提取有价值的知识,进一步提高信息的利用率,对公司及时制定相应的对策有非常重要的意义,在这里,讨论几个主要商业行业中的商业信息处理。

2.1数据挖掘技术在电子商务网站数据中的应用

随着Web技术的发展,电子商务网站正在成为现在商家的必争之地。如何让电子商务网站有效益要想有效益就必须吸引客户,增加能带来效益的客户忠诚度。电子商务网站每天都可能有上百万次的在线交易,生成大量的记录文件和登记表,如何对这些数据进行分析和挖掘,充分了解客户的喜好、购买模式,甚至是客户一时的冲动,设计出满足于不同客户群体需要的个性化网站,进而增加其竞争力,几乎变得势在必行。若想在竞争中生存进而获胜,就要比您的竞争对手更了解客户。

在对网站进行数据挖掘时,所需要的数据主要来自于两个方面:一方面是客户的背景信息,此部分信息主要来自于客户的登记表;而另外一部分数据主要来自浏览者的点击流,此部分数据主要用于考察客户的行为表现。但有的时候,客户对自己的背景信息十分珍重,不肯把这部分信息填写在登记表上,这就会给数据分析和挖掘带来不便。在这种情况之下,就不得不从浏览者的表现数据中来推测客户的背景信息,进而再加以利用。就分析和建立模型的技术和算法而言,网站的数据挖掘和原来的数据挖掘差别并不是特别大,很多方法和分析思想都可以运用。所不同的是网站的数据格式有很大一部分来自于点击流,和传统的数据库格式有区别。因而对电子商务网站进行数据挖掘所做的主要工作是数据准备。

2.2数据挖掘技术可以用在金融领域的应用

金融事务需要搜集和处理大量数据,对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣,并可观察金融市场的变化趋势。

数据挖掘在银行信息中的应用。商业银行业务的利润和风险是共存的。为了保证最大的利润和最小的风险,必须对账户进行科学的分析和归类,并进行信用评估,利用数据挖掘工具,可以根据客户的消费模式预测何时为客户提供何种产品。银行如何让一家新开的银行网点实现快速赢利呢?银行结合了GPS推理信息系统和商业智能应用系统,在银行的客户信息中,详细记录有客户的常驻地,并且,当银行客户到该银行网点办理业务时,银行商业智能系统将自动记录客户的操作信息,以及银行网点地址信息。经过大量的记录,客户的常驻地到银行网点的行动路线,将被通过数据分析而得出。大量的客户路线得出后,我们可能会发现,某个地区进行银行业务操作的客户特别多,但他们附近没有银行网点,而是要到离他们较远的地方去办理,于是银行就决定在这个地区开办一个银行网点。

数据挖掘在证券信息中的应用。上市公司定期公布的财务报告具有很强的信息含量,但是当期会计盈余数据的信息会在披露前后在股票市价中迅速得以体现。因此对于中长期投资者来说,重要的是预见未来。质地优良且未来具有较高盈利增长能力的公司是中长期投资者(包括普通投资者,证券投资基金和券商)普遍关注的对象,因为只有这类公司才能给投资者带来持续的回报。而财务报告包含了大量描述公司经营状况的数据。这些数据应能为投资者提供关于公司未来盈利能力的信息。对于中长期投资者而言,需要做的就是利用这些信息挖掘出未来能够具有较高盈利水平同时又具有较好的成长性公司。采用数据挖掘技术来发掘这些财务报告中是否包含关于公司未来盈利情况的信息,获得较精确的预测效果,选出的投资组合能否获得超额收益,这对于投资者来说是非常重要的。

2.3数据挖掘技术在企业市场营销中的应用

数据挖掘技术在企业市场营销中得到了比较普遍的应用,它是以市场营销学的市场细分原理为基础,其基本假定是"消费者过去的行为是其今后消费倾向的最好说明"。通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。这些来自各种渠道的数据信息被组合,应用超级计算机、并行处理、神经元网络、模型化算法和其他信息处理技术手段进行处理,从中得到商家用于向特定消费群体或个体进行定向营销的决策信息。4数据挖掘技术在民用通信部门中的应用

我国各种民用通信用得最多的国家之一,为了分析出那一类收费对应那类层次的人群,我们就可以利用数据挖掘技术,把当前电信消费者的数据进行收集、分析、总结,制定出有效的管理办法,这既有利于公司又有利于客户的优惠政策,这样能够及时发现问题,减少顾客流失,为通信公司挽回损失。数据挖掘在通信部门中体现在三个方面:(1)客户挽留解决方案;(2)电信业客户细分解决方案;(3)电信业交叉销售和提升销售解决方案。这三个项目的实施,可以为民用通信部门解决三个决策问题:第一,预测哪些客户最具有流失的倾向以及影响客户流失的关键因素,通过预制的分析模型提供"流失记分"帮助识别风险客户,在客户流失之前采取针对性措施来挽留他们。第二,根据客户可能的行为和潜在的盈利性对客户进行分类,制定更准确的产品组合、更准确的产品介绍和产品捆绑服务。第三,从现有客户中识别出有可能接受交叉销售和提升销售的客户人选,评估客户过去的购买模式,预测客户下一步可能购买什么。

3.结束语

随着数据挖掘技术和现代商业技术的不断发展,商业管理者已经认识到数据挖掘技术能从原始数据中挖掘潜在的巨大商业价值和所蕴含的科学知识。随着数据挖掘技术不断应用到商业信息领域中,这将激发数据挖掘技术的潜力,进一步推进数挖掘技术在商业信息中的应用