数据挖掘技术在软件工程的实用性

时间:2022-02-09 09:54:46

导语:数据挖掘技术在软件工程的实用性一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

数据挖掘技术在软件工程的实用性

【摘要】随着科学技术的发展,数据挖掘技术水平得到提升,很多领域都开始应用该技术。软件工程也是高科技时代的产物,其发展与信息技术存在直接关系。在软件工程领域使用数据挖掘技术,可以体现出该技术的优势,促进软件研发水平的全面提升,降低软件研发成本,推动社会的发展。本文通过说明数据挖掘技术与图书馆管理信息系统的内涵,阐明数据挖掘技术在图书馆管理信息系统中应用的作用,并举出具体的应用实例,有益于加强图书馆中的管理工作,也便于管理工作的决策与研究,使图书馆管理工作更加标准和规范。

【关键词】数据挖掘技术;软件工程;图书馆管理;管理信息系统;应用策略

1引言

信息化领域高速发展,数据挖掘技术成为先进信息技术被广泛应用,并且逐步使用到软件工程中,让开发、管理、代码编写等各个环节顺利进行,从而实现数据挖掘的高效进行,促进数据质量的提升,提高研发速度,提高软件工程开发水平,满足各项工作的运行需要,促进软件工程领域的发展。我国图书馆的馆藏图书量较大,需要处理的信息量也不断变得繁杂。在此条件下,图书馆管理信息系统充分应用数据挖掘技术是十分必要的,我们要通过数据挖掘技术进一步改变较为传统的图书馆管理,达到提高图书馆信息化管理整体水平的目的。

2数据挖掘技术与图书馆管理信息系统

2.1数据挖掘技术

数据挖掘技术主要是对数据进行深入的开发,并在大量的数据中整理出有价值的数据,达到杂乱数据规整化的目的。大量数据中仍然具有缺陷,比如不完整性、随机性和噪声性等,利用该技术对数据进行挖掘,并从各种数据中提取出有价值的信息,使其更具实用性。在数据处理过程中使用数据挖掘,是对数据信息的转换。数据挖掘也是一种多学科融合之下的技术,体现出大数据的优势。利用数据挖掘掌握全部数据信息,更容易被用户采用和使用。数据挖掘实际上是对数据进行深度加工和精细加工的过程,并且在数据分析中具有高度的自主性。它主要针对各种格式的数据库和Internet,首先构建完善的数据库系统,实现数据清理与转换,经过挖掘之后得出结论,进行进一步的分析和总结。数据挖掘技术被广泛应用于生产和生活的各个领域,并取得了良好的效果,例如数字图书馆的个性化服务,同样可以利用数据挖掘技术,从它的应用效果可以看出,服务质量得到了极大提升[1]。

2.2图书馆管理信息系统

图书馆管理信息系统是通过计算机掌握全部图书馆信息,让图书馆管理顺利实施,这是现代化图书馆管理的模式,专业性高、可使用性强、工作内容比较繁杂。图书馆管理信息系统对数据进行采集、存储和转换,给用户提供完善的信息,取代以往人工作业方式,提高工作精度和质量,让图书馆管理者做出正确的决策。在信息化建设的过程中,合理应用海量的网络资源,及时进行深入分析和研究,深度挖掘信息资源的内在,给用户提供有用的信息,让管理人员了解内在的关系,实现管理人员与图书、用户之间的高效链接。

3图书馆管理信息系统中数据挖掘技术的作用

3.1切实提升信息获取速度

信息获取速度的提高是当前图书馆管理的需要,也是信息管理技术应用的优势,体现出数据挖掘技术的优势。信息获取速度的提升,是通过数据挖掘技术在图书馆管理信息系统中的高效应用,能够更进一步记载用户的浏览记录、阅读倾向,并进行更加深化的观测,然后系统会将所获取的数据通过分析、融合,找到具有价值的数据,并通过关联规则将同时获取的相关规则进行编制,组建出能够为用户提供充分选择和利用的图书资源,信息获取顺利实现。

3.2确保用户个性化服务

图书馆的目标是给用户提供高水平的服务,满足不同人群的阅读需要。但是,从管理的过程来看,这样图书馆的服务会更加被动,并不能达到用户使用的要求,这种处于被动的服务模式使图书馆的管理发展滞后。而充分应用了数据挖掘技术的图书馆,在此技术的支撑下,为用户提供了由自己进行实际操作和向用户推荐相关阅读服务一个平台,有效地提高了图书馆的智能化水平。这种现代化的服务模式既保证了图书馆在服务过程中处于主动,使人力与物力的配置更加合理化,也使用户更加明确自己的实际需求,促进了服务质量的提升,确保了用户个性化服务[2]。

3.3实现图书馆资源优化利用

图书馆资源的优化利用可以发挥出图书资源的作用,利用数据挖掘技术可以实现。系统内存储大量的借阅日志,跟踪用户和书籍信息,每日借用书籍而形成的大量数据信息,传统的数据分析无法确定借用书籍资源的趋势。应用数据挖掘技术后,将图书馆每日借书数据深入挖掘和利用,分析用户的真实需求,发布相关的服务方案,保证图书馆资源科学合理的应用。因此,在数据挖掘技术应用到图书管理系统后,有效地优化了信息资源,改善了信息架构,科学地解决了此类问题。首先,它可以先有效地分析图书馆中用户的浏览记录和借阅日志记录,以及分析出图书馆馆藏图书的记录,再将分析出的数据进行系统分析,把分析结果与用户实际的需求作为基本的根据,以此确定图书馆馆藏书目的类型和数量。其次,随着信息技术的发展与完善,网络信息的发展也越来越完善,在此环境下,它能使图书馆轻松地获取有价值的信息并将其添加到信息资源数据库中,丰富了库中的信息资源,也使管理人员的工作效率得到提高[3]。在图书馆的规模建设的持续发展中,日渐更新的藏书量变得更加繁杂,会使用户对图书的搜集和阅读造成较大困扰。为了有效地控制信息资源,有必要将其基本属性进行分类,以确保信息整合和转化的科学性和合理性。

3.4达到信息自动处理的要求

经过信息处理技术的应用,保证挖掘技术可以充分利用,这是图书管理信息系统基本功能,与传统的图书馆管理中的信息处理模式相比有较明显的差别。传统的图书馆管理中,数据采集常常受到挖掘时间限制,会存有数据缺失,数据遗漏等现象,不利于查找,此时,挖掘技术中的数据清理,就能有效地解决此类问题。数据挖掘技术在该系统中的应用使用户所需要的数据能够更加完整精确地存储在数据仓库当中。用户只需遵循标准化的检索程序,可以直接获取目标文件信息。相对而言,该类型的信息挖掘过程具备标准化、自动化、广泛性的优势。

3.5馆藏资源优化利用

利用数据挖掘技术可以充分掌握用户与图书、图书之间的关系,以此为基础对图书的采购进行指导。一方面,适当筛除借阅率低的旧书,针对借阅率高的图书类型进行丰富和填充,达到优化馆藏的目的,使图书馆的图书资源更加符合用户需求,利用掌握的信息客观分析图书转化趋势。另一方面,不同学科也有着差异和关系,且随着时间的变化而改变,通过运用数据挖掘技术把这种关系呈现出来,以此用来指导图书馆中专业学科的设置,也达到了优化馆藏的目的,同时,为用户提供了相关学科专业的咨询服务和推荐服务。

3.6图书馆决策制定达到智能化标准

数据挖掘技术应用到图书管理中,能够收集到与图书馆中信息资源相关的全部信息,掌握内部数据,并且为决定的制定提供强有力的支持,保证数据可以充分利用,促进工作顺利开展和实施。

3.7创建数字图书馆

现代社会发展之下,数字图书馆是未来发展的必然。分析数据挖掘技术的形态,数字图书馆通过现代化信息技术的研发和应用,可以掌握全面的图书馆资源,采集图书图像、文字与语音等资源,这种情况之下,处理和储存了现有的信息资源,有利于最终价值的进一步提升。分析应用的状态,可以完成数字图书馆建设,掌握足够的数据信息。总之,数据挖掘技术的广泛应用,能够系统应用现代有效的分析工具和统计方法,同时,还可以应用决策树、规则处理等技术获取足够的信息资源,它实现了对图书馆管理模式的可行性分析,最后利用知识表达的方法可以给用户提供数据挖掘技术,让信息管理达到数字化、智能化的标准。

4图书管理中应用数据挖掘技术的案例分析——图书关联规则方面

4.1关联Apriori算法介绍

Apriori算法是为了找出数据中出现次数频繁的集合,进行数据库扫描处理,形成数量庞大的频繁项集,且每一次形成的频繁项集都会经过迭代的方法形成频繁候选项集,然后再次扫描数据库,保证生成的集合是频繁项集。Apriori算法的基本思想是:首先通过多次的迭代,找出所有符合支持度标准的且是最大个数的频繁项集;其次,根据上述找见的频繁项集,输出得到的强关联规则。通过上面第一步找出的频繁项集生成的规则,只把置信度大于用户设置的最小置信度的规则保留下来,要想让形成的频繁项集更加有效,提高挖掘效率,可以使用递归的方法,其挖掘步骤如下:产生大量的频繁项集后,及时把生成的非频繁项集筛除,减少重新组合频繁候选项集的时间;在使用Apriori算法前先把一些特殊的事务删除掉,这样生成的频繁项集,不会再次计算这些特殊事务,减少误差。

4.2应用到图书间关联规则

深入分析发现用户和图书的关联规则,然后可以给客户推荐图书和优化馆藏资源,比如优化馆藏与提供个性化服务。根据系统中用户的借阅记录可以直接看出图书的借阅率,然后就能挖掘出关联性较强的图书,即为优化馆藏。同时,可以把关联性强的图书推荐给选择过类似图书的用户,或者给该用户推荐与他选择图书关联性强的其他书籍。也就是说,按照图书管理系统的数据特性,从借阅记录中,通过关联分析把用户与图书之间的关系挖掘出来。具体包含下述几个步骤:(1)数据准备。给用户推荐图书时,通常会推荐与该用户以往选择图书关联性强的图书,例如,用户在借阅《呼啸山庄》时,也会借阅《濒死之眼》。通过利用数据挖掘可以发现,图书之间的关联规则可以优化馆藏,并为用户提供个性化服务。(2)数据预处理。进行挖掘前,要挖掘的数据有一些是含有杂质的,或者存在信息不完整的情况,所以在实验环节要对该类型数据实现预处理。内容如下:①空值处理。数据挖掘表内,不允许有空值属性的字段存在。如果表中填充空值,例如,在借阅信息表中,挖掘的重要参考字段是分类号,而分类号有空值,那么可能会使表中信息的不确定性更加明显,使具有确定性的成分变得更难把握,此时就需要根据副本的相关信息将此空值进行数据补齐,使数据挖掘表更加完备。②噪声处理。数据挖掘表内,一些没有意义的数据给数据分析影响结果产生不利影响,因此,应该充分开展数据挖掘和分析,提高工作质量和标准[4]。

5结语

综上所述,数据挖掘技术中具有描述性、预测性的数据分析功能为在图书馆管理信息系统中应用提供了重要的技术支持,而数据挖掘技术应用到图书馆管理系统内,给系统产生积极的影响,并且发挥出该技术在图书馆管理信息系统的作用,可以有效地增强系统功能,使其工作更加便捷。在图书馆信息化建设中,管理人员自身的现代管理意识提升,才有可能充分认识到数据挖掘技术在其中的应用优势,做好其信息化建设的具体应用内容,保证系统中数据挖掘应用水平的有效提高,进一步推动系统的发展。

【参考文献】

[1]黄俊.数据挖掘技术在软件工程中的应用[J].信息通信,2020,33(2):254-256.

[2]胡宇辉.数据挖掘技术在软件工程中的应用[J].电子技术与软件工程,2019(5):187.

[3]汪敏,朱习军.基于改进的Apriori算法的关联规则分析[J].计算机科学与应用,2021,11(6):11.

[4]闫绪鹏.探讨软件工程行业中数据挖掘的应用[J].科技资讯,2019,17(2):47-48.

作者:董德生 单位:63810部队