计算机文本信息挖掘技术论文
时间:2022-09-28 09:49:43
导语:计算机文本信息挖掘技术论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。
我国的经济社会不断发展,科学技术水平不断提升,在数据时代背景下,信息呈现爆炸增长趋势,需要对数据信息进行高效处理,不断提高工作效率。信息技术加快了数据传播的速度,优化了信息交流的方式,但也存在安全隐患问题。为了保障网络安全,可以应用计算机文本信息挖掘技术。
1计算机文本信息挖掘技术概述
计算机文本信息挖掘技术类属于数据处理技术的范畴,被应用在数据处理之中,主要面向文本信息。应用计算机文本信息挖掘技术可以从海量文本信息中提取有效信息,并概括这些信息数据的特点等,对这些信息进行分类和识别。计算机文本信息挖掘技术具有复杂性特征,其应用流程如下所示:(1)计算机文本信息挖掘技术会对文本对象进行选取,文本对象大多是来自期刊、网页和其他数据库中的文本信息。(2)计算机文本信息挖掘技术对文本对象进行了预处理,包括对文本对象进行去噪处理、分词处理等等。在预处理过程中,计算机文本信息挖掘技术提取了文本对象的特征,并将文本对象特征表示出来。(3)计算机文本信息挖掘技术对文本信息进行了深入挖掘,对具有统一特征的文本对象进行了分类,并考察了信息数据之间的关联性,预测了文本对象的发展趋势。以上三步是计算机文本信息挖掘技术应用的重要流程,也是文本挖掘的主要步骤。在应用计算机文本信息挖掘技术时,还需要经常应用邻近分类算法。邻近分类算法类属于文本分类方法的范畴,在应用邻近分类算法的过程中,需要先制定分类方案,并对数据、分类方案进行比对,看文本属性最接近哪一个分类方案,可以被归入到哪一个分类方案之中。为了确保分类的准确性,需要明确分类方案的描述特征,并对文本进行设置。通过计算文本和分类方案的邻近性,可以对文本进行初步分类。
2计算机文本信息挖掘技术在网络安全中的应用
2.1应用必要性。当前信息数据越来越多,如何剔除无效数据,保留有效数据,成为各行各业关注的重点问题。信息技术改变了人们的生活方式,改变了社会的生产方式,人们依靠手机、电脑进行线上交流,通过微博、微信等进行线上互通;社会通过网络系统进行生产控制,通过信息技术进行运营监督。信息技术在一定程度上便捷了人们的生活,推动了社会的发展,需要进一步推动信息技术创新,扩大信息技术的应用范围。在发展的同时,也需要看到信息技术存在的问题。伴随信息量的不断增加,网络中的虚假信息、诈骗信息等越来越多,只有对这些垃圾信息进行有效拦截,才能保证网络安全,保障用户的个人权益。计算机文本信息挖掘技术有着重要的应用价值,其可以对海量信息进行有效分类,识别网络中的真实信息、虚假信息,并对广告信息等进行剔除。计算机文本信息挖掘技术对信息数据进行有效判断,能够保障网络安全。实际应用条件上,针对网络化的信息形式,需要对其中的基础文本信息进行分析,尤其是与系统内容相关联的信息内容上,务必要进行必要的调整,并通过相应的技术条件,保证网络信息内容的安全性。例如,在当前的技术应用条件下,通过手机系统程序,就可以完成对与手机接收信息的文本分析,并在大数据系统的基础上,通过文本内容的捕捉,确定此类信息的状态。由此,定位可能存在的垃圾信息,并在手机使用设定中,将此类信息规整到统一的存储格式中,由使用者进行二次确认,并保证信息管理的有效性状态。2.2应用路径。为了发挥计算机文本信息挖掘技术的作用,应该改进邻近分类方法。计算机文本信息挖掘技术通过邻近分类方法对互联网信息进行分类,只有优化邻近分类方法,才能提升文本信息分类的准确性。传统的邻近分类方法存在弊端,不同分类特征可能存在共线,文本信息分类可能会出现讹误情况。在技术改进过程中,需要坚持将传统方法作为依托,并对文本特征进行细化描述。技术人员需要合并共性属性比较明显的文本特征,并考察特征向量的维度,对其进行有效压缩。通过上述方法,文本信息分类将更加高效。为了验证计算机文本信息挖掘技术的有效性,需要开展实验,考察计算机文本信息挖掘技术与网络安全检测之间的关系。技术人员首先要确定实验对象,包括文本信息预测库等,并尽量扩充其中的文本信息,确保其中有正常文本信息、广告信息、诈骗信息等等。根据语料库设定原则,需要对文本中的数据信息特征进行有效概括,看哪一种信息类属于文本信息、哪一种信息类属于广告信息和诈骗信息。技术人员也可以对广告信息、诈骗信息等进行合并,将其命名为危害信息。技术人员需要采用邻近分类方法,测试计算机文本信息挖掘技术的应用效果。在设置评价参数的过程中,应该采用算法判定方式和专家判定方式。上述实验将会出现四种可能性:(1)算法、专家判定安全信息;(2)算法、专家判定危害信息;(3)算法判定安全、专家判定危害信息;(4)算法判定危害、专家判定安全信息。技术人员需要对评价精度、评价误差等进行计算,并设计信息检测平台,为计算机文本信息挖掘技术的应用提供支撑。网络信息检测平台应该分成一级功能、二级功能,一级功能应该包括首页、用户管理等,而二级功能应该包括分类方法、参数评价等。2.3文本挖掘主要技术方向。文本挖掘技术,是计算机网络化的应用技术手段,也是具体系统开发的方向性技术,在与具体产业进行结合的过程中,可以凭借自身的技术又是条件,适应到多种类型的技术空间中,展示自身科技型价值,适应知识经济发展环境。(1)基于网络文本分析的技术条件,可以在网络新闻与舆情发掘的过程中,发挥自身的技术优势,对构筑安全的网路环境,贡献出基础性技术内容。在网络化的舆情环境中,个人信息、商业机密等内容的传播,都会造成严重损失,威胁到企业与个人的信息与财产安全。而在这一内容的管理中,需要对客观的网络舆情状态进行分析,在过滤文内容的同时,过滤具体的信息数据,通过关联性分析、网络溯源、舆情评价等内容,保证对于整体信息的管理状态。尤其在舆情的推演中,可以形成完整的模型系统,并在模型的综合作用下,保证技术的完整性与成长性,针对实际工作环境做出必要的基础性保证。(2)专利信息的安全管理中,应用文本数据挖掘的工作模式,也可以起到积极作用。专利信息,大多是企业核心科技的关键内容,与企业的经济收益与市场竞争条件息息相关,需要在技术内容上,形成系统性的防护条件,并在执行过程中,针对专利系统的管理流程,设置具体的文本挖掘工作方案,在程序的规范性状态下,保证管理的有效性。方法上,需要针对专利权登记资料、专利所有权挖掘、专利使用权调查等内容,维护整体技术管理体系的建设状体,实现同步化的专利技术分析。(3)在文本挖掘技术的应用开发中,表现出了明显的技术成长性,在多种专业领域展现技术应用条件的同时,也在综合性、管理性的内容中,呈现出了明显的应用价值特征。例如,在医疗领域,文本分析可以被应用在医学健康分析的工作中,通过在中药成分分析、西药用药规律总结等多种信息化内容的安全数据整理,利用各种敏感词汇与数据,保证了整体信息化系统的建设条件。又如,在企业的市场管理中,可以凭借这技术应用条件,对市场环境中的相关信息进行提取与分析。并在综合相关市场人员掌握数据的同时,结合企业实际发展状态,形成指导性的参考数据材料,保证整体信息系统的建设状态,并使相应网络资料为实际运行策略的制定提供参考,维护了发展信息综合性分析执行效果。
3结论
综上所述,我国的信息技术不断发展,互联网范围进一步拓展,网络安全问题屡见不以在网络新闻与舆情发掘的过程中,发挥自身的技术优势,对构筑安全的网路环境,贡献出基础性技术内容。在网络化的舆情环境中,个人信息、商业机密等内容的传播,都会造成严重损失,威胁到企业与个人的信息与财产安全。而在这一内容的管理中,需要对客观的网络舆情状态进行分析,在过滤文内容的同时,过滤具体的信息数据,通过关联性分析、网络溯源、舆情评价等内容,保证对于整体信息的管理状态。尤其在舆情的推演中,可以形成完整的模型系统,并在模型的综合作用下,保证技术的完整性与成长性,针对实际工作环境做出必要的基础性保证。(2)专利信息的安全管理中,应用文本数据挖掘的工作模式,也可以起到积极作用。专利信息,大多是企业核心科技的关键内容,与企业的经济收益与市场竞争条件息息相关,需要在技术内容上,形成系统性的防护条件,并在执行过程中,针对专利系统的管理流程,设置具体的文本挖掘工作方案,在程序的规范性状态下,保证管理的有效性。方法上,需要针对专利权登记资料、专利所有权挖掘、专利使用权调查等内容,维护整体技术管理体系的建设状体,实现同步化的专利技术分析。(3)在文本挖掘技术的应用开发中,表现出了明显的技术成长性,在多种专业领域展现技术应用条件的同时,也在综合性、管理性的内容中,呈现出了明显的应用价值特征。例如,在医疗领域,文本分析可以被应用在医学健康分析的工作中,通过在中药成分分析、西药用药规律总结等多种信息化内容的安全数据整理,利用各种敏感词汇与数据,保证了整体信息化系统的建设条件。又如,在企业的市场管理中,可以凭借这技术应用条件,对市场环境中的相关信息进行提取与分析。并在综合相关市场人员掌握数据的同时,结合企业实际发展状态,形成指导性的参考数据材料,保证整体信息系统的建设状态,并使相应网络资料为实际运行策略的制定提供参考,维护了发展信息综合性分析执行效果。
参考文献
[1]江启煜,何晓华,刘秀峰,等.基于大数据整合与文本挖掘的中药生物分子信息文献系统关键技术模型[J].医学信息学杂志,2019,40(02):53-57.
[2]韩文智.计算机文本信息挖掘技术在网络安全中的应用[J].华侨大学学报(自然科学版),2016,37(01):67-70.
作者:刘树飞 单位:湖南工艺美术职业学院
- 上一篇:计算机软件安全及防护策略
- 下一篇:计算机程序设计课程群建设论文