大数据技术范文
时间:2023-03-14 02:54:56
导语:如何才能写好一篇大数据技术,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词: 大数据; 4V特征; Hadoop; 云计算
中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2015)01-13-02
Overview on big data technology
Yang Jing
(Department of Computer Science, Yunyang Teachers' College, Shiyan, Hubei 442000, China)
Abstract: Big data is a new technical wave after the network of things and cloud computing. To understand big data technology, the definition and 4V characteristics, the key technologies and main application fields are systematically analyzed in the paper. Through the introduction of the basic conception, characteristics, the main application fields with typical cases are summarized. The core technologies, key strategies of cloud computing, hadoop and data backup are analyzed. The potential information safety risks are pointed out. The countermeasures are given to provide some suggestions and references for wider application and study in the future.
Key words: big data; 4V characteristics; Hadoop; cloud computing
0 引言
物联网、云计算等新兴技术的迅速发展开启了大数据时代的帷幕。大数据技术是指从各种各样的海量数据中,快速获取有价值信息的技术,大数据的核心问题就是大数据技术。目前所说的“大数据”不仅指数据本身的规模大,还包括采集数据的工具、平台和数据分析系统复杂程度大。大数据的研发目的是发展大数据技术并将其应用到相关领域,解决实际生产、生活中的各种问题,从而推动信息技术健康地可持续发展。
1 大数据的定义及主要特征
与其他新兴学科一样,目前大数据没有一个统一的标准和定义。一般认为:大数据是由大量异构数据组成的数据集合,可以应用合理的数学算法或工具从中找出有价值的信息,并为人们带来经济及社会效益的一门新兴学科。大数据又被称为海量数据、大资料、巨量数据等,指的是所涉及的数据量规模巨大,以至于无法在合理时间内通过人工攫取、管理、处理并整理成为人类所能解读的信息。这些数据来自方方面面,比如社交网络、传感器采集、安防监控视频、购物交易记录等。尽管尚无统一定义,但这些无比庞大的数据被称为大数据。大数据具有如下4V特性[1]:
⑴ 体量Volume,是指数据存储量大,计算量大;
⑵ 多样Variety,是指大数据的异构和多样性,比如数据来源丰富,数据格式包括多种不同形式,如网络日志、音频、视频、图片、地理位置信息等等;
⑶ 价值Value,是指大数据价值密度相对较低,信息海量,但是要挖掘出真正有价值的数据难度较大,浪里淘沙却又弥足珍贵;
⑷ 速度Velocity,是指数据增长速度快,处理速度要求快。
2 大数据技术的应用领域
通过对海量数据进行采集、分析与处理,挖掘出潜藏在数据海洋里的稀疏但却弥足珍贵的信息,大数据技术正在对经济建设、医疗教育、科学研究等领域产生着革命性的影响,其所带来的巨大使用价值正逐渐被各行各业的人们所感知。
2.1 金融领域
大数据的火热应用突出体现在金融业,各大互联网企业(谷歌、阿里巴巴等)纷纷掘金大数据,开创了新的互联网金融模式。目前阿里巴巴的互联网金融做得如火如荼:基金、小额信贷、余额宝和理财保险产品等等,阿里巴巴之所以能够做火金融服务,其主要原因就在于阿里的大数据,阿里巴巴的电商平台存储了大量微小企业客户及数以亿计的个人用户行为信息、交易记录、身份数据等,拥有最好、最全的数据以及最完整的产业链,做P2P及个人小额信贷,具有最大优势[2]。相反,传统商业银行早期就已推出的小额信贷业务,开展得并不十分顺利。
2.2 市场营销
今天的数字化营销与传统市场营销最大的区别就在于精准定位及个性化。如今企业与客户的交流渠道发生了革命性的变化,从过去的电话及邮件,发展到今天的博客、论坛、社交媒体账户等,从这些五花八门的渠道里跟踪客户,将他们的每一次点击、加好友、收藏、转发、分享等行为纳入到企业的销售漏斗中并转化成一项巨大的潜在价值,就是所谓的360度客户视角。例如谷歌的销售策略主要着眼于在线的免费软件,用户使用这些软件时,无形中就把个人的喜好、消费习惯等重要信息提交给了谷歌,因此谷歌的产品线越丰富,他们对用户的理解就越深入,其广告定位就越精准,广告所攫取的价值就越高,这是正向的循环。
2.3 公众服务
大数据的另一大应用领域是公众服务。如今数据挖掘已经能够预测海啸、地震、疾病暴发,理解交通模型并改善医疗和教育等。例如,可采用神经网络和基于地震时间序列的支持向量机方法来预测地震的大概方位、时间、震级大小等重要信息,为通用地震模拟程序提供关键的数据,从而对地震进行早期预警,以使防震抗灾部门可以提前做好应对措施,避免大量的人员伤亡及财产损失;再如,将各个省市的城镇医疗系统、新农村合作医疗系统等全部整合起来,建立通用的电子病历等基础数据库,实现医院之间对病患信息的共享,提高患者就医效率[3];电力管理系统通过记录人们的用电行为信息(做饭、照明、取暖等),大数据智能电网就能实现优化电的生产、分配及电网安全检测与控制,包括大灾难预警与处理、供电与电力调度决策支持和更准确的用电量预测等,并通过数据挖掘技术找出可行的节能降耗措施,以实现更科学的电力需求分配管理。
2.4 安防领域
安防领域中最重要的就是视频监控系统,从早期看得见到现在看得远、看得清,视频监控是典型的数据依赖型业务,依赖数据说话。尤其是高清、超高清监控时代的到来,会产生巨量的视频数据。这些巨量视频监控数据中,多数是冗余无用的,只有少数是关键数据,如何剔除这些无用数据,一直是人们研究问题的焦点。在大数据技术的支撑下,通过对巨量视频数据的分析与处理,可实现模糊查询、精准定位、快速检索等,能够对高清监控视频画质进行细节分析,智能挖掘出类似行为及特征的数据,从而为业务分析和事件决策判断提供精准依据。
3 大数据处理关键技术
3.1 数据备份技术
在大数据时代,如何做好数据的安全备份至关重要。数据备份是数据容灾的前提,具体是指当出现某种突发状况导致存储系统中的文件、数据、片段丢失或者严重损坏时,系统可准确而快速地将数据进行恢复的技术。数据容灾备份是为防止偶发事件而采取的一种数据保护手段,其核心工作是数据恢复,根本目的是数据资源再利用。
3.2 Hadoop
大数据时代对于数据分析、管理等都提出了更高层次的要求,传统的关系型数据库和数据分析处理技术已经不能满足大数据横向扩展的需求。为了给大数据处理、分析提供一个性能更好、可靠性更高的平台,Apache基金会开发了一个开源平台Hadoop[4],该平台用Java语言编写,可移植性强,现在Hadoop已经发展为一个包括HDFS(分布式文件系统 )、HBase(分布式数据库)等功能模块在内的完整生态系统,成为目前主流的大数据应用平台。
3.3 云计算
如果把各种各样的大数据应用比作在公路上行驶的各种汽车,那么支撑这些汽车快速运行的高速公路就是云计算,云计算是大数据分析处理技术的核心。正是由于云计算在海量信息存储、分析及管理方面的技术支持,大数据才有了如此广阔的用武之地。谷歌的各种大数据处理技术和应用平台都是基于云计算,最典型的就是以UFS(UIT云存储系统)、MapReduce(批处理技术)、BigTable(分布式数据库)为代表的大数据处理技术以及在此基础上产生的开源数据处理平台Hadoop[5]。
4 大数据应用带来的信息安全隐患及应对策略
大数据时代,海量数据通常存储在大规模分布式的网络节点中,管理相对分散,而且系统也无法控制用户进行数据交易的场所,因此很难辨别用户的身份(合法及非法用户),容易导致不合法用户篡改或窃取信息;此外,大数据存储系统中包含了海量的个人用户隐私数据及各种行为的记录信息,如何在大数据的挖掘利用中确定一个信息保护和开放的尺度, 是大数据面临的又一难题。为了合理利用大数据并有效规避风险,我们提出以下四点建议:
⑴ 国家出台相关政策,加强顶层设计,保障数据存储安全;
⑵ 增强网络安全防护能力,抵御网络犯罪,确保网络信息安全;
⑶ 提高警惕积极探索,加大个人隐私数据保护力度;
⑷ 深化云计算安全领域研究,保障云端数据安全。
5 结束语
在当今信息知识爆炸的时代,大数据技术已经被广泛应用于商业金融、电力医疗、教育科研等领域。随着数据挖掘技术的不断进步,相关信息行业竞相从规模庞大、结构复杂的大数据海洋中攫取更多有价值的数据信息用于分析、解决现实生活中的各种实际问题,从而实现信息技术的快速健康发展。本文梳理了大数据的基本概念及4V特征,总结归纳了大数据技术的四大热门应用领域及三大核心处理技术,分析了大数据技术带来的诸如信息窃取及篡改、个人隐私数据泄露等信息安全隐患,并提出了相应的解决措施及建议。当然,目前大数据技术的研究尚处在起步阶段,还有许多深层次的问题亟待解决,如大数据的存储管理是通过硬件的简单升级还是通过系统的重新设计来解决,大数据4V特征中起关键作用的是什么,大数据技术的应用前景是什么,等等。就目前来看,未来大数据技术的研究之路还很长,需要我们用更加敏锐的洞察力来分析和研究。
参考文献:
[1] BARWICK H. The "four Vs" of big data. Implementing Information
Infrastructure Symposium[EB/OL]. [2012-10-02]. http://.au/article/396198/iiis_four_vs_big_data/.
[2] 韦雪琼,杨哗,史超.大数据发展下的金融市场新生态[Jl.时代金融,
2012.7:173-174
[3] 张敬谊,佘盼,肖筱华.基于云计算的区域医疗信息化服务平台的研
究[J].计算机科学,2013.40(10):360-365
篇2
1、大数据技术是指大数据的应用技术,涵盖各类大数据平台、大数据指数体系等大数据应用技术。
2、大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
3、随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。
4、大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
(来源:文章屋网 )
篇3
关键词:大数据;计算机;数据备份;安全保障
中图分类号:TP311
文献标识码:A
文章编号:1009-3044(2017)10-0025-01
数据信息作为时代的信息管理标志其安全性必须收到更大的重视,数据信息的安全存储系统尤为重要,防止信息数据的丢失的管理备份系统更为重要。因此能够将数据信息妥善管理,保证其正常工作的技术相当重要,但当数据真正丢失或不可避免地出现问题以后能够尽快地将其找回或者是在有效的时间内将其完整地恢复,以确保整个计算机系统能够正常工作的技术更是必不可少的。
1.数据备份概念及其特点
数据备份指的是将计算机系统的所有数据或者是部分重要数据借助某一种或多种手段从计算机一个系统复制到另一个系统,或者是从本地计算机存储系统中复制到其他的存储系统中。其目的就是保障系统可用或者是数据安全。防止由于人为的失误或者是系统故障问题亦或是自然灾害等方面的原因造成系统数据的安全性无法保障的问题。数据备份更重要的原因是数据信息的多重保存以备不时之需。
数据备份按照备份的实现方式可以分为单机和网络两种备份方式,传统的备份就是单机备份针对计算机本身将数据进行异地存储,现代比较流行的就是网络备份。这是针对整个网络而言的,这种方式的备份较为复杂,是通过网络备份软件对存储介质和基础硬件存储设备的数据进行保存和管理。由于网络备份是在网络中进行数据备份的,因此也就不同于普通的传统单机备份,是包含需要备份的文件数据和网络系统中使用到的应用程序以及系统参数和数据库等内容的。
数据备份的作用在于:一方面,在数据受到损害时对数据进行还原和恢复;另一方面,数据信息的历史性、长久保存,方便数据的归档。
2.数据备份存储技术
备份换言之就是数据的再存储,因此备份技术是存储技术的重要内容之一,但是数据备份存储作为计算机系统技术与简单的备份区别很大。计算机数据备份存储技术时更为全面、完整、稳定安全的数据信息的备份,是网络系统高效数据存储的,也是安全性较高的网络备份。
文件存储作为最基础的数据类型是随机存储在硬盘上的数据片段和文档资料,这些存储的数据文档、报表甚至是作为数据库文件的应用程序等等在存储一定的量就会出现超出容量的情况因此对其的整合是必要的。这样的整合是将存储的各类数据或者是数据库以一个顺序和程序的形式出现,帮助人们解决备份存储的空间问题,技术问题以及成本问题。更能将工作人员的连续数据维护和监控从繁重的工作中解放出来。
3.保障计算机数据网络备份的安全性策略
通过网络传输的备份数据在传输过程和传输路径方面必须确保数据的安全性。若不能保证数据的安全那么一些企业的关键数据和重要应用程序就会受损,甚至是失去了备份的意义。因此相比单机备份而言网络备份更要确保安全传输和安全存储。
首先确保备份数据的机密性。数据信息的网络备份不能被非法用户随意获得,因此在数据备份过程和传输过程中必须防止数据的机密性被破坏。一般数据备份常用的方法是加密。必须保证是数据拥有者才能使用这些数据信息,关键的数据信息的加密工作相比更加严格。数据内容不容有失,甚至是数据的相关名称和代码等也不能随便被非法进入系统的人获得才是最能保障数据安全的方式。
此外,在数据网络传输存储之前一定要确认接受信息一方的真实性,核实双方信息是否匹配,一定要在双方身份确认之后才能对网络的数据信息进行发送和接受,这样既避免了欺诈行为又确保了网络中间不可信的因素存在使数据信息遭到破坏。
其次。确保备份数据的完整性。数据备份存储不是一个简单的过程,数据信息是通过设备和网络之间传输来完成备份数据存储的。这一个成必须要保障所传输的信息完整地被上传而且这些数据信息不能被其他方拦截和篡改,以破坏备份数据信息的内容和属性等。此外在存储时也要保障数据信息的正确无误完整保存。
再次,备份存储的数据可用性。数据存储必须是可用的,而且是计算机资源用户合理合法的使用。对于网络备份系统的信息和信息用户系统的信息是完全一致的,是可用的。备份数据资料必须在合法用户需要时可以随时安全使用。这是网络数据备份存储必须保证的。
篇4
【关键词】云计算 大数据 云数据中心 安全体系
一、引言
大数据时代,原有的信息资源处理手段已经不适应迅速增大的数据量级。大数据依托网络技术,采用数据挖掘、关联分析等技术手段对分布式存储的异构海量数据进行处理。无论是网络环境、计算平台、还是存储载体,都分属不同的信息系统。大数据进一步加剧了网络空间中防御与攻击的不对称性,大数据信息安全主要体现在处理系统、过程的安全,而传统的信息安全防护措施多集中在“封堵查杀”层面,难以应对大数据时代的信息安全挑战。因此应加快构建多层次、高质量的大数据纵深防御体系结构。加强大数据信息安全保障能力,是解决大数据安全的唯一出路。
二、大数据安全挑战
基于大数据环境下所带来的安全挑战包括:
1、应用安全防护:大数据环境下的应用防护风险,包括资源滥用、拒绝服务攻击、不安全集成模块或API接口及WEB安全;2、虚拟化环境安全:基于云计算和虚拟化技术的云计算数据中心为大数据提供了一个开放的环境,分布在不同地区的资源可以快速整合,动态配置,实现数据集合的共建共享。网络访问便捷化和数据流的形成,为实现资源的快速弹性推送和个性化服务提供基础。然而平台的暴露,使得蕴含着海量数据和潜在价值的大数据更容易吸引黑客的攻击。虚拟化环境安全成为大数据安全的重要威胁。3、移动接入安全:BYOD-移动接入安全,包括身份假冒和信息劫持等。4、安全与大数据融合:恶意的内部员工和数据隐私保护面临威胁。
本文分别从上面四个方面来分析大数据安全技术体系的建设办法,构建大数据纵深防御体系结构。
三、大数据安全技术体系
大数据应用安全防护主要在应用防护区部署虚拟化综合安全设备,包括DDOS、防火墙、IPS和WEB防火墙(WAF)等,同时部署漏洞分析系统,进行安全评估和渗透测试。
大数据虚拟化环境安全主要通过虚拟化防火墙TopVSP(Vgate、TAE、TD)和虚拟机管理器安全,即外部防火墙。实现虚拟化环境的性能优化和安全策略迁移等。
移动接入安全从下到上分为统一接入控制、数据安全及威胁防护和全生命周期设备管理三层。其中统一接入控制层在终端接入区使用身份认证及授权和虚拟应用及虚拟桌面,在网络接入区使用VPN加密,在业务服务区使用远程锁定、数据擦除、备份与恢复、GPS定位和自动报警灯管理器后动来实现。全生命周期设备管理包括资产接入、部署、运行和销毁全流程管理,资产接入包括资产的发现、注册和初始化;资产部署主要包括安全基线制定和配置及策略执行;资产运行包括资产的挂失、锁定、密码重置、定位、备份与恢复、报警等;数据销毁采用远程应用卸载和数据擦除等技术。
基于大数据融合下的安全云,主要实现方式是通过安全检测与大数据技术相融合,利用云计算能力及大数据处理机制实现信息访问的审计、安全威胁智能的发现、隐私数据的保护。主要包括安全监测与预警和安全审计及隐私保护两方面内容。安全检测与预警主要是通过7×24监控和运维,对事件进行收集、处理和存储,继而进行关联分析、威胁检测、风险计算和风险分析,将分析的结果通过短信或者邮件通告,并形成相应的工单、知识库和相应的报表进行派发、流转和处置。安全审计及隐私保护主要是为了避免内部恶意员工导致的云数据中心信息泄露,主要通过云安全设计平台实现大数据的审计和取证,主要的审计技术包括业务访问审计、数据库审计、安全运维审计和数据隐私保护审计等。
篇5
关键词:大数据 智能 数据分析
中图分类号:F503 文献标识码:A 文章编号:1674-098X(2014)04(a)-0021-01
对于数据分析来说,其主要的目的就是通过对数据的分析去发现问题或预测趋势。从数据钻取、大规模分析的技术手段、以及算法执行上来说,大规模分析是和小规模数据在技术上是有很大差异的。想要探究大数据下的智能数据分析技术,首先要对数据分析这一概念进行深入研究。
1 数据分析
数据分析的过程其实简单的说就是做报告,做什么样的报告反映什么样的指标。最开始的时候基本上是data processing。例如零售行业来说,最主要的指标就是库存、销售同比增长情况、利润同比增长情况、促销率等等。对于不同的行业会有不同的相关的KPI需要跟踪,所以报告的内容也会有所侧重,但是只要你一个行业做久了,熟悉了套路之后,基本上就是以同样的方法开展。
对于数据分析,如果公司部门分的比较细的(例如可能有建模组),那么做数据分析可能永远都是做data processing了。对于模型的分析,需要你对业务有了深入的了解就可以建立一些模型出来(例如推荐模型)等等。
数据分析主要涉及的技能:
(1)数据库的能力。越全面越好,如果不是理工科的,最起码要会select那些简单的查询语句。
(2)EXCEL、PPT的能力。报告的呈现一般都是Excel+PPT的形式,最好VBA,这样就可以将很多人工的工作转化为自动化的能力,提高工作效率,领导也对你刮目相看,自己也有更多空余的时间准备其他方面的知识。
(3)市场分析能力。学会观察市场的走向和关注的内容,例如零售行业,现在大家都对CRM很热衷,那相关的分析方法和方式是怎么样的,你要自己去了解。从来不会有人手把手的将所有东西都告诉你,你必须自己学会去增长知识。
(4)一些会计的知识。因为通过以上分析,就是会计管理的一部分内容,最后还是公司盈利问题。有兴趣的也可以去看看战略管理方面的,对于做数据分析也很有好处的说。
综合来看,可以说数据分析=技术+市场+战略。
2 如何培养数据分析能力
理论:
基础的数据分析知识,至少知道如何做趋势分析、比较分析和细分,不然拿到一份数据就无从下手;
(2)基础的统计学知识,至少基础的统计量要认识,知道这些统计量的定义和适用条件,统计学方法可以让分析过程更加严谨,结论更有说服力;
(3)对数据的兴趣,以及其它的知识多多益善,让分析过程有趣起来。
实践:
(1)明确分析的目的。如果分析前没有明确分析的最终目标,很容易被数据绕进去,最终自己都不知道自己得出的结论到底是用来干嘛的;
(2)多结合业务去看数据。数据从业务运营中来,分析当然要回归到业务中去,多熟悉了解业务可以使数据看起来更加透彻;
(3)了解数据的定义和获取。最好从数据最初是怎么获取的开始了解,当然指标的统计逻辑和规则是必须熟记于心的,不然很容易就被数据给坑了;
(4)最后就是不断地看数据、分析数据,这是个必经的过程,往往一个工作经验丰富的非数据分析的运营人员要比刚进来不久的数据分析师对数据的了解要深入得多,就是这个原因。
3 大数据
大数据就是通过统计分析计算机收集的数据,在人们可能不知道“为什么”的前提下,了解到事物的状态、趋势、结果等“是什么”。
对于大数据,一直来说,数据规模导致的存储、运算等技术问题从来不是最重要的瓶颈。瓶颈只在于前端数据的收集途径,以及后端商业思想引领的模型和算法问题。早期的各类OLAP工具已经足够了,后来类似海杜普这样的研究则彻底降低了分布式数据的架构成本和门槛,就彻底将大数据带入了一个普及的领域。
从技术层面说,大数据和以前的数据时代的最大差异在于,以前是数据找应用/算法的过程(例如各大银行的大集中项目,以及数据建仓),而大数据时代的重要技术特征之一,是应用/算法去找数据的过程,因为数据规模变成了技术上最大的挑战。
大数据的特点:
(1)大数据不等同于数据大,我们处理问题是根据这个问题的所有数据而非样本数据,即样本就是总体;不是精确性而是混杂性;不是因果关系而是相关关系。
(2)大数据应用的几个可能:当文字变成数据,此时人可以用之阅读,机器可以用之分析;当方位变成数据,商业广告,疫情传染监控,雅安地震时的谷歌寻人;当沟通变成数据,就成了社交图谱。一切都可以量化,将世界看作可以理解的数据的海洋,为我们提供了一个从来未有过的审视现实的视角。
(3)数据创新的价值:数据的再利用。例如重组数据:随着大数据出现,数据的总和比部分更有价值,重组总和和本身价值也比单个总和更大;可扩展数据:在设计数据收集时就设计好了它的可扩展性,可以增加数据的潜在价值;数据的折旧值:数据会无用,需淘汰更新;数据废气:比如语音识别,当用户指出语音识别程序误解了他的意思,实际上就有效的训练了这个系统。
总之,大数据是因为对它的分析使用,才产生和体现它的价值,而不是因为其用到了突出的技术和算法才体现了它的价值。
4 大数据下的智能数据分析
在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,实际中,选择处在两个极端的数据往往更容易找出它们之间的联系,把它们放在一个框架中看才能发现问题。因此,可以用以下四种方法在大数据背景下进行智能数据分析:
(1)从解决问题的角度出发收集数据;
(2)把收集的数据整理好,放入一个框架内,并利用这个框架帮助决策者做出决定;
(3)评估决定与行动的效果,这将告诉我们框架是否合理;
(4)如果有新的数据出现,我们将考察能否利用它对前面三步做出改进,以及我们今天是否还需要收集更多种类的数据。
5 结语
数据分析的最终目的是帮助业务发现问题并解决问题,提升公司价值,而这些是从数据发觉的,而不是盲目下结论。每家公司都有自己业务生产的数据,通过数据分析、同比环比、漏斗分析及模型等,发现业务上存在的问题,帮助公司业务的优化。
参考文献
[1] 李贵兵,罗洪.大数据下的智能数据分析技术研究[J].科技资讯,2013(30).
篇6
大数据时代实质上指的是信息时代,因为大数据的大内涵指向为计算,数据则是指信息,也就是说,大数据从本质上来说就是一种关于信息的处理技术,其以计算为主要特征。同时,在大数据时代的背景之下需要理解大数据与云计算之间的关联性。因为在数据积累越来越多、处理需求越来越高的情况之下,只有依靠更为精密的计算器才能解决数据积累库存的问题。下面就以此为前提具体分析大数据时代背景下的计算机信息处理技术。
关键词:
大数据;计算机;信息处理技术
当前,人类的认识已确定了以“关系”作为解释万事万物的基本事实,并且认为在人类社会中,只有有效处理人与人、人与物之间的信息交流问题,令其实现快速化、精准化的对接才能较好促进人类社会的演进与发展。因此,在这种较为进步的理念基础上,目前的计算机信息处理技术应作为工具、方法、意图而为人类走出困境及可持续发展发挥更大的作用。
1大数据特征及影响
大数据的特征主要体现在三大方面,分别是数据量、存储空间、处理速度。因而在计算机处理信息时,需要鉴别区分数据种类,如区分文字、图片、视频、网页格局此类信息就有助于提高处理的便利性。根据现有社会结构中起作用的企业集团观察,大数据的影响主要是令原来的制造生产“6+1”产业链转变为“4+1”。比如,传统的制造业生产中要求根据产品设计、原料运输、生产加工、订单处理、市场营销、零售六大环节进行按部就班地生产制造,而运用大数据之后就可以较好打破这种产业链的“程序”,从而实现重新排列组合。比如,当建立大数据平台之后,就可以较好利用数据信息,网络平台首先以“订单处理”作为主要切入口,然后压缩其中的环节,提高生产效率,实现零库存,最终实现订单处理、生产设计、原料运输、生产加工的新型产业链闭环。也就是说,通过运用大数据方法,能够有效按照信息采集、数据分析、文字表述等步骤,较好实现以消费者为主导的制造生产计划,令市场经济环境下的企业运作更具有计划性、可控制性,既有利于资源的合理配置,也能够为企业的发展提供理性规划选择。
2计算机处理技术分析
计算机数据处理技术中包括以信息为主要处理对象的获取、传输、加工、存储、感知、安全、发展、问题。具体如下。
2.1获取-加工-传输
计算机信息处理技术以互联网作为基础,由于它的交互属性,因而在整体上要完成的是一种数据信息的传达—处理—接收过程。其中处理部分是计算机信息处理技术发挥重要作用的领域。比如,以搜索为例,在引擎中消费者或用户往往需要通过“关键词”检索自己所需的“相关信息”,因此,计算机信息处理在这个方面就需要提前分类与处理信息。(1)从获取信息的层面观察,手段的合理性非常重要,其中要求设置一个具有实时性的监控机制,以此达到及时存储处理、垃圾处理,其目的在于提高软件操作效率,有效实现数据处理的合理化。(2)从处理信息的角度观察,其中的处理主要是以交互性为前提,从处理信息本身、用户需求两个方向考虑实施数据信息的“加工”,通常要求按照性质、功能、学科、“热冷”(使用频率)等进行科学分类,以此为使用者提供便利。(3)从传输的角度分析,其主要是通过信息平成,其中的传输要求计算机处理技术为其提供安全性、可控制性。
2.2存储-感知-安全
大数据的数量积累决定了在其在存储方面的困难及占用空间的无限扩展,因此,除了实时存储、清除之外,最重要的是发展一种新的技术,令存储能够更为安全、高效集中。比如,DEEPWEB数据感知技术、安全技术就可以为其保驾护航。(1)时代背景决定了大数据积累库存量的持续增长、快速增长,因此,在信息处理过程中要求以这种增速作为主要特征,运用一系列技术手段,更为安全、快速地完成处理,具体要求提高处理效率。从存储信息的手段实现观察,应以分类原则为基础,尽量从结构形式进行数据的高效化存储。(2)感知重点集中于DEEPWEB数据感知,其中主要的内容指的是将其与获取技术进行结合,利用网络深层空间技术实现数据信息抽取、分析,其处理过程以动态化的数据访问作为整理手段,集合效率较高。(3)在数据信息的安全技术处理层面观察,要求从多个层面着手,包括重点数据的检测、信息技术产品的开发、计算机信息安全体系的建构等。根据现阶段的安全防护要求分析,应注重操作人员、计算机信息处理人员的共同努力,如操作者或用户应注重应用时的安全性,降低危险发生的可能性。计算机信息处理技术人员则应尽量过滤、禁止危险信息。
2.3发展-问题
信息技术推动互联网发展的过程中,显著的特点在于易变性,因此,在实践过程中要求计算机信息处理技术的主体能够拥有一个动态化的发展理念,始终站在发展的前沿为用户的使用提供便利。下面先说明发展的基本方向为向云计算网络转化发展,然后指出当前计算机信息处理技术分析中不可忽视的两大难题。(1)计算机所处的网络环境因其本身的属性、局限性决定了它的硬件的使用范围,同时要求实现计算机网络向云计算机网络的转换,尤其是在当前数据越来越多的情况下,其发展理念趋向于网络数据、计算机硬件之间的分离,并以此达到转化目的。(2)第一个问题是作为工具的“双刃性”。计算机信息处理的基本面集中于网络之中,而这种以“符号系统”构建起来的语言编程往往由于工具使用主体的多元性而使作为工具的计算机信息处理技术具有“双刃性”。第二个问题是数据信息的“无用化”。作为知识的数据信息第一次发生质的飞跃是由于印刷术的推动,最近一次根本性的转变则主要是依赖于信息技术。当前在大数据的时代背景之下,云计算的发展成为了必要条件,只有研发一系列计算软件才能真正应对当前的大数据时代。在这个方面机器优于人,但人类与信息处理之间脱离却产生了一个重要的后果,即数据信息的无用化,比如,碎片化信息、海量集中信息中的选择性决定了威廉姆斯所说的“传播的控制性”,所以在这种情况下,数据信息作为一种处理对象、传播对象,它更多是在一种选择之中完成“单向供应”。
3结语
大数据时代背景下的计算机信息处理技术相对复杂,专业化程度高、处理技术难度大,人脑处理的方式已很难适应目前所面临的大数据,因此,应注重对于云计算网络的研究、引入、运用,以此实现大数据处理的“机器化”。根据现阶段的发展状况观察,建议在计算机信息处理技术方面增加技术研发投入,同时,尽量开发数据处理针对性较强的专业化软件,较好应对大数据时代,以及所带来的挑战。
参考文献
[1]杨洁.办公自动化中计算机信息处理技术的应用探析[J].科技资讯,2016(16).
[2]陈成业.关于大数据与计算机信息处理技术的发展辨析[J].信息系统工程,2016(5).
篇7
关键词:大数据技术;创新;社会管理机制
随着云计算、物联网、移动互联网等网络产业的迅速发展,大数据技术已经渗透进了社会生活的各个领域,成为重要的社会生产因素,推动着全球经济社会的迅速发展。①当今时代,城市管理正朝着信息化、网络化以及精细化方向迈进。在这样的发展新形势下,在数据收集、处理、加工方面颇占优势的大数据技术便成为创新社会管理机制的重要手段。我们首先要掌握河北省社会治理中存在的问题,进而将其与大数据技术相联系,运用大数据技术变革社会的管理方式,从而找到解决河北省社会现存问题的方法,推动河北省社会又快又好发展。
一、大数据的内涵
1.大数据的概念大数据,又被称为巨量资料②,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据通常是指以一种多元化的形式,通过众多来源途径搜集而来的庞大的数据组合,大数据通常具有实时性。大数据技术是位居数据分析前沿的现代化技术。2.大数据的特点在物联网等各种网络的迅速发展,智能终端、视频监控等网络技术快速普及,数据呈现爆炸性增长的背景下,应时代而产生的大数据表现出了四大显著的特征。首先,大数据规模庞大。所谓大数据,最重要的特征是大,从TB级别,跃升到了PB级别。到现在为止,社会所生产的印刷材料的总量才几百PB,从古至今所有人类所说过的话的总量大约才几EB(1EB=1024PB)。从这些对比分析中,足以看出大数据所蕴含的数据规模之大。其次是大数据处理的高速性。大数据有一个“一秒定律”,其含义是为了处理结果能够及时有效,大数据必须要在1秒钟内形成所需要的答案,如若不能,处理结果则过期作废。面对如此庞大的数据群,要在1秒内获取答案,这是堪比光速的运算时速。第三是大数据种类的多样性。大数据的种类非常多,包括各种视频、图片、地理位置信息等等。多样性的数据类型,促使数据划分为结构化数据以及非结构化数据。结构化数据是以文本为主的便于存储的数据类型,而非结构化数据则是与之相反的极不容易存储的数据类型,如今社会非结构化数据越来越多,数据多样性的发展对数据的处理能力提出了更高的要求。第四是大数据的价值性。大数据的价值密度极低,以一段视频为例,在整个视频中,能够使用的数据可能只有一两秒。想要获取大数据的价值就好像在沙地里寻找金子般困难,要从纷繁复杂数量庞大的数据中寻找非常稀少但却极其珍贵的数据信息。
二、河北省社会管理中存在的问题及原因
1.河北省社会管理中存在的问题当今社会飞速变化发展,但与之相对应的社会管理机制却处于滞后状态。河北省社会管理机制存在着诸多问题,亟待解决,主要表现在以下几个方面:首先是社会的各个管理部门之间的数据资源不能很好地做到共同分享,社会管理处于一种破碎化的管理状态之下,各部门之间相互分割,单独管理,缺乏沟通,进而导致对相同数据进行重复统计,极大地浪费了政府进行社会管理的成本。同时由于各部门之间缺乏沟通,致使民众办一件事要在各个部门之间来回穿梭,从而导致公共服务质量水平低下。其次是河北省社会管理中存在着严重的越位、缺位现象。政府在社会管理中占据主导地位,实施着全能型政府的管理模式,忽视甚至阻碍社会组织和民众在社会管理中的作用,最终也导致政府自身负担过重,使社会服务效率低下。管得过宽分散了政府管理职责范围之内的事的精力,导致该处理之事管不好,多管之事也为难的局面。除此之外,河北省在社会管理中还存在着决策制定失误,执行行为受阻,社会监测和预警体系不完善等问题。2.引发这些问题的原因首先从思想观念方面而言,河北省在社会管理中管理理念滞后,在特色社会主义社会建设过程中仍未实现从管制理念到服务理念的转变;在社会管理过程中,各类主体之间依旧没有协同管理的观念;在数据频繁变换的今天,仍旧没有改变静态管理观念。思想指引行为,管理理念落后进而导致管理行为跟不上社会发展的步伐,社会发展所产生的问题得不到解决,反过来又阻碍了社会的管理。其次是在大数据时代下,在社会管理中缺乏对大数据的统筹机构以及标准体系,从而导致数据资源无法实现共享、得到有效的利用。并且决策者忽视已有数据和民众意愿,致使其所做的决策不能够与时俱进,符合民意,从而使得社会管理中民怨四起,严重制约了社会发展。第三是在社会管理中,数据管理技术的落后也是一个重要的因素,大数据极为重要的作用在于预测,只有通过预测才能未雨绸缪,从而提早做好防范,数据管理技术的落后阻碍了这一过程的实现,进而影响了社会的管理。
三、利用大数据技术创新河北省社会管理机制的对策
篇8
[关键词]大数据分析 批量处理计算 流式处理计算
中图分类号:X734.2 文献标识码:A 文章编号:1009-914X(2016)10-0206-01
1 引言
随着互联网技术的不断发展,物联网技术、移动互联技术、社交媒体等技术及其应用在是越来越多,全球的数据急剧膨胀,人类已经步入了大数据的时代。大数据中包含着大量的隐含信息,需要从这些隐含的信息中提取有价值的大知识,这些大的知识将在更高的层面上、更广阔的视角、更大范围内对用户提供洞察力、决策力,为人类以及社会创造更大的利益以及价值。目前主流的大数据库计算模式分为两种,分别为批量式计算和流式计算两种模式。
在批量计算模式中,首先是需要对海量数据进行存储,然后对这些存储的静态数据进行集中起来进行计算,目前的Hadoop就是一种非常典型的批量计算架构;在流式计算模式中,无法确定数据的到来时刻以及数据的次序,也不用将数据全部进行存储起来进行计算。而是当这些流动的数据到来之后直接在内存中进行实时性的处理,典型的Twitter、Storm、Yahoo的S4就是这种流式的数据计算模式。
2 应用场景及数据特征
2.1 批量处理系统
对于批量处理系统来说,这类系统比较适合对于静态数据进行数据挖掘,从海量信息中获取具体的含义,得到很明智的决策,最终为领导提供辅助决策制定相应的应对措施来实现业务目标。大数据中的批量处理系统适合先进行存储然后进行计算,对于数据处理的实时性要求不是很高,但是对于数据的准确性和全面性要求更高。
2.1.1 数据特征
对于批量数据来说,通常具备三个典型的特征,(1)数据量比较大,数据量从TB级别到PB级别,数据主要是以静态的形式存储在磁盘上,存储的时间比较大,一般不进行数据的更新数据,海量数据可以重复进行使用,这种数据不容易移动以及备份处理;(2)数据的精度比较高,存储的这些数据一般是属于企业中的一部分,是长时间积累下来的;(3)数据价值密度相对来说比较低。往往有价值的信息比较少,因此需要采用合理的分析算法对这些批量数据进行信息抽取,同时处理批量数据比较耗时,一般不提供交互功能,当提取结果与预期差别很大时,会浪费很多时间。因此,批量处理系统比较适合相对比较成熟的作业。
2.1.2 代表性处理系统
对于批处理系统来说,比较典型的代表是由Google公司开发的文件系统GFS(google File System)和研发的MapReduce编程模型。虽然Google公司没有对这两项技术进行源码的公开,但是基于发表的两篇文章,Nutch子项目中的Hadoop实现了开源的两个产品:HDFS和MapReduce。Hadoop成为批量处理架构中非常典型的一种架构模式,HDFS负责对静态的数据进行存储,通过MapReduce对这些静态数据进行计算逻辑的分配。Hadoop成为很多IT公司的大数据主流架构,基于HDFS和MapReduce建立了很多项目。
MapReduce编程模型收到很多主流IT的欢迎,主要有几个方面的原因:(1)MapReduce是一种没有共享的大规模集群系统,这种集群系统具有很好的性价比和伸缩性;(2)MapReduce模型比较简单,容易理解,便于使用。能够不仅仅处理大规模的数据,而且能够对很多细节进行隐藏(包括自动并行化、负载均衡、灾备管理等),能够很大程度上降低程序员的工作量。
2.2 流式处理系统
2.2.1 数据特征
一般情况下,对于流式数据来说,是一个无穷的数据序列信息,对于流式数据中的每个序列来说数据的来源是不同的,数据可能是结构化或非结构化,这些序列往往包含时间特征,或者有其他能够表示有序的标签信息。从数据库的角度来说,流式数据中的每个元素都可以看成是一个元祖。流式数据在不同的场景中能够表现出不同的特征信息,比如表现流速的大小、元素特征的数量、数据格式不同等。
2.2.2 代表性处理系统
流式计算处理系统目前得到广泛的应用,包括Twitter的Storm,Facebook的Scribe,Linkedin的Samza等。本节主要是对Twitter的Storm进行详细的介绍。
Storm的主要特点是一种基于分布式的、可靠、容错性好的流式处理系统,被分配的流式处理作业能够分发到不同的组件上,被分配的每个组件负责一项单一的、特定的处理任务。Storm集群中输入流由Spout来进行负责,Storm将流式数据分发给Blot的组件,Blot组件对其进行处理。Storm可以进行实时的数据处理以及对数据库进行更新,能够被用于进行持续的计算,对连续的数据流进行查询处理,在计算的过程中结果是以流的形式输出给用户。还可以用于进行分布式的处理RPC。
3 大数据关键技术
3.1 大数据批量计算关键技术
在大数据批量计算中,系统架构、分布式文件系统、分布式数据处理系统等关键技术成为制约其发展的关键技术。
(1)系统架构
在进行大数据处理的过程中,需要的关键技术主要是针对海量的数据进行存储以及分析计算,因此选择合理的架构对其进行批量处理是其中的重点。
(2)分布式文件系统
在大数据应用中,文件系统是其中非常重要的一个部分。对于海量的数据需要采取分布式存储的方式存储到磁盘上,方便后期的计算。
(3)分布式数据处理系统
对于分布到磁盘上的海量信息,如何选取合理的数据处理系统对其进行处理分析是其中的一个非常重要的关键点。
3.2 大数据流式计算关键技术
对于流式计算中,理想中的大数据流式计算应该具有比较低的延迟、高的吞吐量、保持持续运行、可以伸缩等特征,这些离不开系统的架构、海量数据的传输、编程的接口、高新技术等关键技术的合理设计与规划。
(1)系统架构设计
流式计算中的架构指不同的各个子系统之间的一种重新组合的方式,对于流式处理计算中需要选择特定的框架进行流式计算。目前主流的流式计算系统中采用的架构分为无中心节点的对称系统架构以及具备中心节点的主从式结构。
(2)数据传输
数据传输主要是完成从有向任务图到物理计算节点之间的部署,部署各个节点之间的数据传输方式。在流式计算系统中,为了能够具备高的吞吐量、比较低的延迟,需要不断的优化从有向任务图到物理计算节点之间的部署及其映射方式。目前主流的数据传输方式分为主动推送方式和被动拉取的方式。
(3)编程接口
在流式计算中,为了方便从有向任务图到物理计算节点之间的部署,需要进行编程实现任务图中各个节点的相应处理功能。需要编制大量的流式数据计算系来提供应用编程的接口,方便的接口能够方便用户实现内部的业务逻辑及处理,减少用户的编程的工作量。
4 总结与展望
互联网技术、云计算等高新技术的快速发展,多样化的应用不断的增加,数据在各行各业中都成为非常重要的一个组成部分,如何在海量的信息中获取有价值的信息是大数据需要完成的工作。本文根据大数据对数据处理的形式不同,介绍了批量处理系统和流式处理系统,并对大数据中的关键技术进行了介绍。
参考文献
[1] 刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报:工学版,2014(06):957-972.
篇9
一、大数据下环境审计的机会
(一)新型数据分析技术让环境审计取证更简便
单就资源环境审计检查取证这方面来说,环境审计与传统审计不同的是其审计程序和方法更着重于现场的核查,因为只有这样才能更直观的对资源环境状况进行了解。同时需要环境审计人员处理大量的图片视频信息,工作量大且对审计数据处理以及分析的时效性提出了极大要求。然而大数据的环境下云审计平台的出让审计队伍不需要直接出现在资源环境审计对象所在地,审计人员能利用互联网计算机对云端数据进行处理和分析从而更好地实现勘察人员与审计人员的分工合作。另一面大数据技术不断发展,其中的图像识别和图像分析技术能给环境审计人员的工作带来极大的便利,电脑与人脑不同,其在观看大量且极尽相似的图片时不会感到疲惫,并且能够找出肉眼不能识别出的细微差别并进行分析。图像识别和图像分析技术日益成熟,让处理大量环境图片和视频也变得非常的方便。随着大数据多媒体传输技术更加成熟,环境审计工作者在某些特定情况可以采用视频传输的方式并通过计算机的处理能够更大限度的了解到现场的气候资源环境的情况,审计数据的处理也更加实时性。
从环境审计相关动态数据计算方面来说,环境审计需要计算大量的审计环境绩效指标数据,与环境资源审计的一些相关数据通常是动态的,需要采用大量采用定性分析与定量分析、延伸跟踪等审计方法。在大数据环境下,计算相关环境审计绩效指标时能比普通计算方式提供更具有保证的实时性,准确性和高效性。大数据技术能从海量分散并且实时变化的动态环保数据中挖掘出有价值的信息快速通过分析并获取当前状况,能保证环境审计数据的时效性。
(二)全数据模式让环境审计数据分析的工作更精准
在传统环境审计工作中,由于数据的多而杂,我们一般会采用审计抽样来分析,不可避免的就会有一定程度的抽样风险会存在。而大数据的环境下,“样本=总体”的全数据模式是分析与审计对象相 关的所有数据,这让审计工作可以建立整体到局部的审计模式。在全数据模式下开展审计数据分析,不仅能够规避了审计抽样风险同时也能打破从局部推算整体的局限性,进而也保证了更加精准环境审计数据分析工作的结果;和传统的的方法比起来,数据不需要进行预处理,减少了大量的工作量同时也保证了数据的原始特征,从而使得开展数据分析工作能够具有更全面、更接近真实的洞察力。(见图1)
二、大数据下环境审计的挑战
(一)大数据对环境审计人才的挑战
与传统审计不同之处在于环境审计的过程中会涉及到大量的环境检测的技术指标,而理解、掌握和运用这些技术指标需要一定的检测装备和高级专业技术人才,本就比传统审计需要更多的复合性人才,而在大数据环境下,半结构化数据与非结构化数据成为了环境审计工作中数据的重要形式,且传统的环境审计工作中,审计人员所面对的是结构性数据,其掌握的也只是对传统的结构性数据分析方法。这对审计人才队伍的建设又提出了更高的要求,为了保证审计结论的客观性和权威性,必须拥有更多复合型的审计人才,只有这样才能减少大数据浪潮带来的审计风险,才能保证环境审计工作能够有效的搜集和鉴证。
(二)大数据对环境审计平台的挑战
1.构建新审计信息平台的风险
从大数据对环境审计平台的冲击来看,虽然当环境审计具有良好的信息数据平台时,公众则可以接触更多透明资料,同时政府部门则可以推动自身政务工作的发展。但受到传统资源环境审计观念影响的审计工作人员,如何实现电子信息环境审计平台的构建与优化,仍然是一个大问题,与此同时,云审计平台的出现也要求环境设计工作对新的工作平台重新作出适应。
2.选择大数据分析工具的风险
环境审计在开展审计数据分析时会涉及到大数据分析的运算工具。但是,大数据分析平台可供选择的商家的数目多,环境审计单位如何选择适合自己的大数据分析平台非常重要,环境审计单位应该结合自己的需求并分析被审计单位的情况,选择适合自己的大数据分析平台,可以预先对其进行应用测试,以选择最佳的大数据分析平台。因为如果一旦选择了不适用的平台,不仅会对进一步审计工作造成困难,还会造成较高的审计风险。
三、大数据下环境审计工作的建设
(一)加强环境审计人才队伍建设
在大数据环境下,关于环境审计队伍的建设,主要在于环境审计人员能否改变传统的审计方式同时转变自身传统的审计意识。需要环境审计人员们能够认识到自己在大数据环境审计中扮演的角色,融入到新的审计环境中去,其次,在环境??计单位需要强化培训其工作人员,同时审计人员也得有不断学习意识,重视自身专业素养,不断提高自己的工作职务胜任能力,在发展自身职业素养的同时也需要了解大数据相关的一些技术,环境审计队伍应该配备一些专业环境审计专家、计算机专家等,也为环境审计人员提供专业帮助,从而提高环境审计的工作效率,降低审计风险。
(二)加强环境审计平台的建设
作为大数据技术的载体―环境审计平台。因此为了更好的在大数据环境下进行环境审计,我们必须建立合适的审计信息平台。首先,构建一个完整,独立而又统一的信息网络组织,让其与财务系统、审计系统、环境系统、计算机专家系统等相互链接,保证信息渠道的畅通。其次,可以构建一个完整的环境审计信息数据库,保存各地搜集的环境审计信息,形成一个完整、安全的环境审计信息系统,再次,我们需要根据自身情况,结合环境审计单位与被审计单位的审计目标,选择适合自己的大数据分析工具,大数据技术才能够更好的给环境审计工作带来便利。
篇10
【关键词】电力信息技术 大数据 发展路径
1 大数据时代背景下的电力信息行业发展情况
1.1 大数据发展面临的背景
随着大数据时代快速迈进,商业市场格局整体发生变化,麦肯锡公司于2011年最先使用大数据分析和研究项目,逐渐引起全社会的广泛关注,如今已成为大多数企业的主流趋势。针对大数据的定义不是硬性的,数据的收集通常利用网络技术实现,集中推送操作是有目的的进行,大量隐藏数据通过数据的整理和挖掘获得,为企业经营管理人员的决策及执行提供了较大的方便。
1.2 大数据时代背景下电力行业发展面临的机遇
电力产业主要从三方面收集相关数据:其一是电网运行过程中的相关数据,以及电网监测项目运行过程中的相关数据,这些数据比较复杂,不仅有报表数据,还包括一些文本信息数据,以往人工数据收集方法早已跟不上时展的步伐,而信息化技术的应用则能够提升信息数据利用效率,提升信息分析能力。其二是电力企业的营销类数据,为确保电网销售流程的完整性,保证电网结构良好运行,既要提高数据基础的稳定性,也要确保电网运行的稳定性。其三是电网管理方面的相关数据,这些数据是所有数据中最复杂的一部分,包括很多视频图像与音频数据,企业分析数据时,科学决策要实现最优化,要使管控结构具有一定的完整性,使管理数据的实效性价值得到有效提升。应用电力信息技术不但能够确保数据的完整性,也能够进一步提高企业的经济效益。
2 立足大数据时代背景电力信息技术的发展策略
2.1 通过大数据检测和诊断电网的状态
为实现管理项目安全有效的运行,一般以大数据发展为前提,采用管控措施来推动电力信息技术的运行。该区域通过设备观测电网数据的采集状态,创建有效的运行机制。以往设备运行时,因机制分析机制过程单一和简单,对全局的控制和考量比较欠缺。不过,将数据融合机制与电力信息技术相互整合之后,就能够实现整合分析电网的实时数据,研究设备的运行信息数据,也可以甄别大量的异构数据,使全景化观测控制平台更加健全和完善,可为观测项目的创建提供有力的数据基础。随着大数据时代的到来,智能化电网的实现成为一种可能,下一步的发展目标就是进一步实现数据的管控和监测,有效数据库创建之后,充分分析和对比相关数据。
2.2 通过大数据分析和研究电能的损耗
电网运行时,通常利用计算机的相关功能分析系统的运行效率,为使数据结构更加完整,实现最小化的功率损耗,可优化配置电源,参数及负荷,使企业的经济效益更高。创建损耗控制机制过程中,通过大数据的应用,可以确保得到准确的电能表统计分析结果数据,对电网的整体运行起到辅作用,而且,电网的管理人员需要进一步分析数据的完整度和准确性。再者,为确保电力企业的实际发展进程与统计结果相符,应当利用大数据计算损耗,并且标注安装环境和测量的误差。我们重点要关注的是,进行精确损耗计算时,电网管理人员应当利用大数据实现实时计算损耗,实现常规化运行离线计算。要以云计算项目为基础,使信息采集与数据更具完整性,充分应用大数据收集元件的运行参数。即通过大数据运行机制可有效统计和控制系统的电能损耗,既要有效践行无损要求,也要确保高效的计算速度。积极落实大数据控制措施,实现企业电力信息技术运行的动态化。
2.3 通过大数据有效控制和预测负荷
电力项目运行时,管理人员应当分析和研究系统参数,因电能无法存储,导致系统的负荷产生变化,整体系统不够稳定,当系统的操作流程运行时,管理人员应当有效控制发电容量,使最大化需求得到充分的满足,以保证低谷控制结构的完善。针对有可能被浪费的电能,管理人员应当采取积极有效的管控方法,有效践行时效性价值。再者,企业管理人员需要对发电量进行合理化调控,既要提升经济效益和社会效益,也要降低企业电力的运行成本。实现整体系统聚合分析机制的良好发展。总而言之,有效应用大数据推送和收集技术,可以确保有效整合和分析大量的电力数据信息,使预测的准确性大大提升,保证电网智能调峰结构更加完整。
2.4 应用大数据智能预警和分析电网
分析系统时,电网管理人员应当利用管控机制监督电网的整体运行情况,以确保创建的大数据参数结构与实际需要相符。这些年,在应用大数据运行框架进行分析和预警时,通常应用预案处理机制实现,这个机制可以预判系统可能出现的问题,针对某些具体问题,还可创建完善的语境模式,既实现智能化网络控制结构的有效提升,也实现了全民网络监管水平的提升,为使电力信息技术项目参数的准确度更高,管理人员应当充分应用云计算技术及大数据技术,创建智能化分析机制,确保整体运行框架更加完善和健全。
3 结语
综上所述,在研究和分析电力信息技术及大数据技术时,不同的区域应当根据自身实际状况,创建更加健全完善的管控C制,使数据的传输和推送更加完整,使运行策略与设计框架得到进一步优化,实现标准化和规范化的数据,使共享机制的运行效率得到提升,确保数据的质量,进一步推动电力行业的数字化发展。
参考文献
[1]杜玉辉,蒋姣丽.大数据背景:高速公路收费系统数据的现状、分析与展望[J].电脑知识与技术,2012(15).
[2]王思宁.2009电力信息通信技术论坛成功举办[J].电力信息化,2009(12).
[3]卢建昌,樊围国.大数据时代下数据挖掘技术在电力企业中的应用[J].广东电力,2014(09).