数据分析师范文

时间:2023-03-19 19:52:32

导语:如何才能写好一篇数据分析师,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

数据分析师

篇1

Keywords:big data of archive; data scientist; post requirements; post duties; quality demands

数据时代,数据成为重要的战略资源。在电子办公深度与广度不断拓展的进程中,人类对数据“精、准、深”的要求日益突出。在基于数据决策、依赖数据管理等“以数据说话”的理念日益深入人心的大环境下,作为大数据的关键组成部分――档案大数据的地位和作用也逐渐凸显出来,它是大数据重要维度即历史维度数据的核心,在各个领域都有很好的应用前景。但是,应该看到,受保密、档案管理机制等因素的制约,档案大数据的应有价值还没有得到充分发挥,档案大数据与其他数据的整合还有一段很长的路要走。为提升档案资源建设与利用效益,对档案大数据进行分析,优化档案事业发展方案,更好地为领导决策和各领域工作的开展提供数据支撑,成为档案工作的重要组成部分,这就需要档案资源和档案事业数据的鼎力支撑。虽然从国家主管部门到各级档案馆(室),都在开展档案数据的统计和分析工作,但是,由于缺乏固定而专业的分析人员,从数据统计和分析的全面性、系统性、多维性、深入性和规范性等方面看,仍有待进一步增强。在此种形势下,档案大数据作用的发挥和档案事业发展的科学性很大程度上取决于档案部门自身结构的优化和管理资源使用效益的提升。

1 档案领域数据分析师岗位设置的意义

大数据时代,数据分析在各领域有着十分重要的意义,各行业对数据分析师的需求与日俱增。与其他数据相比,档案大数据很大一部分源于政府、军队等组织机构的活动,具有权威性和凭证性等不可替代的价值特点,虽然有着服务社会、服务百姓的义务,但又必须确保国家利益不受侵害。因此,在行业内部设立数据分析师岗位不仅是社会需求、也是档案行业组织机构结构优化的内在需要。

1.1 优化档案资源体系建设的需要。从局部看,各级档案部门都不同程度地存在着档案收集不齐全、著录不规范等问题。从整体看,各档案部门之间存在着档案资源交叉重复、数据异构等问题。系统地设置统计项目,全面地对档案资源建设现状进行分析,就可以准确地发现档案资源体系建设中的弱项和“瓶颈”。通信网络和数字设备发展实践告诉人们:当今,电子文件的增长几乎达到了几何级。例如,阿富汉战争期间,美军为打击一小股恐怖分子,其情报侦测、监视系统24小时产生的数据量就达53TB。在如此大的数据量面前,如何分类电子文件、确定保管期限?网站、微博、通讯交友软件等产生的数据,哪些是需要作为电子文件保存的、又该如何保存?现有馆(室)藏档案资源,哪些方面需要丰富、哪些方面需要“瘦身”?如何从国家层面调控档案资源体系建设?这些均有待于档案领域数据分析师从“保存历史、服务社会”视角、以可靠的数据和科学的分析给出建设性的解答。

1.2 分析和把握档案利用规律的需要。档案资源的利用是有规律可循的,掌握了这个规律对于提升档案资源利用率是十分有益的。有的档案资源,其利用具有扩展效应,即一次成功利用可能会激发人数更多、范围更广、程度更深的利用,例如名人档案、著名战役档案、历史典故档案等;有的档案资源,其利用具有递减效应,即一次成功利用之后可能很长时间内不会再有第二次利用,例如事关普通百姓的个人档案。如果机械地根据其前段时间的关注热点推荐档案信息服务产品,则不仅达不到理想效果甚至还会引起用户反感。依托数据分析师的科学分析,有助于档案部门聚焦服务热点,提前做好档案信息服务预案,根据用户需求方向准确提供档案资源及其编研产品服务。

1.3 推动档案管理科学发展的需要。近年来,档案事业出现了一派欣欣向荣的景象,尤其是档案信息化建设、民生档案的收集与管理等得到了长足发展。但是,无论是硬件建设、还是软件建设,离精细式、集约化科学发展尚有一定距离,这就需要发挥档案大数据的决策助手作用。对于不同学识背景、不同工作经历、不同职业精神的数据分析人员来说,同样的统计数据得出的结论也是不尽相同的。设置固定的数据分析师岗位,则有益于提升数据统计和分析工作的科学性。通过数据分析师对档案事业分门别类的统计和分析,可以有效地冲破经验主义思维的“篱笆”,发现和把握新形势下档案管理工作的发展规律,更加统筹、协调和集约化地利用管理资源,构建档案事业发展的良好生态。

1.4 更好地服务社会发展的需要。如果说“读史可以明智”只能模糊地形容档案的作用,档案大数据在金融、医药、卫生、交通、安全和军事等领域的成功应用,已经很好地量化和解释了档案大数据的价值。它是转换思维方式、科学决策的直接支撑,是引领社会更快、更好发展的“催化剂”。设置档案大数据分析师,无疑会有助于提升档案信息服务于社会的广度与深度。同时,也有助于档案部门把握契机创新服务社会的模式与内容。

2 档案领域数据分析师的岗位职责

档案领域数据分析师,可以依据各级主管部门、档案馆(室)的编制和事业发展状况合理配置,其职责主要是从档案资源建设、档案利用、档案事业综合发展以及档案文件内容等方面进行数据统计和分析,并制定优化方案和提出发展规划建议。

2.1 档案资源数据统计和分析。档案资源数量统计和分析,主要是对馆(室)藏或者主管范围内的档案资源数量情况进行统计和分析,包括对各全宗文件数量的分类统计和分析、同类全宗文件数量的对比分析、现行全宗文件产生量与归档量的对比分析、永久档案与定期档案数量的对比分析、不同类型载体档案数量的对比分析、不同地域不同系统档案移交数量对比分析、不同时期档案数量对比分析、不同密级档案数量对比分析等。

档案资源质量统计和分析。主要是对馆(室)藏或者主管范围内的档案质量情况进行统计和分析,包括档案资源载体和信息完好度分析、档案资源结构分析、档案著录情况分析、档案信息化建设情况分析、档案目录数据库质量分析、档案全文数据质量分析、档案缩微情况分析、档案修复情况分析等。

档案资源优化方案的制定。基于馆(室)功能,在科学分析的基础上,提出一定范围内档案资源体系建设优化方案。主要是从档案资源结构和数量视角,有重点地对现有档案资源进行丰富、再鉴定工作。对明显存在缺失的馆(室)藏方向,分析档案资源可能的分布点,为收(征)集工作提供指导。具体分析档案著录、目录数据库构建情形,提供档案著录尤其是电子文件著录以及档案目录数据库优化方案。必要时,对全文数据质量进行优化。根据档案完好度统计,制定档案修复计划。

2.2 档案利用数据统计和分析。档案利用人群统计和分析。主要是对用户基本情况进行统计和分析,包括用户职业、单位、年龄、学历、档案专业知识、兴趣点、档案意识等,从共性和个性等方面进行分析和研究。

档案利用目的、利用效益统计和分析。主要是对档案利用目标和用户所获得的收益进行分析。从编史修志、工作查考、解决个人问题等方面对档案利用目的作进一步细分,分别进行统计和分析,并关注其利用效益。同时,分析一定时期内得到用户关注和利用的档案资源,尤其是得到用户重点关注或利用的档案资源。

档案检索效率统计和分析。主要是对档案目录和全文的检索效率进行分析,与图书情报资源等相关领域的检索效率进行对比,考虑其是否满足用户需要,有无改进策略。密切跟踪信息和知识领域的发展前沿,将先进的技术和工具应用到档案检索效率的提升上来,主要是对档案信息组织和检索模式提出创新方案。

档案利用发展趋势预测。由于社会和国家发展的需要,人们会在一定时期内有重点地开展某个或某些方面的工作。数据分析师应密切关注某个系统、国家乃至整个人类社会的发展形势,科学地统计和分析用户的潜在需求,准确地预测出档案利用的重点方向,从而有针对性地做好档案利用准备工作。例如,编史修志工作往往在国家层面、某一系统或行业层面进行统一行动,有的又会与编制体制调整、大型纪念活动、大项任务开展等时机紧密结合;个人利用档案,往往会与国家出台某项政策、某一年龄段人群的成长经历、某些文化活动的开展等密切关联。根据档案利用历史数据的分析、当前社会热点、用户关注方向等,引导档案信息资源的开发,借助大数据工具,利用档案信息资源整合平台,充分地进行知识挖掘,高效地构建专题数据库,向用户推送档案信息资源。

2.3 档案事业数据综合统计和分析。档案人才队伍建设情况统计和分析。当今时代,不仅要求档案工作者具有较高的信息素养,而且需要档案工作者转变理念,从知识管理视角出发,为用户提供问题解决方案。档案领域数据分析师应该对档案工作者个体素质和整个队伍建设情况进行统计和分析,要重点关注专业学历、知识储备、年龄结构、管理能力、信息素养和职业精神等方面。

档案事业组织领导形势统计和分析。组织领导是档案事业发展的关键。档案领域数据分析师,应可以系统地设置档案事业各类统计表格,并根据形势发展创新地设置统计项目和衡量指标。不仅要分析档案主管部门对档案工作的组织领导情况,还要分析各级组织机构对档案事业的组织领导形势,包括工作规划、经费投入和对档案事业的关注度等。

档案专业硬件、软件建设情况统计和分析。在国家大力倡导档案信息共享平台建设的情形下,对行业内硬件、软件建设情况进行统计和分析,要重点对档案馆(室)库房建设、档案安全体系建设、业务设备建设、档案软件系统建设等方面进行统计和分析,避免低水平重复建设、提升管理资源利用效益。

制定档案事业科学发展方案。档案领域数据分析师要适应大环境的需要,从档案工作者个体出发,提出人才培养和培训方案。从档案人才队伍整体建设出发,合理提出编制调整、人才配备和人才发展等建议。在硬件建设方面,从档案事业整体发展视角提供指导意见,合理配置各类设备设施。在应用系统开发方面,针对技术发展形势及时提供建议,为颁布软件系统需求标准、协调资源做出贡献。

2.4 档案文件内容大数据的分析和知识挖掘。无论是科技档案、专门档案,还是文书档案,其利用都是围绕着组织机构(或个人)的业务行为开展的。因此,从业务层面对档案内容大数据进行分析,是档案大数据分析的重要内容。根据各专业发展的需要,利用高效、可视化的图形分析工具,对档案文件内容大数据进行分析,挖掘出其中蕴含的知识点,以指导各领域业务工作的科学开展。

3 档案领域数据分析师的基本素质要求

数据分析师肩负着对档案事业各类数据进行统计和分析的职责,并且要根据分析结果制定出推动各行业科学发展的、切实可行的方案,这就要求其具有高度的事业心和责任感,具备档案、计算机、数学和管理等领域专业知识和技能。

3.1 思维开阔,开拓精神强。无论是统计项目的设置、还是优化方案的制定,都要求档案领域数据分析师关注相关领域前沿发展形势,具有开阔的思维和较强的创新意识,能够敏锐地捕捉到档案事业发展中的主要矛盾,打破旧的思维和工作运行模式,为建立起切合实际的、具有前瞻性的档案工作机制贡献力量。

3.2 档案专业功底扎实。档案领域的数据分析,其出发点和落脚点均在档案收集、管理和利用。因而,数据分析师应具备系统的档案专业理论知识。不仅要熟知档案领域基本理论,而且要掌握领域前沿发展和理论创新情况,密切跟踪行业发展实践,能够科学地设计好统计与衡量指标、优化和促进档案事业的综合发展。

3.3 掌握计算机应用专业知识。数据分析师经常要与计算机网络、多种软件工具打交道,必须具备较高的信息素养和扎实的计算机应用专业知识。档案领域数据分析师,应了解机器学习、人工智能和自然语言知识,能够结合领域实际,提出具体的统计、分析软件系统需求;能够熟练操作基本分析软件,掌握大数据分析工具的使用(如R软件、SPSS、MATLAB),准确地采集、处理数据,必要时进行数据迁移;能够在看似无关的数据中挖掘出蕴含的关联、发现档案资源建设和档案事业发展内在规律。

3.4 熟悉管理学基本理论。无论是档案资源管理、还是档案事业的综合管理,都离不开管理学基本理论的运用。因此,档案领域数据分析师应熟悉现代管理学基本理论,具有严谨的逻辑思维能力和较好的文字表述能力,能够运用管理学前沿理论来指导档案资源建设和档案事业科学发展方案的制定。

篇2

关键词数据挖掘 教学模式 合作式教学

中图分类号:G642文献标识码:A

数据是无处不在的。当飞速增长的数据给我们带来方便和便捷的同时,也将我们推入浩瀚的数据海洋。广泛用于商业和科学领域中的自动数据收集设备每小时能够产生几TB规模的数据,人们面临的问题已经不再是没有充分的信息可选择,而是如何有效利用如此庞大的数据,并且找到蕴含于这些信息之中的有价值的知识。由于数据分析师的匮乏,导致了很多领域出现了“数据丰富而知识匮乏”的现象,因而在信息计算科学、统计学等本科专业中开设数据分析课程是非常有必要的。

数据分析就是分析和处理数据的理论和方法,从数据中获得有用的信息,其内容丰富,方法众多,最大的特点就是“让数据说话”。该课程设计的分析方法众多,如:方差分析、非参数统计、多元统计分析、判别聚类分析、时间序列分析等。由于计算机编程的复杂及数据的难以采集,这些分析方法在课程中大多处于理论教学,使得本科阶段的学生很难接受。随着计算机及统计软件(如SAS,SPSS)的普及,大大的减少了对程序能力的要求,随着大量数据被数据采集者开放(如金融数据库),使学生有可研究的对象,从而使得我们在大学本科阶段开设数据分析课程成为可能,但需要合适的教学模式以适应本科阶段的教学。

由于数据分析的方法众多,对不同学科的数据又会有其特殊的分析模型,在一门课中介绍全部是不可能的,透彻的介绍每种方法的原理更是不可能的。基于学生的数学和计算机基础,从实际问题出发,介绍了常用的方差分析,回归分析,主成份分析、判别和聚类分析等方法,以方法综合应用为主,理论为辅,运用SAS软件来实现。在教学过程中采用了以下几个模式,并达到了较好的教学效果。

1 选用SAS软件为课程配套工具软件

在数据分析课程的教学中,算法实现对于本科生来说难度太大,该阶段的学生只学过C语言,很多分析方法如果用C语言来编程完成,难度将无法想象。我们要培养数据分析师,而不是高级程序员。随着统计软件在全球的流行,我们选取了SAS软件作为工具,结合数据分析课程的教学。通过简单的编程即可实现所有数据分析方法,并且应用多样化,功能强大。但由于SAS入手较难,为了不影响数据挖掘可能的教学时间,我们为该专业学生准备了两周实践课程,专门进行SAS的教学,取得了很好的效果。在数据分析课程中,每一种方法只需介绍基本思想,简单原理,计算步骤及SAS系统中对应的模块和程序说明。例如在介绍方差分析时,同时介绍SAS系统中ANOVA和GLM过程,利用SAS软件可迅速得到各种统计量,学生只需通过结果做相关的分析结论,简化繁琐计算,节省课时,提高了学生的学习兴趣。

2 引入合作式教学,加入讨论课模式

数据分析课程当中,理论知识的传授和应用能力的培养归根结底是为了解决实际问题。各种分析算法,软件都是帮助解决问题的一个工具。如何让学生去面临实际问题,并通过收集数据,建立模型,求解模型从而解决问题,这才是我们希望学生真正得到的能力。所以,我们引入的合作式教学模式。每次讨论课给定特定的专题,学生以组为单位收集相关资料数据,并进行问题分析,选定数据分析方法并建模求解,对得到的结果进行相关的解释,最后进行合理性分析。如对某产品在各个超市的销售量的分析,判断地区是否对销售量有影响。整个过程从灌输式的教学模式转变为引导式的教学模式,学生在讨论课当中占据主导地位。在分析问题得到结论后,以小组为单位进行总结汇报,由组外同学进行点评讨论,教师只做启发,指导工作。这种教学模式,不仅大大提高了学生的主动性,调动的学生思维,提高解决问题的实际能力,表达、沟通及团队合作能力,而且课堂气氛活跃,参与面广,讨论中相互发现问题,纠正错误。

3 适当介绍方法产生的背景、原理、重点介绍方法的综合应用

适当介绍方法产生背景和原理,可加深学生对分析方法的理解,深入了解方法的适用领域,所能解决的问题,与实际相结合,从而提高学生的学习兴趣。但我们更应该把分析方法综合应用作为首要教授的方面,即如何让学生把所学的数据方法正确的应用到实际问题当中。我们应该从以下几个方面入手:

(1)介绍分析方法的基本背景和原理,讲清应用范围。教学中,我们可简单介绍分析方法的基本思想和计算方法,但其具体能解决何种问题必须讲清。如:聚类分析和判别分析两类问题,都是用于事物的分类,但两者的本质是完全不一样的。判别分析中的类别是已知的,并且类别的属性或已知,或间接的给出(通过一组已经分类的样本),根据已知的知识对现有未知的样本进行分类。而聚类分析则体现的是“物以类聚”的思想,将相似性强的样本归为一类,其中类别的特点,数量在聚类完成前是完全不知道的。如医生看病判断病情属于分类问题,而对新的疫情进行类别区别则是属于聚类问题。利用实例使学生区分两种方法所能解决的问题以及两种方法所处理的数据的区别。

(2)融入数学建模思想,加强分析方法的应用。每个分析方法从理论到实际应用都需要一个过程。如果将一个实际问题转变为一个数学能解决的问题,就需要运用数学建模的思想,建立数学模型解决实际的问题。如:一个城市的安全程度往往可以通过这个城市的犯罪率来体现,但是犯罪种类之多使得我们无法通过某种犯罪次数来得出结论。这就使得我们要建立主成分分析模型,运用主成份分析方法,将现有的多种犯罪数据进行线性组合,得到几个主要的犯罪指标――总体犯罪率,重度犯罪比例等等。利用少量的指标去体现原来多个指标所体现的大部分信息,达到反应总体状况的效果。通过简单的、学生感兴趣的例子,引入主成份模型的原理,介绍分析方法,使其感受到主成份分析的重要性和必要性。通过各个主成分依次求出,其反应出的总体信息不断加大,还可引入贡献率和累计贡献率得概念,使学生明确如何合理选择主成分。比如当前m个主成份的累计贡献率达到85%的时候,就可认为这m个主成份能够反应总体的绝大部分信息。重点介绍各个统计量在当前模型中的含义,作用及对应关系,使得学生能够使用分析方法在实际中加以应用。

(3)加强介绍方法的步骤、软件实现及结果解释。建立模型后如何利用软件解决模型是学生必须掌握的技术。任何数据分析算法,都不太可能利用人工计算完成。由于我们选取了SAS作为分析软件,所以在课堂中,介绍完原理和数学模型后,都会给出相关实现的步骤。SAS编程相对简单,分析过程大多是PROC步完成,其针对每种分析方法都会有相关的过程函数,并且会有与算法对应的输入参数。学生只要模仿调用相关过程,并对结果进行相关解释即可实现相应分析方法的应用。比如利用SAS程序进行回归分析简单例子:

proc regdata= study.bclass;

modelweight = height /r clm cli dw;

run;

其中,模型参数r表示要输出残差分析,包括因变量的观察值、由输入数据和估计模型来计算的预测值、残差值、标准误差、学生化残差、COOKD统计量等。通过计算可得到各个相关统计量的值,学生无需涉及计算过程,只需知道计算得到的各个统计量所代表的含义,并会对结果进行解释。只有学会对结果的解释分析,才能解决真正的实际问题。

通过教学实践,我认为将统计软件作为配套工具和数据分析方法结合教学,可以起到相辅相成的作用,加入合作式教学模式,开展讨论课不仅学生综合能力得到了提高,而且学生团队合作意识得到了加强。同时,教师必须担任好自己的角色,要精心设计教学中的每个细节,如分析方法原理的引入,讨论专题的选择等,这样才能起到良好的教学效果。

注释

纪希禹. 数据挖掘技术应用实例[M]. 机械工业出版社,2009.

篇3

据国家邮政局数据,2013年“双11”全天共产生订单快递物流量约1.8亿件。对比2012年数据,“三通一达”快递公司流量全部翻倍,日处理量已过千万,却并未像往年出现“快递爆仓”的现象,网购者普遍认为配送效率较高。这其中,大数据应用起到了绝对的重要作用。

一、大数据时代

最早提出“大数据(Big Data)”的是全球知名咨询公司麦肯锡,他们认为“大数据是下一轮创新、竞争和生产力的前沿”,“对于企业来说,海量电子数据的应用将成为未来竞争和增长的基础”。由于大数据具有规模性、多样性、高速性、价值性的特点,使得数据处理工具、处理方式,随着互联网与信息技术的进步,得到逐步发展,同时大数据应用也已经深入到各行各业,从科技到医疗、政府、教育、经济以及社会的其他各个领域。2013年5月召开的“京交会”上,申通快递展示了其最新的“信息化智能平台”。该平台通过对数据的归纳、分类和整合,可以清楚地查看申通网络任何一个网点的经营现状和业务构成等。而在2013年初,京东商城就已启动云计算研发基地,并成立“京东商城――中国人民大学”电子商务实验室,着力电子商务大数据的分析与合作。

二、大数据给物流专业教育带来的机遇与挑战

据规划,菜鸟网络将建成一张能支撑日均300亿元网络零售额的智能物流骨干网络,让全国任何一个地区做到24小时内送货必达。这是大数据在物流领域的一次大应用,这种应用将会改变物流行业格局,势必给各物流运营商带来冲击。所以,物流快递行业必须及时提高企业竞争力度,扩大企业实力,进而迎接激烈的挑战,而一些菜鸟网带来的不仅仅是挑战,还蕴含着有利商机,同时创造大量的就业岗位,带来大量的人才缺口。根据麦肯锡公司的预测报告,到2018年,仅仅美国可从事“深度分析研究”的大数据专业人才短缺就将达到14万~19万人之间。这些人才不但需要掌握着机器学习技术、统计或计算机科学技术,而且还必须能够真正知道如何将庞大的数据信息转化为有意义的商业情报。大数据的价值在于从海量的数据中发现新的知识,创造新的价值。可喜的是,物流快递行业正是一个产生大量数据的行业,在物流快递各个环节中都会产生海量的数据。应用“大数据”技术,通过对其中的数据进行归纳、分类和整合,清楚地分析企业网络任何一个网点的经营现状和业务情况等。然而,传统物流本科教育培养的是更偏向物流系统构建、分析,物流系统运营管理等精英人才。大数据在物流行业的应用产生的物流系统数据分析师对企业的作用将越来越大,这就对物流教育提出了更高的要求。只会IT技术的人才是不能解决物流行业数据处理问题的,大数据需要的是复合型的人才,需要将深厚的技术背景与所在行业和业务领域的需求相结合。物流教育机遇随之而来。

三、我国物流专业教育现状

虽然大数据给物流教育带来了机遇,但当前的物流教育模式,仍然不能胜任,因为我国推行物流教育20多年来,取得了一定的成就,但同时也存在一定的问题。(1)学科建设不够完善。缺乏独立的物流知识体系,很容易造成教学安排的重复,导致教学体系的冗余状态。(2)教育模式陈旧。现阶段的教育模式仍然是重知识传授、轻能力培养,填鸭式教育不利于学生创新能力培养,分析问题、解决问题能力也欠佳。(3)教材杂,不能因材施教。存在相当一部分教材知识出现了重叠问题,很少将物流实践经验技术总结指导来进行教材编写,教材质量普遍较低。(4)课程结业考察模式陈旧。学生只学习教材,容易形成期末突击学习,考完就忘的局面。(5)教学配套实验室建设落后。即使建设了相应的物流实验室,但用于教学和科研的较少,拥有物流省级以上实验室的更少。(6)学术与实践能力并重的物流教师缺乏。由于当前教师都需要博士学位,因此大量年轻教师都缺乏企业实践,对学生培养不利。(7)案例、互动教学少。物流是实践行业,教育应辅以大量案例、互动教学,但当前案例教学大都较陈旧,国外案例不大符合国内实际情况,更多的案例没有能将问题分析透,不能让学生在实际中学习成长。

四、大数据背景下物流专业教育模式

在当前大数据发展如火如荼的背景下,大数据分析处理能力对物流专业教育提出了更高的要求。物流是实践性很强的行业,物流教育也应立足实践。大数据带来的是思维的转变,强调的是创新,是新发明、新服务的源泉。因此物流教育应立足实践并积极创新,其教育模式可适当借鉴国外教育模式。德国模式:德国从人才培养目标、课程体系、师资队伍和实践环节的设计上都以应用型人才培养为基础,对于培养目标而言,培养的人才不仅有系统的科学技术知识,而且具有超强的实际应用能力,学生毕业后能很快胜任大中型企业的技术骨干或小型企业的技术骨干等工作,其课程体系也与企业实际应用紧紧衔接,师资队伍也以双师型(即双轨制)为主,实践环节考核也有严格要求。

英国“工读交替,实践教学”模式:学生先到企业学习,了解企业的需要和自己需要的理论知识体系,再回到学校进行专业知识技术的学习,之后再回到企业进行实践。通过这种形式让学生充分将理论知识与实践技能相结合,毕业时同时具备较好的系统知识与实践技能。高校的培养目标、课程设置等方面均以应用为主,注重产学结合。多数高校与当地的企业形成互利合作机制,系科设置和课程设置按社会需要调整,学校招生人数大都以企事业单位的需要和劳动市场的人才预测来确定。这种人才培养模式不仅为社会培养大量应用型工程师,也大大提高了就业率。美国“生计教育”模式:高校的专业设置、课程设置与社会职业需求紧密关联,使高校教育与社会职业高度相关,高校本科应用型人才培养强调学生在接受教育的同时接受专业知识与技能的培训。人才培养的特点可以概括为:教学方式灵活多样、企业高校合作培养、政府企业支持培养、系统知识与专业技能同时培养。这三种模式总结起来,就是高校教育注重社会需求,按岗位需要来设置知识技能教育体系,注重实践,高校与企业联合培养学生,其毕业后反哺企业,提高实践能力与行业热情。

因此,在当前形势下,物流教育模式可适当做出调整,可从以下几个方面进行转变:

1.明确就业定位。全国各高校的物流专业可根据自身专业优势进行物流人才教育细分,不必全国都培养大致相同的人才。各高校有各自的优势专业,完全可以形成自己的独特优势,进行差异化物流教育。根据定位来设置自己的培养计划,按需培养。

2.加强校企合作。各高校可根据自己情况,加强与企业的合作,细分行业,形成以行业为基础的物流专业特色。同济大学物流工程专业至今已与建材行业、快递行业、快消品行业、电子产品行业等多个行业建立产学研合作基地,通过行业渗透积累科研经验,反哺教学,培养卓越工程师。

3.加强学生实践。在建立的产学研基地中,充分磨合企业需求,为企业提供科研保障的同时,加大学生实践力度,强调学生在实践中学习,在实践中成长。大数据教育靠学校自身是无法完成的,只有将学生投入到企业实践中,从企业获取数据,应用所学知识技能进行挖掘分析,为企业提供决策支持,才是多赢。为此,建议设置两个实习期:大一暑假一至两个月的专业实习,了解企业需求和学生自身所需学习的知识体系;第二个时期为大四上学期,学生学习后再实践,要求能为企业解决一些具体问题,如大数据分析、网络优化、仓库布局及运作优化等。同济大学物流工程专业当前已设置6周的企业实习,全身心投入到具体实践当中。

4.开展校企合作的科研训练计划。建立如全国物流大学生设计大赛类似的训练计划,由企业根据自身情况题目,由学生组队参赛,培养协作意识、动手能力与创新意识,解决实际问题,同时企业也能获得一些“意想不到”的创新想法。学生的毕业论文或毕业设计尽可能安排在企业进行,双导师的培养模式更能让学生快速成长。同济大学物流工程专业的某件毕业论文,将企业的仓库效率提高30%。

5.鼓励教师到企业践习。君欲善其事,必先利其器。只有当教师拥有足够的行业经验的时候,才能更好地减少填鸭式教育,让课堂更生动,提高教学效率,也能为企业解决更多的科研问题,形成紧密的校企合作关系,为学生教育提供更好的资源保障。

6.加强实验室、专业图书馆建设。高水平实验室是科研和教学的必要手段。实体仿真实验器材和软件环境,可以让学生合理地构建自己的物流网络,充分发挥想象力,培养创新能力,也是作为大数据分析的必备硬件。专业图书馆建设也能彰显专业优势,提供科研教学便利。

篇4

关键词:房地产产业;数据挖掘;技术;市场

中图分类号:F293.3 文献标识码:A 文章编号:1001-828X(2013)10-0-02

一、引言

近几十年来,随着社会经济的不断发展,很多的新型产业在不断地发展当中,在这其中,发展最为迅猛的是房地产产业。目前我国的房地产行业已然逐步变成了能对我国社会经济发展产生重大影响的产业部门,房地产产业给企业家带来了巨大的经济效益,增加了国民经济的发展的收入,并在经济发展的过程当中占主导地位,这使得许多的企业家投入房地产产业的投资当中,房地产行业在一时之间商业价值迅速增大,然而伴随着房地产行业的快速发展,我国的房地产行业越来越多的问题被凸显出来,如房屋空置率居高不下,房价增长幅度过快,房地产业投资过度等。而数据挖掘技术中的神经网络模拟法,可以充分对房地产市场进行预测以及分析,并且可以得出可靠的结论,降低问题所引发的风险,这样才能够保障房地产产业能够健康并稳健地发展。

二、房地产行业需要数据发掘技术支持

由于市场的竞争日益加大,很多新型产业由于得到不较为合理的发展需求而一夜倒闭,因此房地产行业想要在日益加剧的竞争中取得胜利,就需要有准确的市场判断与充分的信息支持。行业信息,客户信息以及经济环境等大量的信息数据积累是房地产行业市场运作的主要参考。在面对成几何级数快速增长的庞大数据,房地产行业需要一个可以将庞大数据转化为有价值知识的有力分析数据工具。否则也只是空有丰富数据但是可用信息贫乏的数据坟墓。

数据挖掘,就是一项数据处理的有效工具,它可以从庞大的数据中发现潜在的模式以及关联,并且能有效的进行预测性分析。在一些统计学、人工智能等数据库技术领域有着广泛的应用。数据挖掘有助于充分看清业务发展趋势,最大化的对未来结果进行预测,并且帮助房地产行业所面临的问题分析出解决的关键性因素,使得企业保持竞争优势地位。

三、数据挖掘在房地产行业的应用

数据挖掘技术在众多领域有着广泛应用,且成效卓著,因而逐渐被应用于房地产行业的相关工作和研究。

(一)数据挖掘的概念

数据挖掘是一项针对企业庞大的信息存储进行系统的理解以及检查雏菊的工具。数据挖掘可以根据预先设定的商业目标,对庞大的数据进行分析探索,寻找出数据中隐含的商业经济规律,并且生成相对应的预测分析模型。

数据挖掘由于所发现的都是可执行,可以理解以及目前未知的信息,所以也常常被称之为Knowledge Discovery in Databases即知识发现。与传统的统计分析技术相比较,数据挖掘技术能更好地与数据库进行结合,而且数据挖掘技术中用以发现信息中隐藏的商业规律已经不仅仅局限于统计技术,其中遗传算法,神经网络,自组织图,神经模糊系统等逐渐发展而出。数据挖掘技术发现的信息只是,不仅可以用于预测模型的构建,更可以被统计分析师用以丰富背景只是,然后在适应的时候运用到数据分析中。

描述与预测是一般情况下数据挖掘的两类任务。描述性的数据挖掘任务主要是用来刻画数据库中数据所存在的一般特性。而预测性的数据挖掘任务则主要是以目前的数据为基础,通过不断的推算以进行未来预测。具体来说,数据挖掘技术主要可以处理一下几种问题:

1.关联分析。所谓关联规则,则是在同一件事中出现不同项时,寻找属性间的相关性。例如在某个项目住宅的目标客户对该项目各个方面评价的相关性分析,所寻找的是某些事件时间上的关联,如房地产周期以及该项目的股票涨跌等。

2.预测与分类。分类是根据预设好的标准以及类别,将数据库中所记录的信息进行分类,如根据房地产客户消费决策模式,建立预测模式,为潜在客户的职业家庭,收入等个人属性分类,预测出其在购房方面可消费支出。房地产行业客户可以分为实际客户,潜在客户与购买者,想要如此分类,分类系统则会产生相应的规则:如果该客户愿意并且可以承担每个月XX元的月供,并且在X年内计划在某地区进行购房,他/她则是潜在客户;而进行过至少一次业务询问的客户,则是购买者。

3.聚类。聚类是想数据库整体分成不同的群组,使得群组与群组直接的差别明显化,并且使得同一群组的数据尽可能的相似。聚类与分类看似相同,其实差别甚大。分类是在进行分类之前,以及知道要将数据分成什么性质的哪几类,而聚类则相反。

4.演变分析。演变分析师指数据挖掘所藐视的行为随着时间而变化的趋势以及规律,并且对其分析对象进行建模。如将教育水平发展趋势,社会经济发展以及认购构成变动进行结合,对房地产日后消费趋势进行分析。

5.描述可视化。通过进行空间聚集以及相似计算等一些具体的地理位置聚类概化,形成形象的某区域的描述。

(二)数据挖掘的市场研究价值

数据挖掘的技术运用多方面,在房地产的运用当中有十分普遍,并且数据挖掘技术在房地产市场的使用价值十分高,因此所产生的经济效益也是十分可观的。同时数据挖掘的应用也极其广泛。房地产行业的客户一般具有特征面熟复杂,客户人群数量庞大,需求不一,并且容易受到外界因素影响,所以,数据挖掘在应用当中不是一层不变的,而是它具有多变性以及多层性的特点。合理的应用数据挖掘技术,不仅可以识别客户的购买行为,分析客户的购买趋势以及购买模式,还可以设计出更好的营销方案,较少商业成本,充分满足客户需要。数据挖掘在房地产行业的应用价值详见下表。

(三)在房地产行业中应用数据挖掘技术

随着社会的不断发展,技术的不断创新,房地产的发展迅速,数据挖掘技术在房地产的使用越来越多,在房地产和房地产业的研究方面应用逐渐广泛,为房地产业带来了诸多的产业效益。

1.数据挖掘技术在房地产的应用

数据挖掘技术应用于房地产,具体需要开展以下工作:

明确商业目标。数据挖掘技术应用的首要任务就是必须明确需要达到何种程度的商业目标,以及需要解决的问题。商业目标描述需要尽可能地清晰以及细化,以便选择适合的挖掘方法以及便于对数据挖掘效果的检测,以判断建立的模式是否有效。在实际应用时,就需要数据挖掘工作人员对房地产业的目标有一个整体把握,在目标指导下开展数据收集、分析工作,从而确保房地产朝着前景广阔的方向发展。

数据准备。在明确商业目标的基础上,为了保证所需要提出的数据质量,除了在进行必要的数据修正以及检查,还需要在不同源的数据之间考虑其一致性。如果一段数据中包含过多的字符,则需要找到对模型输出影响最大的字符,适当地减少其他不影响模型输出的多于字符。若是数据集是有许多变量组合起来的,需要选择性的扩大变量范围,形成效果良好的预测变量,因此在准备数据阶段,需要依照实际,考虑是否需要建立新的变量。在房地产中,就需考虑客户、市场消费信息调查数据的重复性、特殊性等问题,确保调查所得数据能够反映真实的市场情况和客户需求,进而做出正确决策。然而某些缺失的数据本身存在有特殊的意义,比如一些富有的客户常常会忽略收入或者是价格的影响,所以对于收集数据要进行适当整理和准备。

建立模型。模型的建立是一个反复完善的工程,并不是一个一次性的工作。选择适合解决某问题的模型,在其建立过程中,可能会对数据产生新的理解,并且修改,甚至改变开始对于问题的设定。大部分的数据挖掘模型并不是为了某个问题而特意设定的,模式之间也不存在于排斥问题,某个模型并不一定是解决这个问题的最好方法。比如:CART决策树以及神经网络既可以帮助分类树的建立,又可以建立回归树。数据模型是房地产市场信息的脉络,课使领导者对于相关信息有一个整体的把握,进而分配各项事务,推动房地产的发展。

输出结果评价以及解释。模型建立之后,还有一项重要的工作,就是解释其价值以及评价其结果。在实际中,应用数据的变化会影响模型的准确率。但是模型选择的正确评价方法并不一定是参照准确度。对模型的评价需要了解错误类型以及产生的相关费用多少。在不同预测错误产生不同代价的模型中,代价最小的模型将是最好的选择而不是出错率最小的模型。

实施。模型在建立成功并且验证通过后,有两种常见的使用方法。第一是给分析师提供参考,由其进行分析查看此输出模型,并且做出方案建议以及解释。第二是将模型应用进不同的数据集合上。正确的输出模型可以标示同一类事例,以及给同一类客户进行打分等。然而在应用模型之后,即使其应用结果很成功,也不能放弃不断监控模型效果。因为一切事物都是在不停变化与发展的,过了一段时间后,很可能随着人们的消费观点以及购买方式的改变,此模型已经无法再进行作用。因此,要随着时间的变化,以及事实结合,对模型进行测试,完善,甚至有些时候需要重新建立更新模型。

通过以上五个具体步骤完成数据挖掘,并应用到实际的房地产工作中,就能实现数据挖掘技术的价值,促进房地产的进一步发展。

2.数据挖掘技术在房地产研究的应用

数据挖掘是进行房地产市场分析和预测的新技术,目前已逐渐应用于房地产业的相关研究当中,但仍有许多问题有待完善。数据挖掘技术在房地产研究的应用主要有以下几个方面:

周期和规律研究。房地产在某段时间、某些特定地区的发展会有波动,通常会以周期的形式出现,有规律可循,这也是房地产商进行投资等决策的依据之一。数据挖掘技术科应用于分析影响房地产波动的周期性因素以及这些因素之间的相互关系。

市场发展趋势研究。房地产业属于市场经济的一部分,受市场的影响很大,包括楼盘供应情况、房地产投资开发、房地产市场的需求、国民经济增长等。数据挖掘技术则应用于相关信息的收集,了解房地产的市场需求,并对市场进行预测和预警,及时采用有效的措施对房地产市场加以有效的宏观调控,促进其可持续发展。

房地产客户和竞争对手研究。研究者通过关联分析和序列分析这两种数据挖掘方法,可了解房地产客户需求及其影响因素,找出客户的消费行为模式,为营销人员提供依据;也可了解竞争对手的信息和发展状况,以便及时进行策略调整。

房地产经济区划的研究。针对房地产经济发展区域分布不均衡现象,研究者应用数据挖掘的比较分析方法对经济区划进行动态分析,及时制定和调整规划。

在我国,数据挖掘技术与房地产领域的结合研究是近几年一个较新的课题,因而还面临许多问题,如国家缺乏数据挖掘技术在房地产应用的具体标准,尚未建立相关的大型数据库,研究的结果的效用不高等等。解决好这些问题,对于房地产业的发展具有重要意义。

四、结束语

综上所述,随着市场经济的不断发展,科学技术的不断创新,人们生活水平的不断提高,新型产业的不断诞生,房地产产业带来的巨大的经济效益已经不容小视,如何才能在社会竞争中,保持房地产效益的增值呢,这就需要研发者精湛的研发技术和市场销售者敏锐的观察力了,数据挖掘技术正是房地产能够保持快速发展的较好技术支持。数据挖掘技术在房地产行业的应用,有利于其把握市场经济动态以及客户购买趋势,使得其利于激烈竞争中优势地位。更能有效的解决快速发展中出现的各种问题,使其服务水平以及营业效率更上一层楼。

参考文献:

[1]陈琳.江苏房地产投资与经济增长关系实证研究[D].江苏大学,2007.

[2]肖建雄.中国房地产业建立战略联盟研究[D].湖南大学,2007.

[3]陈超.我国房价的非理性波动研究[D].东北师范大学,2007.

[4]汤丹花.江苏省现代服务业发展研究[D].江苏大学,2006.

[5]伊元元.LG集团投资房地产的竞争战略研究[D].哈尔滨工业大学,2006.

篇5

【关键词】大数据时代 数据分析 信息安全防护

随着我国网络信息技术不断的发展,当下时代已经成为大数据时代。以往大数据的概念主要存在于物理学领域、生物学领域、生态环境学领域、军事领域、金融领域、通讯领域等,而当下网络和信息业的空前发展使大数据引起了人们的关注。数据信息已经渗透到社会的各行各业,人们通过相关数据信息的发现和利用,可达到增加生产率和市场消费率的效果。但大数据技术收集信息软件给网络用户的隐私带来了问题,网络私人信息的安全防护遭到威胁。因此本文对大数据时代的数据分析与信息安全防护做出相关研究,研究内容如下。

1 大数据概述

大数据主要是指使用常规软件工具无法在规定的时间内对网络往来信息进行捕捉和管理以及处理。大数据时代的主要特点为5V,即数据总量大(Volume)、类型繁多(Variety)、价值密度低(Value)、速度快、时效高(Velocity)。大数据的初始计量单位为P(P=1000T)、E(E=100000T)、Z(Z=10000000T),数据量庞大,其种类包括网络文字信息、音频信息、视频信息、图片信息以及地理位置等,数据种类丰富对数据的处理能力也提出了较高的要求。在大数据中,虽然信息量大,但可利用的信息是有限的,因此,大数据价值密度较低。大数据相对于传统数据而言,需要人们更强的处理信息的能力和速度,对人们的数据驾驭力量提出了挑战。大数据在影响着人们生活方式的同时,还影响着各个行业的发展,大数据的出现也使信息安全面临着一些问题。

2 大数据时代数据分析概述

2.1 抽样量化

在大数据时代,样本就是总体本身,因此在分析某事物的过程中,不需依靠少量的数据样本,而是得到全部的数据。传统的抽样有样本缺乏稳定和随机抽样困难的情况,且在事先设定好了调查目的往往会使调查内容和范围受到人为限制,调查过程中的侧重点也导致抽样数据无法反映总体情况。另外样本量的有限也使抽样结果缺乏精确性,致使错误率的增加,同时传统抽样时间效率和生产率低。

2.2 数据模糊计算

在大数据的影响下,人们接受数据较为繁杂,数据精确性减弱。有数据规模庞大,因此对数据追求精确性的可能性较小,测量数据和调查数据都会因为一些不可控的因素或认为因素致使数据精确性欠缺。大数据时代获得的数据量多,但不精确的数据也在其中,因此对待大数据应该看到其有利方面。数据的不精确也有利于对事物总体的了解,样本的增加使信息更为真实。大数据的不精确是不经意产生的,因此,在需要精确数据的领域还是需要避免不精确性的发生。

2.3 利用数据关系

关注事物的相关性,而不是只追求因果。传统抽样中会预先假定因果,但在大数据时代,数据的复杂和庞大,会导致因果关系复杂化和分析因果复杂化。因此,大数据不不利于追求因果关系,而利于事物相关关系的追求。大数据对数据的分析思路为分析数据相关性,事物关系之间的形式多样化,关系和目的也是根据数据的变化而变化,没有相对较为固定的因果和亲疏关系。

大数据所提供的价值可以让人们预判自己所想知道的事情,比如华尔街利用网络民众的情绪变化进行抛售股票;基金公司根据对购物网站顾客的评论来分析产品销售情况;银行根据网络求职的岗位情况判断就业;投资机构从大数据中查找企业破产的前兆;美国总统团队根据社交软件分析选民喜好。以此可以看出在大数据时代,可利用的数据信息对利用者而言十分重要。

3 大数据时代面临的信息安全问题

3.1 信息安全风险

由于大数据的特点之一为存储信息较为广泛,对信息安全性有一定的影响。大数据信息海量存储技术的成熟降低了信息存储的成本,因此大数据信息处理量显著增加,处理中心分析信息也变得更加容易。大数据信息中心可以根据终端网络用户的行为信息进行分析,然后将结果提供给信息利用者,分析搜索的商品后向你推荐所感兴趣的商品。在移动互联网,终端用户信息被随时采集和存储,造成了信息安全风险。

3.2 个人隐私泄露

有一些网络企业会对网络终端用户的隐私进行搜集。为了赢得市场竞争优势,用户信息成为了企业的发展根据。比如一些智能手机软件会在用户不知情的情况下,对用户使用软件的时间、地点和位置进行信息记录,发送到软件服务器,暴露用户的个人隐私泄露信息。

3.3 安全防护难度

大数据时代由于非结构化的数据类型多、价值密度低,信息量庞大,因此对安全防护技术要求较高,目前我国防护技术还未能够处理大量和多类型的数据,因此数据防护难度系数较高。

4 数据时代面临的信息安全问题的应对措施

4.1 安全技术研发

目前大数据需要能够处理大量和多类型的数据分析技术,以主动发现大数据中潜藏的威胁,比如利用信息丰富开发认证系统技术或建设数据真实分析系统,将恶意信息和无用信息排除在外。

4.2 制定个人隐私泄露保护法律法规

由于大数据是新生事物,因此相关的法律法规存在空白。网络上违法的数据信息行为需要有强制和高效的规则对其进行规范,以保护个人信息的合理利用性。

4.3 提高民众信息安全认知

大数据来源于民众,因此提高民众的信息安全意识,可有效防范数据信息面临的信息安全问题,从而起到维护个人隐私泄露、避免负面影响的作用。

5 结语

综上所述,大数据时代数据分析与信息安全防护具有重要意义,当下网络和信息业的空前发展使大数据引起了人们的关注,数据信息已经渗透到社会的各行各业,数据分析使人们受益匪浅。但大数据技术收集信息软件给网络用户的信息安全带来了问题。比如信息安全风险、个人隐私泄露、安全防护有难度等,本研究作者经过多方面思考提出提高安全技术研发程度、制定个人隐私保护法律法规以及提高民众信息安全认知的解决意见,以促进大数据时代信息安全性的增加。

参考文献

[1]田秀霞,王晓玲,高明等.数据库服务――安全与隐私保护[J].软件学报,2010,21(5):991-1006.

[2]刘小龙,郑滔.一种针对非控制数据攻击的改进防御方法[J].计算机应用研究,2013,30(12):3762-3766.

[3]李峰,李虎成,於益军等.基于并行计算和数据复用的快速静态安全校核技术[J].电力系统自动化,2013,37(14):75-80.

篇6

关键词:大数据;数据分析;统计学

大数据在如今社会已经成为热点词汇,不仅在计算机领域,在其他各个行业都能够得到运用,为各个行业提供便捷,为了让大数据能够得到充分利用,下文将对大数据分析相关方面进行讨论。

一、大数据与大数据时代

(一)大数据大数据是在当今科技飞速发展的情况下,一种新兴的信息数据处理技术。随着社会科技的进步,各行各业对于数据的应用也越来越广泛,传统的数据处理技术耗时较长且精准度较为低下,已经不能满足现代科技对数据应用的要求。新时代的大数据系统具有超大的数据容量,同时兼容半结构化与结构化的数据,远远超出传统数据库管理系统的管理能力。因此新的大数据技术就此诞生。大数据在发展过程中,具有比为鲜明的特点。与传统数据处理技术相比,大数据具有数量庞大、多样化、速率快、价值高的特点。在信息处理的速度不断加快的当今社会,这样的特点为大数据的广泛应用打下了坚实基础。由于数据的数量较为庞大,且各种数据近年来的增长趋势呈指数型,其数据的种类和形式也各有不同。其次,合理利用大数据技术,能够在一定程度上降低成本,提高效率,因此,大数据处理各项关键技术的进一步的开发与利用已成为了提高自身效率,实现核心竞争力的重中之重。

(二)大数据时代大数据时代是指在物联网技术、计算机技术、数据信息处理技术的基础上,通过互联网途径,大量收集并处理分析数据资源,而形成一种新型的信息时代。大数据时代的主要核心内容是对庞大的数据体系进行处理以发挥价值,从而提升数据分析效率以及数据应用价值。大数据时代是由多种信息技术共同组成,可以有效地避免数据处理中不同步、使用不方便的情况发生,具有高效可靠的数据处理、整合、分析及汇总的功能。因此,大数据时代的新型数据处理技术可最大程度的对数据进行分析与挖掘,极大提高处理数据的效率。

二、大数据时代与统计学

(一)大数据时代与统计学的关系统计工作是集数据的搜集、整理、分析和解释为一体的系统的过程。大数据与统计二者互相依存,通过统计的方法和原理对数据进行整理和分析,提高数据的精确度和适用度,以此来实现数据的价值和利用率。由此看来,大数据与统计学的联系既紧密,又存在区别。大数据与统计学的关系甚为密切,它们都是关于数字的学科。统计学为大数据提供了了施展方向,而大数据将统计学引领至更深更广的空间。共性之一就是社会与数据。几乎所有的行业与大数据都有着密切联系,这些联系或直接或间接,而人们正是通过获取数据并进行分析,从而才能得到商业知识和社会服务等能力。大数据与统计学的区别。首先,信息规模不同。大数据的分析对象是与某事物有关联的所有数据,要求数据量庞大。统计学则是用样本来分析和推断总体的数量特征。在大数据时代,则可以通过各种方法和渠道获得全面而又完整的的信息资料,从而完成更多从前无法完成的事情。其次,动静标准不同。数据经过了搜集、整理、分析的过程就很有可能因为精确性不足而被认为失去了用处。而大数据时代,则不必再担心这个问题,数据的精确性和原始性不在被过分重视,人们可以接受复杂数据。第三,数据搜集形式不同。在以往数据搜集形式主要是抽样调查,方法局限。而在大数据时代,特点是信息爆炸和互联网飞速发展,这一情况得到改观。最后,思维方式不同。大数据时代人们的思维发生转变,人们开始更多的关注事物的相关关联。

(二)大数据对统计学研究工作的影响首先,大数据丰富了统计学的研究对象。在大数据时代,我们既可以以结构化数据作为测量单位对文本、图像和视频等进行分析,还可以对非结构化数据实行分析。其次,大数据影响了统计学的工作进程。统计数据需求丰富,原有的统计抽样分析不能在适应时代的发展,而现代科技方法如透过传感器自动收集数据等方法取代了传统方法,更加便捷有效。

三、大数据数据分析理念

(一)统计学的应用随着现代科技的发展,传统的大数据已经不能满足人们对数据处理的要求。传统的抽样数据调查不能满足大数据的数据处理以及知识发现。因此,新技术及思维的引进就显得尤为重要。新的统计学思维以及知识的应用能够很大程度的提高大数据分析的效率。摒弃对传统的小数据样本的依赖,不在用传统的统计工具对数据进行全部分析。而是对数据进行针对性的分析,使数据分析更加精准,并且能够更加全面的体现数据的价值。我们利用统计计算工具对数据进行分析从而判断数据的变化趋势。统计学的应用可以,为数据分析提供科学的参考依据。

篇7

(兖州煤业榆林能化有限公司,陕西榆林719000)

[摘要]随着信息技术的发展与应用,各种数据信息通过互联网、云终端、交际圈、物联网等之间的大规模传递,人类进入到一个大数据时代,数据信息之间的传递影响着人们的决策成本,传统的信息不对等所造成的差距条件已经消失,而不起眼的数据却能够创造巨大的价值。本文对大数据时代背景下数据分析理念进行分析和指导。

关键词 ]大数据时代;数据分析理念;分析

[DOI]10.13939/j.cnki.zgsc.2015.22.074

在传统的商业运作模式中,在运营过程中对自身经营发展的分析只停留在数据的简单汇总层面,缺乏有效地对客户网络、业务范围、营销产品、竞争对手优劣等方面进行深入解析;而在当今大数据时代,通过所接收的大量内部和外部数据中所蕴含的信息中透露的市场弹性,可以预测市场需求,进行分析决策,从而制定更加行之有效的战略发展计划。“大数据”是一个量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。在当今信息时代,很多企业用户在实际应用中把多个数据集放在一起,已经形成了PB级的数据量;数据类型广,数据来源种类多,且数据种类和格式日渐丰富,囊括了半结构化和非结构化数据,早已打破传统的结构化数据范畴,如何在大数据时代背景下进行科学有效的数据分析这需要加强对市场的了解,对泡沫经济的规避,了解数据所传递的信息真假。

1数据化决策的兴起与运用

在大数据时代,信息之间的爆炸增长,使得各种信息传递非常之快,只需要拿起网络终端就可以了解到地球另一边发生了什么。文字、图形、影像都化作数据流在网络中以电信号的方式传递着信息。数据流在传递各行各业的信息同时形成了渗透于各行业的核心资产和创新驱动力。在大数据时代,企业所拥有的数据集合规模及数据的分析和处理能力决定着企业在市场中的核心竞争力。

因此通过数据分析进行决策渐渐成为新的分析理念,例如,在支付宝上进行对电影票房的投资,这些投资通过对导演往期作品和演员的表演张力,及投资方的选角等数据进行分析,预测电影的票房,选取投资可获利的电影,进行票房投资,从而获取票房分红。我国的石油油田根据地震技术的收集数据,进行科学统一规划的分析处理,形成对地下油田的分析建模,能够有效直观地展示地下油藏的分布情况,从而选择油井的开采点。中国人民银行通过对人民币汇率的涨幅,进行数据分析,来制定符合中国国情的外汇货币政策,对货币进行宏观调控,这能够有力的保护人民币升值时,在国际贸易市场中国进出口贸易所面临的压力。在大数据时代背景下,通过直觉和经验进行决策分析的优势不断下降,在商业、政治及公共服务领域中,通过对大数据进行数据分析从而做出符合时代背景的决策,已成了目前的潮流。

2数据分析理念及方法

(1)数据分析要引入统计学思想。在大数据时代背景下,传统的抽样分析已经并不适用于对大数据的分析中,在大数据时代应当要转变思维,转变抽样思想,样本就是总体,要分析与某事物相关的所有数据,而不是依靠少量数据样本,这样才能够在最大限度地明白事物发展变更过程,能够对数据所表露的信息进行更好地处理[1]。要更乐于接受数据的纷繁芜杂,不再追求精确的数据,这并不是说其严谨性降低了,而是往往不起眼,不符合常理的数据更能够反映实际的情况。通过对数据网络之间的联系进行分析,不再探求难以捉摸的因果关系,通过数据的分析处理更能够反应数据的变更。这些想法都与统计学相关通过所收集的数据,进行有效的分类处理,能够更好地反应事物的变化,更有利于做出决策[2]。

(2)数据分析流程。在实际的数据分析过程中,因大数据贯穿区域较广,在地域和行业之间穿插交错,颠覆了传统的线性数据收集模式,而形成了颠覆传统的、非线性的决策基础,这种决策方式要求我们通过对数据进行收集,将各行各业所收集的基本信息,转化为数据,将数据经过初步的整合分类,做出符合当地当时的数据信息,将数据进行深层次的技术处理,将处理过后的信息化为知识,运用到实际的决策中去。在大数据时代,数据的积累并不会贬值,而且还会不断增值,为了更全面、深入地了解研究对象,往往需要对数据进行整合,这就使得数据的积累尤为重要。

(3)数据分析对统计学的意义。在大数据时代背景下数据分析理念能够有效地对数据流进行合理地分类处理,进行科学的统计行为,统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,这就意味着所有有用的数据信息均来源于数据分析处理之后的结果。大数据的数据分析理念扩宽了统计学的研究范围,而不仅仅只是实现数据的对比,而是从根本上丰富了研究的内容,如:一些实时性需求会用到EMC 的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存储Infobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop,满足大多数常见的分析需求,对传统的统计工作有着四个转变。统计研究过程的转变,使统计过程成为收集与研究。统计与分析这部分的主要特点和挑战是分析涉及的数据量大,统计研究工作思想的转变,数据的收集不断增加,信息的录入不断升级,其对系统资源,特别是I/O会有极大的占用。这就使得能够更好地进行数据分析处理决策[3]。

3数据分析过程中注意事项

3.1数据分析要明确变量

将数据收集进行处理是为了明确市场中的某一个变量意义,这就使得在进行数据分析的时候要能够明确地找寻变量存在前后所发生的变化,通过数据对比可以知道该变量在大数据的市场中所存在的影响因素。是否对市场有着风险或有利于市场的开发利用,能够在数据分析后做出合理决策。

3.2统计中不再追求精确的数据

大数据时代下,数据的不精确性不仅不会破坏总体信息可靠性,还有利于进行剥丝抽茧,从而了解总体情况。大数据时代,越来越多的数据提供越来越多的信息,也会让人们越来越了解总体的真实情况。错综复杂的数据能够反映数据之下到底是泥潭还是机遇。数据之间传递的信息良莠不齐,如果要一一追求准确性不利于统计工作的开展,因此可以将个别的异常值剔除。大数定律告诉我们,随着样本的增加,样本平均数越来越接近总体,这就使得样本与总体的差异性很小,更加符合实际情况。

4结论

综上所述,大数据包含结构内外的海量数据,随着云计算平台进行大规模收集处理,通过建立数据库的手段,对数据分流,使用数据挖掘等方法进行处理、分析,使得所数据结果更加符合显示状况。数据分析理念是通过阐明存在于世界、物质、感官享受上的复杂网络关系,从而做出符合时代背景的分析决策。

参考文献:

[1]维克托·迈尔·舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.

篇8

关键词:实践教学 Crystal Reports 数据分析 应用型人才

中图分类号:G642.41 文献标识码:C DOI:10.3969/j.issn.1672-8181.2013.19.087

1 实践教学的分类

目前,高校人才培养目标正在向应用型人才方向转移,比如:独立学院、职业学院以及高职高专都明确提出他们的人才培养目标就是满足社会需要的实用型人才,而实用型人才培养的重要环节是加强实践教学,学生通过大量的实验活动提升自己的理论与实际操作水平。

一般认为,实践教学由基础型、设计型和综合应用创新型等三类各具特色并逐层深化的实践教育方式构成一个完整的体系。

1.1 基础型实践教学

基础型实践教学由基础课及专业基础课中包含的演示型、基础型和设计型实验环节组成,目标在于巩固和提高学生学习的理论知识。

1.2 设计型实践教学

设计型实践教学由专业课中的综合型试验或独立实践课程组成,目的在于进一步提高学生的动手能力、理论联系实践的能力及创新能力。该类实验采用在教师指导下,学生自主选题、自主设计、集体交流,鼓励创新和团队协作等新型实验教学方法,使学生的实践能力有跨越性的突破。

1.3 综合应用与创新型实践教学

综合应用与创新型实践教学以学生参与各项校内外社会活动为主,学生可随不同的指导老师,按兴趣分组,按能力分工,着眼于学生实践能力的综合培养,着眼于潜力个性开拓,着眼于创新精神的激励。努力培养学生掌握企业管理和工程设计的基本方法,实现学生从具备一定实验能力到具有较高实战能力的跨越。

2 Crystal Reports 系统

2.1 Crystal Reports简介

Crystal Reports 是SAP公司开发的、功能强大、动态和可操作的报表解决方案,它能读取多种数据源,在网络环境下设计、开发可视化报表,嵌入到企业ERP系统或普通应用系统中。在Crystal Reports的帮助下,用户能够制作企业OLAP在线分析,进行企业业务,比如财务、生产和销售管理的在线分析,以便指导企业经营工作,全球很多大公司都在选用这个软件。

2.2 Crystal Reports特点

2.2.1 丰富的呈现形式

多种报表样式:普通报表、交叉表和多维报表;

20多种图形:条形图、饼图、曲线图、甘特图、雷达图等,另外提供常用的报表模板。

2.2.2 广泛的数据源连接

提供超过35个数据驱动用于访问任何相关数据源,支持在一份报表中整合多个数据源的能力,包括:ODBC、ADO等数据存储方式。

2.2.3 可视化设计环境

通过拖放元素组成报表,设置标题,自定义变量,整合数据库字段等,有排序专家、分组专家、汇总专家和图标专家等向导。还有强大的公式语言:160多个系统函数,也可以自定义需要的函数。如图1所示。

图1 Crystal Reports的可视化设计界面

2.2.4 多种文件导出格式

如:Word、Excel、HTML、XML、PDF、RTF、CSV、TXT等,方便将信息递交给不同需求的用户。

2.3 学习Crystal Reports软件的好处

对于信管专业的学生,培养目标包括三个方面:第一,掌握计算机科学和管理学的基本知识和技能;第二,具备进行信息系统分析、设计的能力;第三,能进行计算机知识和管理知识的交叉复合应用,能够在专业应用上有所创新。根据专业培养目标,要求信管专业的学生成为进行软件开发,进行OLTP在线事务处理和OLAP在线分析处理的应用型人才。

在企事业单位的数据处理过程中,通常利用大型数据库和大型软件系统来完成相关任务,同时需要进行应用软件的二次开发,比如ERP软件SAP、Oracle应用于企业后需要定制各种财务、生产和销售分析报表,SAP、Oracle的ERP系统本身自带的报表不可能满足所有用户的所有需求,因此这些大型的标准化软件需要系统实施人员进行再开发,而Crystal Reports由于具有上述优点而成为最好的开发工具,所以可以选择Crystal Reports对信息管理和电子商务专业的同学进行相关的系统训练以适应社会发展的需要。

3 利用Crystal Reports 进行实践教学的方法

Crystal Reports既是一个在线分析软件也是一个报表开发工具,因此,可认为属于程序设计科目,我们把它作为理论课程《数据分析与挖掘》的实验部分介绍给信息管理和电子商务专业的学生是因为这门课程的主要内容是介绍数据库的OLAP在线分析和数据仓库的数据挖掘,在进行OLAP分析中,需要利用多维报表工具,而Crystal Reports可以制作多维报表。

从Crystal Reports的特点以及它的应用范围来看,可以把利用它进行的实践活动归类为设计型实践和综合应用与创新型实践相结合的实验项目,所以对同学们要求按照“规范设计,鼓励创新”的原则进行实验活动。

由于《数据分析与挖掘》课程的理论性强、内容多、难度大,所以相关实验采取学生分组进行,每个小组2-3人,明确小组中每人的职责,比如:数据收集、OLAP报表制作、结果分析、报告撰写等工作内容,要求他们齐心协力、通力合作,首先把实验内容和分工情况汇报给实验指导老师,经过实验老师的确认同意后,学生才能继续后面的实验。实验时间除了学院实验室安排的课时(一般在实验专周中的15学时),还可以在实验课后用自己的电脑完成,完成后撰写5000字左右的实验报告,把实验过程完整地记录下来,并对实验提出自己的建议,以便实验老师不断完善实验模式、改善实验指导,使之更符合社会发展和培养目标的需要。

由于Crystal Reports是《数据分析与挖掘》课程的实验项目,所以让同学们接触实际应用案例是首先必须考虑的问题,我们采取鼓励同学广开门路,挖掘数据来源,实行一个案例一个小组,找不到合适数据源的小组可以共享其他小组数据的方法解决数据源和案例问题,经过同学们的努力,收集了10多个企业实际运行数据,由于数据和信息是企业的生命,也是企业严加保护的资源,一般企业不愿提供,因此我们只要求企业过去10年至过去5年的部分数据,并对数据加以删减修改变更,保证企业的数据不泄密,同学们收集到的数据类型主要有Excel、Access、SQL Server以及Oracle等,这些类型的数据都可以被Crystal Reports读取,但是读取之前必须进行ETL的操作,即对数据进行抽取、转换和载入数据库,以规范数据格式,完成数据标准化操作。

实验教师在整个实验活动中除了在实验室向同学们演示Crystal Reports的使用方法外,还必须跟踪同学们的实验进度,加强对实验过程的管理,要求同学们分组用PPT演示稿上台介绍自己的实验情况,让全体同学分享他们的成果,实验老师对同学们完成的实验报告要进行点评,让他们知道自己那些地方做得好,那些地方有欠缺,以便今后改进提高。

4 取得的成果及对实验教学的思考

在经过实验专周的活动后,同学们完成了基于企业经营业务的在线分析OLAP实验,分组提交了各种报告,如图2所示。

图2 学生的OLAP实验报告

从这些报告中,我们可以看出大部分同学完成情况良好,制作的图表美观大方,文本格式标准规范,大家通过实验理解了数据分析与挖掘的基本概念,学会了Crystal Reports的操作方法,能够利用软件工具读取各种数据源,进行数据的OLAP在线分析,按照需要制作标准报表、交叉报表和多维报表,这个过程相当于对应用软件系统进行了二次开发,开发的结果为企业的经营决策提供重要的参考意见,达到了预期目标。

通过这些实验项目的实施,我们感觉到在实验教学应该注意如下几点:

第一,教学思想具备理念新颖性。

教学模式的构建受教学思想的支配,教学思想是教学模式的灵魂和核心,好的教学模式必须以先进的教学思想为指导,体现先进的教学理念。实施新颖的教学思想可以通过向同学们开出现代的、先进的学习科目来实现,比如:数据仓库、数据挖掘等。

第二,教学目标强调技术实用性。

在当今信息技术条件下,应用性人才必须能够将信息技术直接应用于工作实践中。实践教学的目的就是培养学生具备这样的应用能力,而不是简单地对理论的验证或对技术的一般了解,我们向同学们介绍Crystal Reports就是出于提高他们技术能力的需要。

第三,教学内容充分考虑社会适应性。

应用型人才培养是以某一技术领域或职业岗位的能力培养为核心。因此,实践教学的内容必须满足社会适应性的能力要求,同时还要提供适应学生可持续发展需要的能力和素质。在内容体系的组织上,实践教学与理论教学必须相互渗透,理论知识需要通过实践再认识,并通过实践课程来实现。

第四,教学手段突出技术先进性。

当代电子信息技术的快速发展,使得教育技术手段得到极大的提高,先进的教学技术对教学模式的改革起到了直接的推动作用,多媒体技术的普及,使仿真训练等更多地应用于实践教学。比如Cisco公司的Packet Tracer网络模拟仿真软件就是一个非常好的例子,在我们的教学过程中,我们也采用了这个软件向同学们介绍计算机网络知识,效果非常显著。

总之,实践教学需要走不断改革创新之路,满足社会对应用型人才的需求,开辟实践教学的新途径,找出新办法,培养合格的社会需要、国家需要的应用型、复合型人才。

篇9

摘要:随着大数据时代的来临,企业的财务分析活动也出现了一系列变化。而财务数据分析作为企业财务分析的重要组成部分之一,其分析结果的准确度直接影响着财务管理水平。在大数据时代,财务分析等同于大数据分析。本文主要研究了财务分析与大数据时代的关系,并阐述了财务分析未来的发展方向。

关键词 :大数据财务数据财务分析资产

1 概述

财务分析最早起源于二十世纪,至今已有一百多年的发展历史,并初步形成了相应的分析管理体制。财务分析具有很强的时效性,其分析内容应随着经济环境的发展变化而及时改变。随着知识经济时代的到来,大数据被广泛地应用至各个领域,如保险、医疗、信息、航空航天等行业,并取得了良好成效。在财务分析中,大数据技术以其大量化、多样化、快速化优势受到了财务管理人员的一致好评,一方面它极大地提升了财务数据分析和处理的能力;另一方面还提高了财务管理的质量和水平。

2 财务分析与大数据时代

在西方,财务分析已经产生发展了近一百年的时间。但在我国,财务分析只有近十年的历史,各方面还有待进一步改进和完善。自我国改革开放以来,财务分析已受到越来越多企业利益相关者的重视,许多会计专业的相关学科也都增加了财务分析的模块。

所谓财务分析,就是指按照一定的专业方法对会计核算资料和报表资料等进行分析,从而准确评价和考察其经营活动、投资活动、分配活动、盈利能力、偿债能力等的财务活动。财务分析可以为企业的投资和经营发展提供良好依据,使其投资人、经理人、债权人等更好地了解企业的发展历史,并预测其未来发展方向,从而做出科学的决策。

会计技术是制定财务报表的基础和前提,财务报表则是财务分析的基础。管理者可以通过财务分析了解和掌握企业的运营状况,进而制定行之有效的管理制度和政策。财务分析的最终目标是使财务管理人员了解过去的经营业绩和当前的财务管理水平,从而进行科学决策,推动其财务管理的可持续发展。因此,会计技术的发展影响和决定着财务分析的产生与发展。这是一个信息化的时代,云平台如火如荼的进行,大数据概念又横空出世。与云类似,大数据起始于信息化,繁兴于物联网以及社交网络等,因此也带有很浓的互联网口味的技术“迷失在太空”的经历。互联网时代,企业注定是要遭遇一场“数据大爆炸”,尤其是大型公司和互联网公司在经营过程中产生大量的、各种各样的数据,数据量越来越大、数据类型越来越复杂、数据增长速度越来越快。概括来说,大数据除了具有庞大的特点以外,数据变化速度快,种类繁多,较高的准确性也是其主要特征。伴随微博、微信等网络媒体的快速发展,及媒体时代的来临,互联网中无时不刻都在产生大量数据,大数据时代来临已经成为了不可逆转的趋势。这给传统的数据仓库数据处理和分析技术都提出了巨大挑战。

最早提出“大数据”时代到来的是全球著名咨询公司麦肯锡。究出其本质,大数据与其说是一门技术,不如说是新环境下海量数据价值发挥的方法之一。传统企业的财务分析可利用这种方法,去进一步发挥作用。大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、整理成为帮助企业经营决策更积极目的的资讯。在《大数据时代》中大数据指不用随机分析法这样的捷径,而采用所有数据进行分析处理。大数据的4V 特点:大量、高速、多样、价值。

“大数据”在物理学、生物学等领域以及金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算之后IT 行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是最终有价值的资产。一个文化系统可以分为制度、技术和观念三个层面。文化系统的发展经历了制度主导和技术主导两个时期,如今世界正在走向观念主导的新时期发展,各民族文化通过互联网正在不断融合,从文字、服饰到生活方式,民族之间的区别正在逐步变小,在大街上,坐在饭馆里,已经不能很快分辨出不同的民族。大数据时代,需要继续保持传统文化的独立性,就是要让我们的社会和数据打上文化的烙印,要建立属于我们的数据体系系统。

目前,大数据的应用已经渗透至我们生活的方方面面。例如每天,阿里巴巴网站上都会进行大量交易,并产生大量数据。而阿里巴巴可以通过分析商户近100 天内的交易数据和管理信息就可以判断出商户是否存在资金和管理问题,并分析其交易风险系数。一旦做出科学判断,阿里巴巴就会正式启动其贷款平台模式,并积极与可能会有贷款需求的商户进行交流与沟通,并向其介绍阿里巴巴的具体贷款产品,综合分析其贷款倾向。又如,随着微信的兴起和发展,人们的学习生活方式也发生了相应的改变。据统计,每天都有超过几亿人使用微信进行交流互动,通过其记录心情和生活。每天人们都会在微信平台上分享图片、文字、声音、视频等,这就使得平台上充斥着大量的大数据。再如某综合类网站的编辑每天都要考核网站的访问量,并密切关注热点新闻。受此影响,在日常生活中该网站编辑逐渐养成了搜索新闻和风云榜的习惯,并找出一些新颖的新闻内容进行编辑整理并及时至网站上,以提高其点击率。常见的搜索引擎,如百度、谷搜狗等每天都会录入海量词汇,并进行对比分析,选出一部分网民可能感兴趣的词汇进行整理,以更好地满足网民的搜索需要。

以上都是当下大数据的应用,随着大数据的发展和进步,它会在不久的将来得到应用。

一项针对大型跨国公司高管进行的调查结果显示,目前企业中约有超过三分之二的管理人员肯定数据的价值和作用,并将其视作企业发展的无形资产,要求企业妥善利用。这就显示了,在大数据时代企业越来越认识到数据本身价值和从数据中得到价值二者之间的差异,要求进一步深化财务管理体制改革,积极运用各项信息化手段进行财务管理,不断提升其数据分析和处理能力,以更好地适应信息时代的企业财务管理需求,从而有效地增加其竞争优势。数据的分析和利用受各方面因素的影响较大,其分析难度较大,且过程较为复杂。因此,企业必须充分利用手头现有资源加强财务数据管理,不断提升其数据处理和分析能力,保证数据价值的充分发挥,实现其决策的科学化和信息化。

举个例子,保险公司的汽车险,员工可以通过搜罗数据,得到车主的驾车习惯是否良好,驾车时间和路段是否安全,停车的车库的环境等数据,进而降低驾车风险低的车主的保险费用,提高风险高的车主的保险费用,这样便从一定程度上增加了保险公司的收益,保证保险公司的利益。销售公司可以从客户的家庭水电费,煤气燃气费的消费情况,使用的手机,电脑,车子的型号,以及经常出没的餐厅,娱乐场所等信息收集,从而更加了解客户的生活水平,以便日后推广什么水平程度的产品。

要想更好地提升企业的财务管理能力,企业就必须进一步明确财务分析和大数据的关系,统筹兼顾,实现资源的优化配置。众所周知,财务数据是企业最基本的数据之一,其积累量较大,其分析结果直接影响着企业财务管理的最终质量。因此,企业在进行决策分析时,必须坚持客观公正原则,以财务数据为基础,制定明确的分析指标和依据,以保证企业财务管理的平稳推进和运行。

在进行财务分析时,财务管理人员首先应该查找和翻阅当期的管理费用明细,并将其与前一阶段的数据进行对比,找出二者的主要差异,从而找出管理费用的变化规律,最终得出变化原因。在进行原因分析时,财务管理人员可以建立一个多维度的核算项目模型,并在模型中做好变化标记。在整个分析过程中,财务人员往往要花费大量时间用于管理费用核算与验证,同时查找相关资料。在财务软件中,上述系列动作要切换不同的界面。而如果利用大数据技术,只要通过鼠标的拖拽,就可以在短短几秒钟内分析出所有管理费用明细发生在每个部门的情况。

对于企业的决策者而言,通过对财务信息的加工、搜集和深度分析,可以获得有价值信息,促使决策更加科学合理。

3 小结

随着我国社会主义市场经济体制的不断发展完善,大数据技术改善财务管理前景广阔。纵观目前的大数据提供商,主流商务软件厂商都在通过自主研发或收购的方式进入大数据的领域。数据属性的标签是人类经验判断的数据,是数据后的数据。例如,你要为一件物品打标签时,其实就已动用了你的经验数据分析,并进行了归纳总结,结合现下的环境给出了判断。若没有考虑环境影响及准确性的评估,这种经验和直觉的判断是不稳定又难以解释的。但从数据收集的角度去看,数据属性标签又是一个潜力很大的数据。在数据属性管理上,对于用户来说,每个人身上贴的标签是多种多样的,但对于企业来说,如何用一个点去将之串联,如何将这些标签归一,又如何把这些点连接起来去描述这个用户,才是核心问题。

参考文献:

[1]陈友邦,张先治.财务分析[M].东北财经大学出版社,2007.

篇10

分布式数据库系统作为计算机网络和数据库有机结合体,建立计算机信息平台和分布式数据库系统两者之间息息相关,相互作用。然而,网络环境复杂性,加之一直处在开放式状态,致使存在诸多不安全因素,直接影响到分布式数据库系统的安全使用。基于此,文章通过对分布式数据系统的不安全因素进行分析,提出了分布式数据库系统安全防护措施,以供参考、完善。

【关键词】分布式 数据库系统 安全分析

分布式数据库作为一种计算机数据库系统,对计算机数据储存于共享尤为重要。在计算机飞速发展的时代,分布式数据库系统的应用在带来方便的同时,也面临着巨大挑战,必须尽快找出处在不安全因素,并采取相应的安全措施进行处理,从而为用户使用提供安全性保障。

1 分布式数据系统的不安全因素

1.1 黑客攻击

黑客攻击的方法是各种各样的,不仅能够利用网络信息上的“监听客户―数据库服务器―服务器的报文”的方式来窃取数据信息,还可利用用户的口令实施身份攻击。此外,为了达到攻击的目的性,黑客还可通过破译攻击方式,使用密码分析来获取加密文件,再解密或者是篡改数据信息。一般情况下,黑客攻击的目的主要是为了扰乱系统的稳定运行与窃取数据信息,其中黑客攻击的方式包括3种类型:假装攻击、迂回攻击及窃取攻击。

1.2 内部威胁

由于分布式数据库系统终端位置的物理特性分布具有分散性的特点,威胁到系统运用内部本身的安全性,加上它的每一个分站点都会存在薄弱环节,会直接给整个系统运行的安全带来威胁。因此,对于每一个分站点的潜在安全风险引起的问题,都会发出警报,这时必须充分利用网络安全性为系统提供安全防护措施。

1.3 计算机病毒

计算机病毒的发展与网络、自身因素有关,对计算机网络来说,网络环境的开发性加快了计算机病毒传播的速度,难以根除计算机病毒。对计算机病毒本身而言,计算机病毒本身具有传染性较强、隐蔽性良好和传播速度快的特点,在发现病毒的时候通常已经被感染计算机病毒。

2 分布式数据库系统安全防护措施

2.1 建立安全审核系统

在运用分布式数据库系统过程中,应建立安全审核系统,对获得任何时间、用户访问数据库系统具有举足轻重的作用,能够提升数据库系统使用的安全性。并且还应建立相应的用户权限安全性审核体系,用来找出威胁系统安全性的来源,以此建立有针对性的数据库安全防护系统。例如某省公安厅交通警察总队的某个项目中,运用了数据库系统安全审计系统,通过部署数据库审核系统,在不更改业务网络结构基础上,采用旁路镜像方法,实时采集服务器和数据库网络数据流,协议分析和识别信息数据,最终将全部网络操作进行还原,然后记录储存于取证分析操作痕迹,以此提出相应的设定安全策略,审核多个不同的分站点,防止违规操作同时,向管理员报警,从而实现分布式部署。

2.2 净化网络环境

针对上述复杂、开放性网络环境条件下,分布式数据库系统运用中存在的不安全因素,为了降低网络环境的影响力,真正做到安全防范,必须净化网络环境,加强网络管理力度,为系统使用的安全性提供保障。例如某市为了净化网络环境,确保计算机信息系统安全,促进计算机应用与发展,按照《中华人民共和国计算机信息系统安全保护条例》相关规定,结合当地计算机应用情况,明确相关部门工作职责,加强网络管理,收集和通报计算机病毒,对计算机病毒来源进行追查,定期检测计算机病毒,及时消除计算机病毒传播与扩散。

2.3 病毒防控措施

分布式数据库系统内部储存与管理着海量数据信息,都是为了防止黑客利用各种非法手段篡改、破坏和窃取数据库中的文件,为了保护数据库系统中全部文件的安全性与完整性,必须对分布式数据库系统中的数据库文件进行病毒防控,做好相应的病毒预防与控制措施,从而有效降低黑客攻击的威胁性。例如某校为了预防与控制本校计算机感染病毒,维护用户利益,按照国家与公安部门相关规定,结合本校的实情,制定相应的病毒防控措施,要求学校信息化建设和管理领导小组负责病毒预防与控制工作,并成立病毒防控小组,负责监督与指导病毒防控工作,根据有关规定检测计算机系统和软件的病毒,对产生病毒计算机进行清除,并更新防病毒软件,新接入的软件必须经过检测,确定没有病毒后才能使用。

2.4 保密安全措施

用户访问权限在通过一系列身份验证后,分站点和分站点之间才可以进行数据互动。为了确保数据信息的保密性,在数据信息传递的整个过程中,一般会对需要传输的数据信息设置密码,在通信双方建立一条保密通道,对数据信息访问与传输进行加密处理,以此避免数据被窃取、反复发送及遭到黑客攻击。另外,应使用实时入侵检测方式,加大分站点之间的安全监测力度,在通信双方建立一条安全通道,加强数据信息传输的保密性。例如某公司为了确保整个分布式数据系统信息系统中数据信息的保密性,在发送信息数据过程中,使用端对端加密方式对数据信息进行加密,然后进入TCP/IP数据包封装,将其设置成不可识别或者是不可阅读的信息数据,最后通过网络方式传送到另一个用户系统中(目的地),再对信息数据进行解密重组,变成可读数据信息。

3 结束语

在开放式和复杂的网络环境中运用分布式数据库系统时,应充分分析了解不安全因素,通过建立访问控制和审计体系和安全审核系统方式,净化网络环境,实时预防和控制病毒传播,从而做好分布式数据库系统保密安全措施,确保分布式数据库系统安全使用。

参考文献

[1]邹平吉.对分布式数据库系统的安全分析与探讨[J].林区教学,2013(12):98-100.

[2]韩春阳.分布式数据库系统的安全策略研究[J].硅谷,2014(07):164-164,181.