智慧物流的基本概念范文
时间:2023-12-25 17:36:43
导语:如何才能写好一篇智慧物流的基本概念,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
关键词:智慧地球 智慧物流 信息化 现代化 策略
中图分类号:F253.9 文献标识码:A 文章编号:1007-9416(2012)07-0239-01
1、智慧物流的背景
“感知中国”是2009年总理在2009年提出的建设的新概念,在此之前,关于智慧建设的概念始于美国。21世纪实在是信息爆炸的世纪,科技的发展越来越快,科技的应用更加广泛,信息时代的内涵其实依然是科技。信息的爆炸是基于科学技术的发展以及应用。物联网被各国争相作为本国的建设目标,物流作为最早接触物联网的行业,在这个行业里物联网技术的应用也是最早的。现代物流的方向大致要朝着现代化、科技化发展,这是时代要求。智慧物流的研究是属于历史潮流,当然根据物流行业的发展状况,智慧物流自2008年IBM公司提出“智慧的地球”这一概念之后,就越来越受各国的重视,为此中国还将之写入“政府工作报告”。智慧物流的建设是完全符合物联网的发展趋势的,当然物流现代化建设自然是对其城市的经济都是有很大的帮助的,也是未来建设智慧城市的一个方面。
这是智慧物流的大致产生背景,但是不可忽略的一点是,虽然智慧物流已经受到我国政府和企业的重视,但对它的研究仍处于初步阶段,更谈不上体系构建,实施的框架企业和学术界都还未达成良好的共识。
2、智慧物流的概念
智慧物流的概念的提出要最追溯到2008年IBM公司提出的“智慧的地球”这一概念,IBM公司作为一家信息技术研究的公司,它对智慧物流的理解也是建立于信息技术的支撑,所以对于智慧物流的基本概念可以说从运输、仓储、包装以及装卸、加工配送等,整个物流的历程步骤都是以信息技术为基础的,智慧物流是将物流系统的各个环节都纳入信息系统的控制之下,实现系统全面感知,这样就可以及时处理以及进行必要的有效的自我调整,总的来说,智慧物流就是以信息技术为依托,通过系统物流的建设,让物流自动化、创新化、准确化,智慧物流实际上也是现代化综合性的物流系统。
3、智慧物流的基本功能
3.1 智能分析功能
智慧物流的显著特征之一是智慧性,智慧性主要体现在智能分析。信息技术的运用,使得智慧物流能运用智能的模拟模型等各种具有智能性的手段来分析物流。分析物流的各个环节,分析物流过程中出现的突发问题,还可以根据这些问题提出智能化得假设并且通过实践来进行检验,来进行解决问题的一个循环。实际上,智能分析是将理论运用到实践中的一种功能。系统自动调用数据,来解决问题,同时来发现漏洞,达到智慧化的效果。
3.2 感知功能
智慧物流是以信息技术作为依托的物流系统建设的物流系统,通过信息手段将传统物流的每个环节和细节都同时纳入智能系统中,包括物流的运输、仓储、包装、装卸、加工、配送等,物流过程是一个复杂的过程,步骤繁多,任务繁重,仅靠人力的话不可能同时对这些信息进行搜集和整理,而现代化的信息技术就能做到。依靠现代科技,能对物流系统的各个环节进行全面感知,接着再对这些信息进行系统分析,从而能及时处理而且自我调整,实现了物流规划的智慧化。
3.3 优化决策的功能
结合特定的物流要求,智能系统可以对要求和物流企业本身的实际情况进行对比、评估,从物流的成本、时间以及其他的特殊方面和标准要求,来评估风险以及对风险进行预测,这是制定合理决策的前提条件,只有做到对物流项目的详细周密分析,对其风险进行有效预测,才能提出最优的最有效的解决方案。这些决策是经过对物流环节和物流信息的周密分析的,相对于人力的局限性来说,智能系统分析后的方案更具准确性。
3.4 及时反馈功能
这是一个非常强大的功能,对于物流企业来说,信息的及时反馈是关系到物流工作完成好坏的最有效的晴雨表,反馈实现系统修正,还能完善管理,总之它是贯穿于物流工作中的几乎每一个环节,它起到的作用既是细节方面的,但同时也是全局性的。
4、智慧物流建设的策略
4.1 大力推广信息技术在物流企业和物流产业基地的应用
信息技术在建设智慧物流中占据着核心地位,它是智慧物流的内涵。例如传感技术,移动计算机技术,还有智能网络等,通过这些最新的信息技术去建立物流智能管理网络体系,建立智能配送中心等。通过各种技术培育出一批优秀的企业,然后通过示范推广,达到带动整个物流行业的智慧化建设的潮流。其中优秀的企业还可以与外资合作,这样不仅会吸引外资,更能促进物流行业的国际化发展。至于说物流产业基地,我们可以选择设备完善、基础较好的物流基地进行示范性建设,其目的也是达到示范推广,带动整个物流行业的智慧化改革。例如,江苏常州的物流建设,常州目前建立了现代化的亚邦医药物流中心,这是一个典型的智慧化物流的示范基地,两年的物流建设不仅促进了第三方、第四方物流的发展,而且还极大地减少了传统物流在资源上的浪费,有利于常州生态经济的发展。
4.2 对物流行业进行合理的发展规划,制定相关完善的法律法规
如果说进行信息化建设是智慧核心内容,那么对物流行业进行发展规划,对物流行业进行法律规范化是物流行业智慧化建设的保证。例如常州市物流现代化建设的成功范例里,常州市就是物流行业的规范性上做足了功夫,在行业的法律法规上进行了符合现代化物流的政策,这样既保证了建设的成果,又能继续保证后续的发展,有利于整个行业的健康、规范。制定相关的法律制度,营造公平有序的市场环境,还有利于消除由于地理原因造成的市场障碍,使资源达到优化配置;而开放的统一有序的市场,能更好地保护经营者的利益。
参考文献
篇2
【关键词】物联网;发展现状;应用
物联网(The Internet of things)的概念是在1999年提出的,顾名思义,“物联网就是物物相连的互联网”。物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。因此,物联网的定义是通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网相连接,进行信息交换和通信,以实现对物品的智能化识别、定位、跟踪、监控和管理的一种网络。
一、物联网的原理及发展现状
物联网是利用RFID等技术在计算机互联网的基础上构造了一个涵盖万物的Internet of Things。在物联网中物品能够彼此“交流”,借助RFID技术让物品“说话”,借助计算机互联网让物品信息实现互联和共享。在物联网时代,钢筋将与宽带共同构成基础设施,经济管理、社会管理、个人生活将在这些基础设施上运转。
国际上美国等国家都极为重视物联网的研究和应用,美国将物联网作为改变产业模式和结构的法宝,用来提高交互效率。欧盟在物联网研发和应用方面做了许多创新工作,各国都企图在物联网发展上取得领先,获得突破。我国物联网方面的研究并不落后,传感器和传感网已在许多省市获得应用,获得许多新的突破。
二、物联网的实际应用
1.智能环保
随着社会的进步,人们对生活品质的要求逐渐升高,社会对环保的要求也不断升高。为提高环境保护管理水平,环保部门可以利用物联网建设智能环保管理系统,通过建立信息采集网络对环境进行自动监测,对重点单位或是区段实现自动监测并实时传输监测到的相关数据,通过建立环境分析系统和信息平台可以及时、准确的向政府部门和社会环境质量资料或是概况信息。物联网技术可以在智能环保系统中对大气、废弃物、水源、放射源以及噪声等进行感知和管理,提高智能环保系统的工作质量和效率。
具体的设计方案需要利用信息网络技术,使环保信息采集系统和处理平台具备智能感知能力和强大的云计算能力以及数据可视化能力,使环保监控体系掌握环保事件产生、发展的规律,辅助灾害预测等各项决策,形成环境监测、执法、数据交换、应急指挥、办公、教育展示等各个中心整合成一体的综合管理系统。
2.智能物流
RFID技术不需要人工干预便可以识别目标并获取数据信息,操作快捷便利。利用RFID等技术可以实现物流信息共享,保证信息传递准确、便捷,提高运输、包装等物流各个环节的工作效率,实现物流与资金、信息、商流的有效融合,降低物流成本,提升物品生产到消费的整体效益,促进物流业跨越式发展。
目前,物联网技术在智能物流的应用,主要集中在物品跟踪、目录管理、自动接收、自动装运、电子产品码等方面。
3.智能家电
最近几年,我国迎来物联网建设的热潮,随之而来的是智能家电的全新变革。基于物联网技术的智能家电将在物物感知的基础上不断产生新的应用,从传统的播放电视节目向更加智能化、人性化的方向发展。在物联网技术的支持下,电视可以根据用户(例如老人或是小孩)的特点自动选择播放内容,并通过语言合成功能向用户推荐电视内容。与此同时,基于物联网技术的智能家电可以解决控制孩子使用家电的问题,例如电视会在孩子离电视显示屏太近时自动黑屏、暂停播放,在孩子与电视距离合适之后再继续播放,或是家长通过3G网络等途径控制孩子上网或是看电视的时间,由电视在显示屏上滚动提示文字并进行语音提示。
4.金融领域
金融行业的发展需要高新科技的支持,物联网技术能够在改善金融安防等方面得到广泛的应用。金融体系由于涉及资金运作,一直是犯罪案件频发区,物联网技术可以充分发挥物物相连的优势,在节省人力、物力的同时提高安防的效率和可靠性。例如借助物联网技术对来访人员进行管理,实时跟踪并监控、记录来访人员的行为和信息,为侦破犯罪案件提供线索,还可以在现金柜等物品上和库房出入口等位置加装RFID标签或是设备,借助软件平台使资金可视化,并对ATM机进行实时监测,发现异常情况自动上报,以保障资金安全,为公安机关破案提供便利。
金融领域的业务繁多,除了上述应用外物联网技术还可以在支付业务和优化金融服务、保险业等方面得到充分应用。例如基于物联网技术发明的芯片银行卡、金融业务各环节的可视跟踪、发挥信息资源优势提供信息咨询服务以及对投保的汽车安装传感设备来监测、记录其运行状态等等。
5.教育领域
在教育领域,物联网技术可以在信息化教学、教育管理、智慧校园等方面得到广泛应用。在信息化教学方面,物联网技术可以使学生的学习环境突破时间和空间的限制,记录学生学习的对象、学习行为,从而合理调整学习方式和内容。在具体的教学过程中,物联网技术可以强化交互功能,例如在生物教学中可以为植物粘贴相应标签,学生能用手机识别标签获得相应的扩展内容。在教育管理方面,物联网技术可以在人员考勤、设备管理等各个方面得到应用。例如对学生证、图书、设备等粘贴RFID标签,可以实时监控学生的行为、快捷的查找图书、跟踪设备的状态等等。在智慧校园方面,物联网技术可以在校内交通、车辆、校园安全、建筑、生活服务、师生健康等领域得到广泛应用。例如借助光线传感器可以控制教室内光线强度,借助红外传感器可以实时监控校园安全状况等等。
6.农业领域
我国是个农业大国,物联网技术能够在现代养殖业、农作物生长、农产品质量监测等方面得到广泛应用。在养殖业方面,物联网技术可以减少工作量,降低工作难度,提高工作效率,例如项圈式等形式的应答器、个体标识等可以对牲畜、家禽等实现有效管理,减少误操作,提高管理水平。在农作物生长方面,物联网技术可以实时监控土壤、灌溉、气候等情况,收集温湿度、大气、氮浓缩量等信息,提高农作物种植的科技含量,做好防灾抗灾工作。在农产品质量监测方面,物联网技术可以对农产品种植、生长、收获、运输、存储等全过程进行监控,快速监测农产品质量并查出问题所在,例如借助RFID等技术建立的农产品可追溯系统,可以有效保障各种农副产品的质量安全。
三、总结
未来物联网的应用将越来越多地渗透于我们生活的每一个角落,物联网的发展是信息社会发展的必然。尽管拥有美好的前景,但在发展的道路上,也面临标准、技术、产业链等方面的困难,需要社会各个层面在物联网关键技术和业务应用上取得突破,以促进物联网的快速发展。
参考文献
[1]蔡日梅.物联网概述[J].电子产品可靠性与环境试验,2011(01).
[2]李红艳,桂超.物联网的应用及其发展趋势[J].福建电脑,2010(09).
篇3
一、食品区域物流供应链体系
(一)基本内容
在社会经济稳定发展和网络信息广泛覆盖的影响下,食品区域电商取得了良好发展,大众的食品消费结构呈现出多元化趋势,人们对食品的需求目标逐渐从数量需求转变为种类需求,想要待在家中就能够品尝到全国各地的美食,这种现代化消费理念为我国食品区域产业提供了巨大的发展机遇,但同时对于食品区域的安全保鲜、物流运输而言又将面临一大挑战,因此,构建食品区域物流供应链对现代食品行业长效发展十分重要。食品区域物流供应链是一种极具功能性且特色鲜明的产品供应链,包括采购原料、安全加工、物流运输、批发零售等一系列过程,其管理工作主要是对上述过程以及制造商、供应商、零售商之间的合作交流进行组织协调和控制规划,便于快速发现问题并及时解决,保障物流供应链的顺利运行。物流是食品区域物流供应链体系内的核心要素,供应链中各个环节的正常运行都离不开物流的有效作用,物流配送的高效发展不仅有助于维系物流供应链模式的稳定性,还能够为企业收获极高的经济效益,促进物流行业实现进一步的转型发展。
(二)特点分析
处于食品区域的物流供应链体系构建特点较为鲜明,既要优化供应链的资源配置,提高其资源系统效率,还需要保障食品在运输过程中的安全问题,降低各类因素导致的成本消耗,在这种条件下,食品区域物流供应链体系的特点主要包含以下方面:第一,物流供应链具有较高的稳定性。食品区域产业结构简单,各项产业之间都存在较为紧密的联系性,相互可以达成友好合作,从而构成具有一定稳定性的物流供应链生态模式,以增强区域物流供应链整体承受风险的能力。与此同时,食品区域产业并不是一个短期发展项目,它具有长期的、可持续发展的产业规划,这也为物流供应链体系的不断完善与优化提供了较为宽裕的发展时间,由此可见,食品区域物流供应链体系可以与食品区域产业实现、稳定发展。第二,食品区域产业的特征较为突出。食品区域产业大部分是基于当地的美食资源和文化资源所诞生与发展的,因此,区域物流供应链体系在构建中往往会融入地方特色,也更多地服务于地方企业,从而对其物流供应链的运输成本、物流配送渠道造成一定影响。例如生鲜水果等食品资源将会对物流供应链的运输条件提出更高的要求,不同的地理位置和交通环境可能决定物流供应链选择哪种运输渠道,所以不同地区的食品区域产业将形成独具区域特征的物流供应链体系。
(三)现实意义
首先,食品区域物流供应链体系的构建具有突出的成本意识,强调以现代信息化技术为主体的物流信息及资源共享,并且能够借助大数据技术搭建物流供应链体系模型,由此对区域产业相关数据、物流供应链成本变化趋势、食品区域产业市场环境等展开深入分析与评估,从而能够完成对物流资源的合理分配,达到最佳资源配置,以提高物流供应链资源的利用率,最终有效降低物流成本。其次,食品区域物流供应链体系的构建离不开现代信息科技的有力支持,网络信息化平台可以通过共享物流信息实现资源配置,有助于平衡食品区域资源结构不均衡问题,并且现代技术的融入让物流供应链体系打破了传统模式对物流信息传递的限制,逐渐朝着智慧型物流供应链体系发展创新。最后,物流信息错漏或不对等都将严重影响物流供应链的稳定发展,也是触发经济风险的关键性成因,而在信息科技支持下所构建的食品区域物流供应链体系,可以在物流供应链内部实现物流信息和资源信息的动态共享,以组织协调物流供应链的实际需求,强化供应链上下组分之间的合作交流,从而形成良好稳定的物流产业经济生态圈,合力维持食品区域物流供应链的稳定发展。
二、物流供应链体系发展现状
近年来随着电子商务贸易行业的飞速发展,大众消费水平日益提高,其中饮食类消费在大众消费中占比较高,由此促进了大批食品企业的产业规模扩张,部分食品零食个体也越来越多,食品区域产业的这一发展形势对我国的物流行业及相关物流供应链提出了极大挑战。近年来,随着中国特色社会主义现代化建设的持续深入,我国交通道路基础建设得以进一步完善,为物流供应链体系提供了良好的发展空间,因此,我国物理供应链规模在近年内实现了飞速提高,并且根据大数据对我国经济发展状况的综合性分析,物流供应链发展与我国GNP(国民生产总值)之间存在一定的正比关系,人民群众在食品区域中购买力的提高和区域产业发展的实际需求,将推动我国食品区域物流供应链规模的有效扩增,所以在未来几年内,我国物流供应链规模还将呈现快速增长趋势。在新时期发展背景与全球经济一体化形势的推动作用下,我国物流供应链的稳定状态将会受到一定影响,食品区域物流供应链也将面临全新的挑战。因此,物流供应链体系需要加快实现传统产业转型升级,并且应根据食品区域产业的具体情况构建与其相匹配的物流供应链体系,以促进物流供应链体系的多元化发展,这样有利于弥补传统物流供应链的不足之处,并降低物流供应链的风险。与此同时,传统食品区域物流供应链体系比较依赖相关资源的支持,使得资源配置安排对物流供应链发展存在较大的影响作用,只有确保每种资源都能发挥其最大效益,才能有效控制物流供应链中资源要素的成本。而在现展中,信息科技、网络设备与共享经济模式都为物流供应链发展提供了更多渠道,其中物流供应链组网模式的构建不仅可以实现资源配置优化,还有助于降低物流供应链资源要素的建设成本,从而推动食品区域物流供应链体系的可持续、稳定发展。
三、物流供应链体系发展策略
篇4
【关键词】大数据 云计算 物联网
数据空间
【中图分类号】G【文献标识码】A
【文章编号】0450-9889(2013)09C-
0190-03
随着社交网络、移动互联、电子商务、互联网和云计算的兴起,音频、视频、图像、日志等数据正在以指数级增长,互联网的边界和应用范围不断被扩展。据麦肯锡的预测,2010年全球范围内硬盘存储的新数据超过7EB(1EB=10亿GB),而到2020年,全球数据总量将达到约35ZB(1ZB=10亿TB),大数据正以其多源、海量、异构的特性冲击着社会的各个领域,为传统的数据库系统在存储、访问和管理大数据方面带来严峻的考验,无论是在学术界还是工业界,都引起人们高度的关注。
2008年,国际顶级学术期刊Nature以“Big Data”为专刊,讨论了大数据给各个领域带来的冲击和挑战;2011年,国际顶级学术期刊《Science》推出“Dealing with data”专刊,重点探讨了对大数据的处理技术;2011年5月,全球著名咨询机构麦肯锡公司题为“大数据:下一个创新、竞争和生产力的前沿”的报告,明确提出应对大数据快速发展的策略,是第一份系统阐述大数据的专题研究成果;2011、2012年,中国举办了第一届、第二届“大数据世界论坛”,邀请了微软、甲骨文、因特尔等国际资深专家,覆盖金融、电信、能源等各个领域,共同探讨大数据前沿技术与发展态势,以应对持续增长的海量数据;2012年1月达沃斯世界经济论坛把大数据作为主题之一,探讨如何挖掘大数据的商业价值,为企业带来更好的社会效益;2012年3月,美国奥巴马政府耗资2亿美元研究“大数据研究和发展计划”,引导工业界、学术界和非营利机构改进和提高访问、收集、组织大数据的技术和方法。
大数据已经成为一种战略资源,具有广阔的应用前景。为了有效地管理大型复杂的数据和高效提取有价值的知识,还需要进一步把握大数据特性,选择合理的处理方式。
一、大数据的基本概念和特征
(一)大数据的基本概念。大数据是继云计算、物联网后的又一全球热点问题,因其潜在的巨大价值而受到各界的广泛关注。大数据从2009年开始流行于互联网,专家们从不同角度定义了大数据,由于大数据本身具有较强的抽象性,目前还没有一个统一公认的定义。
在早期,著名的Apache的开源项目Nutch用大数据描述用于批处理或分析的大规模数据集。大数据研究机构Gartner将大数据定义为一种具大规模、多样性和高增长特性的信息资产,其结构与现有的数据库处理系统不兼容,需新的并行数据处理平台或技术从大数据中提取潜在有价值的决策、优化信息。《著云台》团队认为,大数据是各种机构或组织在生成或交互过程中产生的大规模半结构化、非结构化数据,需要比关系型数据库有更强的数据存储和计算能力。全球排名第一的企业数据集成软件商Informatica认为大数据包括海量数据和复杂数据类型,其规模超过传统数据库系统进行管理和处理的能力。著名的存储解决方案公司NetApp定义大数据包含分析、带宽和内容三要素,侧重于大数据的实时分析、高速处理和高可扩展性。维基百科则认为大数据是超过当前现有的数据库系统或数据库管理工具处理能力,处理时间超过客户能容忍时间的大规模复杂数据集。
大数据概念上虽然与“海量数据”和“大规模数据”相似,但仍存在重要的差别。在内涵方面,它不仅包含了“海量数据”和“大规模数据”,而且还包括了更为复杂的数据类型;在数据处理方面,数据处理的响应速度由传统的周、天、小时降为分、秒的时间处理周期,需要借助云计算、物联网技术降低成本,提高处理大数据的效率。
(二)大数据的基本特征。大数据通常是指数据规模大于10TB以上的数据集。其特征是具有典型的“4V”(Volume、Variety、Velocity、Value),即规模性、多样性、高速性和价值性。
1.规模性。随着信息化技术的高速发展,数据开始爆发性增长。社交网络(微博、Twitter、Facebook)、移动网络、各种智能终端等,都成为数据的来源。淘宝网近4亿的会员每天产生的商品交易数据约20TB;Facebook约10亿的用户每天产生的日志数据超过300TB;Google每天通过云计算平台处理的数据超13.4PB。迫切需要智能的算法、强大的数据处理平台和新的数据处理技术,来统计、分析、预测和实时处理如此大规模的数据。
2.多样性。由于数据来源于不同的应用系统和不同的设备,决定了大数据形式的多样性。大体可以分为三类:一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;二是非结构化的数据,如视频、图片、音频等,其特点是数据间没有因果关系;三是半结构化数据,如HTML文档、邮件、网页等,其特点是数据间的因果关系弱。
3.高速性。大数据与海量数据的重要区别在两方面:一方面,大数据的数据规模更大;另一方面,大数据对处理数据的响应速度有更严格的要求。实时分析而非批量分析,数据输入、处理与丢弃立刻见效,几乎无延迟。数据的增长速度和处理速度是大数据高速性的重要体现。
4.价值性。大数据中有价值的数据所占比例很小,大数据的价值性体现在从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析,运用于农业、金融、医疗等各个领域,以创造更大的价值。
二、大数据的关键技术
(一)存储技术。随着Internet技术的迅猛发展,各个领域数据急剧增加,目前已达到PB级海量数据,传统的数据库管理系统已经不适应存储数量巨大、形式多样的数据,迫切需要新的技术应对规模急速增长、结构复杂多样的数据存储。为满足大容量存储,需构建分布式存储系统,如当前流行的hadoop海量分布式平台,当数据量增加时,通过增加存储节点来保持数据分布的平衡,保持系统的易扩展性;为存储结构复杂多样的数据,应摒弃当前只针对结构化数据的存储方案,根据不同格式数据选取不同的存储策略。对结构化、半结构化和非结构化的数据可依次采用类似shared-nothing分布式并行数据库系统、面向文档的分布式存储系统、面向文件的分布式存储系统,以兼具多种数据格式,快速应对海量数据统计、查询和更新操作。
(二)机器学习技术。从数量巨大、结构复杂的大数据中挖掘出有用的知识和规律,人工操作已无能为力,必须利用机器学习技术,更深层次智能分析数据,更高效获取数据中隐藏的有效知识。随着大数据时代的到来,文本数据、图形图像数据、网络流量数据等不断涌现,用于处理大数据的机器学习新技术被提出并受到广泛关注。传统的机器学习方法如支持向量机、决策树、贝叶斯、神经网络等,因泛化能力有限,已经不适应大规模网络的快速分析。能同时利用有标记样本和无标记样本的半监督学习技术、整合多个具有差异性学习器的集成学习技术、充分积累历史学习结果的增量学习技术,凭借其对高维采集、查询和存储方面的优势,已被引入到处理大数据的并行技术中,为大数据的研究提供了新的思路。
(三)高性能计算技术。大数据的出现对计算能力的要求越来越高,大容量数据中心维护,并发任务的访问,高速的传输率和各设备间的负载均衡都需要高性能技术的支持,具体来说,在计算成本方面,需采用价格低廉的分布式计算节点,通过大量廉价节点进行并行计算,降低传统计算方式的成本;在计算实时性方面,引入各种高效机器学习算法,同时借助软硬件协同的优势,根据客户的计算任务,快速创建数据、分析数据、计算数据,并给用户提供毫秒级的体验;在数据格式方面,对各种不同的数据要采用不同的格式处理方法,计算难度和开销增大,各种数据平台的兼容和软硬件平台的协同是提高高性能技术的关键之一。
(四)统一描述技术。由于大数据的数据源异构、地理位置分散、表现形式多样,这使得数据间存在不一致性问题。对大数据进行处理的第一步是对不同格式的数据进行统一描述,数据的统一描述有两方面的优势:一是提供统一的数据结构,简化系统的处理复杂度;二是减少系统上层应用程序处理数据的开销。RDF(Resource Description Framework)即资源描述框架在描述资源的一致性方面具有通用性、智能性等特点,但其建模语言不丰富,逻辑推理能力有限,还需要一个具体的语法体系对其进行扩展。为应对大数据,基于本体的数据描述成为研究热点,主要集中在对数据描述的模型一致性、逻辑一致性和关系一致性方面。目前的研究只是在小规模的数据集上得到验证,还未有成功统一描述PB级及以上数据的案例。因此,研究基于RDF的数据描述框架,构建本体元数据模型,并对其进行有效地分层描述,解决格式各异的数据的统一描述问题,对大数据的预处理十分关键。
(五)可视化技术。数据可视化是把数据转换图形的过程。通过可视化技术,大数据可以以图形图像、曲线甚至动画的方式直观展现,使研究者观察和分析传统方法难以总结的规律。可视化技术主要可以分为图形技术、几何技术、图标技术、分层技术等。无论哪种可视化技术,都需与扭曲和交互技术相协同。针对海量、异构的大数据,目前数据可视化研究的热点包括:其一,层次可视化。Inxight公司成功将Hyperbolic tree层次数据处理技术用于解决focus+context平滑过渡难题,并广泛运用于图书分类和目录结构的应用。其二,多维可视化。研究中心Xcrox Palo Alto提出多维可视化结构table lens,由于其对大型数据有很好的适应能力,已使用到相关的产品中。其三,文档可视化。面对纷繁复杂的文档、电子邮件等数据,西太平洋国家实验室提出SPIRE可视化技术,能高效地确定大型文档中文件间的关系,对数据挖掘有极大的推动作用。其四,web可视化。随着Internet的发展,web数据持续膨胀,Chi等人成功地把7000多个节点连接成一棵树形,运用网站可视化变换技术,实时展现网站内容和访问量的变化情况。可视化技术的研究和发展,是实现大数据可视化的关键。
三、大数据的发展趋势
(一)大数据与云计算。为解决互联网应用对大规模计算能力、数据存储能力的迫切需求,云计算的概念被提出。云计算是一种分布式计算平台,通过虚拟技术将海量的硬件资源和虚拟资源虚拟成虚拟资源池,并根据需求任务的大小,向虚拟资源池获取相应的计算和存储资源。在大数据处理的需求下,出现了许多优秀的云计算平台,例如Apache开源的Hadoop、 Google的MapReduce、微软的Dryad等。在处理格式多样的大数据时,云计算能协调组织众节点,提供廉价的资源和服务,具有较可靠的可扩展性和容错性。然而,对于大规模复杂的应用系统来说,云计算还有诸多的技术问题有待深入研究。为应对数据密集型服务,云计算提供分布式并行编程技术、分布式并行数据库技术,可通过开源的编程接口和工具来调用服务,其优势是能高效处理结构简单的大数据,但对关系复杂的大数据的处理,在效率和准确率方面还不能令人满意。
大数据技术的目标是解决应用中多源、异构、海量数据的管理和使用问题,但其本身不具备处理大规模数据的存储资源和计算资源的能力,因此必须在已有成熟的技术基础上,引入新的与之相对应的大数据存储和计算平台。云计算以数据为中心,对大数据集进行处理,并向用户返回高效服务,具有并行化、虚拟化、按需服务等特点。从数据管理角度来说,大数据技术是对数据组织结构的描述,研究重点是数据的查询、更新、索引等操作技术;而云计算则是一种分而治之,按需索取的大数据分布式服务模式。这两个概念提出的背景都是为满足海量异构数据的组织和管理要求。从相互之间的影响来看,前者为后者提供了广阔的应用背景,后者为前者数据管理提供了存储和计算资源,两者相互促进,相互依存。
(二)大数据与物联网。随着智能交通、智能家居、智能物流、智慧景区等应用的兴起,物联网已成为未来经济的新增长点。美国、德国、英国、意大利和丹麦等国家争先推出物联网相关发展策略,使物联网规模不断扩大。互联网到物联网的跨越,极大地推动了大数据的发展。物联网是指把所有物品通过信息传感设备与互联网连接起来,实现智能化识别和管理。它从结构上分为四层,即实体层、感知层、网络层和应用层。其每层都与数据的产生或者处理息息相关。大数据与物联网的结合是机遇与挑战并存。
首先,产生数据的平台多样化。从原来的个人电脑扩展为传感器、智能手机、各种业务系统、平板电脑、监控录像等,这使得感知层需要感知的数据呈现多样化。目前主流的感知技术有视频文字采集技术、红外线技术、传感器技术和蓝牙技术等,但随着感知的数据数量级的不断增加,相应的感知技术也要不断地改进和完善。其次,物联网技术的局限性。事物的发展需要一个过程,处于发展初始阶段的物联网还受到一些技术的约束。在大数据的传输和处理方面,物联网技术还存在通信距离短、外部环境适应力不强、异构网络兼容性差等问题。传感器链接的距离范围是100米到1000米,不适合长距离的通信;当外部的环境发生变化,传感器的稳定性能大幅度下降,对具有高性能计算存储系统的安全带来风险;物联网的标准是建立在广电网、通信网和互联网等异构网的基础之上,还没有统一完善的标准体系。
(三)大数据与数据空间。大数据来自不同组织,它的跨域、分布、异构性以及海量的特点给传统的数据库管理系统带来巨大挑战,目前,管理着世界上最大数据的谷歌、雅虎和微软等公司,都不使用传统的数据管理系统,而是另辟蹊径去寻找可以满足大数据管理需要的技术。M.Franklin等人提出了数据空间的概念。数据空间是M.Franklin等人为应对信息量不断增长以及数据信息管理需求而引入的一种信息管理新概念。
目前关于数据空间技术的研究主要集中在个人数据空间方面,并取得了一定成果。国外的研究工作主要以iMeMex和SEMEx两个个人数据管理系统为代表。iMeMex由瑞士联邦理工学院开发,它推动了信息抽取和查询技术的进步,但缺点是不支持语义查询;SEMEx由华盛顿大学开发,成功把语义关联应用到实例中来高效提取信息。同时,麻省理工学院计算机科学系的David R.Karger等人研发了个人数据管理系统Haystaek,该系统采用了URF(Uniform Resource Identifier)半结构化数据模型统一表示用户数据,体现了数据空间“pay as you go”的数据集成思想。美国华盛顿大学数据库研究组的sharedviews项目实现了名为Homeview的原型系统,该系统能够支持个人动态数据的共享,但数据的类型和共享方式有限。
在国内,数据空间技术已经开始受到广泛关注。中国人民大学孟小峰教授等人对数据空间的概念、实现数据空间支撑平台所需的关键技术进行了详细的阐述与分析,并带领中国人民大学网络与移动数据管理实验室研究团队研发了具代表性的个人数据空间原型系统orientsPac。在综合考虑数据的模型、组织形式和分类方法基础上,提出了与数据相关的eorespaee模型和与任务相关的TaskSPace模型,但该系统的不足之处是用户不能自己定义关联。
综上所述,以物联网、云计算技术作为数据收集、数据管理手段,用数据空间技术来组织大数据,实现多层次、多粒度的大数据挖掘,是处理大规模数据行之有效的途径,也符合大数据管理和服务的需求。
【参考文献】
[1]孟小峰,慈祥.大数据的管理:概念、技术与挑战[J].计算机研究与发展,2013(1)
[2]王涛,余顺争.基于机器学习的网络流量分类研究进展[J].小型微型计算机系统,2012(5)
[3]袁平鹏,刘谱,张文娅,等.高可扩展的RDF数据存储系统[J].计算机研究与发展,2012(10)
[4]孙扬,封孝生,唐九阳.多维可视化技术综述[J].计算机科学,2008(11)
[5]王鹏.走进云计算[M].北京:人民邮电出版社,2009.
[6]宁焕生,徐群玉.全球物联网发展及中国物联网建设若干思考[J].电子学报,2010(11)
[7]A.Halevy,M.Franklin,and .Maier.Principles of Dataspace System. The Twenty-Fifth ACM SIGACT- SIGMOD-SIGART Symposium on Principles of Database Systems, Illinois,ACM,2006:1-9
[8]JP. Dittrich. A Platform for Personal Dataspace Management. SIGIR PIM Workshop.Personal Informat ion Management - A SIGIR 2006 Workshop.Seattle, CM.2006:40-43
[9]L.Blunschi.JP. Dittrich,OR. Guard. The iMeMex personal data space management system. Third Biennial Conference on Innovative Data Systems Research. Asilomar, ACM.2007:114-119
[10]Karger DR,Bakshi K,Huynh D,et al. A customizable general- purpose information management tool for end users of semistructured data. 2nd Biennial Conference on Innovative Data Systems Research. Asilomar ,ACM.2005:13-27
[11] Roxana G, Magdalena B, et al. Home views: peer-to-peer middle ware for personal data sharing applications.26th ACM SIGMOD-SIGACT-SIGART Symposium on Principles of Database Systems. Beijing,ACM. 2007:235-246
[12] OrientSpace[EB/OL].(2013-03-05)[2013-03-05].http:///