云计算与分布式技术范文

时间:2024-01-08 17:45:26

导语:如何才能写好一篇云计算与分布式技术,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

云计算与分布式技术

篇1

【关键词】云计算 数据挖掘 系统设计

随着网络大数据信息处理技术的发展,对数据处理的规模不断增大,对数据信息处理的精度要求不断提升,采用云计算进行数据分布式网格计算,能提高数据的并行处理和调度性能,根本上提高数据的计算速度,因此,云计算成为未来大数据信息处理的主要趋势。在云计算环境下进行数据挖掘,是进行大数据信息特征提取和数据开采的基本技术,相关的算法研究受到人们的重视。

文献采用云计算环境下分布式数据模糊C均值聚类的挖掘算法,在受到较强的毗连特征干扰时,数据挖掘的精度不高。针对上述问题,本文提出一种基于分布式自适应特征调度和高阶累积量后置聚焦的数据挖掘算法,并进行了仿真实验性能分析,得出了较好的数据挖掘效果的结论。

1 基于云计算的分布式数据挖掘算法设计

为了实现对基于云计算的分布式数据挖掘系统设计,其中,数据挖掘算法设计是关键,本文提出一种基于分布式自适应特征调度和高阶累积量后置聚焦的数据挖掘算法,假设数据信息流为,数据信息流通过噪声滤波,得到数据流聚类相似性函数表示为,其是一组准平稳随机的时间序列,对数据库中的存储信息流进行能量谱密度特征提取,得到输出数据x(t)的第n个宽频带分量,分布式自适应特征调度模型表示为:

2 嵌入式Linux的内核下数据挖掘系统设计描述

在上述进行了算法设计的基础上,进行数据挖掘系统的软件开发设计,基于云计算的分布式数据挖掘系统总体模型中,采用ST 超低功耗 ARM CortexTM-M0 微控制器,系统建立在嵌入式Linux的内核平台上,系统包括程序加载模块、数据存储模块、数据缓存调度模块和数据通信传输模块等,通过配置CAN_IMASK寄存器,采用LabWindows/CVI进行数据远程控制和信息通信,基于云计算的分布式数据挖掘系统给用户提供一个简单、统一的系统调用接口,系统可配置4路组联合Cache,基于云计算的分布式数据挖掘系统的寄存器系统时钟120 MHz。嵌入式Linux的内核下数据挖掘系统通过VISA软件接口发送Flash设备上的文件系统内核到HP E1562D/E SCSI数据硬盘进行数据存储,调用s3c2440_adc_read()函数,进行程序加载和基于云计算的分布式数据挖掘系统的嵌入式控制,使用Qt/Embedded作为GUI,利用开源Linux操作系统的丰富网络资源,实现数据挖掘系统的远程通信信息传输和控制。

3 仿真实验

为了测试本文设计的基于云计算的分布式数据挖掘系统在实现数据挖掘中的优越性能,进行仿真实验,分布式数据信息采样的时宽为10 ms, 分布式数据的随机采样率为KHz,调控因子λ=0.25。根据上述仿真环境和参数设定,进行基于云计算的分布式数据挖掘系统的数据挖掘和处理性能分析,首先进行数据挖掘的输出时域波形采样,结果如图1所示。

从图可见,采用本文算法进行数据挖掘的准确度较高,为了对比性能,采用本文方法和传统方法,以数据挖掘的准确配准性为测试指标,得到对比结果如图2所示。

实验结果表明,采用该方法进行基于云计算的分布式数据挖掘,数据挖掘的准确配准性能较好,系统的可靠性较好。

4 结束语

本文提出一种基于分布式自适应特征调度和高阶累积量后置聚焦的数据挖掘算法,并进行了实验分析。结果表明,采用该方法进行数据挖掘,数据挖掘的准确配准性能较好,系统的可靠性较好,具有较好的应用价值。

参考文献

[1]陆兴华,谢辉迪,许剑锐.基于近场通讯和物联网的饭堂自动计价系统[J].智能计算机与应用,2015,5(06):18-21.

[2]童峥嵘,郭尊礼,曹晔,等.小波包变换对CO-OFDM系统高峰均比的抑制性能研究[J].光子学报,2015,44(12):1206001-1206001.

[3]谭营军,王俊平.基于MEACO的无线传感器网络路由光通信算法研究[J].激光杂志,2016,37(02):131-133.

作者简介

李颖(1977-),女,广东省韶关市人。硕士研究生学历。现为广东科学技术职业学院讲师。主要研究方向为虚拟化与云计算。

篇2

关键词:云计算;分布式缓存技术;物联网

中图分类号: TP391.44;TN929.5

多网融合、物物互联、移动互联网对社会的快速发展有十分重要的作用,这就为云计算技术的快速发展创造了一个良好的机会,云计算是指利用网络将所有的计算应用和信息资源连接起来,确保人们能随时对信息资源进行访问、使用、管理。云计算是物联网发展的基础,物联网主要负责解决物与物之间的互联,随着物联网应用的快速发展,产生的数据流越来越庞大,这就需要一个很强的信息处理中心。云计算是一种分布式、虚拟化、并行计算的方法,能极大的提高物联网的计算能力和存储能力,对物联网的发展有十分重要的作用。

1 云计算分布式缓存技术

1.1 分布式缓存的部署方式

分布式缓存的服务器集群主要采用无主架构,由于服务器的节点地位相同,因此,可以利用网状的全连接方式进行连接。为保证系统的使用方便,可以利用API进行数据透明访问,这样就不必掌握数据在后端服务节点的分布情况,就能极大的提高系统的使用效率。由于分布式缓存的数据是均匀分布在集群各节点,因此,当集群中节点数量增多时,集群的数据处理能力也会逐渐提高。分布式缓存还能提供一个操作控制台,人们可以在任意的服务节点登录,查询集群服务节点的数据信息情况,同时人们可以利用操作维护台对分布式缓存集群软件的版本进行安装、更新、配置。

1.2 分布式缓存功能架构

分布式缓存是一个应用程序,能提供多个数据服务节点构成的服务集群和客户端程序库,客户端可以同数据服务节点进行通信,形成服务器列表,并将应用程序提出的存取请求利用路由算法映射在确定的数据服务节点上。数据服务节点可以分为通信支撑层、数据处理层、数据存取层等三部分,通信支撑层主要负责适配通信协议,根据数据处理层中路由链路管理区域的指示进行键链和侦听端口,并且进行底层通信数据包的接收、发送;数据处理层主要由访问控制处理模块、链路管理模块、数据迁移控制模块等部分组成;数据存储层是由内存、硬盘、SSD等进行三级存储管理,内存管理的主要任务是掌握内存的分配效率,同时根据数据访问情况对内存状况进行控制,内存管理还能规避内存碎片的出现;硬盘和SSD存储管理的主要任务是在保证服务器访问功能的情况下,进行永久的数据信息存储。在三级存储管理的模式下,系统能保证当服务节点需要重新启动时,数据存储层的数据不会出现丢失、自动修改等现象。

1.3 分布式缓存的关键技术

1.3.1 一致性Hash及虚节点

一致性Hash的前提是将分布式缓存数据服务器节点和存储数据键的哈希值求出,然后映射在0-232的圆上。根据数据映射在圆的位置,按照顺时针的顺序进行查询,将查询到的数据保存在第一服务器上,如果没有在0-232上找到相对应的服务器,则相对应的数据会保存在第一缓存数据服务器上。如果Hash出现热区现象,系统会以虚拟节点的方式,对过热的Hash区间进行配置,保证过热的Hash在负荷低的服务器节点上运行。由于数据节点服务器的机型不是相同,服务器节点的容量和性能存在一定的差异,同时一个服务器节点可以负责多个Hash区间的运行,因此,这种方式能保证系统的快速、高效运行。分布式缓存平台可以将一致性Hash和虚拟节点的特性融合在一起,并且将0-232的Hash空间分成多个区域,各个区域代表不同的虚节点,由于各个服务器节点的性能有一定的差异,因此,各个区域的虚节点的数量也不相同。

1.3.2 智能路由交换

路由是指在分布式缓存集群中,虚节点在数据服务节点的分布状况。分布式缓存平台能构建一个分布式锁同步系统进行全局路由表存放,全局路由表对分布缓存集群路由的管理有十分重要的作用,只有保证全局路由表的准确性,才能保证智能路由的正常运行。如果需要进行路由变更时,必须先在全局路由表中找到相对应的路由进行修改。

2 云计算分布式缓存技术的优势

云计算分布式缓存的优势在于,分布式架构的扩展性很强,如果发现系统的性能不能满足工作需求,可以在构架中添加新的节点,从而扩展架构的性能。由于分布式架构具有良好的扩展性,因此,分布式缓存的容量可以随着节点的增加而增加。分布式缓存是采用Key―Value的存储方式,缓存的架构和内存访问形式使得分布式缓存性能很高,单个节点每秒能达到20万多次的操作。为防止单点故障的出现,分布式缓存采用多份副本复制的方式。加上分布式缓存采用一致性Hash数据分布算法和无中心化架构,这样可以保证当局部某个节点出现损坏时,不会对整个集群的运用造成影响。

3 云计算分布式缓存技术在物联网中的应用

物联网是无处不在的,它可以让所有物体通过物联网进行信息交换,物联网技术融入了RFID技术、纳米技术、传感技术、智能技术、嵌入技术等,物联网技术极大的改变了人们的生活和工作方式。物联网可以分为传感器网络、信息传输网络、信息应用网络等三个层次,传感器网络是指条形码、RFID、传感器等设备的传感网,主要负责信息的采集和识别;信息传输网络主要负责传输对传感网采集的巨量数据信息进行远距离无缝传输;信息应用网络主要负责数据处理及为人们提供所需的信息服务。

物联网业务网关是实现物联网应用和物联网终端智能连接的桥梁,是物联网正常运行的基础。由于物联网业务网关包含所有设备间数据信息,同时物联网业务网关不仅支持标准协议终端信息的处理,还支持非标准协议终端的业务鉴权,因此,必须保证业务网关有良好的性能。将云计算分布式缓存应用在物联网业务网关中,能有效地提高物联网业务网关的吞吐率,确保物联网业务网关具有高并发处理能力和数据动态迁移能力,同时当服务器某个节点出现故障时,正在处理的事物不会中断,这就极大的提高了物联网业务网关的事物处理能力。

4 结束语

物联网和云计算有密不可分的关系,物联网的发展需要云计算的大力支持,物联网在运行过程中,会收集到大量的数据信息,如果没有良好的数据存储能力和处理能力,就会对物联网的发展造成极大的影响。云计算分布式缓存技术具有容量大、数据信息处理快、反应迅速等特点,云计算分布式缓存技术和物联网的结合能为人们及时、精细的管理物质提供依据,将云计算分布式缓存技术应用在物联网中,能就极大的提高资源的利用率,增加社会生产水平。

参考文献:

[1]高洪,董振江.云计算分布式缓存技术及其在物联网中的应用[J].中兴通讯技术,2011(04):125-128.

[2]秦秀磊,张文博,魏峻.云计算环境下分布式缓存技术的现状与挑战[J].软件学报,2013(01):141-142.

[3]屠要峰.云计算分布式缓存及其应用实践[J].通讯世界,2012(10):117-119.

[4]韩银俊,高洪,郭斌.基于云计算分布式缓存构建IPTV业务平台[J].电脑知识与技术,2011(03):164-166.

[5]赵培,陆平,罗圣美.云计算技术及其应用[J].中兴通讯技术,2010(05):105-107.

[6]饶庆云,丁晶晶,苏乐乐.基于云计算的分布式切图服务设计与实现[J].测绘与空间地理信息,2013(z1):241-243.

篇3

(新华通讯社 北京 100070)

摘 要:云计算环境下,计算机软件系统规模逐渐变得复杂,用户数量逐渐上升,许多用户均为非计算机专业技术人员,安装、运行复杂的计算机软件系统非常困难,因此计算机软件系统架构的发展方向是无需安装、扩展性能高、运行效率快,以便能够使得云计算环境下计算机应用软件得到快速推广和普及。

关键词 :云计算;分布式软件;系统架构;管理系统

中图分类号:TP3 文献标识码:A doi:10.3969/j.issn.1665-2272.2015.15.046

收稿日期:2015-05-16

0 引言

计算机技术、网络技术、数据库技术的快速发展,使得计算机数据处理速度越来越快,并且拥有了数亿T字节的光纤阵列存储器,能够存储海量的电子商务、电子政务、金融证券、通信运营数据,使用云计算技术为用户提供按需服务。云计算技术可以大幅度提高信息化服务能力、共享数据信息服务资源,云计算能够集成分布式计算、移动计算技术,设计与开发大量的云服务应用软件,为用户提供云设备基础设施服务、云计算平台服务和软件集成运行管理服务。

1 云计算环境下分布式软件架构的重要性

目前,随着云计算技术的快速发展和进步,计算机技术、网络技术和数据库技术促进了分布式软件的普及和应用。本文对国内外相关文献资料进行研究,发现许多计算机学者已经开发了ebay、淘宝网、证券交易系统、电子政务管理系统等自动化办公管理系统,提高了人们工作、生活和学习的信息化水平。但是,随着分布式软件的应用和拓展,人们的需求越来越多,分布式软件功能越来越多,规模变得越来越大,逻辑业务处理能力也需要满足越来越快的要求。因此,为了能够满足分布式软件的需求,软件工程师经过多年的研究,提出了软件设计架构的理念,以便能够保证分布式软件具有较高的鲁棒性、健壮性、可靠性、可移植性和可扩展性。

许多计算机学者、软件工程师对软件体系架构进行了研究,但是一直以来对软件架构没有形成一个统一的定义。对于不同的应用软件,软件工程师具有不同的开发目的,软件架构也需要提供不同的侧重点,通常情况下,软件架构可以描述为软件功能、软件交互性和交互模式,因此软件系统架构具有三个非常明显的特点,具体如下:一是软件系统结构在很高层次上对分布式管理系统进行抽象,无需关注系统的具体结构和实现过程;二是软件系统架构需要支持软件系统的具体功能,因此在设计软件架构时,需要动态考虑软件系统的动态行为;三是系统分析员设计软件系统架构时,需要充分考虑系统的兼容性、安全性和可靠性,并且能够支持分布式管理系统运行维护过程的伸缩性和扩展性。迄今为止,分布式管理系统常用的架构包括C/S和B/S体系架构模式,随着计算机技术的快速发展,必将诞生更加合适的软件架构,适应现代分布式管理系统的应用需求。

2 云计算环境下分布式软件常用架构

2.1 两层C/S软件架构应用

分布式软件开发初期,由于网络通信技术不发达,因此人们开发的软件通常采用单机版模式,软件功能较为简单,系统健壮性、可扩展性、可移植性较弱。随着云计算技术的诞生,互联网技术发展较快,传统单机版软件无法联机处理逻辑业务,并且不能够共享数据资源,因此逐渐无法满足人类自动化办公需求。随着云计算技术的快速推广和应用,分布式软件可以满足在线访问、数据共享、联机业务处理等功能,因此软件的功能越来越复杂,并且会在软件运行过程中得到完善,系统架构需要保留强大的可扩展性、可移植性和互操作性。经过多年的研究,许多计算机学者和软件工程师提出了C/S体系架构。

C/S体系架构主要包括两个非常关键的组成部分,分别是客户端(Client)和服务器端(Server),其作为分布式软件早期采用的系统架构,可以为软件工程师提供基本的网络逻辑业务处理功能。客户端的主要逻辑业务是为用户提供一个具有良好导航帮助功能和操作功能的界面,以便用户能够根据自己的需求,操作分布式软件,向服务器端发送逻辑业务请求,并且可以将服务器处理结果展示在运行界面上,以便用户能够进行浏览。服务器端是系统的核心组成部分,服务器包括的种类很多,比如Web服务器、系统数据库服务器、防火墙服务器、应用服务器等,以便能够安全接受、解析用户发送到服务器上的逻辑业务请求,判断逻辑业务请求是否需要数据库进行处理,如果存在,则调用数据库访问组件,以便能够进行插入、删除、修改等更新操作,并且将数据处理结果与应用服务器处理结果集成在一起,反馈到客户端。C/S体系架构如图1所示。

2.2 三层B/S软件架构应用

随着云计算技术的快速发展,移动互联网、无线网络的迅速普及,已经促进了网络用户以数以万计的速度上升。据世界互联网协会统计,目前全世界网民已经达到32.5亿人,其中我国网民已经达到了6.58亿。随着各国政府、企业对云计算软件的推广,信息化系统得到了更多的普及和应用,基于C/S系统的软件需要安装复杂的客户端程序,升级、运行和维护过程复杂。因此,为了能够提高人们使用计算机软件的热情,进一步促进人类社会信息化发展,计算机学者提出了B/S体系架构模式。B/S体系架构模式分为三个层次架构,主要包括表示层、逻辑业务处理层和数据处理层,在具体的分布式管理系统中,表示层关联的内容为用户端浏览器、逻辑业务处理层关联的内容为Web服务器、数据处理层关联的内容为数据库服务器。

(1)表示层:表示层关联分布式管理系统的浏览器,其可以为用户提供与系统交互的接口,并且采用较为友好的操作模式,为用户提供逻辑业务输入、逻辑业务处理结果输出的功能,也就是用户通过表示层输入业务请求信息到逻辑业务处理层,并且可以接受逻辑业务处理层的处理结果,以便能够有效地实现分布式管理系统的功能。

(2)逻辑业务处理层:逻辑业务处理层关联分布式管理系统的Web服务器、应用服务器和通信服务器等,是B/S架构模式的中间层,该层可以解析用户逻辑业务请求,并且查看逻辑业务请求中是否存在数据处理业务请求,如果存在,则可以发送至数据库服务器,由其处理完毕之后反馈给表示层。

(3)数据处理层:数据处理层关联数据库服务器,数据库服务器可以有效地实现数据定义、数据操作等,并且能够将数据库处理结果反馈给逻辑业务处理层,完成分布式管理系统的主要功能。B/S体系架构如图2所示。

B/S体系架构是当前分布式应用系统采用的主流架构技术,分布式管理系统采用该架构时,用户无需按照客户端应用程序,只需要在IE浏览器中输入服务器地址即可登录系统实施各种操作,具有良好的应用性能。因此,本文系统架构设计过程中采用B/S体系架构。

3 结语

云计算环境下,分布式管理软件可以为用户提供更多的服务需求,提高人类信息化应用水平。随着分布式软件功能的复杂化,软件规模逐渐增大,因此为了能够提高软件的便捷性,促进分布式软件更好地进行普及和推广,云计算环境下分布式软件采用C/S架构和B/S架构,可以保持系统强大的可扩展性、可移植性、安全性,提高了系统处理速度和性能,实现数据共享和联机业务处理。

参考文献

1 张鹏飞. 探析云计算体系架构及其关键技术分析[J]. 计算机光盘软件与应用,2014(18)

2 秦秀磊,张文博,魏峻等.云计算环境下分布式缓存技术的现状与挑战[J]. 软件学报,2013(1)

篇4

【关键词】云计算移动综合网管应用

一、移动网综合网管现状

随着3G业务的发展,移动网综合网管起着越来越重要的作用。运营商集团级管理机构除了对各省网络上报的告警进行全网监测以外,还需要对各省上报的话务数据进行整体或局部的分析,以便及时掌握全网用户行为的变化。3G网络中的网元数量远远大于GSM网络,3G网络中的告警数量、网元数量、分析数据激增导致综合网管的数据量越来越大,加上新增PS域的话务及原有2G网络的各类数据,综合网管数据传输和存储的负担变得越来越重。

为了适应新需求网管软硬件需要随着业务量增大不断扩容,这样就出现了一方面网络扩容需要较高的投资和维护成本,另一方面资源利用率又普遍偏低、资源使用又不均衡现象。这种不均衡有的是服务器间不均衡,有的是峰值与非峰值间不均衡,任何一套系统均要具备面对周期性高峰压力的能力,忙时或峰值时的应用需求对服务器配置提出了很高的要求而在非忙时资源又呈闲置状态。在这种普遍存在的既不能满足使用又存在资源浪费的情况下,将所有的计算资源集中起来统一使用,合理分配和利用资源解决现网问题变得越来越突出,云计算虚拟化技术恰恰可以解决这个问题。

二、云计算介绍

2.1云计算的概念

云计算是一种基于互联网的,通过虚拟化方式共享信息资源的计算方式,它融合了并行处理、分布式计算、网络计算等新兴技术和概念,对超大规模的分布式环境提供数据存储和网络服务。

2.2云计算的技术特点

云计算的主要计算方式是面向数值和信息处理的,在数据存储、数据管理、并发控制、系统管理方面都有着独特的技术。其特点主要如下:1.海量分布式存储;2.并行编程模式;3.数据管理技术;4.分布式资源管理技术;5.虚拟化技术。

2.3云计算的优势

云计算采用的分布式计算,与传统计算模式相比具有如下优势:1.稀有资源可以共享;2.通过分布式计算可以在多台计算机上平衡计算负载;3.可以把程序放在最适合运行的计算机上。

三、云计算在移动综合网管中的应用

3.1构建网管云的思路设想

云计算是将所有的计算资源集中起来统一使用,这种使用是通过虚拟化技术实现的。主要思路如下:首先,整合开放测试环境及接口服务器等利用率较低的服务器,将高端服务器划分成多个虚拟服务器,提供给开放测试和接口服务器等使用。这样一方面可以降低采购和维护成本另一方面可以减少闲置资源,替换下的服务器也可派做他用。其次,通过虚拟化技术实现计算资源池化共享。通过资源共享,可以把工作负载封装并转移到空闲或使用不足的系统,从而使闲置资源得到充分利用,提高资源利用率。最后,通过构建云网管平台,可以使业务脱离具体的计算机硬件,维护精力可以重点放在业务创新和业务使用上。

3.2云架构的实施步骤

(1)构建云架构的物理基础,包括服务器、存储和网络设施。(2)数据虚拟化。通过虚拟化软件对物理设施虚拟化,获得相对合理灵活的网络运行环境。(3)操作系统。现在很多虚拟化的厂商都提供云计算操作系统。业界首款云计算操作系统是VMware vShere。(4)数据库和运行环境。云计算和云存储对海量的数据进行处理,传统的有些数据库不适应这种易扩展、易并行的特点可能会逐渐淡出。目前常用的两种一种是Nosql数据库(如Bigtable、Hbase),另一种是并行关系数据库。适应下一代的数据库需要非关系、分布式、水平可扩展、架构灵活、易复制,支持海量数据。(5)中间件和面向服务的架构。中间件(Middleware)属于可复用软件范畴,处于操作系统、网络和数据库之上,应用软件之下。其作用是为处于上层的应用软件提供运行与开发环境,帮助用户灵活、高效地开发和集成复杂的应用软件。(6)自助管理服务。云环境搭建之后,可以将应用程度运行在云上,各省对各自的数据和程度具有控制权。

3.3实施小型云计算系统的方案

从现网的角度来看,目前可以实施的小型云计算系统方案有两种,一种是把云端统一建在全国管理机构,各省的网管系统改造后统一接入云端。这种方案的优势就是设备统一,运维集中,缺点就是全国现有网络改造工程量大,在改造过程中安全系数偏低;第二种就是把云端分别布署在集团和各省,这种方案的优势就是对现网可以平滑切入,对现网改造的工程量较小,接入过程网络相对安全。缺点是投资大。

关于例旧改造问题:云计算的优势就是分布式计算,无论采用方案一还是方案二,对现有设备引入分布式计算模式都是必需的,目前常用的云计算分布式技术主要有如下几个:1.中间件技术2.移动Agent技术3.P2P技术4.网络计算技术5.Web Service技术6.普适计算7.云计算,这些分布式计算技术不论采取其中的哪一种或哪几种,都需要对网管系统的软硬件进行统一资源整合。

关于引入云计算后的安全问题:目前该运营商综合网管主要使用内部专网专用的形式,外部网络的袭击和泄密应该不是主要安全的问题。主要问题应该存在于“云计算”技术本身安全策略或技术没落不到位造成的技术隐患。

四、云建设过程中可能存在的问题及其解决方法

在云建设过程中网络运行是有风险的,需要进行整体考虑。主要侧重以下几方面:(1)计算平台统一规划的考虑。第一步需要统一计算平台,把现有的存储设备、服务器设备、网络等硬件捆绑后进行兼容性测试,由于要考虑设备利旧,在布署前需要统一考虑计算平台的兼容问题,以避免将来出现不必要的麻烦。(2)集成现有资源问题。是否能有效集成现有资源是判断云布署是否高效的关健之一,如果不能有效整合现有资源,不仅会造成巨大浪费而且也违背了云计算的本质。(3)高度虚拟化和资源共享要求的统一考虑。高度资源共享是一个很难的问题,实现高度共享需要高度虚拟化,而高度虚拟化除了服务器虚拟化以外,还包括网络虚拟化、存储虚拟化等,因此在布署之前需要综合考虑现有网络是否具备相应的架构、技术储备、人员条件和基础环境。(4)提升用户感受的统一考虑。根据有些运营商新建的云计算试验网,发现目前的云计算网络在存储能力方面确实有了一些增强,但在用户使用感受方面并没有明显的变化。

五、结束语

当前的云计算已经形成一种蓬勃发展的驱势,小型云计算网络构建将以一种新颖灵活的方式在企业中得到应用。虽然到目前为止,云计算仍然存在着标准不统一、技术不够成熟、异构网络解决问题,但云计算展现出来广阔的应用前景已经得到了业界人士的普遍共识。

参考文献

[1]葛澎.分布式计算技术概述.微电子学与计算机,2012.5

篇5

本期记者走访的是北京友友天宇系统技术有限公司,作为国内企业中为数不多的掌握了云计算平台核心技术的初创公司,友友系统正在产业链中定位自己的方向。

云计算是IT产业的一次大潮。在潮起潮落中,现有的IT厂商都会面临新的洗礼——淘汰者被大潮冲走,一批新的创业者也会涌现。位于北京云基地的北京友友天宇系统技术有限公司(以下简称“友友系统”),就是在云计算大潮下出现的一个新面孔,它随着云计算大潮而生,正经受着云计算市场的严峻考验。

作为云计算产业链条中的一环,特别是位于云计算软件中的最底层——云计算平台,友友系统的产品显得过于专业,也不为人所熟知,但其产品却是构建云计算平台的核心,用友友系统员工自己的话说,就是通往云计算世界的一部梯子。作为国内为数不多的掌握云计算平台核心技术的国产厂商,友友系统周围强手环伺。友友系统如何定位自己在云计算世界中的角色,其产品又怎样应对市场需求?日前,本报记者就相关问题独家专访了友友系统的创始人之一、友友系统CEO姚宏宇博士。

发现云计算技术本质

关于云计算的定义几乎每个人都有自己的理解。姚宏宇认为这并不奇怪,因为新的技术变革必需经历这一过程,就像之前的分布式计算、网格计算甚至互联网一样,假以时日,人们的意见必然会趋同。

“云计算是一种商业模式,也是一种技术进步。”他说,对云计算的理解可以分为两个层面:从商业模式的角度看,云计算是互联网模式的延伸和发展,它把互联网的服务从原来的信息服务延伸到硬件资源、软件资源以及所有跟IT相关的东西。“我把云计算叫做Internet 2.0。从服务模式来讲,云计算与互联网的本质一样,都是通过互联网交付服务,只是云计算把这个范围扩展得更大。而从技术角度来看,云计算无非是把很多不同种类的、分布在各地通过网络联接起来的资源结合起来,这个结合体叫做‘云’。”

集群计算、分布式计算、并行计算、网格计算是一些技术人员谈到云计算时总会提到的概念。姚宏宇认为,这些概念相互之间存在着密切关系,并行计算和分布式计算等很多概念都是从最早的集群技术演化而来的。

在计算机科学的发展过程中,大规模计算有两种不同的发展理念,一个叫“Share everything(一切皆共享)”,一个叫“Share nothing(一切皆独享)”。第一个理念的代表是并行计算,其具体实现就是超级计算机,超级计算机的存储、内存和CPU都是共享的,比如CPU可能有几千个,但从操作系统层面看就是一个CPU。这一技术路线下的产品商业应用范围较窄,主要应用在特定领域,对社会和商业影响较小;第二个理念的代表是分布式计算,这种系统中每个节点都是一个独立单位,每一个小单元完全可以自己做计算,能完成所有计算机该做的操作,目前的计算机应用系统基本都是这一体系下的产物。

不过,上述这些理念和发展方向最终都能通向云计算。云计算的本质就是能够通过分布式计算、集群计算、网格计算等技术把各种资源有机地结合起来,让外面看到“云”,而不是看到很多小的计算机节点。同时,无论“云”里发生什么事情,上面的业务系统都不会受到影响。这就意味着这个云要足够大、足够有弹性。“而友友系统的核心技术就是实现资源整合,特别是数据资源的整合,并且屏蔽掉过程中的技术复杂性。”姚宏宇说。

打造云计算操作系统

创立之初,友友系统给自己的定位是基础软件的技术提供商,后来又进一步明确为云计算平台技术供应商。“尽管不敢说是IBM和Oracle的竞争对手,但是友友系统与它们的产品的确处于一个层面,而和国内绝大多数IT公司不一样。”姚宏宇坦言,由于技术的专业性,要想跟普通大众描述清楚他们是做什么的,并非易事。

姚宏宇把自己的产品归为云计算操作系统。他说,从传统的IT架构来说,友友系统的产品属于中间件,位于操作系统之上、应用系统之下,因此叫云计算中间件比较合适。但中间件这个名字对中国人而言含义并不明确,而命名为云计算操作系统是因为其产品之于云计算整体架构的确如同传统计算机系统中操作系统的作用一样。“当然,我们提出云计算操作系统概念不是从传统IT架构的角度出发,更多的是考虑到面向未来。”

姚宏宇解释说,一台计算机包括一个CPU、一个内存、一个磁盘外加一个外壳,这就是冯·诺依曼计算机的典型结构。如果设想这个计算单元分布在1万台机器的CPU上,是由几十个计算节点组成的一个整体,用各种友友系统的软件对这个“超级计算机(云)”进行管理,那么这个软件就是云计算操作系统。因为业务系统是架在友友系统的软件之上的,下面则面对单机的操作系统和硬件,对业务系统来说其下的整套东西就相当于一个虚拟的计算机。从这个角度说,友友系统的产品和普通计算机上的操作系统所做的工作是类似的。

不过,云计算操作系统毕竟不是我们常见的操作系统,而今称为云计算操作系统的也并不多,主流的包括VMware的vSphere和浪潮的云海OS等。那么,同为云计算操作系统的友友系统CloudWare到底有何不同?

在姚宏宇看来,大家的方向基本一致,但与VMware和浪潮的云计算操作系统侧重于虚拟化和对虚拟化环境的管理不同,友友系统的云计算操作系统更侧重于资源的集中和整合。“我觉得云计算最终目的是,前台无数端,后台一片云。”姚宏宇说,云计算操作系统的作用就是能够把这一片云管理起来,让端都认为后台真的是一片“云”,前台需要的东西后台通过统一标准的接口可以提供。从技术上说就是,这个云计算操作系统能为前台提供一套SDK或者API。它能够把后台所有的分布资源管理起来,让前端认为后面就是一台机器,这个管理体系就叫做云计算操作系统,虚拟机的管理只是其中的一部分。

研发五大核心产品

友友系统的云计算操作系统并不是一款单独的软件,而是由友友系统的一系列核心产品构成的。姚宏宇把这些产品分为两个层次:位于核心底层的Bitsflow、NetVM、DataCell;在其之上的平台产品智存、智维,它们都具有自主知识产权和核心技术。其中,Bitsflow主要负责大规模分布式系统之间的通信和协作,是一个高容错、高性能的数据交换和应用协作平台;DataCell是一个用于海量数据的分布式存储系统,也叫云存储;NetVM是一个分布式管理系统及分布式计算开发框架,相当于三个产品中的总调度。

“这三个产品相当于三个引擎,就如同Linux内核一样,用于支撑之上的两大平台级产品,分别是智存和智维。”姚宏宇介绍说,智存主要针对对象和文件存储,类似文件系统;智维用于进行大规模系统的运维和管控。”姚宏宇说。

值得一提的是,所有这些产品中负责网络通信的Bitsflow是基础,也是友友系统区别其他云计算公司最大的核心竞争力。姚宏宇把云计算的技术路线分为三类,一类是以存储为核心,以Google为代表;第二类是以虚拟化为核心,以VMware为代表;第三类是以亚马逊为代表的混合体。而友友系统选择的技术路线区别于以上三者,友友系统是以网络通信为核心,这也是姚宏宇看重Bitsflow的原因所在。

“以网络通信为核心,这是基于我们多年来一直专注大型分布式系统研究的结果。”姚宏宇解释说,“所谓分布式系统是基于网络有延迟这个前提的,如果网络无限快,它就不是分布式系统了,而是一台超级计算机了。我们的工作就是努力管理好网络层,这就相当于缩短了分布式系统中各个模块之间的距离,这是我们公司整个技术的理论基础。”姚宏宇说,正是由于选择了这样一种技术理念,才使友友系统解决了分布式系统的协同和数据交换问题,大大简化了其它后续产品研发上的技术挑战。

姚宏宇坦言,由于产品的专业性,特别是专注在云计算的底层,而且解决方法又有别于传统技术,使得他们的产品在推广上遇到的第一个难题就是如何向客户说清楚他们的技术究竟是什么。不过,他遇到的最大挑战还是市场不成熟。比如在解决海量数据的整合时,人们更倾向于传统的基于数据库的各种集成技术,而没有想到或者还不太认同友友系统提出的解决方案,尽管友友系统的方案实现成本更低、上线更快。

“好在技术和成本优势明显,口碑正在逐步建立,这几年项目也渐渐开展起来,尤其在金融、电信、电力、政府、互联网、教育等领域,我们每年的进步都非常明显。”姚宏宇表示,未来友友系统的重点是继续培育市场,同时完善自己的产品。他说最大的愿望是有朝一日用户能像认可关系型数据库一样认可友友系统的技术。

创业者档案

姚宏宇,1988年考入中国科技大学少年班,1993年赴美留学,先后获威斯康辛大学麦迪逊分校计算机和材料系的硕士及博士学位。自2000年起在硅谷从事大规模企业软件和互联网技术的研究、开发和管理工作。曾任美国雅虎研究院高级研究员、美国SideStep公司资深管理人员及架构师等。2007年在北京创立友友系统, 并担任公司总经理。

记者观察

自信源于对技术的准确把握

采访姚宏宇后,有几个印象深刻。第一是他的技术背景,第二是他对市场的把握,第三则是友友系统的商业模式。

外界一提起姚宏宇,往往要说他在科大少年班求学、美国攻读技术专业、随后在雅虎工作。涉及到姚宏宇技术背景的部分,往往语焉不详。姚宏宇说,正是由于在雅虎的一段经历,才让他真正了解到互联网的魅力和最新技术发展趋势。所以,在采访中,他一再把云计算和互联网相比较,坚信云计算是“IT行业真正的一次新技术变革,将产生无法想像的影响力”。他也坚信,“产品叫不叫云计算都无所谓,我们做的就是与大数据、大系统有关的事情,只不过现在赶上了云计算热潮。”

他的这种自信源于技术,而非概念炒作。

由于重视技术,友友系统成立几年后,一直在做研发,并没有将精力放在市场推广上。“现在大多数情况是用户提出需求后,其他公司做不了,才找到我们。”姚宏宇说,一是技术满足用户需求,二是大幅度节约用户投资,最多能为用户减少60%的投资。所以从供需关系看,潜在市场较大。但用户也有担心,因为技术太新,现有产品解决不了的情况下,只能抱着试一试的态度采纳友友系统的方案。这让姚宏宇不得不一次次给用户阐述技术。

篇6

处理非结构化数据

在数据库应用中,经常会涉及全文文本、图像、声音、影视、超媒体等信息类型,这些信息的字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成,这就形成了典型的非结构化数据。在企业中非结构化数据主要有办公文档、披露的信息、Web的页面,以及工作中一些培训、宣传、监控用到的多媒体信息等。

如今,非结构化数据处理越来越普遍,而非结构化数据的处理也成为关系型数据库面临的一个很大挑战。一般而言,非结构化数据的组织主观性比较大,缺乏统一的规则,处理起来难度大,然而,非结构化数据越来越普遍,促使各关系型数据库厂商不得不对其产品进行拓展而使其具备管理非结构化数据的功能。

目前,主流的关系型数据库,包括Oracle、SQL Server、Sybase、DB2都或多或少对非结构化数据类型提供了支持,如SQL Server 2008中引入了文件流fileStream技术,支持非结构化文档的存储、查询和检索。Oracle数据库则采用大对象BLOB技术存储非结构化数据。面向对象的数据库中还有一个典型代表是Cache数据库,在非结构数据的支持上走得更远些。

云计算与分布式数据库

数据海量、类型复杂、响应速度要求高,这些都对现有数据库构成挑战。实际上,无论是内存数据库还是基于存储的数据库,当前的这些主流数据库都很难支持面向特大型非结构化数据的应用系统,而随着分布式计算、云计算技术的发展,数据库找到了一种应对办法,这就是数据库的分布式实现。

分布式数据库是从数据库与服务器组合关系来说的,它由若干个站集合而成,这些站又称为节点。分布式数据库系统通常使用较小的计算机系统,由多个计算机组成,每台计算机中都有数据的一份完整拷贝或一个分片,计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。Oracle的并行数据库RAC就是一种分布式数据库,它的核心技术正是分布式计算。RAC共享了多种资源,采用统一的数据库命名空间和一套共享的存储。同样,GreenPlum也是一种分布式数据库,它实现了简单的共享,共享的内容是管理节点和数据库命名空间。

严格说来,分布式数据库并非因云计算环境而生,但却很适合云计算环境下的需求。这是因为云环境下要求数据库具备很强的横向扩充能力,这就要求节点之间尽量减少共享,而采用节点的分片技术来并行处理是解决办法之一。

云计算技术的一个重要内容是任务的分解和结果的汇总,然后通过后台的并行计算来完成大规模的处理。对于具体行业来说,云计算平台软件、虚拟化软件都不需要自己开发, 但面向特定行业的大规模数据处理应用软件没有通用的产品,需要针对特定的应用需求专门开发,其中会涉及诸如并行算法、索引查询优化技术研究以及系统的设计实现等。例如,提出云计算的Google公司为实现其搜索服务,专门设计了新文件系统(GFS)和存储库(Bigtable),采用调度器(Scheduler)的主从调度技术将存储信息和任务分片(Sharing),并采用映射归约(MapReduce)处理技术,从而实现了对网页的存储检索,最后将一个大型的数据库分成多片,调度器(Scheduler)负责任务分解,将结果分拆给节点。每个节点负责一个数据片,负责完成数据库的基本功能(插入、复制、查询),并把结果传给上层的调度器,从而使数据处理达到横向扩展(Scale Out)的能力。

在 RAC中,命名空间是一个逻辑概念,不会导致资源瓶颈。RAC数据库本身是一套基于磁盘的数据库,其服务器节点的磁盘操作、没在内存缓冲区的磁盘读写操作都需要共享的磁盘来完成,因而统一共享的存储是RAC的资源瓶颈之一,而RAC的性能瓶颈还会体现为后台磁盘的I/O瓶颈。Oracle推出的一体机Exadata,其中一个重要的特点是采用并行计算的存储服务器和闪存,以提高存储的I/O能力。在其满配的一体机中,数据库服务器有8台,存储服务器为14台,可见一体机设计中对存储I/O的偏重。

在GreenPlum体系中,在主机上规划查询项目,并将其分成若干部分在节点上并行执行,所有通信功能都在一个高宽带网络互连体系上实现。这种体系下每个节点都有一个通往本地磁盘的独立高速通道,因为没有共享存储,存储和节点都有很强的横向扩展性能力。

云环境下的数据库架构设计

基于云计算对灵活性和可扩展性方面的要求,云计算下的数据库可以使用多个分片数据库并行处理,来形成一个超级大数据库,这个数据库共享的组件尽量少,因而不太适合共享存储。而随着虚拟化技术的提高,特别是虚拟机的性能损耗符合一定要求时,分片数据库也可以架设在虚拟机上。借组云计算的资源调度技术,这样一个可伸缩的并行数据库可以在云计算环境中形成(参见附图)。

值得一提的是,云计算的发展使得数据库的扩展更为简单可行。其中,云管理平台负责资源的监控、自动调度,当查询类并行数据库的性能不足的时候,云管理平台可以自动为虚拟机(VM)增加资源,或通过增加新的虚拟机(VM) 来增加并行数据库的处理能力;而当系统面临的压力减少时可以通过减少分片处理数据库来减少资源需求,或通过减少所在虚拟机(VM)的资源。当然,这就要求查询类并行数据库的管理主机能感知资源和分片数据库的变化,而重新分配处理任务。

篇7

关键词:云计算;信息技术;IAAS;OpenStack;公安网

一、云计算的综述

(一)云计算的概念

云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云计算(Cloud Computing)是网格计算(Grid Computing )、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。

中国网络计算、云计算专家刘鹏教授对云计算做了长短两种定义。长定义是:云计算是一种商业计算模型。短定义是:云计算是通过网络按需提供可动态伸缩的廉价计算服务。

(二)云计算的原理

原理是通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。

云计算按照层次将业务模式划分为3层,最顶层是软云,中间层是平云,底层是基云。在基云之下是构建云计算的基础技术。

(三)云计算核心技术

云计算系统运用了很多技术,其中以编程模型、数据治理技术、数据存储技术、虚拟化技术、云计算平台治理技术最为关键。

(1)虚拟化技术

虚拟化技术是指计算元件在虚拟的基础上而不是真实的基础上运行,它可以扩大硬件的容量,简化软件的重新配置过程,减少软件虚拟机相关开销和支持更广泛的操作系统方面。虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等。在云计算实现中。计算系统虚拟化是一切建立在“云”上的服务与应用的基础。

(2)分布式海量数据存储

云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式(集群计算、数据冗余和分布式存储)保证数据的可靠性。

(3)海量数据管理技术

云计算需要对分布的、海量的数据进行处理、分析,因此,数据管理技术必需能够高效的管理大量的数据。

(4)编程方式

云计算提供了分布式的计算模式,客观上要求必须有分布式的编程模式。云计算采用了一种思想简洁的分布式并行编程模型Map―Reduce。Map―Reduce是一种编程模型和任务调度模型。主要用于数据集的并行运算和并行任务的调度处理。

(5)云计算平台管理技术

云计算系统的平台管理技术能够使大量的服务器协同工作,方便的进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。

(四)云计算的服务模式

(1)软件即服务(SaaS)

所谓SaaS是指用户通过标准的Web浏览器来使用Internet上的软件。SaaS在人力资源管理软件上的应用较为普遍。以销售和管理SaaS而闻名,是企业应用软件领域中最为知名的供应商。

(2)平台即服务(PaaS)

所谓PaaS是指云计算服务商提供应用服务引擎,如互联网应用程序接口(API)或运行平台,用户基于服务引擎构建该类服务。

(3)基础设施即服务(IaaS)

IaaS定位于底层,向用户提供可快速部署、按需分配、按需付费的高安全与高可靠的计算能力以及存储能力租用服务,并可为应用提供开放的云基础设施服务接口,用户可以根据业务需求灵活定制租用相应的基础设施资源。

三、公安网数据中心应用私有云的意义

私有云是一种灵活的服务模式,能够帮助公安网络应对各种各样的基础架构需求。其特点主要包括:

支持异构系统:私有云支持数据中心现有(和将来)的异构基础架构,包括服务器、存储、网络硬件、操作系统、虚拟机管理程序、存储功能以及文件系统等。

与管理工具集成:私有云易于配置和扩展,能与各种IT管理工具集成并调用它们,这些管理工具主要用于安全、配置、目录、报告、数据管理、管理控制台、内部监管以及法规遵从管理。

与工作负载管理器、中间件和应用程序集成:云是为了运行应用程序而存在的,因而云管理平台必须提供灵活的可编程接口,以便能很容易地与单位必须的工作负载管理器、中间件和应用程序集成。

可配置的资源分配政策:能感知资源,能感知工作负载―能够最有效地部署和处理进入云计算环境的各种工作负载,并根据明确定义的政策,预留资源给客户,以便经济高效地满足服务水平协议(SLA)。

支持IT和业务流程:为各种IT和业务流程提供支持,允许IT部门实现操作自动化。

跨区域解决方案:具有足够的扩展性和灵活性,能在需要时通过重新配置资源,实现跨地区的IT集成。

四、OpenStack私有云的架构体系

(一)OpenStack体系结构

OpenStack 核心是计算虚拟化, 软件定义网络(SDN, Software Defined Network), 软件定义存储(SDN,Software Defined Storage)。软件由 Nova、Neutron、Cinder、Swift、Keystone、Glance、Horizon 等项目组成。还集成了关系数据库 ( 如MySQL),消息队列(如 RabbitMQ),Apache Httpd 等第三方服务组件。

OpenStack 架构由计算节点、网络节点、 存储节点、控制节点等集群组成。

(二)OpenStack 架构设计

OpenStack Compute建立在无共享、基于消息的架构上。Cloud controller通过HTTP与internal object store交互,通过AMQP和scheduler、network controller、 和volume controller 来进行通信。为了避免在等待接收时阻塞每个组件,OpenStack Compute用异步调用的方式。

OpenStack Compute多结点物理架构:通过简单部署nova-compute在一台额外的服务器以及拷贝nova.conf文件到这个新增的结点,可以在两结点的基础上,添加更多的compute结点,形成多结点部署。在较为复杂的多结点部署中,还能增加一个volume controller 和一个network controller作为额外的结点。对于运行多个需要大量处理能力的虚拟机实例,至少是4个结点是最好的。

五、OpenStack对公安网数据中心的影响

一、OpenStack对公安网络数据中心网络设备、服务器和存储进行完全虚拟化,对设备进行统一管理,可对资源按需分配,使资源利用率最大化。

二、OpenStack可对运行的各类服务提供负载均衡,确保为终端提供更实时、快速与稳定不断线的在线服务。

三、OpenStack 高可用提供 Active/Active 双活模式及负载均衡, 能在设备出现故障时自动切换主机和从机,确保不会发生业务停止或数据丢失的情况。

四、OpenStack可实现对资源的弹性管理,在系统或服务负载增大时自动扩展资源分配。

参考文献

篇8

【关键词】 云计算 PaaS 电信运营商 业务能力

在移动互联网、全业务运营的竞争大环境下,服务类型不再成为各运营商的优势,如何快速地部署业务,提供个性化的服务、差异化的运营和精确化的管理将成为竞争中的关键因素。传统的业务网架构和建设模式下,投资和运营管理费用随着业务系统规模的扩张而增加,业务能力开放性和共享性很差,容易造成平台硬件和公共软件模块的重复建设,无法快速部署、弹性扩容,对于新型互联网类业务适应性差。

随着云计算技术的不断发展,为电信运营商在业务网架构演进上提供了一些机遇。云计算包括SaaS、PaaS和IaaS三种服务模式,其中PaaS平台层在整个云计算体系中起着关键的支撑作用,PaaS平台把端到端的软件开发、测试、部署、运行环境以及应用程序托管作为服务提供给应用开发者。

在新形式下,面对云计算发展的巨大商机,电信运营商也需要将PaaS作为其云计算技术引入的重点,构建基于云计算PaaS平台的新型业务网架构将成为电信运营商深入转型的重要举措。

一、主流PaaS简介

PaaS,称平台即服务,主要是指在基于云计算基础上,通过互联网为用户提供软件部署和运行环境的服务平台。它主要为应用程序的执行提供资源,同时根据实际资源的使用情况来收取相应的费用,它也是云计算在未来的发展趋势。

PaaS可以根据供应商提供的用户应用程序在这个环境之内运行。PaaS的开发与应用具有以下几个方面的特点:1)使开发者能够充分地利用供应商提供的应用能力,对互联网进行不断地开发;2)为应用运行环境和管理机制提供了保障,降低了应用运行管理力度,大大加快了应用的速度。

二、基于PaaS云的业务网架构

基于PaaS云的业务网平台是独立于底层物理环境、基础业务能力的PaaS架构的云平台,应实现业务开放、、执行、基本业务能力的封装,个性化业务及应用提供等功能。可实现业务能力的汇聚和开放、业务应用快速上线。

应该包括以下几部分基本功能:

(1)能力开放引擎:能力开放引擎是实现电信能力、内容能力、应用能力、数据能力封装的能力网关,提供基于SOA的Webservice服务接口供业务应用调用能力服务,实现业务能力的聚合和开放。

同时需要实现对各种能力的管控:

接入控制:协议转换、路由管理、接口适配、免订购。

能力管理:用户管理、开发者管理、业务能力路由数据管理)。

能力鉴权:安全管理、鉴权认证、免订购应用支持。

(2)业务运行引擎:是基于PaaS云的业务网平台的逻辑主体,提供标准的应用托管环境,主要支持大规模应用的部署、分布式计算和数据库服务,以及应用的集群管理和路由管理,包括:

集群管理:伸缩管理、资源管理、动态迁移、容错控制。

路由管理:负载均衡、分布式缓存、智能分发。

(3)业务开发引擎:包括标准的开发环境,主要支持互联网开发,提供基于SDK的开发工具包并提供必要的组件库,提供能力调用模拟网关、终端模拟器,一键部署和管理工具。

基于PaaS云的业务网目标架构图1:

三、 关键问题分析

在PaaS系统建设过程中,运营商需要结合自身特点,采用与之匹配的商业模式,掌握好系统的运营流程,以确保目标功能和架构问题得到有效的解决,以推动云计算PaaS的持续发展。

3.1 云化演进模式

目前来说,运营商在云服务方面,主要推出IaaS、SaaS两种,其中,PaaS暂时还没有推出产品。然而,通过利用云计算PaaS服务,电信运营商将会推出两种模式:

(1)从IaaS向PaaS拓展模式

当前,运营商推出的IaaS云服务主要以下产品:云存储、云数据中心、云桌面、云安全等。这种产品模式主要支持开发商将IaaS应用在云数据中心,同时合理地调整应用中的资源需求弹性。并将相关程序上传至PaaS平台,这样不仅能够确保产品的正常运行,而且能够减少额外的配置。

(2)从业务应用向PaaS拓展模式

在为客户提品服务的过程中,运营商经常会发现一种现象:在各个产品中,一些电信核心资源和应用功能将会被复用,鉴于此,运营商可以将应用功能封装起来,以组件形式开放给开发者,这样能够减少开发的工作量。而就是利用PaaS云的方式来实现这个能力开放的过程。

3.2 关键技术

(1)分布式存储技术。目前,随着云计算技术的不断发展,分布式文件系统得到了广泛的应用。分布式文件系统作为底层存储架构,具有容量高、扩展能力强等优势,从而使得该系统所构建的数据库成为云数据管理中重要组成部分。这些数据库通过利用分布式计算技术,在一些场合应用中具有一定的优势。

(2)能力开放技术。基于PaaS的云化平台,具有汇聚互联网能力,利用能力开放技术,为开发者提供最简化的接口形式。同时,还可以简化电信能力,合理地调用参数进行配置,并可以将传统电信接口形式转换成互联网主流接口形式,甚至可以为主流操作系统的SDK包的互联网能力提供开放,以统一标准确保互联网能力得到合理的引入。

(3)沙箱技术。目前主流的PaaS平台采用了沙箱技术进行应用的隔离。沙箱是实现平台应用隔离的技术,在不同应用运行环境下,达到了的隔离环境的目标。供应商为了提供沙箱环境,主要通过为每用户应用提供一个容器的方法来达到隔离的目的。

(4)分布式缓存技术。在互联网应用中,经常会遇到反复在数据库中执行相同的查询从而取出相同的数据的情况。对于数据的查询会耗费一定的时间,这种重复读取极大地增加了数据库以及WEB应用服务器的负载,数据处理时间延长将导致WEB应用服务器延时增加。为了解决这个问题,缓存技术逐步被应用到WEB应用中,同时与分布式技术相结合,形成了分布式缓存技术。

四、发展展望

云计算技术的出现,给运营商带来了一些机遇,如在业务扩展、服务升级、平台整合上提供了机会。但同时也对运营商现有运营管理体制和组织架构带来了冲击。在云计算应用中,运营商合理地定位好各自的云计算服务目标,这样才能够确保企业的持续发展。

PaaS作为整个云计算服务体系中重要系统之一,直接影响到运营商之间竞争的成败。目前来说,我国大部分运营商在PaaS方面进行了商用,但与业界标杆相比,仍然存在着较大的差距。由于运营商有存量用户规模较大,且具有可开放的电信能力和丰富的运营经验,若能够在商业模式、关键技术等方面得到进一步的突破,搭建基于云计算PaaS模式构建的业务平台,将会汇聚云计算的优势,为合作伙伴提供一站式的部署运营服务。

参 考 文 献

[1] 陈玄平.PaaS理念及其在电信运营中的应用[J].福建建筑,2012(05).

篇9

关键词:云计算;局域网;网络构建;关键技术

中图分类号:TP393.1 文献标识码:A 文章编号:1674-7712 (2013) 08-0000-01

云计算技术是一种分布式计算技术,该技术可以将常规的局域网数据处理工作转移到在网络中部署的分布式计算机中,集中优势资源对应用数据进行集中处理或存储,这样不仅降低了局域网终端的硬件部署需求,还进一步提升了局域网资源的利用率,降低了局域网的维护成本。

一、云计算特点和优势分析

实际应用中,不同用户对云计算技术的应用需求不尽相同,按照侧重点不同可以将云计算平台分为三类,分别为虚拟化技术、基础软硬件设施共享以及云计算平台网络服务。但是无论云计算的应用目的是什么,其都具有云计算所具有的三个特点。

(一)统一的底层平台实现。云计算可以为用户提供统一的操作平台并向用户开放通信接口,这就降低了用户的接入门槛,不必要对云工作的原理进行了解和掌握即可完成相应的工作。

(二)云平台灵活可调节。云计算中的一个关键技术就是虚拟化技术,利用该技术局域网用户可以根据自己的使用需求获得相应的云空间和操作权限,且单用户的平台需求可以根据实际需求进行适当调节。

(三)云平台具有超强的计算能力。由于云平台使用了分布式计算机对用户数据进行集中处理,因而局域网用户可以通过高性能计算机获得更快更便捷的计算服务,且该服务的获得不受终端设备性能制约。

鉴于云计算具有上述特点,故在局域网中使用云计算技术进行网络部署和应用时可以获得传统的局域网部署和应用所无法获得使用体验和使用优势。具体来说,(1)云计算可以向局域网用户提供数据集中存储服务,这就大大降低了数据泄露的可能性和用户存储成本,提升了网络数据的安全性;(2)云计算可以提供更快的事件反应速度,依托云计算的高性能的数据处理服务,用户所需的服务时间得到了很大程度的减少;(3)软件安全性能的提升,基于云计算技术构建的局域网将软件服务转移到云端进行,依托云端的安全技术可以为局域网用户构建更加安全有效的工作环境。

二、基于云计算技术的局域网架构与实现

云计算技术下的局域网架构主要分为四层,分别为基础硬件层、基础管理层、应用接口层以及应用层

(一)基础硬件层。基础硬件层用于向局域网用户提供基础硬件支持,不仅包括多种存储设备,还包括多种高性能数据处理设备。虽然这些设备在局域网中处于不同区域,但是可以通过统一的云计算管理系统进行整合和统一,消除了传统的物理机空间上的限制。

(二)基础管理层。本层是云计算局域网实现的核心部分,应用到的云计算相关技术也最多。利用本层中所使用的计算机集群技术、分布式文件管理系统以及网格计算等技术可以快速便捷的完成各设备之间的初始化工作,且在各设备之间建立起适当的协同关系,让其组成统一的整体对外提供服务和支持,实现高效数据处理和存储等功能。由于基础管理层对基于云计算的局域网建设具有重要支撑作用,故在该层的建设中必须采取适当的安全防护策略。

(三)应用接口层。本层用于向应用层与服务层之间的数据通信提供开发环境和开发接口,具有较高的灵活性。按照该层规范编写的应用程序可以在用户和云计算平台之间建立起一条稳定持续的数据传输通道。

(四)访问层。该层主要面向对象为局域网用户,局域网内经过授权的合法用户可以使用访问层中开放的登陆接口进入云计算平台,并在平台中获得相应权限的操作、空间以及资源配置权限等。

三、局域网内的云计算关键技术

(一)数据存储技术。云计算系统可以为多用户提供并行服务,因此云计算中的数据存储技术必须在保证数据存储有效性的同时向用户提供高性能、高传输率的数据存储于传输服务。当前云数据存储技术主要有GFS技术、HDFS技术等,这两种技术均可以实现对数据信息进行分布式存储,且采用冗余等技术来保证数据的可靠性。

(二)虚拟化技术。虚拟化技术是云计算中的核心技术之一,能够对局域网内的资源进行高效整合与利用。

其中,服务器虚拟化技术可以将单一的硬件资源划分为多个虚拟硬件资源,且保证每个虚拟操作系统之间相互独立,这样就极大的提升了局域网服务器的使用效率,更加便于进行快速网络部署、故障恢复以及统一管理等内容。

存储虚拟化技术可以对整个局域网内的存储资源进行统一调度和管理,用户可支配的存储空间不再受硬件终端的限制,而是根据用户需求变为动态可调整的。在该部分技术中用户还可以使用安全认证技术、数据加密技术等提高数据的安全性。

应用虚拟化技术可以将硬件和软件进行剥离和抽象,使得应用程序的运行不再受系统和底层硬件的制约,该技术极大的提升了应用软件的兼容性能。

桌面虚拟化技术可以按照用户要求为用户提供独立的、可恢复的桌面环境,用户可以在局域网环境下利用不同终端对个人桌面环境进行访问和操作。该技术可以降低用户局域网接入成本,提升用户在局域网中的灵活性。

(三)其他关键技术。局域网中可应用的云计算技术还有数据管理技术、安全技术、业务接口技术、分布式编程与计算技术等。这些技术均可以在云计算平台内利用分布式计算机的高效性和可靠性为局域网用户提供可靠、大容量、高速率的数据服务。如数据管理技术可以为局域网用户提供大数据处理功能的支持;安全技术可以利用云计算平台的集约性和专业性对用户数据提供数据备份、隐私保护、安全防护等功能;业务接口技术可以支持用户在不同局域网内进行数据迁移;分布式编程与计算技术可以让用户在权限范围内进行自主编程以实现其特殊使用需求等。

四、总结

云计算技术可以为网络用户提供快速高性能数据和应用服务,随着局域网用户需求的不断发展以及个性化需求的逐渐变更,在局域网中应用云计算技术必然会成为一种主流趋势。

参考文献:

[1]彭石红.浅谈云计算的关键技术[J].广东教育:职教,2011,10.

[2]刘媛.云计算在局域网中应用设想[J].科技风,2010,1.

篇10

购买推荐

图书分析师庞敏丽认为该书云计算研发人员和爱好者的学习和参考资料。通过对生意宝旗下比购宝(Boogle.cn)——“网络购物第一站”收录的博库书城、淘宝网、京东商城、卓越亚马逊、当当网、拍拍网、文轩网、中国互动出版网、99网上书城等众多含图书销售的网站,价格搜索显示,目前,京东商城该书为最低价,推荐购买。

目 录

第1章 绪论

1.1 云计算的概念

1.2 云计算发展现状

1.3 云计算实现机制

1.4 网格计算与云计算

1.5 云计算的发展环境

1.5.1 云计算与3G

1.5.2 云计算与物联网

1.5.3 云计算与移动互联网

1.5.4 云计算与三网融合

1.6 云计算压倒性的成本优势

习题

参考文献

第2章 Google云计算原理与应用

2.1 Google文件系统GFS

2.1.1 系统架构

2.1.2 容错机制

2.1.3 系统管理技术

2.2 分布式数据处理MapReduce

2.2.1 产生背景

2.2.2 编程模型

2.2.3 实现机制

2.2.4 案例分析

2.3 分布式锁服务Chubby

2.3.1 Paxos算法

2.3.2 Chubby系统设计

2.3.3 Chubby中的Paxos

2.3.4 Chubby文件系统

2.3.5 通信协议

2.3.6 正确性与性能

2.4 分布式结构化数据表Bigtable

2.4.1 设计动机与目标

2.4.2 数据模型

2.4.3 系统架构

2.4.4 主服务器

2.4.5 子表服务器

2.4.6 性能优化

2.5 分布式存储系统Megastore

2.5.1 设计目标及方案选择

2.5.2 Megastore数据模型

2.5.3 Megastore中的事务及并发控制

2.5.4 Megastore基本架构

2.5.5 核心技术——复制

2.5.6 产品性能及控制措施

2.6 大规模分布式系统的监控基础架构Dapper

2.6.1 基本设计目标

2.6.2 Dapper监控系统简介

2.6.3 关键性技术

2.6.4 常用Dapper工具

2.6.5 Dapper使用经验

2.7 Google应用程序引擎

2.7.1 Google App Engine简介

2.7.2 应用程序环境

2.7.3 Google App Engine服务

2.7.4 Google App Engine编程实践

习题

参考文献

第3章 Amazon云计算AWS

3.1 Amazon平台基础存储架构:Dynamo

3.1.1 Dynamo在Amazon服务平台的地位

3.1.2 Dynamo架构的主要技术

3.2 弹性计算云EC2

3.2.1 EC2的主要特性

3.2.2 EC2基本架构及主要概念

3.2.3 EC2的关键技术

3.3.4 EC2安全及容错机制

3.3 简单存储服务S3

3.3.1 基本概念和操作

3.3.2 数据一致性模型

3.3.3 S3安全措施

3.4 简单队列服务SQS

3.4.1 SQS基本模型

3.4.2 两个重要概念

3.4.3 消息

3.4.4 身份认证

3.5 简单数据库服务Simple DB

3.5.1 重要概念

3.5.2 存在的问题及解决办法

3.5.3 Simple DB和其他AWS的结合使用

3.6 关系数据库服务RDS

3.6.1 SQL和NoSQL数据库的对比

3.6.2 RDS数据库原理

3.6.3 RDS的使用

3.7 内容推送服务CloudFront

3.7.1 内容推送网络CDN

3.7.2 云内容推送CloudFront

3.8 其他Amazon云计算服务

3.8.1 快速应用部署Elastic Beanstalk和服务模板CloudFormation

3.8.2 云中的DNS服务 Router

3.8.3 虚拟私有云VPC

3.8.4 简单通知服务SNS和简单邮件服务SES

3.8.5 弹性MapReduce服务

3.8.6 电子商务服务DevPay、FPS和Simple Pay

3.8.7 Amazon执行网络服务

3.8.8 土耳其机器人

3.8.9 Alexa Web服务

3.9 AWS应用实例

3.9.1 在线照片存储共享网站SmugMug

3.9.2 在线视频制作网站Animoto

3.10 小结

习题

参考文献

第4章 微软云计算Windows Azure

4.1 微软云计算平台

4.2 微软云操作系统Windows Azure

4.2.1 Windows Azure概述

4.2.2 Windows Azure计算服务

4.2.3 Windows Azure存储服务

4.2.4 Windows Azure Connect

4.2.5 Windows Azure CDN

4.2.6 Fabric控制器

4.2.7 Windows Azure应用场景

4.3 微软云关系数据库SQL Azure

4.3.1 SQL Azure概述

4.3.2 SQL Azure关键技术

4.3.3 SQL Azure应用场景

4.3.4 SQL Azure和SQL Server对比

4.4 Windows Azure AppFabric

4.4.1 AppFabric概述

4.4.2 AppFabric关键技术

4.5 Windows Azure Marketplace

4.6 微软云计算编程实践

4.6.1 利用Visual Studio2010开发简单的云应用程序

4.6.2 向Windows Azure平台应用程序

习题

参考文献

第5章 VMware云计算

5.1 VMware云产品简介

5.1.1 VMware云战略三层架构

5.1.2 VMware vSphere架构

5.1.3 云操作系统vSphere

5.1.4 底层架构服务vCloud Service Director

5.1.5 虚拟桌面产品VMware View

5.2 云管理平台 vCenter

5.2.1 虚拟机迁移工具

5.2.2 虚拟机数据备份恢复工具

5.2.3 虚拟机安全工具

5.2.4 可靠性组件FT和HA

5.3 云架构服务提供平台vCloud Service Director

5.3.1 创建虚拟数据中心和组织

5.3.2 网络的设计

5.3.3 目录管理

5.3.4 计费功能

5.4 VMware的网络和存储虚拟化

5.4.1 网络虚拟化

5.4.2 存储虚拟化

习题

参考文献

第6章 Hadoop:Google云计算的开源实现

6.1 Hadoop简介

6.2 Hadoop分布式文件系统HDFS

6.2.1 设计前提与目标

6.2.2 体系结构

6.2.3 保障可靠性的措施

6.2.4 提升性能的措施

6.2.5 访问接口

6.3 分布式数据处理MapReduce

6.3.1 逻辑模型

6.3.2 实现机制

6.4 分布式结构化数据表HBase

6.4.1 逻辑模型

6.4.2 物理模型

6.4.3 子表服务器

6.4.4 主服务器

6.4.5 元数据表

6.5 Hadoop安装

6.5.1 在Linux系统中安装Hadoop

6.5.2 在Windows系统中安装Hadoop

6.6 HDFS使用

6.6.1 HDFS 常用命令

6.6.2 HDFS 基准测试

6.7 HBase安装使用

6.7.1 HBase的安装配置

6.7.2 HBase的执行

6.7.3 Hbase编程实例

6.8 MapReduce编程

6.8.1 矩阵相乘算法设计

6.8.2 编程实现

习题

参考文献

第7章 Eucalyptus:Amazon云计算的开源实现

7.1 Eucalyptus简介

7.2 Eucalyptus技术实现

7.2.1 体系结构

7.2.2 主要构件

7.2.3 访问接口

7.2.4 服务等级协议

7.2.5 虚拟组网

7.3 Eucalyptus安装与使用

7.3.1 在Linux系统中安装Eucalyptus

7.3.2 Eucalyptus配置和管理

7.3.3 Eucalyptus常用命令的示例和说明

习题

参考文献

第8章 其他开源云计算系统

8.1 简介

8.1.1 Cassandra

8.1.2 Hive

8.1.3 VoltDB

8.1.4 Enomaly ECP

8.1.5 Nimbus

8.1.6 Sector and Sphere

8.1.7 abiquo

8.1.8 MongoDB

8.2 Cassandra

8.2.1 体系结构

8.2.2 数据模型

8.2.3 存储机制

8.2.4 读/写删过程

8.3 Hive

8.3.1 整体构架

8.3.2 数据模型

8.3.3 HQL语言

8.3.4 环境搭建

8.4 VoltDB

8.4.1 整体架构

8.4.2 自动数据分片技术

习题

参考文献

第9章 云计算仿真器CloudSim

9.1 CloudSim简介

9.2 CloudSim体系结构

9.2.1 CloudSim核心模拟引擎

9.2.2 CloudSim层

9.2.3 用户代码层

9.3 CloudSim技术实现

9.4 CloudSim的使用方法

9.4.1 环境配置

9.4.2 运行样例程序

9.5 CloudSim的扩展

9.5.1 调度策略的扩展

9.5.2 仿真核心代码

9.5.3 平台重编译

习题

参考文献

第10章 云计算研究热点

10.1 云计算体系结构研究

10.1.1 Youseff划分方法

10.1.2 Lenk划分方法

10.2 云计算关键技术研究

10.2.1 虚拟化技术

10.2.2 数据存储技术

10.2.3 资源管理技术

10.2.4 能耗管理技术

10.2.5 云监测技术

10.3 编程模型研究

10.3.1 All-Pairs编程模型

10.3.2 GridBatch编程模型

10.3.3 其他编程模型

10.4 支撑平台研究

10.4.1 Cumulus:数据中心科学云

10.4.2 CARMEN:e-Science云计算

10.4.3 RESERVOIR:云服务融合平台

10.4.4 TPlatform:Hadoop的变种

10.4.5 P2P环境的MapReduce

10.4.6 Yahoo云计算平台

10.4.7 微软的Dryad框架

10.4.8 Neptune框架

10.5 应用研究

10.5.1 语义分析应用

10.5.2 生物学应用

10.5.3 数据库应用

10.5.4 地理信息应用

10.5.5 商业应用

10.5.6 医学应用

10.5.7 社会智能应用

10.6 云安全研究

10.6.1 Anti-Spam Grid:反垃圾邮件网格

10.6.2 CloudAV:终端恶意软件检测

10.6.3 AMSDS:恶意软件签名自动检测

10.6.4 CloudSEC:协作安全服务体系结构

习题

参考文献

第11章 总结与展望

11.1 主流商业云计算解决方案比较

11.1.1 应用场景

11.1.2 使用流程

11.1.3 体系结构

11.1.4 实现技术

11.1.5 核心业务

11.2 主流开源云计算系统比较

11.2.1 开发目的

11.2.2 体系结构

11.2.3 实现技术

11.2.4 核心服务

11.3 国内代表性云计算平台比较

11.3.1 中国移动“大云”

11.3.2 阿里巴巴“阿里云”

11.3.3 “大云”与“阿里云”的比较

11.4 云计算的历史坐标与发展方向

11.4.1 互联网发展的阶段划分

11.4.2 云格(Gloud)——云计算的未来