大暑诗句范文

时间:2023-04-06 11:42:25

导语:如何才能写好一篇大暑诗句,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

大暑诗句

篇1

不过,每一次概念或工具的履新,尤其是商业层面,其有确定意义或意义的确定的前提,都是为企业客户降低了成本,也使普遍的消费者获得了更好的服务。

尽管“大数据”在最近几年才引起人们的关注,但许多互联网公司走在了时代的前面,他们作为大数据时代的先行者,为如今的“大数据”的兴起奠定了基础,并在历史的经历中卓有成效,有时也成为追逆或效仿的对象。以下,希望从IBM、SAP、Oracle、Facebook、亚马逊、百度、阿里巴巴、腾讯、京东这十家大数据的先行践行者们,看看他们都在各自的领域创造了哪些有关大数据的基础与标准,以便让更多的B和C再进一步了解一下“大数据”应用的逻辑。

IBM、SAP、Oracle:

我们只是大数据的搬运工

前段时间IBM卖掉了自己的芯片业务,这表明了IBM对自己的未来有着一些清晰的规划――减少硬件业务,将精力投入云计算、分析以及智慧地球的项目之上。IBM全球副总裁Eric Sall说,“IBM不能装作这世界一成不变,这世界当然在随时变化”。IBM此举也恰巧说明了一个行业的趋势,即数据在未来的发展至关重要,而分析数据的能力则显得尤为突出。从信息时代到数据时代,是一种抽象的简化。

作为一个以大数据为基础为各行业提供解决方案的企业来说,硬件业务的多少与好坏似乎已并不能衡量自身的实力,自身的软件服务才更可能决定一些根本性的东西。在今年,IBM宣布以10亿元组建新部门,目的是发展公司最新的电脑系统Watson,它将据客户过往的历史记录,帮助企业更好地认识客户,随时随地以客户选择的方式进行接洽,并在需要行动时提供强大支持。因此它将大大节省企业/客户的人工成本,以便更好地做出决策,更快的实现业务成效,而在去年,这一系统已经开始应用于医疗以及零售领域,帮助行业实现转型。

尽管如此,IBM仍然是到了一个艰难的时刻,尽管投入了较大资金发展全球数据中心,比如以20亿美元收购云计算基础架构服务提供商SoftLayer,但其在云计算领域取得的收入应属是杯水车薪,面对来势汹汹的后起之秀,IBM这个蓝色巨人可能需要放下过去的慢热,虽然大象和蚂蚁转身需要的能级不同。

说到IBM就不得不提SAP,这个由前IBM员工成立的软件公司如今已经发展为全球最大的企业应用软件供应商。然而,SAP所涉及的领域不仅于此,他已经将自己的触角伸及到了体育界。相信大家对2014巴西世界杯德国队的夺冠记忆犹新,在这背后或有“大数据”的力量,可谓是德国队的“第十二人”。早在此次世界杯之前,德国足协便与SAP公司合作,定制名为“Match In-sights”的足球解决方案,用以迅速收集、处理分析球员和球队的技术数据,基于“数字和事实”优化球队配置,从而提升球队作战能力,并通过分析对手技术数据。通过此种方式,德国队在战术制定上的时间成本大大缩短,这可以算所是“大数据”的一种胜利,同时也是未来体育发展的一种趋势,即引入当今世界最发达的技术,提高自身比赛水平,借助大数据强有力的分析处理能力制定合理的训练计划与比赛战术,而非像以前那样单纯的依靠球队的不断操练来实现。我们可以相信,在未来,不只是体育届,任何范畴内的决策都会要借助“大数据”的分析结果来完成,因为它可以既便捷又准确。

这就是“大数据”的力量。百度李明远有一句话:“大数据的特点就是发现人们原来看不到的数据,将这些数据应用于商业,改变认知的核心工具。”由此才产生了诸多在接入“大数据”业务后,发展迅猛的公司,Oracle就是其中之一。

Oracle最初的业务仅是数据库,这也是他存在的基础,直到1987他才成立了一个仅有7人的软件开发部门,管理也十分成松散,而这个部门成立的理由只是因为Oracle公司需要一个财务管理系统。就在这种偶然下Oracle开始了“大数据”业务的发展,至1996年,Oracle赢得了华为的合作,稍后又拿到了美的、中兴的订单,直到1998年,他们已经拥有了1300位客户。仅用了6年时间,Oracle就超越了诸多前辈一跃成为应用软件业的第二,虽然同SAP仍有很大差距,但已经是一个不小的成绩。

Oracle应用软件的创始人杰夫・沃克说过:“尽管SAP有R/3,但在应用软件市场上,他们并没有达到高不可及的程度,他们并没有真正做到象Oracle那样成功。”到目前为止Orcale已经成为了应用软件业仅次于SAP的公司,为戴尔公司、苏格兰皇家银行等业界巨头提供服务。其中,波士顿医学中心在使用了Orcale的应用服务以优化其临床及数据存储环境之后,不仅消减了存储成本并且使其性能也提高了74%。

不论是IBM、SAP还是Oracle,都是依靠应用软件服务来创造盈利,他们在“大数据”的数据服务上已经取得了成功,其占据的市场份额是后起之秀们难以企及的。其实他们所做的并不复杂,可他们发现了前任未曾发现的信息。国内外的企业中,做应用软件的不少,意图涉足大数据领域更多,可是却仍在低端市场中苦苦挣扎,这并非管理水平偏低的原因,而是因为太过看重自身的利益而忽略了“大数据”业务发展的必然条件,成本的降低与服务的提高,只有针对这些不变的点,才能真正走上“大数据”的发展道路,成为下一代领导者。

百度、google:不要再把我们看做搜索引擎,我们正在做些别的事情

“新一代的数据收集不仅是数据工具,数据本身会有很大的发展。”李彦宏如是说。

同样是2014巴西世界杯期间,百度“世界杯预测”上线,尽管足球是一件不确定性极高的事情,可在比赛结束后发现,百度这次的预测无一错误。想想世界杯时无数走上天台的小伙伴们,若是知道百度有此神器,应该是有些感想的吧。

在其赛事预测的产品说明中写到“百度大数据部收集了2010-2013年全世界范围内所有国家队及俱乐部的赛事数据,构建了现在的赛事预测模型”,这是其利用“大数据”在传统领域的又一次尝试,并且他们希望在建立起成熟的模型之后,在球队训练、体彩等方面发挥商业价值。可以推断,百度应该在“大数据”上有着极大的野心。

球赛预测的结果是可喜的,不过百度在另一项事情的预测上则栽了跟头。在《黄金时代》上映之前,百度会上宣布电影《黄金时代》的票房预期可达2.0―2.3亿,当时的媒体都认为这个数字估计的太过于保守,然而截止到10月16日,《黄金时代》的累计票房为4698万,如此成绩对于片方、媒体和公众而言都是出乎意料,2.0亿的票房估计竟然已经算是十分乐观。这并不是百度第一次做票房预测了,早在7月14日爱奇艺就透露在内部,百度票房的预测已经有了百分之八十的准确率。百度也因为此次的预测失败而推迟了票房预测产品的上线,我们可以看到在百度预测中,电影票房预测那一项仍是灰色,标注着“即将上线,敬请期待”的字样。对此,可能的原因是类似《黄金时代》的文艺类影片样本较少,不确定性大。

同百度这次失败同样的,他的竞争对手Google也有马失前蹄的时候。在2008年Google推出了他的Google Flu Trends流感预测服务,在这之后的几年时间中,预测的结果都是准确的。这也帮助各国对即将到来的流感进行了有效的预防,避免了更大的损失。直到2013年2月,Nature上出现文章,表示GFT预测的全国范围的流感样疾病(占全国人口的比例)近乎是实际值的2倍,这是由于Google所抓取的数据是直接从搜索引擎中来,这就使得真正的流感患者同跟风搜索流感的人混淆在一起,最终夸大了流感人口的比例。

可见,“大数据”中最重要的不是分析数据而恰恰是数据本身,如果数据本身存在着问题,那么不论算法如何正确出来的结果也是失之千里。

当然这仅仅是两个微小的错误,并不能就此否定这两家公司在“大数据”上做出的努力,毕竟以搜索引擎起家的他们天生就具有“大数据”应用研究与实践的优势。如今百度已经有了一套看起来更完整的“大数据”引擎系统,共三个部分:开放云,百度的大规模分布式计算和超大规模存储云,对应到Google则是他举世闻名的数据中心以及基于Colossus的云;数据工厂,百度将海量数据组织起来的软件能力,对应到Google,其近年来为迎接大数据时代不断改造核心技术,包括比MapReduce批处理索引系统搜索更快的Caffeine,专为BigTable设计的分布式存储Colossus,Dremel和PowerDrill管理和分析大数据,以及Instant和Pregel。百度大脑,能够应用这些数据的算法,对应到Google,Google提供的大数据分析智能应用包括多个方面,技术有Big Query、趋势图等。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。可以说二者在如和发展“大数据”上思路及其一致。在百度预测的界面我们可以看到已经能够看到一个预测开放平台,为每一个用户提供平台化的预测服务。借助这种服务,应该能够更准确地预见未来的趋势,趋利避害。譬如通过“疾病预测”,可以知道同类疾病全国哪家医院最好,同城医院中,哪家医院现在排队人数较少,或者当前天气需要预防那种流行病;通过“景点预测”,我们能够有效地规划出游行程,只能看人不能看景的情况,而景区也能够据此作出正确的判断而非依靠以往模糊的经验。对于企业来说,能够有效地规避风险,调整战略,进而减低成本,缩减开支,最终达到效率与收益的提高。

在如今搜索引擎市场已经不能为他们带来更多盈利的情况下,百度与Google将目光同时转向了“大数据”开发与研究。曾经有一个这样的问题,问百度能够依靠大数据做些什么,答可以分析网上卖假药的情况。这固然是针对百度搜索中侧边经常显示的广告的调侃,但也反映了百度所面临的尴尬,搜索业务所能提供的利润已经接近饱和,盈利模式的更新已经迫不及待,而通过“大数据”变现,在目前是一条最有希望的道路。有消息称,Google每年通过“大数据”可获得约80亿美元的收入,这一数字远远超过了百度。若百度能通过“百度预测”这一系列产品获得成功,那么他所能获得的不仅仅是更加海量的数据,更是源源不断的现金流。

亚马逊、京东、阿里巴巴:

当你们在浏览商品时……

眼下随着日子的临近,一年一度的双十一又要来了,在那些网页弹出的广告中,不难注意到那些推荐的产品,正是曾经搜索过或者浏览过的,这正是基于“大数据”的结果。而这种智能推荐的服务是“大数据”应用商业化中较为成功的例子。

说道电商中“大数据”方面做得最成功的无疑是亚马逊了,亚马逊是云计算的奠基者,他在用户偏好、商业领域等方面的“大数据”能力可以说甚至超过了Google。他从每一位客户上捕捉大量数据,如购买记录、浏览记录、浏览时间等,从这些杂乱的数据中找到产品的关联性,从而产生最适合推荐给用户的产品。亚马逊不对人进行分类,而是对用户的需求分类,从而产生了亚马逊的推荐系统,而此举它带去30%的销售收入。反映在网页上,我们可以看到亚马逊会将智能推荐的过程贯穿购物的始终。此外,亚马逊也会向用户发送邮件,推荐少量的商品,甚至是你未来可能会用到的商品。更为重要的是这一系列过程并不会令人产生反感,用户体验也随之提高。

对应到国内,不得不提的是阿里巴巴,作为国内最早运作云的部门,他的推荐系统同样优秀。在淘宝首页你会很容易看到一个名为“发现・好货”的浏览框,其中的物品全部都同你最近浏览购买或搜索的类似。

淘宝作为一个拥有海量用户数据的平台,每天都有上千万交易发生,数据从手机端、电脑中上传,为阿里提供了一个数据库。自去年3月起阿里上线了自己的云服务平台――御膳房,旨在为第三方软件服务商和品牌商提供大数据计算、挖掘、存储的云环境开发平台,构建阿里数据生态。这也是其在以“云计算、大数据”为核心的DT战略上迈出的一步。截止到目前,仅一年多的时间,就同300多家第三方软件服务商形成了合作,提供了包含流量推广、商品管理、数据分析、CRM、ERP、广告精准投放等多个支撑工具,覆盖了180万天猫、淘宝商家,为他们带去了利润。例如,通过“日报单品分析”服务能够使得运营人员方便的进行单品优化、页面调整,分析人员能够清晰地进行业务分析;通过“财务对账”服务能够使得线上付款、线下交易更加融合,节省了中间周转的成本。阿里数据平台事业部王贲表示:“我们就像一个厨房,提供了最优质的原材料、最锋利的工具,让开发者、服务商这样的大厨能够快速实现大数据应用的各种idea。”

同样的还有京东,虽然目前在云计算领域还远远达不到阿里的高度,但仍有着自己的努力。作为一个直接为用户提品的电商,供应量变得十分关键,京东通过销售情况、市场预期、时间日期的综合数据,形成一个预测系统,最后自动形成订单发送给供应商,避免缺货情况的存在。另外,在我们搜索商品时,出现的标签往往并不是商品的分类而是来自于商品的评价,这让我们能够更为准确的找到自己想要的商品。这一服务源自京东对于后台搜索数据分析的结果,他们发现在京东商城进行购买的用户往往对商品的分类并不清楚,而经常以商品的功能或作用来进行寻找,因此在他们看来,更重要的是在搜索栏中出现商品的评价而非分类,而主动将此类标签加入搜索系统中能使用户更好的找到自己想要的商品,加强了对用户的服务,使得购物体验大为提升,而这一举措更是使自身的赢利大为增加。

然而这三家电商所收集的数据较多的为非结构化数据,在理解与分析上较为困难,因此偶有推荐系统向客户并不需要的商品的情况的发生。

马云在卸任演讲上说:“很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联网的时候,大数据时代又来了。”“大数据”为平台提供了更好的信息支持,创造出更优质的服务,更优质地服务又能带来更多的数据,更多的数据样本使分析结果更为精确,为用户提供更佳的体验,如此则有更多的人投入使用中来,这样便形成了一个数据的良性循环。如此,“大数据”可以说是未来电商们发展的基础资源及优势所在,透过“大数据”的支撑,能够提高用户数量,提供优质服务,降低运营成本,提升总体盈利。

腾讯、facebook:

交流的是情感,看到的是数据

还记得今年情人节时Facebook发表的那份关于恋爱的数据么,通过“大数据”他能知道你们何时会恋爱,何时可能分手,甚至你本身尚未意识到时,他就已经察觉了。这是基于2.7亿活跃用户的统计结果。

同传统的恋爱过程类似,社交网络中的爱情也有一段“追求”的阶段,在这一阶段中,每位用户每日会至少推送一条消息,而在关系确定之后推送的频率则会直线下降。另一个趋势是在找到伴侣后,由于爱意的增加,情侣间互动的内容会越来越甜蜜,正能量的传递也会随之增多。不仅如此,Facebook甚至能够推算出这段感情能够维持多长时间,最长的可达4年以上,以及最容易分手的时间,通常是在5-7月。也许,Facebook应当基于此推出一项恋爱预测的服务,来帮助广大单身青年们“脱团”,使他们的“双十一”不再孤单。

早在2012年,Facebook就开始了用户“大数据”的收集,主要是收集用户在Facebook上公开的感情数据,并尝试着让用户发表自己收听习惯,并得到了有趣的结果。根据这些数据,他们制作出了“恋爱歌曲TOP10”以及“失恋歌曲TOP10”以此来慰藉那些坠入爱河以及伤心不已的用户。可这并不是出于一时的好奇心或仅为好玩,最终的目的是将这些数据用于用户推荐服务上,他们根据统计得到的数据,建立了“看心听曲”服务,即根据用户的心情,推荐不同的曲目,如此贴心的服务,不仅使用户们感到暖心,同时也让Facebook的用户忠实度有了上升。

国内的腾讯在公司还在很小的时候就通过后台记录、分析用户的每一个习惯,时至今日已经拥有了广大的用户数据,而正是这种对数据的重视,使得腾讯建立了今天的企鹅王国。

如今,腾讯云服务已经有了包括计算与网络、存储与CDN、监控与安全、数据分析等多项服务,并投入到清华大学微信建站,糗事百科、365日历应用软件运行等项目之中,为他们提供了多样化的服务。DNSPod CEO吴洪声说:“接入腾讯云之后,极大地减少了我们运维成本,特别是使用了云数据库和CDN之后,我们的服务响应更快了,运营产品变得更简单了。”其中,腾讯的数据分析平台已经接入了100过个产品的各类数据,涵盖数据数据管理、数据监控、数据分析、数据可视化、数据挖掘等多个方面,而推出的云分析服务,则是其“大数据”战略的重点所在,从公布的信息中来看,从微信到微博,腾讯为云分析提供了全面的平台支撑,达到了统计全面上报详细的目的。

小小比如,腾讯基于“大数据”的产品“广点通”,在腾讯大社交平台海量用户积累的基础上,进行以人为核心的数据挖掘,实现精准的广告推荐,形成用户、物品和推荐位之间的交叉效应,其中最成功的就是同万科联手,使万科投入了3万的广告费用,获得了400万元的销售额。

然而腾讯现在需要做的除了开发“大数据”与云,还要打通自己的后台数据,使其形成一个完整的生态圈,等待后期完全成熟的技术,加以借鉴,更深层次的挖掘自己的“大数据”。

基于社交网络的公司统计分析“大数据”的一个特点就是侧重于呈现人的行为以及社会关系的信息,从这些数据中,可以分析人们的日常生活与行为,从而从中挖掘社会、政治、商业等信息,甚至能够预测未来。在这两点上,腾讯与Facebook都做到了不少,也许我们如今不应将它们狭义地视为一个SNS社交软件,而是进行重新的定义,如今它们的核心竞争力已不再是社交领域,而转移到数据业务上,而SNS只是更好地完成其“大数据”战略的一种应用,产生、收集、挖掘海量数据的一个工具。正如投资人Federated Media的约翰・巴特利(John Battelle)对Facebook的展望那样,“该公司正尝试着对自身进行重新定义,不满足于做狭义方面的社交网站,而这恰是外界对它的理解”。

以上这些,算案例吗?应该算吧。如果不是案例,就不是在讲大数据。

一般而言,国外的公司起步早发展快,如今已经成为全球“大数据”领域的领导者,他们懂得如何将开发出的“大数据”服务快速变现,通过这种方式源源不断的为自己的“大数据”开发及数据获取提供资源,已经形成了一个成熟的生态体系。虽然IBM处于财务困境,但我们相信他只是到了一个继续转型的时期,丢掉沉重的硬件包袱,他必将重新崛起。而SAP虽然面临众多后起之秀的竞争的巨大压力,可业界第一的位置仍然难以撼动。对于Oracle来说,想要和SAP一搏,仅靠不断的收购是行不通的。

不论“大数据”这个概念是否仅是互联网行业制造出的一个噱头,越来越多的信息被映射到网上,数字世界正逐渐转为虚拟世界,互联网企业坐拥海量数据并将其应用于自身服务中已是一个不争的事实。当然,未来没有一家企业不是互联网企业。

篇2

近日,一朋友刚拿到驾照,想买一辆车,打算先在网上了解一下。细心的她发现,在浏览了汽车页面后,在与汽车无关的页面上,也同样出现了相关的汽车广告。这并不是巧合,而是在她使用的电脑上,一个被称为Cookies的文件记录了她的浏览热点。

大数据成为热门趋势,越来越多的品牌厂商和广告营销机构都在发力以大数据为基础的网络营销模式。

大数据未来的发展是大家有目共睹,人们总是振臂高呼,“大数据时代已经到来”。是不是从线上发现客户线索,转至线下成交,大数据的使命就结束了?NO!

当然,收集数据只是大数据应用的第一步,如何分析并应用才是重要环节。采集到的数据并不是每一个都有用,汽车品牌主需要将多渠道、标准不一的客户数据进行整合,建立汽车大数据库。

篇3

【关键词】大数据 数据分析 数据分析师

近年来,业界、学术界兴起了大数据讨论,一夜间大数据时代到来了。大数据给学术界带来了新的思潮,大数据正在颠覆着很多传统行业的模式,带来变革。有人预测,大数据必将成为商业、政府、科研、教育、医疗等各行业面临的一个挑战。在大数据时代,数据分析、数据挖掘工作面临着机遇与挑战,本文从数据分析的角度,结合国内外相关研究,试图回答大数据是什么,如何应对大数据的问题。

一、认识大数据

(一)大数据的宗旨:经过分析的数据才有价值

大数据要发挥作用必须经过分析,这是由大数据的4V特性(数据量大、数据类型多、要求处理速度快、低密度)决定的。也就是说,数据都是高维、低密度的,从单个数据中难以看出规律。因此,必须经过分析,针对高维进行降维,提炼大量低密度信息中的价值,才能发挥作用。否则,大数据背景下,反而更容易使得“活”信息混迹在大量“死”数据中被淹没。面向大数据的分析要“简单、迅速、规模化”。

(二)大数据的目标:实现基于数据的决策与资源配置

大数据最终要实现科学决策,基于信息对称的有效资源配置。随着大数据分析技术的发展,可利用数据来源从线下封闭的数据库、数据仓库扩展到开放性的O2O(Online To Offline)融合数据,可分析数据结构从原来以数值为主的结构化数据发展到涵盖文本、视频、音频等多媒体数据。从而,大数据将逐步改变我们的决策目标和社会资源配置方式。基于数据的科学决策是一贯追求的目标。然而,信息不对称是常态,因此传统决策目标是建立相对满意而非最优(决策科学家Simon提出),资源配置效率基于市场优于基于计划。大数据背景下,迅速获取分析更多辅助决策信息成为可能,因此决策目标可实现向最优的无限逼近,实现基于数据的“计划”资源配置将更有效率。

(三)大数据的角度:个性化服务+中观指数+宏观连结

目前发展大数据,主要有基于数据为客户提供个性化营销服务、预测中观行业或区域趋势指数、基于连结的宏观资源配置方案等角度。这不仅仅体现在阿里小微融资的个性化风控决策、高端品牌在线特卖品牌和定价动态决策(基于阿里巴巴网商活跃度指数和零售商品价格指数)、Discern group企业发展战略咨询报告上,还体现在阿里巴巴商务智能指数(预测经济发展态势)和基于公共气象数据的各行业资源配置优化服务上。

互联网金融是大数据发展各角度的前沿阵地。在金融领域,要实现从金融互联网向互联网金融的快速转型。传统模式下的金融企业开展网上业务,如:网上银行、网上理财,并不是真正的互联网金融。互联网金融是指通过互联网新技术为客户实现搜索或风控等服务增值,比较有代表性的是,消除供求双方结构不对称的P2P贷款,提高存取效率的保值理财产品余额宝。

(四)大数据的关键点:保证数据质量

要发展大数据分析,首先要保证数据质量。错误的输入必然导致错误的输出。没有数据质量,一切都是浮云。数据质量没有保证,是不敢用的。数据质量是一项耗时、费力的基础工作。

保证数据质量要求数据采集与清洗过程中秉持两大原则:相关性和低噪声。第一,大数据,数据并非越“大”越好,而是相关数据越“大”越好。特别是,在数据采集中,要以采集尽可能多的“相关”数据为目标,而非不加筛选越多越好。第二,大数据,首先数据获取时要保证不存在诱导倾向的干扰因素,同时进行去噪处理。

保证数据质量要建立数据的数据。针对数据质量建立数据标签,才有进步。有了对数据质量的数据,数据才能被决策者更为安全科学有效地使用。

(五)大数据竞争的核心:分析人才的竞争

大数据时代,作为一种资源,数据不再是稀缺资源。互联网、门户网站、社交网站、微博、微信等新媒体积累了大量数据,缺乏的是对这些数据的分析人员。缺乏专业的分析人才,即使守着数据的“金山”,也只能望“山”兴叹。因此,美国Turbo Financial Group采用最新的大数据分析技术聚焦被FICO遗忘的15%人群建模,阿里提出建立大数据分析的开放式平台,希望能够集结更多专家智慧,同时培养阿里分析人才,挖掘阿里数据“金矿”。

二、把握大数据

大数据对社会生活带来方方面面的影响,我们如何把握大数据时代的机遇,需要慎重对待大数据带来的挑战。总结起来,主要有三个方面:

(一)大数据时代,数据整理和清洗工作

(1)数据整理和清洗工作是数据分析的基础。大数据专家根据经验,普遍认为该工作是一项基础性工作,耗时多且简单,占到数据分析工作量的60%以上,是数据分析前提和基础。在此基上,数据分析工作需要对数据进行标识,进行深度分析,撰写专题报告,确保结果可以执行,最终落实到决策和实施。

(2)大数据时代,需要充分借助IT技术管理数据质量工作。在大数据时代,人工逐笔发现、解决数据质量问题的方式成本高、效率低,不可持续。要尽量规范化、系统化、自动化管理数据质量工作,将节省下的人力资源投入到新问题的研究中。

(二)大数据时代,数据分析的特点

(1)采用倒金字塔模式分配“思考、工作、分享”的时间比重。数据分析工作包括三部分:“思考”,分析实际问题,将实际问题转化成数学模型,提出解决方案的过程;“工作”,将解决方案程序化,得出结果的过程;“分享”,将分析的结果,转化为决策,付诸实施的过程。在时间分配上,金字塔结构或柱形结构的分布形式不是最佳结构,倒金字塔结构比较合理。即,思考的过程花得时间长些,可以减少后期工作量,少走弯路。

(2)通过数据分析进行科学决策。很多人存在误区,认为数据分析就是做报表、写报告。在大数据时代,数据分析不仅仅停留在此,需要进行深度分析,建立数据化决策的流程。要尊重数据、认识数据,但不迷信数据。在尊重数据、尊重事实的前提下,减少主观因素的干扰,快速做出数据化决策,这是一种能力。

(3)大数据时代,数据分析的要义是――简单、迅速、规模化。数据分析的结果要简洁、易懂;数据分析的时间要短,尽可能的自动化地出结果,要快速的满足客户的需求;数据分析的方法能够实现大批量规模化。优秀的数据分析师应具有全局的预见性,一有问题可以马上把该问题打成很碎、很多的问题,甚至把一个问题克隆出很多问题,从而与业务人员建立信任,降低工作量。

(4)从“死”信息中,分离出“活”的信息。大数据有数据量大的问题――产生大量的“死”数据。错误数据是指数据与实际情况不一致,异常数据是指数据正确但数据远离群体的大多数,这类数据情况的处理手段比较成熟。而大数据时代,大量数据是不活跃主体,即“死”数据。因此,需要从高维低密度数据中,提取“活”的信息,发现规律。防止由于“死”信息的存在,导致分析结果不能正确反映“活”的群体特征。

(三)大数据时代,数据分析师的培养

(1)培养核心技术人才,确保长期竞争力。美国在建立全国医疗系统时,将系统外包给了加拿大的一家公司,系统运行的第一天就出现了崩溃。美国政府为此对该模式进行了反思,概括起来有三点:①外包公司设计时只顾满足甲方的眼前利益,不会为甲方的长远利益考虑;②项目外包造成美国技术骨干人员断层,导致出现问题后自身无法解决;③采用该模式导致美国没有了核心技术。

因此,在采用项目外包模式的同时,需要掌握其核心技术。在大数据时代,从数据分析、信息管理、IT技术三个方面保持核心竞争力。需要培养和保持业务、产品设计、数据分析、数据架构等方面的骨干队伍。

(2)建立专业化的大数据分析团队。大数据分析的核心是数学建模,基础是实际业务,结果是自动化程序。在实际工作中需要正确、合理的使用数学建模的思维,构建以数学模型做为基础的数据分析,建立量化管理风险的理念。深刻认识并正确驾驭大数据分析,大数据分析的方法是处于不断发展过程中的,需要根据实际问题,结合实际数据,灵活构建模型。

参考文献:

[1]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014,(2).

篇4

1、大数据(bigdata),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

2、在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

(来源:文章屋网 )

篇5

数据革命的浪潮正潜移默化地影响着经济社会的各个方面,包括作为基础产业的物流业及其细分领域。

利用大数据驱动信息化建设,物流车队的整体油耗,车船的位置信息、行程轨迹、运行周期等空间地理数据都能通过系统进行智能化处理,更好地实现精简流程、提高效率、降低成本的目标。大数据的分析和应用,正助力物流业完成从粗放、低效、高耗的传统业态向集约、高效、环保的现代物流转型,帮助物流企业更加精细化地了解和研究客户需求,从而“量身定制”个性化的产品和服务。

事实上,数据应用一直以来都存在,而在今天的大数据时代,关键是如何让数据变成财富。

对于物流企业来说,尽早针对“大数据”进行产品、业务、管理等一系列的变革和创新,率先挖掘“数据商机”,是掌握未来的核心竞争力乃至生存机会的根本。当然,这一切都要以建立和提高数据的收集、挖掘、处理和应用能力为前提。

没有人能阻挡时代的步伐,具有前瞻性眼界的企业,正在积极融入大数据时代。

马云很早就说:“未来的世界是数据的世界。”今年5月,他主导建立的“菜鸟网”,未来也将在数据商机方面深耕细作。而阿里巴巴与十大快递公司的核心合作点也正在“数据”方面,阿里巴巴物流事业部总经理龚涛指出,阿里巴巴可以通过数据给快递企业提供线路容量扩容指导,通过数据回溯、监控和预测,快递公司可预判消费者和商家的服务需求,开展主动服务。

物流业界以数据处理和应用为基础的各类物流信息平台在全国范围内不断涌现,极大地改变了物流运行业态。而许多物流企业也在积极试水大数据应用。在百世汇通,大数据正在为企业战略规划、运营管理和日常运作提供重要支持和指导。据百世物流科技(中国)有限公司副总裁张砚冰介绍,百世汇通尝试运用大数据来管理、分析和判断加盟网点的运营行为,通过网点在系统内的足迹建立数据分析模型,成功地预测了几次网点的异动,使工作方式由被动式变为主动式、前置式,减少了大量客户投诉,把问题消灭在萌芽阶段。圆通快递几年前便已开始投资数亿元与IBM合作开发以金刚核心业务系统为主体的信息技术平台,以获取处理海量数据的能力。

与大数据采集、处理、分析和应用相关的各类产品与设备也陆续在物流作业中投入使用,如能处理物流信息的智能手机、GPS系统以及在车辆或者包裹上的传感器系统??

篇6

“我们的数据库资源来自全世界1400多家拍卖公司,包括将近800万个艺术作品的记录。”在上海浦东的一家高端会所,来自美国Artnet公司国际拓展部的托马斯侃侃而谈,表露出运用艺术品大数据这枚“利器”进军中国市场的决心。

Artnet是一个成立于1989年的艺术品数据公司,它积极在世界范围内开展合作,除拍卖行之外,欧洲艺术品博览会、来自柏林和布鲁塞尔的相关机构也加入了合作者的行列。

而这一次,Artne将目光瞄准了中国。“中国的艺术品和古董拍卖市场是全世界最具上升动力的市场。”托马斯认为,中国的艺术品市场有着强大的后劲,在大数据的应用上将大有可为。

当天,齐聚此次艺术延伸产业“头脑风暴”的还有喜马拉雅美术馆创始馆长沈其斌、上海文化艺术品研究院执行院长孔达达和当代艺术家、批评人及策展人徐子林等中国艺术品领域的大佬。

“通过艺术品数据,可以在数据挖掘的基础上,为投资人提供艺术品市场发展的动向,帮助他们找到准确的投资方向。”孔达达称,艺术品大数据在国际上发挥的作用已经越来越重要。

市场繁荣促进“大数据”到来

中国艺术品市场在近几年的火爆,惊动了世界。“中国已超越美国成为世界最大的艺术品和古董市场。”一份来自TEFAF欧洲艺术基金会的最新数据显示,中国在全球艺术品市场所占的份额由2010年的23%上升到2012年的30%,美国所占市场份额为29%,比2011年下降了5%。

不仅如此,欧盟的27个国家所占总份额为为34%,下降了三个百分点。伴随着欧美国家艺术品交易市场份额的下降,中国的艺术品市场开始发挥威力。仅就2011年来说,中国艺术品交易额就达到了461亿欧元,相对于2009年上升了63%。无疑,中国艺术品市场潜藏着巨大的商机。

“在过去十年里,中国艺术品市场资金量有很大的增长,让业内不得不用诸多金融市场方法去进入艺术市场。”托马斯介绍,良好的数据是保证艺术品市场的基础,艺术品大数据在市场里的作用非常关键。

“中国需要艺术品数据作为观察市场的工具,艺术品大数据可以把艺术家作为金融市场的‘个股’来进行分析,从这个角度观察艺术品和艺术家成长的轨迹,也可以借助这些数据去分析艺术品的走向,为这个市场提供研究方法,使艺术品市场成为更透明、更有效的艺术市场。”

“大数据”的大能量

虽然中国艺术品交易规模逐渐攀升,但艺术品数据化的程度与欧美地区相差甚远。

“运用艺术品大数据可以为艺术品市场做不少事情。”托马斯介绍,通过Artnet搜集的艺术品交易记录,可以分析出艺术品市场的变化。“比如可以把一些艺术家放在一起,很容易综合出一个流派的指数,从中观察到他们交易数量的变化等,这些为艺术品研究报告的撰写提供了准确的数据。”

以过去十年艺术品交易市场为例,通过大数据挖掘,发现占市场交易最大份额的是现代派和印象派画作,其中,现代派占比34%,印象派则为24%。二者合力抢占了全球艺术品市场大半江山。

对此,孔达达分析称:“目前艺术品大数据在国际上已经有了较好的口碑。以Artnet为例,他们对于数据的整理较为谨慎,全线的1300多万个数据在欧美的各种银行、艺术品机构都得到了广泛的应用,带动了艺术品市场的数据化。”

他还明确表示,上海文化艺术品研究院将很快与Artnet建立合作关系,将在中国建立服务器,并由上海文化艺术品研究院搜集中国的艺术品市场的数据,充实到Artnet的数据库里,丰富中国艺术品交易市场的数据。

不过,国际上艺术品市场数据提供多以收费的方式进行。以Artnet来说,一条数据需要支付10~25美元,“如果要做一份报告,那将需要支付一笔昂贵的费用。”这种模式在中国国内是否可行,还值得商榷。

如果雅昌网也开始收费

国内艺术品市场近年来的活跃,也催生了不少提供艺术品交易数据搜索的平台。但孔达达认为,目前国内投资者对于艺术品金融大数据的概念还不太清晰,现阶段发展还很不成熟。

以雅昌网为例,它是国内较大的艺术品交易数据中心,可从中搜索全国的艺术品交易数据,同时数据还是免费提供。但由于其基础数据未经处理,读者无法从这些数据本身直接得知真实的交易情况,只能自己进行甄别。

“艺术品的数据有干净的数据、可疑数据以及垃圾数据。干净的数据是已经及时清理过的准确的数据,而可疑数据和垃圾数据分别是那些有疑问的和没有用的数据。”孔达达介绍,目前国内搜集到的基本都是二级市场的数据。

“这些数据主要源于十几个拍卖公司提供,仅仅是初始数据,里面有不少疑问数据和垃圾数据,对于那些竞拍后未付款或赝品等数据,国内还未及时清理,有时也会因为信息不对称而搜集不到。”

不仅如此,目前国内画廊、古玩店、私家交易等数据的获取几乎为零,这些数据属于一级市场的范畴,但尚未有专门机构对一级市场进行数据整理,在我国艺术品界还处于空白阶段。

篇7

1.1 大数据及其影响

大数据(Big Data)是目前最重要的科学、技术和社会话题。借用IDC数据公司的定义:“大数据是一种新一代的技术和架构,具备高效率的捕捉、发现和分析能力,能够经济地从类型繁杂、数量庞大的数据中挖掘出色价值。”

大数据定义有着如下的基本前提和含义。

① 大量的数据:大数据概念源于数据的爆炸性增长。用世界著名的咨询公司高德纳(Gartner)研究报告的描述:“同一类型的数据量快速增长;数据增长速度的加快;数据多样性、新数据来源和新数据种类的不断增加。”

② 多种类型数据积累:新的数据存储和数据采集的技术发展使巨量数据的采集、收集、存储成为可能。网络技术、移动设备、数字传感器、数码摄影/摄像、监控影像、卫星定位系统、遥感技术、气候和环境监测技术等等,每时每刻都在各种形式、各种类型的大量数据。

③ 计算技术的进步与发展:现代计算技术、网络技术、多媒体技术和数据库处理技术等可以处理各种形式的海量数据,产生出大量的高附加值的数据、结果、状态和知识。

④ 数据处理能力成为战略能力:数据量的激增、数据类型的多样、技术平台对数据的综合处理,造成了知识边界扩展、知识价值提升、知识衍生能力加快,它极大地影响到了企业、个人、社会和政府的决策,极大地促进了社会生产力的发展,使掌握大数据技术者获得了竞争优势和难于模仿的核心竞争力。因此,大数据技术也成为了国家的核心战略资源。

大数据的含义广博、技术领域广泛、技术平台多样、作用效果巨大、影响意义深远。理解大数据的理论、方法和架构,适应大数据的变革与发展,分享大数据所带来的种种便利和收益,便能够在大数据时代占领先机。

1.2 大数据对数据库技术的影响

大数据的宗旨是处理数据,数据库技术自然占据核心地位。而大数据环境下的数据库技术也具有明显的特殊性。

1.2.1 大数据环境下数据处理技术面临的新特点

数据量宏大。对数据库技术影响最大、最直接的方面莫过于数据的爆炸性增长。即使先不考虑数据类型的变化,需要处理的数据从MB扩展到GB,现在再扩展到TB,不远的将来数据库将经常面对PB量级的数据,这必然对数据库的硬件架构、数据库系统结构和数据库应用产生重大的影响。

数据形式多样。另外一个对数据库技术产生重要影响的因子是数据的多样化,传统数字、图像、照片、影像、声音等多种数据资源需要进行处理,并且和传统关系式数据不同的,许多数据格式中的有价值数据并不多,例如多张图片定对象的变化,连续视频影像中对特殊对象的跟踪等等,其数据抽取方式、过滤方法和存储、计算方式均有别于传统数据库。

单机或小型局域网的数据库处理无法满足。当前,数据量爆炸式增长,数据类型日趋多样,传统关系数据库的处理能力已难于满足,需要新的数据库处理技术。

传统的并行数据库的灵活性具有局限性。并行数据库系统取得了辉煌的成绩,但是它的灵活性不佳,弹性受限,系统规模的收缩或扩展成本非常高。这样的系统适合于“相对固定结构”的计算结构,例如机银行业务管理系统或城市交通管理系统等。

结构化、半结构化与非结构化形式并存。让数据库有能力处理这些半结构化和非结构化(有时不作区分)数据变成了新型数据库技术的一项迫切要求。

对结果要求的模糊化。在大数据的时代,计算技术不仅限于回答“是/非”问题,而是需要更多的模糊化结果。例如,流感有很可能在一周后流行、近期可能发生5级左右地震、近一周国际往返机票将上涨……这些答案并不精确,但足以指导人们的活动。非结构化数据的处理结果常常是给出模糊化的答案。

新数据库技术的出现与挑战。新需求的出现,促使了新技术的产生,为处理非结构化数据,Apache、Google、Amazon等公司分别开发了适应各自需要的新型数据库系统,相关的专家经过分析和总结提出了NoSQL的设计理念,并创建了许多成功的产品。

1.2.2 新型数据库技术的特点

与传统数据库技术相比较,新型数据库技术具有一些明显的特点,具体如下:

可处理的数据总量和数据类型增加。不再为数据结构化或数据代表性而人为地选取部分数据或进行数据抽样;不再靠样本规模的大小来控制结果的置信区间和置信度。新的数据库处理技术试图利用“全部数据”,完成对结果的计算和推断。

使用更多的非结构化数据,而不是片面地强调全部使用结构化数据。在非结构化的高复杂度、高数据量、多种数据类型的情况下,允许结论和结果的“不精确”,允许追求“次优解”。体现大数据技术“以概率说话”的特点。

不再试图避免或降低数据的混杂性,而是把“使用全部数据”作为追求“次优解”的途径。即在复杂、混乱、无结构化与确定、规整、结构化数据之间做出平衡。

在遇到“使用全部数据,得出模糊化结果”与“实用部分数据,得出准确结论”的选择时,新型数据库技术一般会选择前者,从一个更全面的角度利用更多的数据资源去寻找答案。

科学地在因果关系与相关关系中做出抉择。如果数据总体支持因果关系的判别和断言,则像传统数据库那样提供因果关系断语;如果数据计算量宏大、成本高昂或条件不具备,则把关注点由“因果关系”调整为“相关关系”——将追求“最优解”变为追求“次优解”或“模糊解”。自然地,这种相关关系的选择不能是随机的,而是预先设计和规划好的。

不同的数据库开发理念,不同的应用目标,不同的技术方案,早就了新型数据库丰富多彩、特点各异的局面。

1.3 从传统关系数据库到非关系数据

在计算机系统结构刚刚趋于稳定的1970年,IBM公司的Edgar Codd(科德)首先提出了关系数据库的概念和规则,这是数据库技术的一个重要的里程碑。科德定义的关系数据库具有结构化程度高、数据冗余量低、数据关系明确、一致性好的优点。关系数据库模型把数据库操作抽象成选择、映射、连接、集合的并差交除操作、数据的增删改查操作等。而1976年Boyce和Chamberlin提出的SQL结构化查询语言则把关系数据库及其操作模式完整地固定下来,其理论和做法延续至今,被作为数据库技术的重要基石。关系数据库中定义的关系模型的实质是二维表格模型,关系数据库就是通过关系连接的多个二维表格之间的数据集合。当前流行的数据库软件Oracal、DB2、SQL Server、MySQL和Access等均属于关系数据库。

到二十世纪八十年代后期,IBM的研究员提出了数据仓库(Data Warehouse)的概念,4年后Bill Inmon给出了被大家广泛接受的数据仓库定义:“数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理中的决策制定。”数据仓库的进步在于,它把决策支持定为数据库中数据组织和管理的目标,从而把智能性和决策能力融入到数据库中。Inmon之后,Ralph Kimball建立了更加方便、实用的“自底向上”数据仓库架构并称之为“数据集市”(Data Mart),这种技术受到企业及厂家的欢迎并采纳实施。虽然数据集市被归并为数据仓库,但是它的出现诱发了商务智能和联机分析技术的流行。

随着数据库在企业中的广泛应用,企业收集了大量的数据,如何从已有数据中提取对企业运营和决策具有重要价值的信息,成为了数据库使用者和开发者关系的话题。“关系数据库之父”科德再次走在了前面,提出多维数据库和多维分析的概念,这便是“联机分析处理”(OLAP),使得数据库已经显现了“智能性”特点。从数据仓库中产生的OLAP又反过来促进和推动数据仓库技术的更深层的发展。

篇8

2000年,在互联网处于最低谷的时候,网易公司为了给自己打气,播出一个广告,我的印象非常深刻。广告词“网聚人的力量”,特别贴切地说明了互联网的本质,即把很多单个的节点连接起来,节点越多,效应和价值越大。网络的效应、价值和节点并不是线性关系,也不是平方关系,而是指数关系,它指的就是全互联的网络。通俗地讲,指数级效能的变化,使互联网产生了颠覆传统行业的能量,这就是“连接”。

互联网的连接功能颠覆了商业模式和业界形态。过去的互联网形式,仅仅变革信息表现方式,加快信息流速度。但是手机出现后,互联网引起了全行业的革命。通过手机,人们不仅可以获得信息、服务,还可以做交易。新的连接关系在出租车行业,也会引起资源利用效率的变革。我有一辆车,去万达广场时,王健林过来搭车,节省了我的油钱,也方便了他,提高了资源的利用率。类似的,其他改革正在继续,比如,有些政府职能正在被取代;报社通过广告盈利或传播信息的方式正在改变;未来的电视台将不复存在,节目制作组直接把片子放到网上,通过网络盈利。

无线互联网、手机互联网等全互联出现后,带来的最大变化是,它改变了企业、产品和消费者之间的关系。今天的企业面临互联网,之所以感到不适应,是因为过去我们与消费者之间有太多渠道、层级。而现在每个企业的产品可以直接面对消费者,很多传统的行销方法不再起作用。物流、服务流、金钱的交易改变了原来的关系网络,减少或消灭了很多中间状态。没有中间环节,消费者可以和供应者建立直接的连接关系。

中国的互联网没有硅谷本源技术的创新来源,却依然发展得这么大。归根结底,这源于商业模式的创新和人口红利。视频网站革了传统电视台的命,腾讯微信改变了运营商挣钱的形式,阿里巴巴聚合了传统零售业的力量,小米改变了手机通信设备制造商的运营模式。

互联网把原来行业赚的钱,回馈给消费者,并赢得消费者的欢迎,所以互联网才能快速地成长,这也是中国互联网的特色。参与感、社区营销等手段,促使你把客户变成用户,再把用户变成粉丝。未来,没有粉丝的品牌将不会是真正的品牌。

有人问我,你为什么做手表?原因很简单。人机互联是2.0,物联网是3.0。物联网时代,是一个重新发明轮子的时代。过去的轮子是圆的,怎么发明都走不出这个框,而现在通过ROT技术,芯片可以放进轮子中。再用互联网技术,把产品体验变成互联网体验,最后改变商业模式,让最传统的生产制造业都有可能变成互联网企业,这是非常好的机会。

篇9

如今大数据已应用于社会和生活的多个方面,交易数据、社交数据等的融合与处理给企业带来了更多福利。在壳牌中国,大数据成为了指导企业业务及运营管理的重要应用。

理解数据之“大”

“所谓大数据其实更多强调的是数据的重要性,本质上不是绝对地说有多少数据就可以称之为大数据,有多少数据就是小数据。”壳牌石油中国区首席信息官徐斌表示,“壳牌石油过去十年甚至更长的时间,基于商业智能、数据仓库一直在使用数据。而当时IT架构基于单机方式运行,数据处理效率受限,数据源也大多来自企业内部。”

“互联网所积累的数据量越来越大,同时对数据处理的要求也相应提高。这就产生了现在新的分布式平台来做数据分析。”徐斌解释道,“所谓‘大’,现在看来可能更多出于广告目的。我个人认为,数据‘大’的概念更多是强调其商业价值,而不用去关注到底是多少数量级,或者是多少维度,这不是大数据的核心。”

“大数据的价值应该是通过数据去发现规律,通过信息整合去发现知识,并对知识进行浓缩形成智慧。”徐斌总结说,“这也是壳牌中国应用数据的最终目的。”

目前,大数据应用已渗入壳牌中国业务体系。在壳牌上游业务中,壳牌通过对地理等数据的实时采集、分析,从而提高油井开采成功率;在油罐管理上,壳牌使用SIR实时数据分析,减少潜在事故启动数量、及早发现问题,大幅降低泄露事故;同时,可减少误报导致的损失。大数据的应用可为每个油站每年节约约4000美元成本。

在下游燃油、油销售上,壳牌整合移动设备、车联网上的客户数据并进行分析,向客户推送定制服务消息。同时,壳牌与阿里巴巴合作,通过对网上交易及社交数据的分析,精确定位潜在客户,实现高达70%的客户转化率。另一方面,壳牌与银联的合作,可通过对相关银行卡交易数据进行分析,从而明晰壳牌的市场份额。

夯实大数据技术能力

目前,大数据发展行动已成为国家战略。2015年两会提出的发展“互联网+”,其中核心技术就是大数据。云、物、移、大、智,大数据是核心,通过数据才能产生资产价值。

“从目前大数据发展国内外情况来看,英国是第1名,中国排位靠后。”徐斌表示,“这一位置也表明中国大数据使用状态、数据开放都比较落后,需要有所提升。但中国大数据应用领域也很多,应用最多的就是金融业、医疗业和政府公共事业,这是目前用的比较多的三个领域。”

对于目前业界存在的一些大数据认识误区,徐斌认为要从两个方面厘清。“首先,大数据不是单纯的技术,其最重要的目的是解决业务问题,帮助业务创造新的机会,需要团队协作实现其价值;同时,大数据实现需要比较好的数据源,如果数据质量不高,再好的系统也没有意义。总的来说,大数据不是工具,是一整套体系。其次,大数据不能解决所有问题。一方面,大数据不是全部数据,因此不能够完全展现事情本质,只能预测可能性概率比较高的事情;另一方面,如果企业自身数据应用不好或存在很多信息鼓捣,也很难实现数据指导决策的有效应用。”

“目前,大数据在各个行业都有一些典型应用。例如汽车企业,可以利用互联网收集数据进行快速决策,调整汽车行驶过程;例如新浪曾经推出南方-新浪大数据100指数,通过大家讨论股票的热度、财务指标考量等维度,精选出得票最高的股票对其进行投资;另外,金融行业可以通过银行交易数据来分析跟踪整个国家经济运行情况。”徐斌介绍说。

那么,对单个企业而言,如何提升大数据应用能力建设?徐斌认为应从四方面着手。一是建立企业大数据体系,包括数据基础平台、数据报表与可视化、产品与运营分析、精细化运营平台、数据产品、战略分析与决策等;二是实现企业数据资产管理,包括数据资产治理、数据资产应用、数据资产运营;三是发展大数据应用应与云计算相辅相成;四是认识到大数据是文化与技术的结合。首先要有数据驱动决策的文化,其次要思考如何通过大数据分析和预测。

六个维度认识大数据价值

徐斌指出,大数据的应用主要有四种。“一是描述性数据应用,相当于给企业管理者一个显微镜和望远镜,了解企业发生了什么。二是诊断性数据应用,但企业发声问题时通过数据分析找出原因,如不良贷款为何一直上升?客户为何流失?哪些客户流程?三是预测性数据应用,比如通过数据测评,提前了解零部件情况,及时调配。壳牌也有这样的配件,比如钻头,如何让它更健康的运作?壳牌通过传感器了解钻头的热度、疲劳度等,及时发现问题。通过数据及时跟踪就可以提前预防,这样就为企业带来大量的价值。四是指导性数据应用,通过多维数据的收集和分析,可以给企业合理的建议方案。比如开发用户,是做线下营销还是线上接触?是找这个群体还是找那个群体?这些都需要大数据分析。这是大数据最核心的应用。”

具体到大数据在企业内部的价值实现。徐斌表示大数据对企业有六个维度价值。

决策支持

假如企业要开一个加油站,在哪个点开?这直接影响到投资有没有回报。通过大数据分析,通过手机信号定位来判断移动速度,判断是车还是人流,看看每天通过车的速度,这样的数据很准确,如果通过它来做决策,显然它的效率会高、回报率更可靠。

运营优化

比如加油站地下油罐的设计,通过大数据分析可以帮助我们决策。比如把这个区域的相应数据进行对比判断,地下油罐是不是有泄露的可能?对壳牌来说,全球评估下来,一个站一年可以省好几万元钱,一年就是十几亿,这是成本的巨大节约。

营销突破

通过大数据找到潜在的客户,可是企业的潜在客户在哪里?以前都是做线下促销活动,精准力很差、转换率很低。但是通过淘宝交易应用,通过新浪微博也可以找到相关的车主,这些人就是我们的客户,我们就对他做精准营销,这个转换率是50%,非常高。

安全保护

比如,人的安全驾驶行为可通过数据分析出来,而化工厂也能通过数据分析及时发现危险,采取措施。

业务创新

用数据做业务创新,比如某服装公司,七天内给一个客户提供定制化的西服。靠的是什么?沉淀十年的西服板型的大数据,优化裁减、安装匹配,这就是创新。

篇10

数字技术的迅猛发展,如云计算、互联网等,掀起了网络信息技术发展浪潮,推动了世界范围内大数据时代的到来,尤其是大数据技术研发投入的加大,更是双重冲击了知识经济和网络化数字化[1]。大数据不仅使人们获得新认知、创造新价值,还在一定程度上改变了市场、组织机构,而且为图书馆自动化发展提供了技术支持。在大数据时代背景下,图书馆管理和服务升级不断得到推动,其服务方式、资源存储等也发生了巨大变化,同时也受到了一定的影响和挑战,需不断创新服务模式,提高服务质量,才能促进图书馆持续健康发展。

1. 大数据知识服务概析

1.1大数据知识服务特征

大数据知识服务是一种面向大量数据的知识服务模式,也是一种新知识服务理念,产生于获取、存储、分析大量数据过程中[2]。由于大数据由大量交易数据、交互数据和数据处理技术趋势汇聚而成,且具有一定复杂性,因此,现有数据中心技术无法满足大数据知识服务需求,需不断进行创新。可见,大数据知识服务的特征主要有:(1)整体性把握知识需求不确定性。(2)跨越共性技术体系和细分特征。(3)支持按需使用或付费。(4)强调用户参与和群体协同。

1.2大数据知识服务主要表现

大数据知识服务是一种提供智慧服务以及面向数子图书馆发展的知识服务模式,智慧图书馆是未来图书馆新模式,以数字化、网络化、智能化等信息技术为基础,主要特征是互联、高效、便利,其智慧服务是一种支持用户应用和创新知识的特殊服务,建立于搜寻、分析、重组知识的服务基础上。可见,在提供智慧服务模式上,大数据知识服务的主要表现有:(1)互联、融合和共享图书馆基础设施。(2)提供智慧服务。(3)智能管理体系构建高效化。

近年来,大数据技术不断发展,数字图书馆逐渐向语义出版、移动阅读等趋势发展,且日益具有“全媒体”资源、完整业务流程等管理能力,而且云计算、互联网等也为数字图书馆的发展提供了技术支持。可见,在面向数字图书馆发展知识服务模式上,大数据知识服务的主要表现有:(1)全新的资源建设策略。(2)构建全新知识服务平台。(3)提供“融入环境、嵌入过程”的预见。

2. 大数据时代对图书馆的影响和挑战

大数据是创新、竞争和生产力的下一个前沿领域,在大数据时代,信息行业深层次分析了数据,并挖掘了其价值,而且数据形态呈现多样性,也具有极高的利用价值,因此处理数据成为了新兴产业[3]。目前,图书馆数据对象、应用技术、价值流向等都和大数据具有一定共性,可见,大数据时代会对图书馆产生影响和挑战,并促使图书馆服务模式发生变化。大数据时代对图书馆的影响和挑战主要包括:(1)大数据为图书馆服务质量的提高提供支持。如今,图书馆间的竞争不仅仅是馆藏资源、空间建筑、服务质量等,还包括大数据拥有量、数据价值挖掘等,同时图书馆日后发展策略也需通过分析和预测大数据而制定。(2)图书馆未来核心资产是综合掌握大数据。大数据价值逐渐为人们认知,其分析技术也日益成熟,这使得读者借阅习惯、服务消费记载等大数据价值被挖掘得更多,这些大数据为图书馆未来发展、服务模式建立等提供了有效依据,并构成了图书馆未来核心资产。(3)大数据时代为图书馆提供了发展机遇和挑战。在大数据时代,图书馆不仅需通过对结构化数据的了解,有效掌握现代客户可接受的服务种类,也需通过对大量半结构化和非结构化数据的了解,挖掘图书馆和客户间可能发生的事,并预测和分析未来,以利于找到适宜的图书馆服务模式,积极应对日后挑战。

3. 大数据时代图书馆服务模式创新策略

3.1建立健全图书馆制度

图书馆既是社会机构,也是国家及政府的制度安排,体现了社会对知识或信息的调节与分配,以利于保障人们知识权利和实现社会知识或信息[4]。在目前大数据时代中,需建立健全一定制定保障知识服务,即图书馆制度,所以为维护和发展图书馆制度,需做好以下几方面工作:充分发挥图书馆保护隐私权和数据安全的作用,并促进数字隐私权基础设施的建立;推动政府或相关组织积极履行制度供给、积极回应、适度规制等治理图书馆的责任,并通过建立健全图书馆制度,对政府、读者等行为进行有效约束与合理调节;构建图书馆公益信息制度,充分发挥其协同作用,保障中低阶层人民基本信息权益;在大数据时代,切实平衡公共权力、公民社会和公民权利,以免信息权力分配不平等。

3.2大数据应用理性化

在信息革命中,积极应用新技术不断创新图书馆制度、文化,可促进图书馆的高效、优质改革,所以经过多次历史经验,我们可以理性的坚信大数据时代可实现图书馆知识服务智能化、智慧化、人性化。大数据时代的到来,给图书馆带来了机遇和挑战,只有正视这些机遇和挑战,积极转变思路,熟练掌握各种技术有效分析大数据,才能在一定程度上跨越式的实现大数据时代图书馆知识服务,进而推进大数据应用理性化,并切实强化信息环境下图书馆人文关怀,维护大数据时代信息公平,保护隐私权和数据安全。

3.3构建图书馆知识服务平台

大数据图书馆知识服务平台是一个智慧平台,集获取、存储、组织大数据以及共享、交易服务资源等为一体,该平台的构建以建设智慧图书馆为基本要求,具有数据源层、基础支撑层、数据流转层、知识服务平台层等体系架构,构建时涉及诸多技术,如传感技术、适配技术、虚拟化接入技术、大数据知识服务终端交互技术等。

3.4培养高素质的智慧图书馆员

一般情况下,智慧图书馆员具有以下特征:见多识广、资质水准高、灵活性、创造力、终身学习等,这是每个智慧图书馆均需配备的人员,尤其是大数据时代背景下,智慧图书馆员更是要高素质,这不仅是人力资源的创新方向,也是培养智慧图书馆员的标准[5]。高素质的智慧图书馆员通常能准确把握对大数据范畴、价值、状态等的分析与预测;能熟练应用多个学科技术,如人工智能、信息技术等;能科学合理的规划图书馆发展方向;能建立综合解决大数据的方案,如对数据进行获取、存储、分析等。