虚拟研究环境的构建
时间:2022-12-16 10:32:00
导语:虚拟研究环境的构建一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。
(一)基本理论。数字化科研由英国在2000年提出,是为了应对当时各学科研究领域所面临问题的空前复杂化,利用新一代网络技术和广域分布式高性能计算环境——网格建立的一种全新科学研究模式,即在信息化基础设施支持下的科学研究活动。此后,该理念便席卷世界各科研领域,大家都试图用它来解决本学科在研究过程中遇到的种种难题。
虚拟研究环境(缩写为VRE)是由e-Science主导的一种结合资源、服务、工具的框架结构,其目标是为特定群体的科研人员构建起一个具有开放共享、安全可控、分布协同的网络化数字化科研平台。
它充分利用信息技术形成虚拟实验室来进行全球范围的分布式、大规模的合作研究,其目标是为科研人员提供一个跨学科、地域、机构的开放科研平台,研究人员可以通过VRE寻找合作伙伴、寻求基金支持、共享研究工具和各种资源。VRE使研究工作更加便利,使研究者能够更加专注于研究工作本身。借助VRE平台即时组建起面向特定研究主题的虚拟团队,集中精力在指定时间内完成研究任务。另外,VRE还提供研究成果的功能,这主要借助机构存储库来实现。
(二)VRE的技术基础。虚拟研究环境概念揭示了一个研究群体如何适应,以应付未来研究挑战的趋势,它不仅揭示了当前研究实践的转变,而且也揭示了通过利用先进信息和通信技术(ICT)的转变,如“网格”计算或“云”计算、工作流引擎、语义技术和先进远程会议系统。
二、虚拟研究环境需求分析
虚拟研究环境,顾名思义,是一种协作活动,它结合了分布式组件的研究能力,以达到研究人员个人或民间团体不可能实现的目标;同时,需要更彻底记录研究过程,维护和更新资源消耗和增值,以便于能被他人重新发现和再利用。
相对一般学术条件,处于虚拟研究环境的科学研究人员在研究实践和学术交流时面临问题,可能更加复杂和涉及的范围更广一些。本文涉及的课题组经过调查分析,得出在虚拟研究环境中研究人员需要得到的保障,有如下几点:(1)使用认证服务验证身份;(2)与协作伙伴沟通和协作;(3)传输数据;(4)配置资源;(5)调用计算;(6)对重复使用的数据和原始生产商给出评价;(7)输出数据和运行数据的存档;(8)既非正式通过博客或维基,又正式通过会议或期刊论文成果;(9)如何发现合适资源;(10)监测资源使用或处理的状态;(11)持续了解当前人员的工作状态;(12)找出特定数据的来源以及它是如何处理的;(13)找出谁拥有对资源的访问权限,以及他们可以用它做的工作。
也许课题组的调查分析不一定很全面,但它给出了明确的指示,众多VREs应包含的功能类型,与其他系统和服务的各种接口。一个社区或研究团体的联合身份验证就变得越来越重要,因为许多国家都在建立跨整个高等教育界的管理联盟的访问接口。数字化教育与研究框架的目标是“提供信息给投资机构和使用信息技术基础设施”。例如,Shibboleth就是主要应用在校园内Web资源共享,以及校园间应用系统的用户身份联合认证的开源项目。
三、虚拟研究环境建设策略
正如虚拟研究环境名称所蕴含的,其目的不是要建立单一的、整体系统,而是不同社会技术工具的配置,它们被装配起来以满足工作在组织、社区和更广泛的社会背景中,没有太多精力的研究人员的需要。因此,研究人员和技术开发人员需要探讨一些虚拟研究环境进一步发展的思路和想法。
(一)纵向和横向一体化。VREs的概念揭示了研究人员进行研究的整个生命周期所需资源的无缝集成。然而,目前的VRE的实施难以实现由个别研究者定制以满足其特定的研究需要,很难访问他们所需要的特定资源,很难进行不同电子研究工具的功能组合来取得预期的效果。
过去的VRE项目侧重于整合不同方面的挑战,且只提供部分解决方案。一方面与一致性用户界面一样,门户网站为机构系统提供使用单一身份验证和授权框架进行纵向集成。基于VREs的Web2.0,使通用功能通过允许集成其他工具的服务和混搭服务合理化。它们是可扩展的,并允许新功能使用APIs组合在一起,从而在不同组织环境的系统之间进行横向整合。
然而,在这两种情况下,因为有对系统的技术能力和访问权限的要求,集成仅限于系统管理员或软件开发人员。在这两种情况下,重点不是研究人员个人的研究经验,而似乎在于组织,如大学、研究机构获得政府部门的认同。研究人员经常在不同的组织环境中工作,如在合作项目中。因此,他们往往面临着需要自己去熟悉不同组织系统的不同接口,同时合作者还面对“是你的工具或是我的”的问题。
类似的问题已经在虚拟学习环境(VLE)中被发现,例如,讨论发现,从某个用户的角度来看,目前VLEs提供的扩展点是不足的。扩展性开发和安装仅限于VLEs系统开发人员和管理人员,最终用户自己无法扩展这些VLEs系统。
VREs允许跨组织边界的资源整合,这意味着,研究人员可以在远程存储器、本地硬盘驱动器和服务器上以同样的方式浏览文件。数据的管理和使用方式可能不同,但出发点是深思熟虑的个人观点。此外,研究人员工作于各种社交场合、简单的一对一合作、较大项目和更广泛的社区。关键是要掌握哪些信息共享、和谁、什么时候和在什么场合。同样,一个深思熟虑的观点需要与他人共享的数据,并且从中有所收获。这使得全面跟踪在目前分布式信息仓库中难以实现需求的重要研究对象来源成为可能。
VREs将研究人员和他们的活动放置在中心,从而允许研究人员能够追踪他们上传文件到什么存储器上、论文在那里发表了、在模拟中使用了什么数据源,等等。然而在这种方式下,一些待选平台存在可能被使用而尚未全面实现的VREs,所以横向和纵向集成的问题在很大程度上仍然没有解决。
(二)商品化和配置。在任何VRE里都有一些可能被许多学科研究人员使用的潜在的通用组件。大量的商品化组件和系统是适用的,正在不懈地努力开发互操作性框架,以促进灵活的集成,形成无缝的协同工作环境。商品化组件提供了大规模的重用机会,从而避免在已存在支持工具的地方做重复工作。例如,同步和异步协作支持就可以由集成工具提供,如即时通讯、wikis、博客等。同样,计算网格的作业提交管理、资源存储中间件管理的通用工具已经存在并且是相当成熟和稳定了,他们的普遍适用性引起广泛支持及发展,因此,重新开发它们没有实际意义。
此外,组件的重用也促进了技术方面的技能重用和终端用户方面的服务供应商重用。如果每个环境都有自己的认证系统,这将大大妨碍系统的融合,因此重新使用一般性解决办法是很重要的,如由一个大型访问管理联合会支持的验证系统。实际上,组成VRE的工具和服务应成为可见的但是被忽视的电子基础设施的一部分,使研究人员能够轻松地与同行合作,而不用关注太多的技术内容。
但是,对于专门管理和科研任务,更专业的支持是需要工具的配置和自适应,以及新工具的开发。为了适应多样化要求和最大限度地重用,模块化的方法是必要的,通过自动化过程,如发现服务和工具来提供支持,这样就让负责管理科研环境的用户解脱出来。不可避免地,这是一个关键点,技术支持人员需要干预,这些干预应该由系统通过某种方式予以支持,使用户能够更多地学习,在将来的活动中变得更加独立。
(三)发展和进化策略。科学研究的本质要求VREs不断适应变化,以配合正在进行的特定研究项目,因为随着研究在实践应用中的不断修正,很可能将需要新的功能,从而使得研究变得没有必要了。与此同时,当经济压力和研究的某些方面成为固定模式之时,意味着需要使用现有的功能和使其尽可能适应变化。一方面我们需要研究人员密切合作;另一方面我们需要技术、服务供应商建立技术配置和社会安排,使研究人员能够专注于创新方面,而不必在技术细节上花太多工夫。
一个重大的挑战就是寻找能不断适应的,可以不承担高昂成本的方式。一般存在两种情况:一种是研究小组中有自己的开发人员和提供及时的支持,这种实践类似于共同实现的概念,它依赖于用户和开发人员的主机代管、日常协作、开发和使用信息系统;另一种是通过开放式环境,服务于研究人员的开放式社区软件包得以开发,这些研究人员分布在世界各地和通过电子手段互动。这两种相反的做法各有其各自的优点,需要设法调解。
建立一个综合电子研究经验,从根本上依赖于服务供应商(为科研任务而开发特定支持内容的实体)、工具制造商和研究人员结合在一起的团体创造力,以及集成这些工具进入完整研究过程的技术和组织平台的创造力。以务实的方式来管理用户-设计的关系是能成功的,但是保留了他们的经验如何普及化,以及在技术供应商、服务提供商、中介机构以及初级和高级的最终用户之间,如何能适应去管理复杂的互动,是至关重要的。
(四)克服障碍需要跨学科的方法。科研的数字化设施和VREs将扮演很重要的角色,虽然数字资源的使用已经组成研究人员工作实践的部分或整体,但是也存在一个广泛的争论,那就是它们对有潜力和更广泛地吸收电子研究实践成果的有效探索产生了抑制。
一些科学家在他们的研究报告中论述了他们所采取的数据收集和分析的方法,这些研究成果揭示了一些相关领域,它们或多或少地运用和实践着VREs,甚至在开发和推动VREs的产生和发展,如培训、教育和推广;用户-设计者的关系和要求、协作;政策和资金;学科组织;个人技能和工作方法;安排组织之间的资源共享;伦理和法律问题、项目管理、表达和公众参与、跨越学科界限、基础理论建设;应用、标准化和统一、技术的说明;资源发现和元数据;共享、重用和屏蔽。显然,实现关于电子研究和网络学术联盟的想法,需要在许多方面进一步开展工作。
由于决策者需要克服在研究政策、组织安排、科学事业结构和奖励制度以及教育和培训方面的变化,有些问题需要进一步研究。同时,目前存在的许多问题是紧密相连的,重要的是,克服这些障碍的努力方向是真正的跨学科、借鉴相关学科的范畴而不仅仅是图书馆和信息科学。
(五)积极参与、合理利用。关于电子研究的想法很有力地论证了生成、保存和再利用研究资源不断膨胀的范围和数量的需要。对电子研究,VREs是至关重要的,因为它们是这些资源将被消耗和创建的站点。在学术交流方面,VREs也可能是转化他们研究成果的实验地点。在这两种情况下,图书馆和信息专业人员的积极参与,可以提供很多帮助,以确保他们的潜能得以实现。
如果我们要确保对提供给研究的丰富数据管理得当,那最好的用处是使用它,并且通过可持续服务支持它。例如,必须有一个支持数据存储服务承诺、为研究人员装配必要的数据屏蔽技术提供的培训和咨询,屏蔽标准和适合不同学科实践需要的代码也必须得到开发。很多专家指出,通过图书馆员和信息职业人员角色的扩大,有一些挑战被提出来了,那就是VREs成为数字资源的保管人和使用的推动器。同样,课题组认为,因为出现新形式学术交流而产生的挑战,将有利于从研究人员与图书馆和信息专业人员密切接触中获益。
当然,虚拟研究环境的研究、支持服务与其技术基础设施是密切相关的。令人鼓舞的是,很多国家已经意识到虚拟研究环境的重要性,通过各种途径和形式,资助和鼓励开展数字化科研及虚拟研究环境研究与开发。同时,许多国家级的科研机构如高等教育机构提出了建立联合数据仓库策略,在科研人员看来,就是提供了一个优秀的、为进一步推动图书馆员和信息专业人员作用的、不断扩大和加强研究人员参与的技术平台。
四、结论
虚拟研究环境已经确定了在未来几年决策者需要加以解决的、推动电子科研实践的、更广泛地吸收的一些重要挑战,如理解对学术工作和交流的影响、理解作为社会技术配置的基础设施、横向与垂直整合的问题、商品化和定制的需要及VREs开发和革新策略等。众多问题的解决需要真正的联合了技术提供商、服务提供商、应用型专家、社会科学家(特别是从事科学和技术研究工作的)以及图书馆和信息专业人员的跨学科方法和平台。