个性化服务信息资源整合论文

时间:2022-08-12 11:36:00

导语:个性化服务信息资源整合论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

个性化服务信息资源整合论文

在个性化信息资源组织体系中,存在着结构、来源各异的信息资源,需要对其进行整合,本文拟对个性化知识门户中的信息资源整合问题进行系统研究。

1基于个性化服务信息资源整合问题的提出

1.1个性化信息服务对信息资源整合的要求

以用户为中心的个性化信息服务模式,是指为了方便用户利用其各种数字化资源,充分利用各种智能化技术对不同类型、不同特点的数字化资源进行整合,实现信息资源、信息技术、信息内容的集成,使目前信息资源组织系统的公共用户界面变得简单、友好,并且使用户能利用同一检索表达式或检索词对各种数字化资源进行同步检索,实现同一主题信息资源的一步到位的检索与查询。同时,还可以根据某些用户特定的信息需求定制具有个性化特点的用户界面来提供符合其特定需求的具有个性化特点的信息和信息服务。

个性化的信息服务是以信息资源整合和信息服务集成系统的建立为基础的,如果没有完备的资源整合体系作后盾,无缝的、贴切的、高效的、主动的、一站式的信息服务模式则是无法实现的。

个性化信息需求及服务要求信息资源必须进行整合。由于目前的信息资源组织体系并没有将其提供的各种信息资源整合为一个整体,只是简单地将各种商用数据资源和非商用数据资源连接到机构网站上提供信息服务。所以,目前绝大多数信息资源组织体系给用户提供的用户界面是一个既相当复杂又不考虑不同用户信息需求差异的公共用户界面。用户使用不同的资源往往需要使用不同的检索软件并需要对路径及其它一些参数进行必要的设置,这样就大大增加了用户检索和利用数字化信息资源的麻烦。[1]

目前信息资源组织体系中各种数字化资源的非整体化状态,致使其用户界面复杂单一,检索方式迥然不同。即使专业检索人员要查检有关某一主题的信息资源,也是一件相当麻烦和复杂的事情,更何况绝大多数用户并不了解各种检索技术、各种数字化资源的结构特点,且信息需求各异。所以,把信息资源组织体系诸要素有机地链接成一个整体,使得一般用户在一个简单、友好的公共用户界面上,利用一个检索表达式或检索词,能得到面向主题的“一步到位”的信息服务,是信息资源组织发展的必然趋势。建立以用户为中心的集成信息服务与个性化定制服务相结合的用户服务模式,是信息资源组织体系满足信息用户多元化、多层次、个性化信息需求,改进数字化资源的利用率,提高服务质量的必由之路。[2]

1.2基于个性化服务的信息资源整合

信息资源整合是一种信息资源优化组合的存在状态,是依据一定的需要,对各个相对独立的资源系统中的数据内容、功能结构及其互动关系进行类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的信息资源体系。信息资源的整合程度直接关系到信息资源能否被高效吸收与利用。

整合是连接现代信息资源组织与传统信息资源组织的桥梁。传统信息机构已建立起大量的电子化、网络化的书目数据库系统,指引读者使用图书馆馆藏。最著名的书目数据库是OCLC的WorldCat数据库[3],该数据库集合了全世界3万多个图书馆的4000万条书目记录。这些用MARC格式保存的书目记录自然应该成为信息资源组织体系的一部分。由于数字化信息只是人类信息的一部分,传统方式组织的书目信息也将日益增长。所以要将数字化信息与非数字化信息有机地联系起来,组成一个广泛的、有序的和完整的信息组织体系。由于传统书目信息和数字信息资源的组织,在技术和标准等方面有较大的差别,怎样建立起这两种信息组织之间的对应关系,也是信息资源组织研究的课题。[4]

基于个性化服务的信息门户将数据库、数据仓库和文档中的信息转变成可利用的信息,并把这些信息传送到用户面前。通过集成化的方法把原有应用系统通过一个核心组件服务器(即应用服务器的服务之一)集成在一起,能够获取其他应用系统中的相关数据和消息,所有独立的、分散的应用系统通过事件、消息和数据的相关性集成为一个有机整体。由于分布、异构的信息系统将是数字信息环境的主流形态,因此整合检索和整合浏览是网络环境下信息服务的迫切要求。目前虽有多方面的探索,但仍处于初步发展阶段。而互操作性又涉及系统的、语法的、结构的和语义的4方面的问题。我们不可能奢望已存信息系统以及即将建立的信息系统全部实现标准化。我们只能最大限度地追求接口标准化,实现跨主题信息网关检索,从而为用户提供高质量的信息检索服务。[5]

信息资源整合应立足于信息资源系统结构性优化整合。系统的结构性是指系统中各要素之间所形成的某种关系,是系统有机联系的反映。相同的要素具有不同的结构形式时,系统就会产生不同的功能和效果。

信息资源系统的结构整合包括横向和纵向结构整合。横向结构指的是信息资源专业学科上的相互关联性,横向整合即对不同的数据库中相同学科专业的信息资源进行优化整合。纵向结构指信息资源在空间上的相互关联性,纵向整合即是将不同学科专业的信息资源整合为具有多维立体网状结构的有机知识整体。

结构是功能的基础,结构决定功能。要发挥信息资源系统的整体功能,必须合理地整合结构,构建有效发挥功能的信息资源体系结构。[6]

基于个性化服务的信息资源整合方式优势有:首先,能够整合多种渠道多种媒体的数字信息,不仅包括文字、还包括图像、音频、视频等不同载体、不同介质的数字信息。其次,能够实现不同类型、不同级次(一次和二次)资源间的链接,建立其图书、期刊、会议、机构、人物等科学研究所需核心资源和相关资源间的整合与链接关系。第三,能够保持知识体系的整体性和关联性,通过知识因子的有序化和知识关联的网状化,沟通相互隔绝的学科领域,使之成为相互渗透、相互作用的有机体,发挥科学知识的整体功能。第

四,能够形成具有新的组织结构和功能的资源系统。这种整合不是简单的集合和链接,而是剔除冗余、重复和劣质信息,形成一个获取便捷、利用率高的新的信息资源体系。[7]

理想的信息资源整合把各种信息资源透明地、无缝地链接在一起,让用户十分方便地使用这些资源而感觉不到他的每一步操作所调用的可能是不同的资源。

在个性化知识组织门户中,经过信息资源的整合,提供统一的检索界面,用户的信息利用将会变得非常便利,这也是数字资源开发、组织和管理所追求的一个重要的目标。

2个性化知识门户中信息资源整合的构想

在个性化知识门户中,信息资源的整合与系统组织形式有:建立开放资源系统、信息资源的整合导航、信息资源的无缝链接与动态重组。

2.1建立开放资源系统

从技术角度,个性化知识门户采用开放结构,开放地集成各种分布、异构和多样化信息资源和服务系统,动态构建满足各种用户群或业务流程需要的虚拟信息服务机制。

之所以采用开放体系,是因为用户面临的是一个分布的信息环境,需要充分利用各种现有和未来的、自建或引进或链接的、采用各种技术平台和数据模式的资源与服务系统,无论这些系统分布在什么地方。为了支持用户在分布环境中搜寻、获取和利用信息,个性化知识门户需要能够对分布和多样化的资源和服务系统进行搜寻、调用和集成,支持互操作和整合处理以及相应的集成管理,形成逻辑的集成服务。而这一切,又要在信息技术和用户需要不断发展、信息资源组织技术和体系结构不断变化的情况下建立,因此必须在按照一个逻辑体系来构建相应的资源与服务体系的同时,争取适应新的技术与机制(包括新的资源与服务类型)的发展。[8]

开放资源系统建设的目标是:制定信息资源系统和服务系统的开放描述、开放数据接口和开放服务接口规范,建立对资源系统数据进行系统化定制加工和个性化组织的政策机制和权益管理机制,建立对服务系统功能与流程进行系统化集成和个性化重组的政策机制和权益管理机制,支持第三方(包括市场力量)按照规则开发、组织和提供个性化知识化特色服务。2.2信息资源的整合导航

信息资源整合强调导航能力,因为信息资源组织体系提供的信息,不管是专业性的还是综合性的,如果不提供导航能力,用户就像是在大海中迷路的船只一样。导航的途径是多种多样的,既有基于资源类型的导航,也有基于知识分类体系的导航,同时也可以按照字顺浏览等。美国国家教育图书馆上,就按照资源的提供网站,向用户提供导航,让人一目了然。OhioLink提供了按主题浏览、资源类型、首字母来提供导航功能。[9]

笔者认为,随着数字化进程的加快,信息资源数量将会越来越多,在基于个性化服务的信息资源组织系统中,全面收集信息资源的相关信息,提供包含刊名、URL、数据库来源、ISSN、学科分类、主题词、资源类型、出版机构、使用权限、刊物被著名检索系统收录情况、刊物通信地址、刊物简介等在内的导航服务十分必要。同时应重视对引进数据库资源的开发研究工作,建立基于信息资源共享的信息机构联机电子资源检索平台,并提供各信息机构的虚拟馆藏信息,以便开展电子资源的文献传递服务。

中国科学院国家科学数字图书馆为支持科研用户方便有效地搜寻、发现和选择利用各种数字信息资源和其它信息资源,建立多个分布的学科信息门户网站,提供权威和可靠的学科信息导航,整合学科信息资源与服务系统,将学科信息资源与服务整合到用户桌面。[10]

2.3信息资源的链接与动态重组

在信息资源组织系统中,普遍存在着信息资源分散组织的现状。如不同格式的电子文档、多媒体文件无法实现统一管理和查询;基于关系数据库建立的业务系统无法高效地完成内容全文检索和主题检索;自建数据库和引进的数据库系统由于来源、所用管理系统的不一,各数据库信息资源之间无法实现统一维护管理,资源与资源之间缺乏按照知识主题的整合,各个分散的资源之间缺乏有机联系,不同信息资源无法实现集中、统一地上网并实现检索界面、检索方法的统一。

所谓信息链接与动态重组,指在已建立的信息资源体系基础上,将有关信息内容链接起来形成新的信息链或信息集合,从而实现信息的重组。[11]这种链接重组重要不依靠作者事先建立的链接,而是专门建立相应的链接机制,有意识地根据用户的特定需要和信息内容内在关系来进行面向用户的信息组织,可以看成是用户界面层的信息组织机制。

在基于个性化服务的信息资源组织系统中,要实现信息资源的无缝链接,即通过统一界面方便快捷地检索到信息资源组织体系内的所有分布式异构资源,实现统一检索界面、统一检索平台、统一用户认证。

在系统内实现对这些多源异构数据的统一管理;为异构、分布式资源提供统一的权限管理机制和安全机制;对多源异构数据的统一和检索;在统一管理和统一检索的基础上为用户提供个性化服务。

使用MARC格式对网络学术数据库的电子资源进行整合,将“实体资源”与“虚拟资源”融于一体,建立基于OPAC的一站式检索,提供“一站式”(One-stopShopping)信息服务。

2.3.1信息链接与动态重组的形式

信息链接具有多样化的形式,如:

(1)知识性链接。主要是信息内容与相关的知识组织体系链接,包括与词汇表、叙词表、分类表等的链接,通过建立链接可解释有关信息内容、按知识组织体系显示及组合信息内容,或进一步支持利用知识组织体系的映射。

(2)参考文献链接。主要指文摘索引与它们所标引的文献之间的链接,

目前已成为各个文摘索引和全文期刊出版系统的标准功能之一,并逐步走向跨出版商跨系统的、可本地控制的开放式链接机制。

(3)引用网络链接。主要链接引用目标文献的文献、被目标文献引用的文献、同被引文献、引文耦合文献等。这类系统往往融合参考文献链接功能,但能进一步通过引文关系来链接相关文献,还可对引用链接实行动态更新,从而形成一个以文献为中心的不断更新的相关信息集合。[12]

(4)语义链接。主要是利用语义网络和概念集等,将信息内容与那些虽然没有直接语言关系或引文关系,但有一定逻辑联系的信息内容连接起来,例如关于某一疾病的文献与那些和该疾病有并发关系的其他疾病的文献链接起来。语义链接需要知识组织体系和推理的支持,往往体现为虚拟的动态的链接。

(5)重组性链接。其重点不在具体文献的检索,而是对一批信息内容按照特定体系重新组织,而这个体系可能是动态定义和个性化的,例如个性化资源系统,按不同分类体系或同一分类体系的不同层面组织资源体系,按主题分类组织检索结果。[13]

2.3.2信息链接与动态重组的模式

在个性化信息资源组织体系中,需要对信息资源进行链接与动态重组,其方式有浅入深依次为:书目管理系统OPAC与数字资源的整合、通过联合检索达到一定程度的整合、建立统一元数据库通过整合检索达到更高层次的整合。

(1)书目管理系统OPAC与数字资源的整合。书目管理系统OPAC与数字资源的整合有两种方法:第一种方法是通过元数据融合达到统一检索的目的,第二种方法是通过建立关联达到相互调用的目的。(2)通过联合检索达到一定程度整合目的。它的实现有两种方法:一是通过执行Z39.50协议,聚合不同平台上的异构OPAC数据库,建立书目整合检索系统。如上海地区图书馆所采用的“Webpac检索系统”的“多数据库检索”,可在统一检索界面上通过著者、题名、主题、关键词、标书号等途径,检索上海交通大学图书馆、华东师范大学图书馆、复旦大学图书馆、上海图书馆的OPAC书目信息,不需要在各个图书馆不同的OPAC界面间来回切换。二是利用数据商提供的MARC数据,根据图书馆制定的数字资源著录标准,将数字资源导入OPAC,形成实体和虚拟馆藏的书目整合检索系统。

(3)建立统一元数据库通过整合检索达到更高层次的整合。通过支持分布的数字信息系统间的互操作、无缝交换和共享信息资源与服务,构建一个逻辑的集成信息服务机制,并按数字资源的逻辑关系组织成立体网状、相互联系的知识资源系统。如中国试验型数字式图书馆,它的数字图书馆应用系统是进行数字化建设及整合各类数字资源的基础平台,实现资源的深层标引和分布式资源库的跨库链接。

3基于个性化服务的信息资源整合展望

信息资源整合与重组是个性化服务发展和信息资源多样性发展的产物。随着数字资源的迅猛发展和个性化服务的普遍实施,可供利用的信息资源层出不穷,资源整合与重组势在必行。但由于数据库集成开发商为了维护自己的利益,在制作数据资源的过程中往往对数据库进行了种种限制,如对数据库进行加密,使一般人难以读懂和理解其数据格式;同时还存在版权问题,这给信息资源整合与重组带来了一定的限制。目前,对资源整合与重组的探讨还处于萌芽状态,还是一个有待于探讨的领域。本文在个性化服务的信息资源组织中初步探讨了其资源整合与重组问题,其实现还有待于信息资源组织领域和数据库开发商的共同努力。

由于分布、异构的信息系统将是数字信息环境的主流形态,因此整合检索和整合浏览是网络环境下信息服务的迫切要求。目前虽有多方面的探索,但仍处于初步发展阶段。而互操作性又涉及系统的、语法的、结构的和语义的4方面的问题。我们不可能奢望已存信息系统以及即将建立的信息系统全部实现标准化。我们只能最大限度地追求接口标准化,实现跨主题信息网关检索,从而为用户提供高质量的信息检索服务。

在信息资源组织与个性化服务的集成过程中,信息交流体系的组织也是重要的环节。信息交流体系是为支持一定应用任务而形成的信息内容和信息行为的集合,是任何实际业务系统的基础,在网络化数字化条件下可以通过一系列元数据来定义、描述和组织,并通过对这些元数据的识别和解析来支持对业务系统和业务流程的自动识别、操作和控制。