学位论文数据库和参考书数据库的发展调研

时间:2022-05-10 09:57:00

导语:学位论文数据库和参考书数据库的发展调研一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

学位论文数据库和参考书数据库的发展调研

【内容提要】根据CALIS管理中心开展的数字图书馆建设情况调查、学位论文全文数据库情况调查和教学参考书数据库情况调查的反馈,对CALIS成员馆目前数字图书馆建设的现状进行了统计分析,同时对CALIS“十五”期间将重点建设的学位论文全文数据库和教学参考书数据库的发展现状进行了总结。

【摘要题】实践研究

1调查情况介绍

为了配合中国高等教育文献保障系统(CALIS)“十五”期间的建设和中国高等学校数字图书馆联盟(CADLA,下称联盟)工作的开展,2002年4月,CALIS在成员馆中间发放了《数字图书馆建设情况调查表》;2002年5月和6月在联盟理事馆(注:目前中国高等学校数字图书馆联盟理事馆都是CALIS成员馆。)中间发放了《学位论文数据库建设情况调查表》和《教学参考书数据库情况调查表》。

截至2002年6月30日,共回收《数字图书馆建设情况调查表》89份,其中书面报告22份,电子版报告67份。这些调查报告中有29份来自综合性院校,34份来自工科院校,9份来自人文社会科学类院校,来自其他专业性院校,如医学类院校、农林院校和师范类院校的报告分别为5份、4份和6份。图1给出对提交调查报告的学校按地区进行统计得到的结果。根据统计数字和图表可以看到,此次在CALIS成员馆中进行的数字图书馆建设情况调查具有一定的代表性,比较全面地反映了高校数字图书馆建设的整体情况。

图1提交调查报告的学校按地区统计的结果

对于在22个联盟理事馆中间进行的“学位论文数据库建设情况”和“教学参考书数据库情况”重点调研,各单位均及时对调查内容进行了反馈。

针对上面的三份调查,本文第二部分从几个主要方面对各成员馆数字图书馆建设情况进行了分析总结;第三部分给出CALIS在“十五”期间将要建设的两个子项目“高校学位论文全文数据库”和“教学参考书数据库”在成员馆中间开展的情况;最后对目前成员馆数字图书馆建设中急需解决的主要问题进行汇总。

2整体分析

通过CALIS的宣传和培训,大部分成员馆意识到开展数字图书馆建设的必要性和重要性。调查结果显示,在2000年前后成员馆根据各自对数字图书馆的理解、现有基础、阶段性工作重点、人员情况,开始从专业性或校园范围的文献信息保障体系、数字图书馆应用系统、数字资源、基础设施等各方面进行建设,全面推动图书馆向电子化、数字化方面发展,并在资金投入力度方面予以重视。

2.1专业性、校园范围的文献保障体系

众所周知,CALIS在“九五”期间建设了三级文献信息保障体系。四个全国中心、七个地区中心分别构成文献信息保障体系的第一级和第二级,在全国和地区范围内行使文献信息保障功能。但是由于人力、物力、财力的原因,这些中心还不能满足所有高校图书馆和用户的全部需要。根据本次调查的结果,目前有10个学校正在开展专业性或校园范围内的文献信息保障系统建设。其中北京师范大学图书馆正在构造有一定规模的“中文教育数字图书馆”,将分布于国内外的中文教育资源纳入统一的检索系统;上海财经大学图书馆在数字图书馆理念以及相应的管理机制等方面进行了研究与实践,提出了建设“财经文献资源信息中心”的设想;电子科技大学图书馆“西南地区电子信息学科与文献信息中心”的建设已具雏形;首都师范大学图书馆和北京工业大学图书馆受北京市教委的委托筹建了“北京高校网络图书馆”;内蒙古大学图书馆“多功能蒙古学文献信息研制服务中心”的建设颇具民族特色;安徽大学、北京理工大学、大连海事大学、福州大学、哈尔滨工业大学的图书馆,依托校园网建立与本校学科发展、人才培养相配套的,以信息服务为重心的全方位、多层次、高效率的文献信息服务体系。

2.2数字图书馆应用系统

考虑图书馆的工作特点,针对图书馆的需要,研究和开发数字图书馆建设中急需的各种应用系统,已经被列入各成员馆的计划中。本次调查发现有16个图书馆正在应用系统方面进行技术攻关。其中开展数字图书馆原型试验系统研发的学校主要有北京大学、复旦大学、西安交通大学、厦门大学、中山大学、武汉大学等高校的图书馆,这些图书馆研制的内容包括数字图书馆体系结构、元数据、信息存储与检索、互操作等相关技术与解决方案;上海交通大学、北京大学、北京航空航天大学等10余所高校图书馆开发了“视频点播系统”,采用大容量存储设备存储多媒体资料在校园网内提供多媒体视频、音频资料的网上实时点播;复旦大学图书馆正在开发“图书馆电子资源跨平台检索系统”,实现统一界面查询,读者可以通过书刊名、文章名、关键词、著者、媒介类型、数据来源等检索项(包括组合检索项),查询系统连接的各个数据库;天津大学、厦门大学、西北师范大学等7所高校图书馆专门成立了“特色资源数字化加工中心”,开展纸本文献数字化、多媒体资源加工、电子剪报、数据库制作的相关硬件环境设备建设及软件支撑平台建设,形成数字化资源的收集、加工、分类标引、整合、、更新、维护等的完整系统;电子科技大学图书馆开发了“专题数据库系统”,为图书馆的数据库建设提供平台,包括开发、分类、全文检索、远程查询、科学管理和升级等功能,能全面、准确、高效地达到网络化数据库系统的应用标准;吉林大学、中国人民大学图书馆利用相关技术,建立了标准化的知识服务系统平台,开发了“服务子系统”,为用户提供个性化服务,包括信息定制、协作咨询、知识挖掘、多媒体教学、VOD点播、重点学科导航等;西安交通大学图书馆正在集中力量,依托CALIS西北地区中心搭建一个统一的软硬件平台,建设地区性数字资源中心、数字化中心、存储中心、交换中心以及数字图书馆研究与开发中心,为用户提供集成化的智能服务。

2.3数字资源建设

资源建设是数字图书馆建设的基础,也是各馆开展数字图书馆尝试的主要选择。“九五”期间在CALIS的宏观调控和统一规划下,一方面,各馆大幅度增加电子文献的引进,以网络版数据库为主,并引进部分光盘数据库;另一方面,各馆在自建资源方面取得了很大的突破,CALIS组织成员馆共同建设了联合目录数据库、中文现刊目次库、学位论文文摘库等数据库。在提交调查报告的89所图书馆中,85%以上的图书馆参与了CALIS“九五”期间的子项目建设,在支持CALIS资源建设工作的同时推动本馆的数字化进程,起到了事半功倍的效果。

与此同时,CALIS有选择性地支持24个单位根据本馆的特色馆藏、资源特性,在网络环境下建立特色馆藏,逐步把有价值的特色信息资源组织起来,建设成CALIS重点学科专题数据库,以便比较集中、更深层次地揭示各高校收集的富有学科特色的文献。目前CALIS重点学科专题数据库包括24家成员馆建成的25个重点学科专题数据库,数据量已达280万条以上,通过因特网进行服务,实现资源共享。

在CALIS的带动下,在24家成员馆的示范作用下,为了更好地满足本校教学科研的需要,其他的CALIS成员馆纷纷开展本馆特色资源的调研、论证和建设工作。本次调查统计结果显示,目前正在进行数据库建设的CALIS成员馆有74所,每个馆根据各自的条件和实力,或者百花齐放,如中山大学、西安交通大学、上海交通大学等17所高校图书馆同时进行几个数据库的建设;或者一支独秀,在数据库建设的质量上下功夫。

成员馆自建的这些数据库围绕着CALIS制定的“建设具有中国特色、地区特色和高等教育特色的专题数据库”的原则,或者对馆藏特色文献数字化,或者做某个学科或专题的数字资源建设工作,比较系统全面地对某个专题进行综合报道。数据库各具特色,有的体现中国文化渊源历史,有的介绍人物生平、业绩、著作,有的针对某个学科或专业做全面的介绍,有的展现科技动态。数据库形式多样,包括图象、文字、解说、全文和文摘,具有学科知识数据库的特点。揭示的内容比普通二次文献库要深,丰富了高校资源。数据库内容丰富,包含中外文期刊、会议论文、专利文献、产品、事实数据、研究机构信息,或集各种信息于一体。有的数据库具备良好的检索系统,提供WEB界面的查询,有些还使用全文检索系统和多媒体系统,可提供全文、关键词、题名、出处、文摘等多检索点检索;为配合学校的教学和科研,为推广高校科学技术成果,展示广大科研人员的劳动成果和聪明才智,给广大读者提供丰富的有价值的科研资料做出了积极的贡献,弥补了图书馆经费紧缺造成的纸本资源的不足,为高校数字图书馆的工作积累了丰富的经验和技术。

2.4基础设施建设

基础设施建设是各馆进行数字图书馆建设的一个重要部分。调查发现,有28所图书馆正在从基础设施建设入手,创造数字图书馆的基本环境。其中22所图书馆对本馆的自动化和网络系统进行了升级与改造,旨在建立先进可靠的高速信息网络系统,建设先进的图书馆集成管理系统,实现图书馆日常业务科学全面的自动化管理,为国内外资源共享提供环境;9所学校建设了多功能电子阅览室、多媒体教学、网络培训教室,提升了图书馆的开发和应用能力,为师生提供多媒体信息服务;北京理工大学、北京化工大学等4所院校还斥资数千万建设了新馆舍,给师生提供了舒适的教学科研环境。

2.5资金支持

《数字图书馆建设情况调查表》中还包括对各个学校用于数字图书馆建设的资金额度及其来源的调查。调查结果显示各成员馆数字图书馆的建设资金分别来源于“211工程”建设经费“985”工程,国家“教育振兴行动计划”,国家和省级自然科学基金,各省市教委、学校的专项拨款,与企业共建,捐助,图书馆年运作经费,学校自筹等10多个方面。由此可见图书馆动用了所有力量,通过各种渠道支持数字图书馆建设。小到学校,大到国家,建设数字图书馆的意识都明显增强,对此投入的资金大幅度增加,部分学校得到的数字图书馆建设的资金更是令人可喜。表1将各馆数字图书馆经费情况按几个等级进行了统计。需要说明的是有17个学校未对数字图书馆资金的投入进行说明,无法进行统计。对72个成员馆的统计结果显示,38.9%的学校数字图书馆建设的资金额度大于100万,其中有8.3%的高校十分重视数字图书馆的建设,投入了数千万资金支持数字图书馆的建设,但是,我们还应该看到,有超过一半的图书馆用于数字图书馆建设的资金小于10万,无力开展规模性的、目的明确的数字图书馆建设活动。“十五”期间,为了在更大范围内共建、共知、共享,CALIS任重道远。

表1数字图书馆建设资金状况统计

3重点调研

下面根据联盟理事馆对《学位论文数据库建设情况调查表》和《教学参考书数据库情况调查表》的反馈意见,综合CALIS成员馆对《数字图书馆建设情况调查表》的反馈意见,对CALIS成员馆“学位论文数据库”和“教学参考数据库”的建设情况进行分析。

3.1学位论文全文数据库建设

“高校学位论文文摘数据库”是CALIS“九五”建设的一项重要成果,是高校间开展文献传递的重要基础数据库之一。“九五”期间共有90余所成员馆参与了CALIS学位论文文摘数据库的建设,学位论文文摘数据提交量已经达到10万条。由于学位论文内容丰富、新颖、情报价值高,对某一专题有独到的见解和系统论述,对科研和生产有较大参考价值,读者需求呈上升趋势,为此,“十五”期间,CALIS将在该库的基础上进一步建设“高校学位论文全文数据库”,全面实现博、硕士学位论文资源的共享。根据《数字图书馆建设调查》和《高校学位论文全文数据库建设调查》的统计结果,CALIS成员馆中有29家开展了学位论文全文数据库的筹备和建设工作,其中13家来自联盟理事馆;目前这些学校学位论文的全文数据加起来有18100条,主要采用WORD和PDF格式保存,也有个别学校采用JPG格式和DJVU格式;其中北京大学、上海交通大学和东南大学图书馆学位论文建设工作开展较早,可以追溯到1996年;北京大学、清华大学和西安交通大学图书馆数据库建设规模较大,有超过5000条的全文数据;已经具有学位论文数据库提交系统的学校有11个,其中北京大学、清华大学等图书馆的系统已经比较成熟,不仅具有学位论文提交系统,而且同时开发了学位论文检索系统,并考虑了学位论文的编目、校验、统计,设计了学位论文管理系统;目前北京大学和西安交通大学图书馆的学位论文数据库系统是开放的,读者可以检索到摘要级,其他学校的学位论文系统有的要进行用户认证,有的通过IP限制访问;对于学位论文的版权问题,各个学校还没有很好的解决方案。比较实际的解决方法是和论文作者签署论文使用协议,限于校园网使用。成员馆的上述工作为“十五”期间CALIS学位论文全文数据库的建设提供了很好的基础。2002年5月底,CALIS管理中心邀请在学位论文建设方面有一定基础的15个联盟理事馆召开了“高校学位论文全文数据库建设工作研讨会”。会议统一了对高校学位论文全文数据库建设的认识,明确了高校学位论文全文数据库建设的指导思想为在统一的建库标准规范下,实现共建、共享。会上大家总结出学位论文建设的主要环节包括总体工作流程、标准规范、论文提交、应用系统、管理与版权等。会后,CALIS管理中心根据各成员馆的意见,整理了《高校学位论文全文数据库建设参考》,为其他准备开展学位论文全文数据库建设的学校提供参考,加快高校特色资源共建共享的进程。北京大学、清华大学、武汉大学、西安交通大学、厦门大学、东南大学等学校还表示愿意根据会议精神,在对各自的应用系统进行修改后,尽快向兄弟院校免费提供。与此同时,大家还认同了将CALIS学位论文全文数据库设计为“集中索引、分布式存储”的数据库的思路。

3.2教学参考书数据库建设

CALIS管理中心充分意识到,建设教学参考书数据库,对高校的公共基础课、专业基础课和一部分精选专业课的教学参考书提供上网服务,可以满足教育事业发展的需要,有效地解决各校教参复本量少的问题,在“十五”期间将“教学参考书数据库”建设提到了议事日程上来。

根据《数字图书馆建设情况调查表》和《教学参考书数据库情况调查表》反馈的结果,目前CALIS成员馆教学参考书数据库建设基本的情况是:14个学校已经建有一定规模的教学参考书数据库,另有11个学校开始筹划;其中教参数据库建库时间最早的是中国人民大学图书馆,始于1996年;北京大学图书馆1999年开始建库;包括复旦大学、清华大学图书馆在内的8所高校图书馆从2000年开始建库;其他的图书馆是在近一年里才开始和计划进行教学参考书数据库的建设;这些学校的教学参考书书目数据量加在一起有49500条,全文数据有5100条,其中复旦大学的书目数据量最多,已达26,500条,中国人民大学的全文数据最多,有3000条;对于教学参考书数据库系统,有7所图书馆使用TRS全文数据库进行二次开发,有3所图书馆采用快葳公司的DIPS系统,2所图书馆馆使用方正Apabi系统;选择MARC做为教参元数据进行著录的有5家,选择DC做元数据的有3家;对于全文,一般采用WORD和PDF格式;对于版权问题,中国人民大学、西安交通大学、中国科技大学图书馆目前的解决办法是限于校园网使用,其中中国人民大学图书馆已经开始对教师著作征询版权,清华大学和上海交通大学图书馆目前的政策是部分解决版权,同时结合访问控制,北京大学图书馆、复旦大学图书馆正在考虑和专业公司合作,全面解决版权;目前在主页上有教学参考书项目链接的图书馆,有上海交通大学、复旦大学和厦门大学,其中复旦大学图书馆的检索系统可以对外提供服务,非校园网用户可以浏览到书目级。

CALIS在6月中旬邀请22家中国高等学校数字图书馆联盟理事单位召开了“教学参考书数据库建设研讨会”。会上,大家根据各自的工作经验对CALIS将在“十五”期间进行的教学参考书数据库的建设工作提出了很好的建议:(1)标准规范方面:希望CALIS在标准、系统等方面提出方案与要求。(2)建设内容:在学科上有所侧重和分工。(3)版权问题:提出统一的版权解决方案。(4)管理方面:以211工程或CALIS名义,请学校教务部门将教参书的收集纳入教务管理工作,以保证教参考书的权威性和新颖性。(5)建设方式:由CALIS组织购买一批有版权的电子参考书,同时在CALIS协调下,由部分高校分工建设,共享数据,成本分摊。(6)合作思路:和数据库商与系统商合作开发系统和解决版权。(7)系统建设:第一步参建各校分别建立教参信息库,同时把数据集中起来建立CALIS教学参考信息库;第二步建设电子全文数据库。

针对以上建议,CALIS正在积极征集包括系统、资源、读者使用、服务模式、实施、经费预算等在内的教学参考书数据库的解决方案并通过申报、调研、审批方式确定承建单位。

4小结

CALIS管理中心通过“数字图书馆”、“学位论文数据库”和“教学参考书数据库”建设情况调查,从各个方面了解了成员馆数字图书馆建设的情况,同时掌握了CALIS“十五”期间将建设的“学位论文数据库”和“教学参考书数据库”在成员馆中的发展现状。

与此同时,通过本次调查,也可以看到在成员馆数字图书馆建设过程中有一些急需解决的主要问题,如标准问题、版权问题、可持续发展问题。目前各单位按各自的标准、格式及其规范将重要资料数字化,利用不同的元数据标准进行著录,没有对学科知识信息进行有序化、系统化整合,知识信息不能全方位、高效地为所有专业工作者所共享,造成资源的浪费和重复建设。如何利用各个学校建设的特色数字资源为教学科研及广大用户提供安全、快捷、准确、完整的信息资源保障服务是CALIS“十五”期间进行特色资源建设过程中需要重点考虑的问题之一。另外一个问题就是版权问题。无论是各成员馆自建的资源,还是CALIS在“十五”期间准备开展的子项目建设,大都需要解决版权问题。在后面的工作中,CALIS应该从各个角度了解、掌握、并向各成员馆普及版权知识,双管齐下,在资源建设中做到既不违反版权,又使我们的建设成果得到版权保护。从调查中我们也发现有些图书馆对数字图书馆的理解还有偏差,过分强调传统资源数字化,只考虑了资源数字化带来的积极效果,没有考虑它的负面影响,例如存储问题,长久有效的使用问题,以及数字化成本和使用价值的平衡等数字图书馆建设中可持续发展的问题。

总的来说,这三份调查充分揭示了CALIS成员馆在近两年数字图书馆建设方面的成绩,也暴露了建设中存在的一些问题,调查取得了令人满意的结果,为CALIS下一步的规划提供了思路。