电子文献资源的稳定性研究

时间:2022-12-21 03:46:06

导语:电子文献资源的稳定性研究一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

电子文献资源的稳定性研究

一、电子资源引证标注

史家作史,贵在真实,有几分材料说几分话。历史学研究著作的参考文献的著录规范与否,是考察其学术水平的一项重要标志。参考文献的著录,主要的考量是为了方便读者可按图索骥来检索文献,目的是证明历史的真实性。文献信息资源的引证标注有三种情况:注释、引文出处、参考文献。由于电子资源制作、流通和发行等方面不同于传统纸质文献,它的著录规范有独特之处,在引用时一般需要注明文献网址、文献格式和访问时间等信息。但基本理念是依据纸质文献的引用和著录规范,包括:作者、文献名、出版单位、出版时间。本文针对使用电子资源过程中常遇到的问题从以下几个方面讨论。

(一)电子文献引证标注与参考标准文献类型中国的历史学学术规范主要参考《〈历史研究〉关于文献引证标注方式的规定》《〈中国社会科学〉关于引文注释的规定》《高校人文社会科学学术规范指南》《中华人民共和国国家标准》(GBT77142005)、《科学技术报告、学位论文和学术论文的编写格式》(GB7713—87)。英文写作引证规范可依照《芝加哥格式手册》(TheChicagoManual)标注。电子文献的复杂性和多样性无疑增加了学术研究对规范细化的要求。关于电子文献的引证标注方法国内外的认识正在走向成熟,但仍没有形成统一标准,一些细节问题需要根据方便他人准确查找的原则具体问题具体判断。关于是否需要标注文件类型,《〈历史研究〉关于文献引证标注方式的规定》《〈中国社会科学〉关于引文注释的规定》没有要求,但《中华人民共和国国家标准》(GBT77142005)要求标注。在我国,电子资源的编目和国际接轨,主要依据国际图联(IFLA)于1997年出版的《电子资源国际标准书目著录ISBD(ER)》,以双字母作为标识:DB—数据库,CP—计算机程序,EB—电子公告;对于非纸张型载体电子文献,还要在参考文献标识中同时标明其载体类型:MT—磁带,DK—磁盘,CD—光盘,OL—联机网络,并以下列格式表示[文献类型标识/载体类型标识]:DB/OL—联机网上数据库,DB/MT—磁带数据库,M/CD—光盘图书专著,CP/DK—磁盘软件,J/0L—网上期刊,EB/OL—网上电子公告。所以,关于是否引用文件类型和载体类型需要看具体的标准,无论投稿或提交学位论文还是研究报告,都需要一一根据具体要求做相应调整。历史学科的引证著录标准并不统一,这一点也需要注意。

(二)不标注网址的电子资源无需引用网址的电子文献主要指那些来自网络,且具有稳定载体、格式稳定和类似纸质图书发行方式的电子资源。如,纸质光学扫描文件和CD、DVD软件。第一,来自纸质出版物的光学扫描电子文献无需引用网址。如果能够确定一份电子文献是完整扫描且未加任何内容修改的图像组合而成的电子文献,仅从参考方面而言应该等同于阅读了原书,在引注时无需声明是电子版文献。这种电子书忠实地再现原文排版的图像形式,包含出版页所有信息,如,作者、出版社、出版时间。其参考价值和纸质文献无异,因为如果将这种电子页面打印出来和复印原书无异。这类电子文献的可靠性最高,也是学术研究和写作所寻求的。如果是通过网络获得这类光学扫描电子书,在写作时标注其格式或来源的网址都是不必要的。第二,原始发行内容未被修改过,且使用虚拟光驱打开的软件虽通过网络获取,仍无需引用网址。包括可以在网络上传播的CD和DVD压缩文件,如,ISO。这类文件需要使用虚拟光驱打开,其实际效果和直接用光驱打开相同,一般在流通环节很难修改,因此可以放心著录,无需注释网址。需要注意的是这类资源一般没有页码,所以不需要注释页码,只注明文献类型、载体类型和出版时间即可。这类软件有很多种,比如《中国大百科全书》(光盘版)、《牛津英语大词典》(OEDonCDROM)等。这类文件很稳定,不管何种渠道传播,如果不是技术人员很难修改内容。其内容不变,参考价值就不变。第三,来自网络的非扫描电子报纸。这类资源主要是指那些经由电子书公司批量购买加工的报纸。这种资源直接通过报社采购,内容未经修改,一般只是改变格式,以EPUB、HTXT、MOBI为主。这类资源站点主要有汉王书城、亚马逊kindle和苹果应用商店。比如,从汉王公司网站“汉王书城”上订阅和下载的报纸。以《参考消息》为例,每一期的内容和纸质报纸相同,引用时无需注明网址和格式,只注明日期和版号即可。

(三)电子资源引证标注网址方法为方便查询资源,往往需要标注电子文献所在网络地址。网址是统一资源定位符(URL,英语UniformResourceLocator的缩写)也被称为“网页地址”。但是事实上,URL具有不稳定性,经常处于“变动”中。一个网址经过一段时间后再打开就不一定能够定位文献。历史学写作中一般不鼓励使用未经纸质出版的网页文献,但在有些情况下又不得不用,比如,图片、统计数据、视频、最新观点和唯一可以找到的信息。这种情况下,引用网址时最好做到以下几点:其一,复制完整的网址。其二,保存全屏为图片格式。具体方法是,网页文件另存为“web档案,单个文件”,最好使用软件辅助截屏Snagit或者按键盘上的PrntScr/SysRq键,可以全屏抓图,在画图文件或word文件里粘贴编辑就可以了。这种保存文件方式双重保险,即便网址变动无法访问了,仍可拿出证据。这一做法已经广泛应用于当今网络社会各个方面,比如,微博留言、网络销售的取证。此外,网络地址的引注方法也应根据具体的规范而变化,如《历史研究》要求标注日期用汉字,而《中华人民共和国国家标准》(GBT77142005)要求用纯数字。以下为例:《历史研究》规范,文下注释方式:①王明亮:《关于中国学术期刊标准化数据库系统工程的进展》,1998年8月16日,http://www.cajcd.cn/pub/wml.txt/9808102.html,1998年10月4日。《国家标准GBT77142005》规范,文后参考文献方式:[2]王明亮.关于中国学术期刊标准化数据库系统工程的进展[EB/OL].(19980816)[19981004].http://www.cajcd.cn/pub/wml.txt/9808102.html.综上所述,电子文献在参考和引用时要注意其稳定性和权威性,针对不同情况加以区别,参照不同标准,灵活运用规范,需用辩证的方法来提高史学写作的质量。

二、历史学电子学术资源状况与前景

电子资源是信息时代的新文献载体产生和发展的必然产物。随着计算机技术的发展和应用的推广,各种电子学术资源也随之产生并迅猛增长。

(一)历史文献电子化是发展趋势自1971年产生电子文献以来,历经短短42年已有数量庞大的电子资源存世。世界上最早的电子书工程是古藤堡工程(ProjectGutenberg,缩写:PG),它开始于1971年,由志愿者参与创建,致力于将文化作品数字化和归档,并鼓励创作和发行电子书。古藤堡工程是世界上第一个数字图书馆。该项目已经收藏了相当多的历史文献供免费下载。进入21世纪以来,电子文献发展速度迅猛,日新月异。生产速度已经远远超过了任何一种传统形式的文献。被公认为世界十大数据库之一的谷歌公司在2004年开通了图书搜索业务,其图书电子化速度十分惊人,到2007年时每天可以扫描3000册图书,到2008年时总量达到了700万册。而另一个拥有巨大数据库的数字文献馆“InternetArchive”,2008年10月时已经在世界上5个国家建设了18个扫描中心,每天可以生产1000册高质量电子图书,总量在2012年10月时也已经达到了300万册,当时的数据总量已经超过了100亿兆。

在这个基础上,历史学电子资源增长速度更快。作者利用“谷歌”(Google)分别在2009年和2012年搜索与史学电子文献相关的词汇得到以下数据。与历史相关的“historydata”(历史数据)、“onlinearchives”(在线档案)、“historyebook”(历史电子书)增长率分别高达842%、485%和1456%。这充分说明历史学可用的电子文献增长速度非常之快,可以用作历史史料的电子资源十分丰富。作为一种新形式的文献其影响范围远远超过以往的任何一种文献形式。首先,计算机存储容量大、网络传播速度快、时间地理限制少,这些因素都极大推动了历史文献普及的程度。电子文献以其便捷小巧的特点在历史学研究和发展中提高了研究的效率。其次,电子资源传播范围广。个人计算机的普及使无数的组织和个人参与了进来。作者在写作前可以通过网络进行检索,多方讨论,交流文献,短期内使文献资料更加详尽。以“互联网档案”(InternetArchive)为例,2002年7月注册用户数为2人,2008年3月份有4,7674名新注册的用户,到2008年8月29日一共有79,1734名注册用户,到2013年6月24日则增长为153,2335名注册用户。读者可以提出自己的意见,使电子文献得到改善。读者也可以参与文献编辑。如,著名的维基百科网站就是一种网友编辑式的百科全书,读者本身也同时可以是电子文献的作者。实际上网络上存在着数量庞大、难以统计的、由电子书发烧友制作的电子书,他们自己扫描、整理、编辑、编写来自实物和网络上的文献,再到网络上。因此历史学研究者就可以更详尽、更快捷地掌握资料进行历史写作。总之,电子资源发展时间短、影响广泛、参与度高,已经成为广大历史学研究人员不可缺少的研究资源。

(二)在我国史学电子文献未来发展前景我国史学电子文献与欧美等发达国家有一定的差距,仍有较大发展的空间,主要表现在史学电子文献开发程度和使用的普及程度低。首先,电子文献普及程度和利用率低。大量电子档案文献只能在科研教学集中的地方使用,这实际上降低了电子文献的普及程度。另一方面,在电子文献集中的地方需求往往有限,加之下载速度低,利用率相对就低。目前在全国高校的图书馆租用的数据库中,史学类数据库虽然内容多,但是真正能够被作者使用的文献却不多。这主要是因为史学研究的“碎片化”现象导致研究人员对特定的电子文献有需求,而历史类数据库往往包罗万象。如,NewsBank公司制作的《世界各国报纸全文库》(www.newsbank.com)有大量的报纸和档案资料,然而用到这种数据的人却比较少。此外,这些数据库的缺点是下载速度慢,登录限制多,租赁费用高等。有些数据库只能在线阅读,不能下载,而其中的大部分图书又都可以在其他的网站找到并以较快的速度下载。因此这类数据库的实际效果有限。租用一个租赁费用高昂,而利用率相对低的数据库,也不利于历史学数据库长远发展。其次,电子文献电子化开发水平低。

近年来我国信息电子化程度不断提高,但与西方发达国家相比,仍有一定的差距。虽然中国有一些文献数据制作单位,如,知网、万方、维普、中国社会科学网,已经建立起了学术期刊数据库,每年都将期刊、报纸、学位论文等内容制成光盘和上网发行。但是在开发水平上还不能与国外的电子资源发达国家相比。比如,国外不但有类似Jstor这样的综合型学术期刊数据库,也有以一个专业内的几种期刊或一种期刊为主的数据库,呈现多样化发展模式。如,作者在研究宾夕法尼亚历史时可以随时下载《宾夕法尼亚历史》期刊上自创刊(1934—2004年)以来七十多年的文章,而且全部为PDF格式光学扫描版的全文,其内容版式与原版期刊别无二致,而中国此类数据库则不多见。此外,我国图书电子化规模小,尚没有出现美国谷歌和国际档案网这样的大型数据公司来承担图书电子化的大型工程。未来中国电子文献有着广阔的发展空间,无论是电子资源电子化程度和开放程度都有待提高,检索数据库系统有待进一步优化,电子版权制度有待改革。相信随着社会信息化程度的加深,我国建立具有高度开放性的图书馆和数据库是未来电子资源发展的必然趋势。随着电子文献数量的增加和在史学研究中的广泛应用,可以预见将来,几乎所有的文字信息都可以找到电子版本。

总而言之,电子资源具有设备和技术更新快,性质不稳定等特点,这就决定了其参考价值取决于发行人、制作技术、流通途径、载体和格式等方面。在使用电子文献时,历史学电子文献引证标注参考标准有所不同,需具体情况具体对待,慎重参考和引证电子文献。随着信息技术的发展,电子资源对于历史学研究日益重要。我国历史学电子文献仍有巨大改善空间,在这方面我们仍需做出很多努力。

作者:刘博单位:中国社会科学院亚太与全球战略研究院