数字化信息档案化问题论文

时间:2022-07-25 05:33:00

导语:数字化信息档案化问题论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

数字化信息档案化问题论文

信息技术几乎已经渗透到了社会活动的所有方面,作为现代社会活动的技术基础,正在逐步改变着社会活动的运行方式。档案作为人类社会活动的产物,必然伴随着社会活动运行方式的转变,在形成、传递、存储和利用等自身运动规律上发生本质的变化。人们积极应对信息化,不仅要关注档案的载体形式变化,寻找适宜稳妥的管理方法,更为重要的是,要研究档案这一事物整体在信息技术基础上的运动新规律,探索和建立基于信息化的管理新理念、新模式和新方法。

一、信息化发展的背景

1、信息系统对业务的覆盖率逐步提高

自上个世纪90年代后,互联网应用的普及和信息经济的兴起,带动了电子政务、电子商务和社会信息化的全面发展。

仅从政府角度看,我国电子政务经过十多年的发展,形成了一定规模的信息化基础设施,建设了大量的电子政务应用系统,正在经历由传统运行方式向以网络为基础的信息化运行方式转移的过程。以北京市为例,“十五”期间,全市1186种政府业务,运用信息化实现的有591种,建成726个业务支撑系统,50%的政府业务通过信息化手段实现;各级政府和业务部门高度重视业务应用系统的开发和应用,约90%的市、区政府部门建设了局域网,超过90%的政府部门达到了人均1台计算机,有90%的政务部门已建成或正在建办公自动化系统,其中无纸化程度达到50%以上的部门占80%。①

2、基于网络平台化的信息共享和业务协同

互联网技术和应用的快速发展,无论是政府还是企业的信息化,都受到战略管理和服务客户的强烈驱动,在不断地扩展信息化的应用领域和内容,朝着基于统一网络管理平台,跨部门信息共享和业务协同的方向发展。

政府各机构在履行经济调节、市场监管、社会管理和公共服务四项基本职能过程时,正越来越广泛地采用信息技术来实现。由于应用目标的整体性,要求政府业务系统、政府信息具有集成性和共享性。例如,北京市业已建立了连接各级政府机构政务系统的政务内网平台,通过信息交换平台和政务门户网站,各级各类政府机构可以实现协同办公和信息共享。又如,北京市东城区首创的网格化城市管理模式,通过综合的信息化手段,实现了对城市各类基础部件的综合管理。再如,“首都之窗”网站群作为政府门户,正把更加全面的政府公共服务纳入到信息化应用范围。②

企业信息化应用模式早已脱离了个别业务系统孤立应用的阶段,步入了企业战略协同系统应用阶段,其中ERP(EnterpriseResourcePlanning,即企业资源计划)最具代表性。ERP是20世纪90年代提出来的,目前已发展为企业管理信息系统中最为流行的一种形式,几乎是企业信息化的代名词。ERP系统以经营资源最佳化为出发点,全面整合企业的供销存、财务、计划、质量、制造等核心业务,并最大限度提升企业各项经营资源的应用效率。

实现统一的网络平台管理,进行系统协同整合,核心的内容就是要进行应用系统及数据集成,建立可以共享的统一数据管理结构。建立一致的数据规格标准和建立统一的数据管理、应用规则,是实现应用系统和数据集成的主要途径。如何建设与上述信息化环境配套的电子档案的统一管理、共享利用的机制、模式,网络环境下的档案馆如何构建和运作,都是需要深入探讨的问题。

3、信息资源战略成为信息化核心内容

2004年12月国家颁布了《关于加强信息资源开发利用工作的若干意见》,标志着我国的信息化步入了以开发利用信息资源为重心的发展阶段,这既是信息化向其本源的回归,也是我国信息化发展到一定程度的结果。

从国家层面来看,信息资源开发利用,就是借助于信息化手段,为提高政府公共服务能力、增强政府能力建设、推动和谐社会发展为目的,形成政府信息资源、社会信息资源综合开发利用的局面,同时推动信息资源产业发展,促进我国经济社会的可持续发展。政务信息资源的开发利用紧紧围绕政务公开、重大基础信息库和重点业务应用系统的建设进行。社会信息资源开发利用重点是强化农业、科技、教育、卫生、社会保障、档案等领域的公益性开发和利用。同时,国家将研究制定鼓励信息资源产业发展政策;健全信息资源市场监管制度,完善网络环境下的著作权保护,提高审批效率,扩大登记备案和事后监督的范围;研究制定政务信息资源社会化增值开发利用的财政政策和信息资产管理办法;制定信息资源开发利用标准体系表,优先制定并大力宣传贯彻信息资源分类、共享、基础编码等国家标准;推进公共文献基础数据库建设,积极开展社会化服务。③

从机构层面,信息资源开发利用是信息资源服务于战略决策、满足客户信息需求和提高业务管理信息提供水平的客观发展需要。从信息化发展的进程上来讲,信息系统总是由满足业务处理、运行需要开始,信息资源的开发利用遵循着数据—信息—知识的过程。机构层面的信息资源开发利用总是从系统集成、数据集成开始,在整合的数据仓库基础上进行数据的挖掘和满足不同需要的数据应用。这实际上类似于我们传统的档案管理利用流程,应当把它纳入到信息化条件下的档案管理内容范畴。

二、信息化条件下档案管理的若干问题

信息化系统正在演化成为各类组织业务运行的基本方式,网络平台正逐渐成为政府机构、企业信息运动的支撑平台。对档案管理活动而言,各类组织运行平台的变化,给我们提出了很多基于数字化概念的新问题,这些问题需要我们去深入思考,探索符合信息化特点的新思路和新方法。

1、电子文件长久保存和长期可用问题

人们把以数字化方式记录的文件,统称为电子文件。电子文件在性质、形式上与纸质文件的不同,无疑是档案界最先感受到和最先关注的信息化带来的变化和影响。由模拟方式转变成数字化的记录方式,主要的问题有三个:一是电子文件的长久保存问题,数字化信息复杂多样的编码格式、读写方法和载体材料,都给电子文件的长久保存带来困难。二是电子文件的证据力和法律效力问题,这包含了对数字方式所记录信息的真实性以及获得、保持信息真实性方式方法的可行性、可信性问题。三是数字化信息与载体的依附关系问题,数字化信息的组织是通过编码形式完成的,人们处理、传输、存储和显现数字化信息,要借助能处理这些编码的信息技术设备间接完成,因此,数字化信息依赖于元数据、数据格式、软件系统和硬件系统才能够被处理、存储和显现。综上所述,电子文件的复杂性、变化性、多样性是过去纸张载体所没有的。

归纳起来讲,目前解决电子文件真实性、长久保存、长期可用的途径主要有如下几类方法:一是通过法规约束电子文件格式种类,如我国的《电子文件归档与管理规范》所选择的管理方式,方法就是尽可能地选择比较通用通行的少量几种文件格式,通过降低电子文件格式种类繁复性,增加电子文件长期保存的可靠性、可控性。二是通过对电子文件存在的系统相关要素的规范设计和过程控制,以保证电子文件的真实性和可靠性,包括系统地记录背景数据和规范、控制信息流转环节等方式。三是提高载体材料寿命或对电子文件处理、存储、传递和应用所依赖的软硬件环境进行备份的方式。四是分离数字信息的语义表示与格式表示,形成不依赖于特定的通用信息存在形式,不会出现因为数据格式及软硬件环境的变迁而造成电子文件不可使用的情况,如以XML作为标识规范的方法,等等。

为了解决上述问题,国内外都作了相当多的探讨和尝试。首先,各国都倾注力量,制定系统成套的和普遍适用于各类信息系统的电子文件管理需求规范和档案系统标准,力求把问题解决在电子文件的形成阶段,达到电子文件永久保存的目的。如澳大利亚的国家“数字化保管动议”,通过建立文件管理国家标准、文件管理元数据规范、文件系统设计与实施程序等标准规范,保障电子文件的长久保存。其次,从数字档案的永久性入手,研究具有长久保存价值的数字档案的系统化保存、保管方式,如美国国家档案与文件署(NARA)于1998年开始,耗时6年时间对永久保存电子文件的可能性、保存技术、保存系统的功能需求进行了全面的论证和试验⑤。第三,研究数字化适用载体在各种状况下的长久保存问题,如荷兰2000年启动了“数字保存试验”项目,针对政府常用的电子文件类型,进行了迁移、采用XML格式和仿真三种数字保护方法的试验,评价各种方法的效果、局限性、费用及应用的可能性。第四,在我国,通常采用的方式是,档案部门站在长久保存的立场,通过归档要求的约束,保障电子文件的可靠性,如《CAD电子文件光盘存储、归档与档案管理要求》(GB/T17678.1-2-1999)、《电子文件归档与管理规范》(GB/T18894-2002)等,省市地方和行业主管机构也制定了相关规范或标准,如建设部的《城建电子文件归档与电子档案管理规范》。

2、多种类型数字化信息的档案化问题

在电子文件数量快速增长的同时,其种类也日益丰富,包括文本文件、电子报表、电子邮件、图形、图像文件、视频文件、网页文件、数据库文件等。数字化信息的复杂多样,具有传统纸质文件所不具有的性质,因此,这些数字化信息的档案化在总体上处于随机状态,有些数据累计存储在业务数据库中,有些被定期销毁,有些则被迁移到临时载体上。如果不能建立系统型的管理规则,很可能造成不可挽回的损失。

导致数字化信息档案化问题的原因归纳起来有以下几种情况:

(1)与传统文件运转流程无关。长久以来,人们已经形成了纸质文件档案化的系统化的方法体系,主要是依靠业务流程的自然发展进程,在业务流程终结时,把文件归档转入档案系统,以备今后工作查考。或者对文件的价值进行鉴定,判别文件对形成者的意义大小以及对社会的意义大小,在规定的时间阶段,把分布在各个机构的文件汇集到档案馆集中保存,以长久留存社会记忆,保障社会发展的延续性。久而久之,文件的档案化形成了对业务运转流程及其规则的依赖性,当数字化信息因不能纳入一般的业务流程,或业务流程因信息化而发生变化时,将会导致电子文件在档案化过程中范围的缺失。比如,电子邮件系统已经成为绝大多数政府或企业网络系统的必备子系统,电子邮件也早已成为人们在进行工作交往时的基本工具,很多国家或组织也都制定了电子邮件的管理制度,但电子邮件的档案化问题依然处于随机管理状态,主要原因就是电子邮件联系方式的公私性质不容易界定,不容易纳入到正常的业务运转流程之中。

(2)非文本型数据。在纸质档案管理时期,由于非文本型数据的数据单元不能完整地表达一个事项,数据结构、信息组织方式与文本方式不同,并且很多结构化的数据库数据经常处在变动之中,无法纳入到文本文件的管理体系,往往不进行档案化处理。信息化的发展,使得电子文件的数量与日俱增,但档案机构往往比较注重对文本型电子文件的归档和收集,对非文本型数据库数据、多媒体数据的归档重视不够,也没有切实可行的档案化措施。而且,档案界还存在着一个概念误区,认为数据库文件本来就有自身的数据结构,并且处在存储状态,没有必要再转化为所谓的档案文件。目前,大部分关系型数据库,都是作为支持业务流程的存储机制来建设的,从性质上来讲,可以认为是“暂存数据”,而且,这些数据往往是随着业务过程的变化而不断更新变化的,在结构上又是连续性的,往往不能按事项分块,不能按传统档案管理方式管理。但是,这些数据往往是一个业务系统的核心资源,

支撑着一个机构的业务运行,绝大多数具备档案价值,如果不尽快建立有效的档案管理制度,可能会造成比较严重的损失。目前,有注意到非文本型数据归档的机构,往往采用简单拷贝、累加存储的方式,或者以备灾数据库的方式同构备份数据。这些方式可能不能真正解决数量巨大的非文本数据档案化问题。

(3)网页类型文件。互联网的普及,使数量巨大的Web文件存在于流动的网络信息海洋之中。我国的各类机构为了与外部环境的联系与沟通,建设属于机构自己的网站的比率很高。据国务院信息化工作办公室的资料显示,到2005年底,我国政府域名()注册量达到23752个,政府网站达到11995个,县级以上门户网站拥有率达到81.1%,其中部委、省级、地级和县级政府网站的拥有率分别为96.1%、90.3%、94.9%和77.7%。⑥但由于网页文件的内容重复率高,数量巨大,各类机构往往都不作档案化处置。这种情况是否存在档案缺失的漏洞,也是值得深入研究的。

3、双轨制与双套制问题

随着信息化的深入发展,各类机构的信息系统覆盖率不断提高,意味着文件的处理、运行过程的双轨制越来越趋向于单轨制,这是一个必然的趋势。但是,在人们的档案思维中,依然存在着对纸质档案的心理依赖,充满了对电子文件的不确信感。这种情形也体现在国家及行业已经颁布的电子文件管理的相关国家标准、行业标准中,规定对于具有长久保存价值的文件,要电子、纸质形式双套保存。

造成双套制比较普遍的原因,从根本上讲是档案思维还停留在纸质文件时代,对电子文件及其存在的技术环境还不熟悉、不确信,对电子文件是否能够长久保存及长期可用缺乏认知。其次,是国家的档案行政机构缺乏档案无纸化战略规划、制度设计和系统规范,使得对纸质文件依赖成为制度性的选择。包括我国在内的很多国家,都相继颁布了《电子签名法》或相关法律,力求通过法律的形式,确认数字化信息在社会交往和经济活动中的法律地位及其具有凭证性的条件。《电子签名法》的意义在于通过法律确定了电子数据可以作为法律凭证,使电子文件具有了与纸质文件同等的证据作用。一般来讲,《电子签名法》主要是规范电子文件的技术条件和应用背景,以保证电子文件在交互过程中的真实性是可确认的,是可以作为证据使用的,但并没有解决电子文件的长久保存问题。而这方面的规范有赖于档案管理机构来解决。

双套制的另一种情形,是国内的各级各类档案馆大量地将纸质档案拷贝成电子档案。为使档案馆蕴藏的丰富档案信息资源能够提供网络应用,根据档案利用需求有选择地提供目录定位服务以及部分档案的原件服务是必要的。如果盲目地无限度地进行档案的电子化,以此作为数字档案馆建设的成就标志,只能造成巨大的资源浪费。

可以想像,不解决双套制的问题,是无法推动信息化发展的。信息化发达国家在信息化进程中都强调“无纸化”作为信息化的战略目标来积极推动,可见它对信息化发展的重要意义。

双套制或无纸化的解决方案,一定不是单纯的技术解决方案,而应该是制度化方案。这个制度化的解决方案,依赖于我国信息化的发展程度,取决于信息系统的业务覆盖率,特别是网络应用的覆盖率。在此基础上要形成无纸化的全面管理制度,可能包括两个层面:档案馆层面的和机构层面的。档案馆层面要解决电子文件永久保存的技术条件(载体的可靠性、信息对格式的非依赖性)、文件真实性的制度和管理系统保障规范、电子文件应用的规范。对机构层面,档案及档案管理系统提供凭证性、证据性文件的系统认证标准、规范,第三方认证机构的建设等。

4、电子文件运动规律与档案管理模式选择

近年来,关于“文件生命周期理论”和“文件连续体理论”的争论十分引人关注。信息化彻底改变了各类社会活动的时空关系和运行模式,人们需要基于新的社会运行方式,建立新的信息思维,寻找信息运动新规律,以求在准确揭示信息运动规律的基础上,更好地进行管理。这是这场争论的意义所在。

“文件生命周期理论”与“文件连续体理论”的实质,是如何看待文件运动的统一性和管理一致性问题。“文件生命周期理论”强调在文件的不同运动阶段有着不同的运动特性,强调在不同的阶段实施不同的管理措施。而“文件连续体理论”认为文件运动是一个整体,文件运动有着不同的功能轴,文件运动每一个时点,都可能包含一个或多个功能价值取向,因此,管理上不必划分文件与档案的阶段性。从弗兰克·厄普沃德对文件连续体模式的四项基本原则看:第一,文件价值的持续性与文件档案化。主要强调的是文件、档案的整体观,这与我国普遍认知的“文件管理与档案管理一体化”的观念是相类似的⑦,是“从文件形成到文件作为档案保存和利用的管理全过程中连贯一致的管理方式”。第二,文件联系以逻辑联系为主。这是传统档案学的基本原则,档案的分类、主题方法都是按逻辑组织文件的方法,即使是网络化条件下,文件分处不同的物理位置,也应坚持这种方法。第三,文件管理制度纳入业务活动目标与过程。它强调的是要把文件管理职能制度化地纳入业务系统中,应该说“纳入”概念在档案界也并不是新概念。第四,档案学是随着组织知识的背景条件变化而变化⑧。这是关于档案学理论随着社会发展环境变化的思想,是任何理论都应该具有的素质。归纳起来讲,文件连续体理论强调的是文件与档案是一个整体,不必区别管理,而且从形成阶段就应予以制度化的干预。显然,这一核心思想存在着理论臆断性。文件的形成是为业务运转服务的,其首要目的和价值是业务的有效运转,如果按照文件的历史价值进行文件系统设计,其结果不仅会削弱文件的真实性、客观性,而且可能导致业务系统效率的极大降低。信息化发展的进程已经证实,无论是政府或是企业的系统,随着时间的推移都面临着系统数据档案化的问题,在业务系统中建设数据档案库,或者是不经档案价值鉴定,简单地直接地迁移业务系统数据到档案库,其信息质量根本无法保证。况且,由机构档案室到档案馆的过程,也绝不能是简单的迁移过程。

作为我国的档案工作者,在学习国外的理论经验时,不能采取简单的“取代”或“覆盖”等方法,而应该是在考察各种理论的基本背景的前提下,积极汲取各种观点中的有益成分,构建适合我国的档案管理可行模式。

网络技术的发展极大地促进了业务系统的连续性、关联性,如果不在制度上和文件管理要素上对业务系统提出要求,比如提出元数据要求,就可能使业务系统自然生成的电子文件无法长久保存。所以,文件连续体理论提出的整体系统思想是非常值得借鉴的。我国的电子文件管理中提出的全程管理、前端控制思想,就是对这种理论的合理诠释。但是,档案有档案的价值取向,对电子文件的管理要素的控制,不能取代对档案价值的判断和对文件的取舍。特别是在信息膨胀的时代,这一点尤为重要。目前,我国很多地方正在积极建设网络文件中心。这种热潮的基本出发点是,对分布在各个机构的业务活动中的电子文件进行集中管理,有的采取集中存储、集中利用的模式,有的采用备份中心的模式,有的采用存储目录、逻辑归档的模式。网络建立的广泛联系,为各种模式都提供了支持条件。无论是物理集中,还是逻辑集中,电子文件中心都不能以文件的集中取代文件的档案化过程。否则,随着时间的推移,就会出现电子文件的大量堆积的局面。无论采用何种理论模式作为指导,在电子文件运动整体环节中都不能取消“档案化”的环节。在信息爆炸的时代,这一点尤为重要。

注释:

①北京市信息化领导小组办公室:《北京市“十一五”电子政务规划研究报告》。

②北京市信息化领导小组办公室:《北京市“十一五”国民经济与社会信息化发展规划》。

③⑥《2006年中国信息化发展报告》。

④www.naa.gov.au/recordkeeping/rkpubs/summary.html。

⑤www.archives.gov/。

⑦何嘉荪、叶鹰:《文件连续体理论与文件生命周期理论》,《档案学通讯》2003年第5期。

⑧TerryCook.ArchivalScienceandpostmodernism:NewFormulationsOldconcepts.Archivalscience.2001(1):3。