档案结构数学模型论文

时间:2022-07-31 11:04:00

导语:档案结构数学模型论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

档案结构数学模型论文

【摘要题】理论探讨

【正文】

1档案结构

马克思主义哲学认为,事物都是以特定的结构形式存在的。每一种事物都有其特有的结构特征,事物若失去其自身的结构形式,该事物也就必然失去其自身的功能和属性。事物的结构是由组成它的各个要素(或因素)按照一定的规则(即要素之间的相互联系、相互作用、相互制约的内在联系)有秩序、分层次地结合成一定的组成形式而实现的。人们认识事物,其实就是要弄清事物组成要素、结构、功能与价值及其本质属性,其中结构具有非常积极的意义。对于档案结构的认识,档案学教材已有所涉猎,主要从档案的实体构成和档案的构成要素两条途径进行阐述。“文件是档案的因素,档案是文件的组合”[1]属于前者,“档案的信息和载体是构成档案的两个基本要素”[2]属于后者。前者主要的目的在于说明档案馆、室的档案与单份文件的区别,强调档案的实体结构,可以为文件的整理和档案馆(室)藏提供理论依据。后者是对档案或文件自身构成要素的概括,虽然它并不说明文件和档案实体的馆藏意义,但这一认识对档案的信息整理和信息分类提供了理论依据,特别是电子文件的出现,文件信息可以自由地游离于原有的文件载体,使得电子文件的整理几乎完全成为文件的信息整理,所以档案文件的载体和信息的二元划分,为电子文件的整理提供了强有力的理论武器。

近年来,对档案结构已有人发表文章进行专门的探讨,一种观点认为“档案的结构是以知识单元的历史联系为依据的文件载体排列方式”。[3]刘新安等在文章《档案物质实体的双重构成》中认为,档案是由“文件实体集合”和“档案历史联系的记录”共同构成。[4]本文是在过去档案界对档案结构认识的基础上,对该问题的进一步的探讨,给出数学模型的基本形式,并以此为基础解释档案学理论和档案工作中的相关问题。

2档案结构的数学模型

档案的结构是一个比较复杂的问题,而且随着档案实践的发展日趋复杂,尤其电子文件的出现,使得档案信息与载体既可合二为一,又可一分为二,因此档案的构成也必然要考虑到档案的信息和载体两个方面。我们可以将其归纳为:A=F(C+I)。

其中,A代表档案,C代表文件的载体,I代表文件载体所承载的信息,“+”表示文件载体与文件信息之和。F是档案工作者赋予文件载体和文件信息的整理行为,即整理的原则和方法。以上公式告诉我们,档案是我们按照特定的原则将文件的信息和载体进行有效组合生成的物质。其基本含义可从以下几方面理解和分析。

2.1任何一种文献,都是由载体C和信息I而构成的,档案是文献中的一种,是文献的下位类概念,它也应该由信息和载体构成,充分揭示了档案与文献的从属关系。档案与一般文献(图书、期刊、报纸等)的主要区别在于两点:其一,公式中C和I严格界定为文件的载体和信息,文件是人类社会活动的伴生物,它具有原始的历史记录性,将文件进行整理生成档案以后,这种属性不但没有削弱,反而得到了进一步的加强,这是一般文献不可比拟的。其二,就一般文献而言,整理过程不是构成文献的必要条件,即经过整理的和没有经过整理的文献都是文献,但就档案而言,我们知道文件转化为档案必须具备三个必要条件,其中之一即是对文件的整理。正如《档案管理学》教材所论述:“档案的特点和优点之一,就在于它已经不是一份份孤立的文件,也不是一批批杂乱的文件的堆积,而是具有内在联系的文件体系,它反映了各种活动和事件的原貌。所以未经整理的、杂乱无序的零散历史文件,虽然也属于档案,但从档案的一般特点来说,它并不是典型的、科学意义上的档案。”[5]换言之,孤立和杂乱的文件经过整理才成为具有结构特征的档案。

2.2A=F(C+I)中的F是文件转化为档案的基本条件,依上所述,主要指对文件实体和文件信息的整理原则。在数百年的档案实践过程中,整理原则也随之发生过几次重大变化。从最早的二元主义的序列原则(即在收文和发文二元下以时间先后进行文件排序)到事由原则,再到后来的来源原则、自由来源原则,一直到上个世纪80年代中后期,我国档案学者何嘉荪、冯惠珍教授提出主、客体全宗的理论,可以说都是对档案整理理论的探讨。由此可见,F随着档案实践的不断发展和人们对档案实践认识的深化而变化,使之具有新的内涵。文件和档案的整理是档案实践的核心内容,贯穿于文件运动的全过程(单份文件→卷→类→全宗→馆藏),它使散乱的文件具备了有机的结构特征。所以公式中的F不是档案的结构自身,但它是搭建档案结构的基本原则和方法。

A=F(C+I),F是一种法则,文件实体和文件信息的有机组合经过F法则变换成为“典型的、科学意义上的”档案。F变换以建立档案文件之间的内在联系、搭建档案文件的有机结构为目的。荷兰手册的作者认为:“一个全宗是一个有机整体,……它按照一定的规则成长着、形成着、并且变化着……”。[6]英国档案学家詹金逊也认为:“它是一种生长的结果,正像一棵树一头动物一样,也是一种有机体。……因此,它的各部分之间,也有着对它本身的意义不可或缺的结构、关节和自然联系”。[7]

2.3A=F(C+I)中的C+I对于新的档案实践,尤其是电子文件、档案实践,具有非常重要的意义。在传统的以纸质档案为主导的档案实践活动中,一份文件的载体与信息是不可分的,文件信息相对于它的载体,其“贞节”程度可谓“从一而终”,所以文件、档案的整理也是载体和信息一并进行的,不可能各自独立进行。这一时期,实际上C+I可以用一个字母表示。但自上个世纪80年代中期《中国档案分类法》问世以后,对传统的文件的结构和整理理论提出挑战。《中国档案分类法》虽然名为档案分类法,但它却不能直接用于档案室和档案馆实体的分类,《中国档案分类法》实质上是对档案信息的组织方法,而不是对档案室和档案馆实体档案的分类方法。由此人们第一次认识到,档案实体的整理和档案信息的组织是可以分离的。正是由于这一原因,在上个世纪80年代中后期的档案管理学教材中,提出档案由文件载体和文件信息两大要素构成,顺理成章,将档案的分类也划分为实体分类和信息分类。何嘉荪教授在他主编的教材和与傅荣校博士合作的专著中将档案的实体整理和信息整理称之为“实体控制”和“智能控制”。

近年来,电子文件的大量涌现直接影响到档案的整理理论和技术。电子文件的信息对载体的依赖不比当年,电子文件的信息相对独立,以至于电子文件在线传输时,其载体往往是不被考虑的,非到文件信息脱机保存时文件的载体才被重视。实际上,电子文件的整理过程已经演化为以著录为依托,以检索为手段的情报信息处理过程,它与电子文件脱机以后的实体保存并没有必然的内在联系,它们可以分别独立进行。因此文件C+I的两元表现形式,对于新的档案实践具有特殊的积极意义。对于脱机以前的电子文件的整理可表示为A=F(I),而脱机以后的实体的分类保管亦可表示为A=F(C),它们允许遵循不同的整理原则F,而且可以各自具有不同的结构。在目前以纸质文件为主导的档案整理中,实体整理(即档案室、馆的整理)以载体的排列为目的,按照历史原则(即档案文件之间的历史联系)进行,实现由文件→案卷→全宗→馆藏的实体结构;按照《中国档案分类法》对档案信息的分类,则遵循逻辑原则,形成与档案实体不同的档案信息的特殊结构。

3A=F(C+I)的异化及其意义

A=F(C+I)概括了一般档案室和档案馆的纸质档案的结构关系,它具有普遍的适用性,但它也可以出现以下几种异化形式,并且与档案工作实践中的特殊情况相对应。

3.1A=(C+I):即在特殊条件下,没有经过任何整理(公式中F不存在)的文件依然可以成为档案,而不能再将它们称为文件。尽管没有经过整理的文件不是“典型的、科学意义上的”档案,但毕竟还是档案,而且在档案实践中也是可能出现的。例如,档案征集是档案收集工作的组成部分,档案室和档案馆征集到的零散文件,虽然它们没有经过必要的整理,我们依然将它们称之为档案。档案的征集虽然在档案的收集工作中不占主流,但却是档案馆的经常性的业务活动,以至于大多省级档案馆都设有专门机构来进行档案征集工作。A=(C+I)是A=F(C+I)异化后的特殊形式,也对应着一定的档案实践活动。在何嘉荪教授和傅荣校博士合著的《文件运动规律研究》一书中,将这一现象概括为“文件运动过程中的跳跃”现象。

其实这一现象在以往的档案学研究中一直没有给予科学解释。在档案学教材中,我们一方面强调文件转化为档案的三个必要条件,必要条件之一就是没有经过整理的文件不是档案,另一方面又认为文件一经归档进入档案室和档案馆就成为档案,那么征集到档案馆、室的零散文件没有经过必要的整理,我们将它称为档案呢,还是文件呢?如果依照必要条件判断,它未经整理是文件,可是它又是档案馆的日常业务之一,而且我们将这项活动不叫做文件征集,而称为档案征集,在档案学教材中也将这部分内容设在档案工作的收集环节讲授,因此形成悖论。我们给出的档案结构模型的异化形式可以给它适当的解释。

3.2A=F(C+X)是档案结构模型的另一种异化形式,即在文件形成档案的过程中侧重于考虑文件载体,而淡化其中信息之间的有机联系及其表现形式(信息I异化为X),这种现象在现实的档案实践中也时而显现。例如:织布厂的样品室中的产品样本,其本身就具有档案的性质,它以实物的形式记录企业的产品开发和生产活动。据笔者调研,甚至有不少企业干脆将布的样本裁减成照片大小装入像册保存在档案室中,将其视为样品档案。如果将这些布的样品视为档案,样品中的信息就已经发生了异化,它不再是一般意义上的文件信息,其中信息的表现形式既不是文字的,也不是图表的,甚至也不是声相的,但是这些样品仍然具有档案属性。其实这些样本与开发它们时所形成的产品档案相互对应,换言之,二者所含的信息尽管表现形式不同,但实质上具有同一性,它们是以不同的信息形式表现同一个产品的信息,共同记录和反映企业的产品开发和生产活动,应该说二者所包含的信息具有内在的必然联系,但是对样品“档案”和产品档案却采取了不同的整理方式,且分别保管。这种情况属于重视载体的特殊性,淡化信息之间的有机联系。此种情况在档案工作实践中绝非个别现象,档案室和档案馆中将不同载体的档案淡化它们信息之间的相互联系,各自整理分别保管习以为常。特殊载体的档案尤其是实物档案往往需要特殊的整理方法,同时形成它们的特殊结构。

3.3A=F(X+I)与以上讨论的问题相反,即重视档案文件信息的结构而淡化文件的载体。当我们对档案的处理重点针对它的信息,而很少关注它的载体形式时,则档案结构的模型异化为A=F(X+I)(此时载体C已经异化为X)。这个表达式最为典型的现实意义是我们目前最为关注的虚拟档案和档案的虚拟整理。在虚拟档案和档案的虚拟整理中,整理的对象主要是针对文件的信息,使之能更好的适应人们的需求,至于电子文件的载体,在文件脱机保管以前,其载体只具有技术方面的意义,几乎与整理没有关系。电子文件即使是脱机以后,它的整理保管与纸质文件的整理原则也不会完全一致,甚至大相径庭。

值得注意的是,对电子文件的整理由于主要是针对它的信息而忽略其载体,所以整理的原则和整理以后所形成的档案结构(信息结构而非实体结构)都将发生重大变化。历史性原则(即按文件的来源、内容、时间和形式等建立的文件之间的历史联系)和逻辑性原则今后会成为电子文件整理并重的两大原则,由此引发电子档案的结构也必将突破纸质的实体档案结构的固有模式。例如,根据“电子文件真实性的永久保管国际研究项目”(IflterPARES)研究成果,一份完整的电子文件构成要包括:载体、内容、物理和智能格式、活动、人员、档案链、背景等7个基本要素,[8]与传统的纸质文件相比,显然文件的微观结构发生了重大变化。从宏观上讲,传统的全宗也不一定再是档案结构中的最高层次。美国档案学者塞缪尔斯(Samusls)提出的“文献战略”应用于传统的档案实践中显然是困难的,但在电子文件领域的应用前景是乐观的。塞缪尔斯(Samusls)的“文献战略”观念对传统的档案的收集、整理、鉴定、检索以及档案的结构形式等方面从理论到实践都将产生深刻的影响。

综上所述,A=F(C+I)概括了一般情况下档案结构的基本模型,F表示使文件转化为档案的手段、方法和原则,它具有明显的时代特征。档案的实体整理从最早的序列原则到事由原则、来源原则、历史性原则以及电子文件出现以后各国档案学者提出的新的原则和方法,都是对F的时代特征的注释,我们应该相信,随着档案实践的发展,F还会有新的含义。另外,F与文件的载体C和文件信息I明显存在对应关系,文件的载体不同(往往表现为I异化)整理的原则和方法也不同;同理,当载体C发生异化,只对文件的信息I进行整理时,也应该采取新的整理原则和方法。更值得注意的是,F、C、I中任何一个要素的变化都会直接影响到档案的结构,因此,不同文件载体和不同文件信息表现形式的档案实践将会直接导致档案结构的多元化。

对档案结构较为系统的研究,目前尚未引起档案界应有的重视,成果较少,将档案结构模型化就更显得困难,本文仅作为对该问题的初步探索,抛砖引玉,希望得到档案界同仁的批评指正。

【参考文献】

1、2陈兆吴,和宝荣.档案管理学基础(修订本).北京:中国人民大学出版社,1996:14

3桑毓域,翟惠媛.论档案的结构及其在实践和理论上的作用.天津档案,2002;1

4刘新安等.档案物质实体双重构成.档案学通讯,2003;5

5冯惠玲.档案管理学.北京:中国人民大学出版社,1999:6

6、7何嘉荪,傅荣校.文件运动规律研究.北京:中国档案出版社,1999:123-125

8冯惠玲.电子文件管理教程.北京:中国人民大学出版社,2001