PC版
搜索导航
论文网 > 管理学论文 > 档案管理论文

数字档案馆元数据迁移研究

  Abstract:To maintain the evidential value of electronic archives in the long-term migration process of digital archives,the paper conducts a deeply analysis of function,scope and process of metadata migration in digital archives.It proposes metadata migration included in migration plan,quality control measures in metadata migration to improve the migration mechanism and long-term preservation quality in our digital archives.
  Keywords:Metadata migration;Electronic archives preservation;Digtal archive
  元数据迁移是确保数字档案馆保管电子档案迁移后凭证性的重要方法,正如澳大利亚新南威尔士档案馆提出的“元数据在迁移中至关重要,是证明文件可靠性的最终手段”。[1]特别是在数字档案馆历次新旧系统更替,电子档案迁移的过程中,缺少对元数据迁移的规划,会造成电子档案背景信息丢失的累积性效应。而在我国目前数字档案馆迁移机制的研究中,中国知网检索出电子文件和档案迁移相关的12篇文献都集中在电子档案本身迁移的研究,元数据迁移研究几乎为零。本文通过分析元数据迁移的功能、内容和关键流程等问题,对我国数字档案馆迁移机制中充分重视和运用元数据,提供参考和指南。
  1 数字档案馆元数据迁移的定义和功能
  迁移一词,英文为“migration”,我国国家标准《GB/T26162.1信息与文献-文件管理-第一部分:通则》中将其定义为“在维护文件真实性、完整性、可靠性和可用性的前提下,将文件从一个系统转移到另一个系统的行动”。国际文件和档案领域代表性定义例如“迁移是系统地将电子文件从一个系统的文件移动至其他系统中的过程”,[2]从定义可以看出,迁移是将电子档案从源系统(软硬件系统)向新系统转化的过程,而所谓元数据迁移,就是在电子档案从源系统向新系统转化的过程中,同时对其携带的元数据进行转化或转移,如图1所示。
  出于技术更新、载体过时、管理模式变更(分布式向集中式模式转变)、格式转换等目的,数字档案馆需要采用迁移策略将电子档案移动至新的软硬件技术环境中,无论是简单的迁移,例如将电子档案从过时的光盘载体上复制到新光盘中,或是将电子档案进行格式更新的迁移活动,还是在较为复杂的迁移活动中,例如将电子档案从旧的电子档案管理系统中抽取出来,移交到新系统中,就会造成或多或少电子档案背景信息的丢失,造成凭证价值的影响。但是如果在电子档案迁移过程中,重视元数据迁移,就会弥补这部分背景信息丢失的缺憾。
  所谓元数据,指的是“描述电子文件内容、背景、结构及其长久保存的信息”,[3]例如主题词、责任者、来源、格式、业务活动、相关案卷等这些信息都是元数据,如果仅有一份独立的电子档案,人们无法了解这份电子档案形成的初衷和其处理的历史背景,但是通过其元数据,就可以理解这份电子档案的关键内容、业务背景和其他档案之间的关系,因此,元数据通过将电子档案置于一定的业务背景和档案管理级次关系中,而促进了电子档案凭证价值的确认。而忽略元数据迁移,对于数字档案馆长久保存活动带来的影响不容忽视,假如一份电子档案保管期限长达100年,数字档案馆会将其在多代系统之间进行迁移,如果第一次迁移丢失了10%的元数据,也就是电子档案的内容、背景等信息丢失,多代系统之间的迁移就会造成成级数的丢失。百年后,用户对电子档案最初形成的业务背景,所处的保管环境,有哪些用户具备权限访问该份电子档案,档案应用了哪个版本的分类方案等系统信息无从知晓,凭证价值受到严重影响。因此,在迁移过程中,不仅要保持电子档案本身的完整性,还需要保证其元数据迁移的完整性,同时还要保留下档案和其元数据之间的链接关系。
  2 数字档案馆元数据迁移的内容
  2.1 电子档案元数据迁移。在数字档案馆迁移过程中,应首先对电子档案进行分析,明确哪些元数据对于迁移后电子档案的凭证性不可缺少,再予以迁移。国际领域提出迁移过程中三类元数据对凭证性至关重要,包括内容类、背景类和结构类元数据。这三类元数据分别说明电子档案的内容、业务和保管背景、结构特征,以一份文书类电子档案元数据为例,如表1所示。
  表中列出的是这份电子档案的内容、背景、结构等重要特征和对应的部分元数据。在迁移过程中应尽可能地保留下这些特征和元数据。数字档案馆需要从凭证价值出发,结合具体业务、未来用户需求去考量迁移过程中重要特征及元数据的保留情况。各类元数据的具体内容包括:
  (1)内容类元数据:说明电子档案的内容特征,即说明文件所要传达的内容,例如主题词、关键词、主要人物等,内容元数据主要用于迁移后电子档案针对内容的检索和利用,是确保其长期可用性的重要工具。
  (2)背景类元数据:说明电子档案的背景特征,即文件形成和管理的环境和历史,例如文件责任者、业务活动等元数据。背景元数据主要有两种:一是文件形成业务背景,说明电子档案形成的业务历史,将电子档案处于一定的业务背景中理解和解释,例如业务时间、业务级别、业务说明元数据;二是文件管理活动背景,说明作为档案管理对象,采取和实施的文件管理活动,例如长久保存、检索、处置、控制、利用元数据,该类元数据提供文件管理行为和决策的可审计追踪,确定该份电子档案是在一定安全管理下进行的,凭证性未经非法篡改等行为影响,因此,对说明电子档案的凭证价值至关重要。当电子档案迁移时,也必须捕获文件迁移过程的元数据,作为背景信息的一部分。
  (3)结构类元数据:说明电子档案内部或外部结构,即文件要素关系,例如相关附件、相关案卷、相关全宗、业务分类方案等元数据。该类元数据主要说明:①文件内部结构,例如电子文件内部包含链接样式表或图像;②文件之间的关系,例如记录同一个业务的多份文件;③文件和文件集合之间的关系,例如文件和所属案卷、类别的关系;④文件和其他实体的关系,例如文件和形成者的关系;⑤文件和其他控制工具的关系,例如文件和业务分类方案的关系,文件和其应用文件保管期限表的关系,文件和利用安全控制法律法规的关系等。在迁移后,这些关系都必须存在,因此,必须在迁移过程中关注这些关系元数据,确保所有必要的元数据都能迁移至新系统中,并且保持可用性,链接至相关文件,这将对维护文件的背景和真实性很重要。
  对于电子档案元数据,我国行业标准《文书电子文件元数据方案》(DA/T 46―2009)中提出了文书类型档案相关元数据可供依据,但是数字档案馆电子档案类型居多,所需的元数据不尽相同,因此,需要形成、参考和依据更多类型的元数据标准作迁移过程参考。在无国家标准可依据的情况下,各馆可以根据实际或是参考国际先进标准来补充,例如美国印第安纳州大学2010年开展的元数据标准的可视化地图项目,该项目对文件遗产领域制定的105项元标准按其应用的资源类型(Domain)、应用领域(Community)、功能(Function)和目标(Purpose)四个维度进行了分类和统计,我国可充分借鉴这些元数据标准应用到迁移工作中。
  2.2 电子档案系统元数据迁移。系统元数据指的是电子档案保管计算机系统中所含的元数据,例如访问授权、访问角色、访问时间、访问人员、系统分类方案版本、版本号、分类方案设置时间、失效时间等元数据。这些元数据“记录了档案管理系统中何人、何时、出于何种原因执行了何种动作,以及何人具备权限查看和执行系统操作”,[4]这类系统元数据看似和电子档案并不直接相关,但是,其是对电子档案所处保管环境的背景说明,对于新旧系统迁移后完整还原电子档案所处的系统背景,通过元数据证实电子档案所处环境的安全稳定性,来证实电子档案的真实可靠。正如欧盟发布《文件管理系统模块化需求》(Modular Requirements for Records Systems)指出的:“系统元数据的重要性就在于其影响电子文件的证据价值。”因此,系统元数据也应当随同电子档案一起迁移。
  对于这类系统元数据,目前我国缺乏相关标准和规范可供依据,可以借鉴欧盟发布的《文件管理系统模块化需求》标准,该标准对电子文件和档案系统中的系统元数据做出过规范,指出为确保电子文件在多代系统迁移中的凭证性,对系统中的每一类重要对象都应捕获其系统元数据,例如对系统中的用户对象应捕获用户标识、用户名、用户创建时间、用户所属分组、用户删除时间、用户权限说明等系统元数据;对系统中使用的分类方案、保管期限表等控制工具应捕获其标识符、创建时间、第一次应用时间、名称、说明、版本、失效时间等元数据。
  3 数字档案馆元数据迁移的核心流程
  国际标准提出,元数据本身也应当作为文件长期管理和迁移。因此,元数据的迁移应当作文件本身一样进行,从计划到实施和完成,分为三步:迁移准备、执行迁移和迁移完成阶段,具体内容包括:
  3.1 迁移准备。在迁移前的准备阶段,数字档案馆应根据迁移电子档案重要特征选择迁移元数据数量和内容。对元数据的完善程度、来源、从系统中如何抽取、以什么格式迁移等问题需要明确。理想的情况是数字档案馆系统本身在运行和维护中就依照一定的元数据规范建设,系统中元数据已经生成完善,直接导出进行迁移即可。而在电子档案本身元数据并不完善的情况下,档案管理人员需要与系统研发维护人员共同协商决定元数据的提取方法、格式和需要人工补充的元数据。
  当明确迁移元数据后,应当制订正规元数据迁移计划,对元数据迁移的过程、记录、质量控制和责任人员等问题必须予以明确说明,确保迁移过程有法可依。对于在迁移过程中,收集、补充、记录元数据的方法和规程都应当做出明确。为确保电子档案凭证价值,迁移过程中,源元数据是不能随意修改的,新电子档案的元数据会发生变化,例如格式元数据从bmp变成jpg,这种新变化的元数据就需要体现在新文件携带的元数据中,对于何人、何时有权生成新的元数据都应记录在案,明确其责权。
  3.2 执行迁移。在元数据迁移过程中,必须确保(1)在新旧系统之间建立元数据对照表,确保所有计划迁移的元数据完整和准确迁移,电子档案能够在迁移过程中保持其凭证性。(2)流程控制:迁移过程中,机构必须充分记录所有流程,包括格式转化流程、元数据封装等文件管理过程,并且以元数据的形式记录,和电子档案保持链接,作为电子档案背景信息的一部分,也有助于证明迁移文件的保管链是连续的、真实的和可靠的;记录流程中做出的所有决策,包括为什么不迁移文件的相关元数据,因为这些元数据对机构的持续业务或可靠性没有价值。(3)质量控制:迁移过程中,应当进行质量保证活动,对迁移过程进行评估、记录、生成报告和由负责人签署。该报告可以证明文件成功迁移。报告内容至少应包括:迁移的文件和源文件的元数据和特征比较说明,迁移过程中使用的所有必要的控制措施等,说明由于迁移导致在元数据格式或内容方面的任何变动,不会影响到电子档案的真实性。(4)元数据封装:有些数字档案馆采用封装包的形式将元数据和电子档案封装在一起长期保存,迁移过程中需要解封装,对更新的元数据需要重新封装。
  3.3 迁移完成。迁移完成后,应检查元数据的准确性,例如元数据字段的必选值都有、字段值长度正确、数据范围有效;字段值数据类型正确,例如数值型、字母型、日期型;元数据值准确,例如形成日期正确等;迁移过程中生成的流程元数据准确;迁移后元数据和电子档案保持链接,关系正确等。另外,还应重视迁移源元数据的处置问题,在某些情况下,源电子档案删除,迁移前的源元数据不应删除,还应当保管一段时间,作为日后查证。

相关论文

档案馆档案数字数据研究
大数据背景下日化企业市场营销创新策
浅谈大数据时代房地产企业新型营销路
乡村生态治理共同体建设的农民主体性
新农村建设中强化农村经济经营管理的
课程思政融入“保险学”教学的路径及
辅导员视角下新闻传播学类专业学生就
人事档案管理信息化建设创新路径研究
河南打造具有国际影响力的黄河文化旅
数字媒体时代辽宁老字号企业品牌运营
大数据时代拼多多盈利模式研究