时间:2023-03-16 15:25:38
序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇电子文件论文范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。
电子政务是指运用信息及通信网络技术打破行政机关的组织界限,优化政府组织结构和工作流程,形成新的政府管理形态,实现政府、非政府组织、企业和公民之间的良性互动。电子政务系统实质上是政府办公自动化在范围和功能方面的延伸,从内部办公延伸到对外服务,它是面向社会的政府办公自动化。在电子政务系统中,公文的起草、审核、签署、以及收文办理等,都是在电子政务的操作平台中进行。这些在电子政务系统中运行的公文,是机关职能活动的历史记录,所以必须按照档案管理的要求进行归档和管理。但由于这些公文是通过电子政务公文处理平台产生的,它的特点决定了其归档和管理的方式并不能简单套用纸质文件的归档和管理方法,而应将电子文件的管理功能嵌入电子政务系统之中,实行文档一体化管理与全过程管理等方式,并采取多种措施,以确保电子文件的真实性、完整性、可读性和安全性。
传统的文件与档案管理,它们各自具有一套独立的管理流程,两个管理流程执行各自主管机关制定的制度和标准,并且两个流程之间是通过文件实体的交接而衔接的。而文档一体化管理是按照文件生成与运行规律,采取统一、严密的手段,高效地组织与管理文件。文档一体化管理与传统文件和档案管理相比较,最大的区别是通过对文件和档案管理流程的重组,达到两者在管理上的无缝化和程序上的一体化,从而最大限度地消除组织机构因素造成的两者在衔接上的真空地带和减少重复性作业。
1电子文件管理的原则
1.1“前端控制”原则
考虑到电子文件的易改性、易逝性等的特点,如果还是象过去那样,按照文件的生成、积累、鉴定、立卷、归档,分类、著录等顺序按部就班地管理电子文件,那么电子文件的真实性就难于保证了,电子文件的流失也是不可避免的,并且还会造成部分的重复劳动。因为电子文件在归档之前就有可能已被修改,或者有些已被有意或无意地删除;有些在文件形成时已提取了主题词,文件归档之后还要进行标引工作,这无疑是增加了劳动量。因此,必须贯彻“前端控制”的原则,即要求将原来纸质文件管理系统中后期阶段需要控制的手段提到前端,也就是说档案部门对于电子公文的管理工作的介入要向前延伸,从文件生命周期的“前端”就开始控制文件的归档活动。具体来说,在文件系统设计阶段,档案人员就要参与设计、进行指导;就应该考虑归档与归档后文件管理的需求,将集中管理一份文件的所有相关信息作为一个整体归档。要把归档工作嵌入工作流程,以保证在每一个流程之后,将相关文件实时归档。并且要求用户及时著录和鉴定文件信息,并且把著录、鉴定信息与电子文件之间建立联系,以保证文件归档时,将该电子文件与相关信息一并移交或发送给档案部门。
1.2“全程管理”原则
根据电子文件的特点,必须建立一个完整的管理体系,即对电子文件从产生到永久保存或销毁进行全过程和全方位的管理,以确保电子文件的真实性、完整性和可读性。
电子文件全程管理原则具体应该体现在电子文件管理体制与模式的确定、管理系统的设计与运行、管理制度的内容和执行等方面。以电子文件管理系统对文件流程各阶段的管理和监控为例:设计的系统应对产生于机构内部各部门及其应用系统上的电子文件进行统一的归口登记、分类、鉴定,同时监控和记录针对文件的一切操作,如文件的创立、登记、修改、审核、签署、分发等。而且,对文件进行的技术操作,包括操作平台的转换、存储位置的改变等都应该记录下来。因为这种管理和跟踪记录,对于证明和保证电子文件的行政有效性和法律证据性都有着重要的作用。
2电子公文的真实性保障
判断传统文件的真实性,主要考察两个方面:一是文件载体的原始性;二是文件形式的原始性,其主要是指具体的文件内容、字体、字迹以及具有法定效用的签署、印章等。只要其中的任何一项发生了变化,就可以对文件的真实性表示怀疑。但判断传统文件真实性的准则并不适用于电子文件,因为一是电子文件的载体与其信息是可以分离的,载体的不固定性,使得电子文件不再具有传统意义上的“原件”的概念;二是电子文件的更改可以不留痕迹,复制起来真假难辨,处理过程又具有隐蔽性。因而判断电子文件的真实性必须更多地着眼于其内容的真实性,主要是认定文件是否就是当时当人当事形成的,主要关注的是其本质的要素保持不变。国际上的一般做法是采用法定程序对电子文件的生命周期进行全过程管理,并通过技术措施和管理制度,组成一个贯穿电子文件从生成、运作到处置全过程的安全“通道”,以此来保证数字信息的真实可靠性。在目前的技术条件下,一般可采取的措施是:
2.1在计算机系统中设置安全防护技术措施
一是建立对电子文件操作者的身份识别与访问权限的控制,防止非法侵入。
二是设置操作日志,自动记录实施操作的人员、时间、内容等。
三是对电子印章、数字签署等采取防止非法使用的措施。在国家立法机构正式颁布有关电子签章的法律实施之前,对只有签章的电子文件,归档时应附加有法律效力的非电子文件签章。
2.2身份识别技术
身份识别技术主要用于正确识别通信用户或终端的个人身份。最常用的方法是给每个合法用户一个“通行字”,代表该用户的身份。通行字一般由数字、字母或特定的符号组成、只有本人和所使用的计算机知道。当合法用户要求进入系统访问时,首先输入自己的通行字,计算机会将这个通行字与存储在系统内有关该用户的资料进行比较验证。如果验明他为合法用户,就可接受他对系统进行访问;如果验证不合法,计算机就会拒绝该用户对系统进行访问。
2.3防写技术
将数字信息文件设置为“只读状态”,在这种情况下,用户只能从计算机上读取信息,而不能对其作任何修改,可以有效地防止用户更改数字信息内容,从而达到保护其真实性的目的。
3电子公文的完整性保障
传统文件的完整性保障主要是通过鉴别文件最初形成的信息内容和载体是否被破坏过,是否保持着作为证据所要求的各要素。而电子文件的显示,却随着使用软件的不同,其外观可能不一样,再加上电子文件的信息与其载体又是可以分离的,因而使得传统文件完整性的判断标准不再适用于电子文件。
目前比较一致的看法是,电子文件的完整性一是指电子文件和与之具有有机联系的其他相关文件数量齐全;二是指每一份电子文件的内容、结构和背景信息没有缺损。为此,要求电子文件归档时,有关电子文件的支持软件和软件的支持文档、以及有关的元数据都应同时归档。在同一活动中,有时除了形成电子文件之外,还可能形成一些纸质文件,为保持这些文件之间的有机联系,确保同一活动中形成的档案信息完整性,应尽可能将这些纸质文件作数字化处理,作为电子文件一并保存。对于在不同应用系统中分散形成的、不同媒体的内容相关的电子文件,如有关同一事件的电子文件一部分在电子邮箱中,一部分在电子表格或相关数据库中,则应收集齐全并保持有机联系。在电子政务系统中按公文处理流程生成的公文,其构成要素包括文件处理单、原文、附件、电子文件的纸质拷贝件等,都应纳入归档的范围。
4电子文件的可读性保障
电子档案来自各个方面,来自各立档单位,往往是在不同的计算机系统上形成的。其内容格式及数据结构不尽相同。这种差异必然导致在利用过程输出时所使用的技术与方法的不同。又由于计算机技术的飞速发展,电子公文形成时所依赖的计算机软硬件技术不久就有可能过时,以致新的软硬件无法读取原先存储的数据,所以为保证数字信息档案长期可存取性,建议采取以下几种措施:4.1采用通用技术
目前,电子公文的形成方式多种多样、很不统一,这将给今后利用工作带来许多的困难。所以在电子文件归档时,应把属于特殊格式的电子文件转换成通用的文件格式;或将电子文件建立在通用的数据平台上,以消除由于技术不同或技术过时所带来的影响。一般文字型电子文件以XML文档和RTF、TXT为通用文件格式;图像电子文件以JPEG、TIFF为通用格式;影像数据以MPEG、AVI为通用文件格式;音频电子文件以WAV、MP3为通用文件格式;多媒体音像数据以MPEG、AVI为通用文件格式。
4.2打包保存法
打包保存法就是在保存电子文件的同时,将与电子文件相关的软件及其应用系统一并保存,并与电子文件存储在一起。在使用该电子文件时,可运用与该电子文件存储在一起的这些软件系统进行读取。此法一般是针对那些无法转换为通用文件格式的电子文件,如用音频设备获得并经过计算机处理的动态影像文件,应注意收集其非通用格式的压缩算法和相关软件。
4.3拷贝法
拷贝是在原来的技术环境下,适时重写信息数据,防止由于存储载体物化性能变化而引起的信息丢失,这也是电子文件长期保存的一种基本方法,此法目前已大量地应用于磁盘、光盘、磁带档案信息的长期保存上,但它不能解决电子文件由于计算机软硬件过时所引起的长期保存问题。
4.4再生性保存法
再生性保存法是指将技术过时的存储在磁性载体或光盘上的电子档案,适时地转移到纸张上或缩微品上的方法。这样利用时就不再使用计算机软硬件技术读取,从而避免了计算机软硬件过时所带来的麻烦,并能很好地保证电子文件长久的可读性。其不足之处是失去数字化信息可远距离传输、检索方便、使用灵活等特点。而且,有些电子档案信息,如声音信息、视频信息、超文本信息、多媒体信息等也无法转移到纸上或缩微品上。
4.5迁移法
迁移法就是将数字信息从一种技术平台转换到另一种技术平台上的复制方法,它是计算机软硬件变化适时改变数字信息格式的一种处理过程。这一过程使得数字信息在将来也可以被读取。迁移也意味着数据信息从一个存储载体转移到另一个存储载体上,以进行数字信息的长期保存与读取。采用迁移法,通常是将对软件依赖性强的格式迁移到对软件依赖性低的通用格式上。或者将数字信息从品种繁多的格式迁移到易于管理的标准格式中。目前迁移技术被认为是保护数字信息长期存取的必须和恰当的选择。但迁移也不能“一劳永逸”,随着电子计算机技术的升级,还应适时再迁移,从而使数字信息随技术更新而一代一代地向下流存。
以上介绍的几种方法,一般地说,对于使用频率很高、软硬件技术未过时的、仅是存储载体理化性能发生变化的,可采用拷贝法;对于使用频率较高、软硬件技术已快过时的,可采用迁移法;对于使用频率较低、软硬件技术已快过时的、并且确有长期保存价值的数字信息可用再生保存法。
5电子文件的安全性保障
建立健全科学、合理、严密的管理制度,从每一个环节堵塞信息失真的隐患,这也是确保电子信息档案真实可靠的重要措施。
5.1建立安全管理制度
电子文件是由人制作的,其管理和利用都要按人的意愿进行。因此对参加电子文件制作和参与管理的人员必须加强管理,以防不测。必须制定一套人人都应遵守的安全管理制度,以约束涉及电子文件与电子档案人员的行为。实践证明,良好的安全规范是保证数字信息安全的一项极为重要的措施。
5.2加强对电子文件制作和管理人员的管理和教育
在电子文件的安全管理过程中,仅靠制度是不够的,还必须加强对涉及电子文件人员的管理和教育。通过宣传教育或短期培训等途径,提高他们对保证电子文件和档案真实、可靠重要性的认识,提高他们科学管理电子档案的素质,增强他们工作的责任感,并树立一丝不苟的工作作风。
5.3建立全过程的管理制度
电子文件从形成到电子档案的开发利用,中间要经过很多环节,哪一个环节出了问题,都会影响到电子文件的真实可靠性。因此,建立全过程的管理制度,明确各环节的职责要求,就显得非常重要。如电子文件形成之后,要及时收集积累,以防分散状态下发生信息丢失;电子文件归档时,要严格检查相关文件是否收集齐全,否则就会给将来利用带来困难和麻烦;迁移时,要认真检查是否发生信息丢失。任何环节的疏忽,都将对数字信息的真实性与可靠性造成危害。
综上所述,要实现电子政务环境下电子文件的科学管理,就必须贯彻“前端控制”和“全程管理”的原则;为保证电子公文的真实性、完整性、可读性与安全性,就必须采取一系列相应的技术措施和手段,以确保管理目标的实现。
参考文献
二、电子文件对档案业务管理工作的影响
1传统的档案工作以纸质文件材料为工作对象,而应用计算机后,电子文件取代了以往的文字材料,它是由拟稿者直接写在磁盘上,并在磁盘上进行修改,一经形成后,马上存贮到办公信息数据中,由档案人员、技术人员所共享。这就使得文件与档案之间不再有明显的界限。纸质档案的管理工作经过长期实践,已总结出一套工作流程及方法、原则,如文件的立卷归档制度。文件的归档立卷工作是档案工作流程的起点,也是文书工作和档案工作的结合点,文件形成后,由文书部门收集立卷后,交档案部门管理,一般一年归档一次。而电子文件随时产生,随时更改,存贮在计算机磁盘或光盘中。因此,它对计算机有很强的依赖性。如果归档,必须以磁盘或光盘的形式移交,归档范围也不能只是“办理完毕,具有保存价值”的文件,还应包括该文件的读取软件甚至操作系统。
2由于电子文件信息与载体的可分离性,档案实体分类也可能将被概念分类整理所取代,因为实体分类的结果只能体现一种属性联系,这种单线排列的方式是手工操作管理档案的需要,但在当今电子文件的环境中,文件的形式特征和内容特征均发生了变化,电子文件可以通过计算机系统进行迅速、有效、多角度的整序,不再需要对它进行象纸质文件那样的分类整理。不同的用户可以根据不同的需要,利用办公自动化系统对电子文件进行自由组合分类。
3由于电子文件的保存价值同时取决于其自身价值和可读性,其鉴定的方法、内容、标准均将发生变化,原有的档案价值理论分析范围也将扩大,要分析电子文件的读取软件甚至操作系统。根据传统的档案价值鉴定理论,文件应根据其凭证价值和参考价值确定保管期限,而电子文件一方面由于制作方便,将产生比以往更多的文件,另一方面由于用户的需要,信息和数据不断地修改和补充,因此很难划定固定的保管期限,况且目前电子文件的凭证价值尚无法律保证。因此,其鉴定、管理方法亦无定论。此外,由于电子文件信息载体的特殊性,其保管方法、要求以及检索和对外利用等方面也与纸质文件有许多不同之处。
三、电子文件对档案学理论的影响
1对档案本质属性的影响
原始记录性是档案的本质属性。这种原始记录性一方面表现在档案的内容上,另一方面表现在档案的形式上,如当事人的亲笔手稿、领导者的亲笔签署等,都表现出真实的原始性。也正是档案的原始记录性,才使得档案区别于图书、情报、资料等其它信息,而具有法律凭证的作用。在办公自动化系统中,电子文件从起草、修改到印发都在计算机上进行,它便于修改、便于复制的特性,使得最能体现档案原始记录性的内容与形式特征不复存在。电子文件是计算机文字处理系统中的最后一个文本,没有草稿与印稿的区别,也没有正本与副本的差异,甚至文件与档案之间很难划定一条人为的界限。人们可以在机器上随时方便地复制电子文件,这样文件是档案的前身,档案是由文件有条件地转化而来这一档案概念就变得难以理解。电子文件的原始记录性和凭证作用如何确定电子文件能否作为档案是否具有法律凭证作用等等,便成为档案界的一系列新课题。这些课题是电子文件能否转化为档案的关键,也是赋予档案本质属性新的内涵的客观需要。
2对档案来源原则的影响
来源原则包括两个方面:从外部来看是尊重全宗,从内部来看是尊重原始顺序。目前,随着大量电子文件的产生,后者愈益受到普遍关注。传统的观点认为源于来源原则的档案检索系统必须一律建立在文件形成者或信息提供者的组织机构及其文件的基础上。只有根据其来源,从形成者的法律责任和行政管理的角度看问题,才能正确整理和理解档案文件。而电子文件在形成过程中,不再严格对应于现存的机关、组织、机构这一现象而产生,人们可以根据需要随时对文件信息复制、修改和重新组合、打乱或破坏文件的本来顺序。因此,要确定档案的来源,不可仅局限于寻找一个恰切的定义,或仅要求完整地保护全宗与文件系列,按照原始顺序进行整理等,而必须正确说明档案的原始联系,了解在整个生命周期中文件组合的变化,应随着客观实际的变化,丰富和发展来源原则。
3对档案学理论研究内容的影响
档案学理论研究的内容是由研究对象所决定的。以往的档案学理论研究是以纸质档案为主要对象,电子文件出现以后,档案工作的对象发生了变化,其理论研究的对象自然也就发生了变化。原有的一些定论、模式将被重新审视,原有的管理思想、管理原则将得到更新和补充,原有的档案学科体系也将得到充实和完善。所有这些研究课题都应围绕电子文件来开展。如电子文件的整理排序技术、信息安全保护技术、计算机病毒防治技术等等,都将成为档案学理论研究必不可少的内容。
四、档案界所应采取的对策
1做好归档电子文件的技术处理工作,实施电子文件管理战略。新型文件材料的归档势在必行,这就要求档案工作者必须深入到现行文件工作领域,对产生的大量电子文件的接收、处置乃至存储工作进行指导,保护电子文件的原始信息,了解文件信息重新组合的来龙去脉。也就是说,通过采取技术处理,将已归档的电子文件改为“只读性”文件,即只能读不能写的不可更改的文件,从而识别和保护电子文件的原始结构,保证电子文件的可靠性,使之与纸质文件一样发挥社会效用。
对于纸质文件来说,内容的原始性附着在形式的原始性上,人们可以借助形式的原始性来证实和确认内容的原始性。纸质文件的原始性体现为内容和形式的统一,对于任何一项形式上的变化,人们都有理由对它的原始性表示怀疑。但电子文件的内容与形式是相对独立的,不仅内容易于变化,而且失去了固定的形式,因此,对电子文件的原始性进行认定是非常困难的。主要表现在以下几个方面:
(一)、电子文件易于修改,而且改动后可以不留任何痕迹。虽然已有一些技术可防止伪造电子文件和在“原稿”上增删改,但其内容发生变化的可能性总是比纸质文件要大得多,从而使人们感到把握其内容原貌的困难。在网络上传递的电子文件也有可能被非法截获或更改。
(二)、电子文件制作过程的虚拟化使得对其原件的界定难于实现。电子文件的制作者不一定像制作纸质文件那样必须制出一份或一批原件来行使其职责,有时它只不过制作一个“窗口”,将必要的信息集中在一起,并在需要的时候将其输出。这个“窗口”可以在众多的电子计算机上显示出来,也可被不同的“收文者”拷贝到他的电子计算机存储器上或转换成硬拷贝保存起来。在不同时间、不同地点、由不同人获得的同一内容文件可以毫无区别,无法区别其中哪个是“原件”,哪个是“复制件”。
(三)、电子计算机软硬件技术的不断更新换代,迫使电子文件必须不断地适应新的“生存环境”,这种适应往往需要以自身结构、格式的改变为代价。因此,长期保存的电子文件很可能在结构和格式上与最初形成的大不相同。
(四)、电子文件不再具有固定的存储载体,根据利用需要,人们可以采用不同的方式输出。对于长期保存的电子文件,还需要定期进行复制,转换载体,以防信息损失。电子文件没有了固定的载体,也就无法通过载体来判定电子文件的原始性。
(五)、电子文件不再具有特定的字迹,人们可以根据需要以不同的字体、字号将电子文件输出,无法从字迹上分辨其原始性。
(六)、目前电子文件的签署技术还不普及,我们还不能为每一份电子文件盖章或亲自签名,因此,也就无法借助印章或签署的字迹来判断一份电子文件是否为原件。
电子文件的这些特点使我们无法采用与纸质文件相同的标准和方法来判断它的原始性,需要为它建立一个新的“原始性”概念。对于一份电子文件来说,只要它的内容确确实实是在当时由原作者撰写或制作出来的,此后又从未修改过,我们就应该承认它是原始的,尽管它没有固定的载体,没有实在的物理形态,甚至因转换而失去了原来的格式。这种“原始性”概念与纸质文件原件的区别主要在于,它抛弃了文件形式上的原始性,仅以文件中所含信息的真实、准确,即内容的原始性为惟一标准。根据现代信息技术的特点和社会各方面对电子文件的需要,我们认为建立这样一个“原始性”的新概念是适当和必要的,它将是电子文件转化为电子档案,全面行使“历史记录”和“社会记忆”功能的根本,是电子档案具有凭证作用和法律效力的基础。但是,对这种看不见摸不着的原始性加以判断和维护却是一件十分困难的、涉及多方因素的事情,这个问题的解决有赖于信息技术的进步、电子文件管理水平的提高以及有关法律的建立和完善。二、确保电子文件原始性的技术措施
电子文件是高科技的产物,它的各种性能是由技术决定的。随着电子文件的广泛使用,信息安全技术就显得特别重要,电子文件的制作者、管理者和档案工作者都应积极采用有关技术措施,提高电子文件的可靠性。
(一)、加密技术
电子通信系统中可采用“双密钥码”进行加密。在网络中的每一个加密通信者拥有一对密钥:一个是可以公开的加密密钥,另一个是严格保密的解密密钥,发方使用收方的公开密钥发文,收方用只有自已知道的解密密钥解密,这样任何人都可以利用公开密钥向收方发送电子文件,而只有收方才能识别这些加密的电子文件内容。由于加密和解密使用不同的密钥,因此第三者很难从截获的密文中解出原文内容来,无法对它进行篡改,从而保护电子文件在传输过程中的原始性、真实性。
(二)、签署技术
目前在电子文件上进行签署的技术主要有两种:一种是光笔签名;另一种是数字签名。光笔签名是签名者使用一种专用的光笔直接在输入板上签名,屏幕是显示出来的“笔迹”,如同在纸质文件上的亲笔签名一样,直观、易于辨认,计算机将这种“签名图像”接收下来,并确认签名者与电子文件的关系。在计算机系统中还可把这种签名设置为一种批准指令,经电子计算机审核签名有效后方可进入下一阶段的操作。另一种是利用“双密钥码”在电子文件上进行数字签名。数字签名是一种字母数字串,发方利用自己的不公开密钥对发出的电子文件进行加密处理,生成一个“数字签名”,与电子文件一起发出,同时还带走一个可使其生效的公开密钥。收方用发方的公开密钥运用特定的计算方法解码检验签名。假如结果位串与传输的一致,那么便有充足的理由相信两个事实:一是这份电子文件确实来自发方,其内容没有被人作过修改,从而证明其原始性;二是发方也必须承认这份电子文件确实是自己发出,对它的生效应负全部责任。和纸质文件一样,电子文件的签署可以表示作者对该电子文件的权力和责任,这种技术在电子文件管理中具有广泛的应用前景。
(三)、消息认证
电子文件的使用者,非常关心他所使用的信息在存储或传输过程中是否“完好如初”,是否被人篡改或替换过,消息认证技术可以消除使用者这个疑虑。比较常用的方法是利用分组密码进行消息认证。先把电子文件信息分成一定的长度,如64比特为一段,发方和收方共同选定一个64比特长的序列及密钥,发方运用这个序列和密钥对电子进行加密运算后得到这份电子文件的“认证字”,将电子文件和认证字一同发送出去。收方也同样运用这个序列和密钥计算该电子文件的认证字,如果计算结果和他所收到的认证字一致,即可认定这份电子文件的内容与发出时是一致的,进而证明这份电子文件的原始性、真实性。
(四)、身份验证
为了防止无关人员进入系统对电子文件或数据进行访问,有些系统需要对用户进行身份验证,如银行系统用户使用个人密码验证,有些文件管理系统使用管理员代码验证等。最常见的方法是给每个合法用户一个“通行字”,代表该用户身份。通行字可由数字、字母或特定的符号组成,只有用户本人和计算机系统知道。当合法用户要求进入系统访问时,首先输入自己的通行字,计算机自动将这个通行字与存储在机器内的有关该用户的资料进行相关的业务访问;如果一种验证不合格,该用户就会被拒绝于系统之外。身份验证技术可用于电子文件访问权限的控制。
(五)、防火墙
这是一种访问控制技术。在某个机构的网络和其它系统网络之间设置障碍,防止其它系统的网上用户对该机构信息资源的非法访问,也可以阻止该机构的机要信息、专利信息从机构的网络上非法输出。防火墙的安全保障能力仅限于网络边界,它是通过在网络边界上建立起来的相应的网络通信监控系统,监测所有通过防火墙的数据流,凡
是符合事先制定的网络安全规定的信息允许通过,不符合的就拒于墙外。从而使被保护网络的信息、结构不受侵犯,实现网络的安全,保护网上电子文件的原始性、真实性。实现防火墙功能所用的技术主要有:数据包过滤、应用网关和服务等。据行家预测,在不远的将来,加密软件标记和数字签名等认证技术可能会直接做进防火墙中。
(六)、防写措施
目前在许多软件中可将电子文件设置为“只读”状态。在这种状态下,用户只能从电子计算机上读取信息,而不能对其做任何修改。在电子计算机外存储器中,只读式光盘(CD-ROM)只能供使用者读取信息而不能追加或擦除信息;一次写入式光盘(WORM)可供使用者一次写入多次读取,可以追加信息但不能擦除原来的信息。这些不可逆式的存储载体可以有效地防止用户更改电子文件,保持电子文件的原始性、真实性。
上述这些技术对于维护电子文件的真实、可靠都具有很好的效果,随着这些技术的完善和普及,电子文件的原始性、真实性可得到更为可靠的认定和更加有效的保护,从而确保电子文件的凭证作用。
三、确保电子文件原始性的管理措施
在电子文件的形成、处理、归档,电子档案的保管、利用等各个环节,信息都有被更改、丢失的可能,即使拥有完善的信息安全技术,也需要有相应的管理措施来保证其得以实施。建立并执行一整套科学、合理、严密的管理制度,从每一个环节堵塞信息失真的隐患,是维护电子档案原始性、真实性的最重要措施。电子文件全过程管理中有关维护其信息安全方面的措施,主要包括以下几方面:
(一)、加强对电子文件制作和管理人员的管理
电子文件是由人制作的,其存储、检索、传输等处理都是按人的意愿进行的,因此,对参加电子文件制作和管理的人进行审查是至关重要的。要禁止那些道德品质不好、工作不认真负责、没有良好的工作作风的人参加电子文件制作和管理工作。要建立一套审查制度,严格把关,这是从源头上保证电子文件原始性、真实性的最关键措施。人是活的因素,易受外界影响,任何一个好成份,在没有管理要求的情况下,也会逐渐懈怠甚至可能变坏。加强对电子文件制作和管理人员的管理,仅依靠审查制度是不够的,还必须提出严格要求,明确具体管理措施,这是在电子文件制作和处理过程中保证其原始性、真实性的重要措施。另外还要进行教育,不断地提高电子文件的制作者和管理人员的责任心,要使他们养成忠于职守的品质,认真负责的工作精神,一丝不苟的工作作风,精益求精的技术水平,这是保证电子文件原始性、真实性的根本措施。
(二)、电子文件的制作过程要职责分明
电子文件的制作人员,应对其制作的电子文件的真实性和能被保管、保存负有责任。为保证电子文件在制作阶段不出现失真现象,避免制作人员的相互推诿、扯皮,首先要明确职责范围。特别是合作制作的电子文件或大型辅助设计项目,更要注意划清制作人员的职责范围,使每一个参与人员负其分工范围内的责任。一般来说,不相干人员不能进入他人的责任范围,工作需要时可允许用只读式的载体调读,以防由于误操作或有意增删改等原因造成电子文件的失真。
(三)、建立电子文件全过程管理的制度
电子文件从形成到电子档案的开发利用,中间经过很多环节。哪一个环节的职责不清,制度不明,考虑不周,都可能影响电子文件的原始性、真实性。因此,及早地建立电子文件全过程管理制度,明确各方面的职责要求,就显得非常重要。如电子文件形成后就应及时进行收集、积累,以防在分散状态下发生信息丢失。因此,一开始就明确由谁进行收集、积累,如何进行收集、积累,建立收集、积累制度和严格的归档制度,是保证电子档案原始性、真实性和完整性的重要措施。电子文件的归档范围、归档内容、归档时间、归档要求等和纸质文件相比,都有很大区别,要明确无误地作出规定。归档时应对电子文件进行全面、认真的检查,凡不符合要求的,都要有明确的处理措施,不能有丝毫含糊,否则将会对电子文件的原始性、真实性和完整性造成极大危害。
电子文件归档应对存储载体有严格要求,并且明确保护措施,不致因载体原因而对电子文件的原始性、真实性和完整性造成危害。为实现电子档案长期保存所必须进行的载体转换也要采取明确的措施,防止在转换过程中造成信息的损失。电子档案的利用有许多便捷之处,但是各种用户和各种形式的利用活动,也会给电子档案管理带来一些不安全的隐患,因此必须加强对电子档案的开发利用活动的管理。
(四)、建立电子文件管理的记录系统
二、做好电子文件管理的策略
(一)统筹安排合理规划
电子文件管理是一个系统工程,最终是为数字档案信息资源建设服务,以达到便于开发利用、造福社会的目的。具体实施起来涉及面广,投资可观,因此必须注重效益,在领导层面对各阶段的目标、任务、措施进行科学、合理地规划部署,如:在工作实施之前展开深入调研、广泛论证、集中讨论,投资大的项目要形成可研报告;形成科学合理的电子文件利用体制机制,优化软硬件系统配置,处理好软件系统服务器的兼容关系,建立方便高效的查询体系等。
(二)严格制度统一标准
电子文件管理工作是一项长期开展的持续性工作,应落实领导责任,组织相关数量的人力,明确责任分工,加强管理,扎实推进工作有序进行。具体工作中要制定相应标准,严格贯彻实施,一定阶段即以标准验收成果,不断改进以保证后续工作的质量。如:组建专门负责电子档文件管理工作的工作机构,主要负责电子文件管理工作、系统设备升级维护、网站建设维护等;制定电子文件管理中著录项目统一标准,数字化技术参数标准等。
(三)多方参与争取合作
电子文件管理涉及社会的各行各业,应千方百计争取社会力量共同参与和支持,引导建立社会大众积极充分利用电子文件这一社会资源的普遍意识,积极回应获得的利用反馈信息,以促进自身工作的不断改进。如:宣传网络利用优势;发挥档案学会等社会组织的作用;非重复性技术工作可以通过合同、委托等方式外包给企业。
一、电子文件归档方式和途径的选择
纸质档案的载体较为稳定安全,而电子文件的载体稳定性差,易损坏,因此归档方式的选择至关重要。经实践检验,利用磁盘,脱机采集数据的介质移交方式容易造成数据丢失。如遇质量较差的磁盘,会影响文件的可读性。为防止数据丢失需制作多份备份盘存档,这不仅加大了工作量,也增加了存贮磁盘的数量,简便而安全的方式是采用网络移交归档,并利用光盘存贮。网络移交的途径有两条:
(一)借助计算机信息管理网,开通电子文件归档专递网线。随着各单位计算机信息管理网的建立与发展,越来越多的重要文件被传输上网。这些文件经过各业务管理部门挑选,反映了职能活动的概貌,上网前,又按着信息管理部门的统一要求进行了文件格式的转换,在一定程度上保证了数据的可靠性和通用性,是归档的重点。对那些未输送到计算机信息管理网上的具有保存价值的电子文悠扬,应由电子文件形成部门编目整理,也利用网络技术向档案部门传输,可以借助信息管理网络在各业务管理机构与档案部门之间开通电子文件归档专递网线,建立依附在信息管理网上的归档专用子系统。将上网与未上网的具有保存价值的电子文件通过此系统传输给档案部门。档案部门经与办公自动化和信息管理部门协商后,要对归档的电子文件提出格式要求,但不能是唯一性的,应认可几种通用性较强的软件,:.DBF、.DOC、.TXT、.EXE等文件。
(二)选择电子文件信息的汇集点,由计算机与信息管理部门负责归档。为适应办公自动化工作发展的需要,人们越来越注重信息工作的系统化和标准化水平,计算机信息系统的开发也从以往的“分散各异”转向“集中统一”,打破了立卷单位人界限,更趋向基于某一方面或几方面职能活动的内容而建立系统。计算机与信息管理部门负责规划、统筹本单位信息管理工作,是开发集中统一型信息系统的牵头部门,成为电子文悠扬信息的汇集点,又具有一定的技术设备及人才条件。由他们负责将日常工作中形成的具有保存价值的电子文件归档,无是最佳归档途径之一。清华大学计算机与信息管理中心计划利用网络技术建立校行政信息管理系统,共分为教学、科研、人事管理三个子系统,正在筹建的教学管理系统与学生注册中心、财务结算中心、教务处、研究生院构成数据交换网。注册中心负责学生注册、选课、排课、考表、成绩等数据的传递;结算中心负责学生交费信息的传递;教务处与研究生院负责学籍、教学计划、课程、毕业审查、学位授予数据的传输。计算机与信息中心接收这些数据后,进行集中处理,经汇总的数据通过信息中心又输送给各业务管理部门共享。随着每年数据的更新,过期数据应由信息中心按档案部门的统一要求,进行鉴定,编目整理,通过网络传输,移交给档案部门保存,或直接存入光盘,定期归档。
无论利用何种途径归档,必须由电子文件形成单位按统一格式编目整理后,传输给档案部门,不能由档案部门自行从网上下载,以保证电子文件形成部门对其数据的真实性、准确性负责。档案部门接收的电子文件一律应存入光盘,最好不用磁盘存贮。
二、依靠原纸质档案立卷工作骨干,实现相关部门职能的交融集成,建立电子文件归档制度。
纸质文件归档经过多年实践,已形成相对稳定的骨干队伍,有较好的工作基础,各立卷部门都设立了分管领导和立卷牵头人,负责督促检查立卷工作。开展电子文件归档也要以人为本,形成一支队伍,承担此项工作。由于大多数计算机与信息管理人员对档案工作较为陌生,不像立卷归档人员经与档案部门多年合作,建立了相对稳定的业务关系,容易与档案部门在电子文件归档上达成共识。所以,依靠原纸质档案立卷工作骨干,比以各单位计算机与信息管理保同为主体,重新建立归档工作队伍更为现实。由于整理纸质档案大多采用手工操作的方法,这与电子文件处理手法相差甚远,需要新的知识和技术手段,现有的立卷队伍尚不适应工作发展的需要,要通过组织业务学习和技术培训,尽快地使他们掌握信息管理自动化的基本知识和技能,担负起电子文件归档工作的重任。
电子文件来源广泛,形成者不仅有业务管理部门的承办人,还有数据录入员、信息管理与计算机技术人员等。将头绪如此之多的电子文件收集归档,必须靠制度约束,使制度变成归档人员的自觉行动。要将电子文件归档工作纳入本单位的立卷归档制度,并列入信息管理工作程序,在布置、检查、总结、考核信息管理工作的同时,布置、检查、总结、考核电子文悠扬归档工作。
清华大学档案馆从1995年底开始抓电子文悠扬归档工作,制定了《机读(电子)文件归档工作暂行规定(试行)》,分别对归档范围、归档单位与分工、归档的方法和要求做了具体规定,并设计了《机读(电子)文件归档目录》样式。为了使各单位主管档案工作的领导和立卷牵头人能够尽快地接受这一新生事物,还将探索电子文件归档工作列为1996年全校档案工作会议主要议题之一,会上,分管档案工作的副校长和档案馆馆长明确提出要将电子文件归档列入立卷归档程序,做为一项重要工作抓紧抓好。于1997年全校档案工作大会上,又提出加快电子文件归档进程的具体要求。在对电子文悠扬的来源进行广泛调研的基础上,本着“注重职能因素”的原则,选择了电子文件的信息综合性强,含“金”量高的校长办公室、党委办公室做为开展电子文件归档的重点和试点单位。先后三次与他们专门研究电子文悠扬归档工作,成立了两办电子文悠扬归档工作小组,由校办副主任任组长,并参照纸质文件归档范围,制定出党办、校办电子文件归档细目。经过努力,现已将部分电子文件归档。
与纸质文悠扬相比,电子文件归档所涉及的问题更加广泛,受制约因素多,仅靠档案部门独家很难完成,应采取电子文件形成部门、档案部门、计算机与信息管理部门三结合的方法。电子文悠扬形成部门熟悉各项管理业务,了解电子文件的自然形成规律和历史联系,是承担归档工作的主要责任者,在鉴定工作价值时最有发言权;档案部门掌握归档的原则、方法,又了解全局情况,可以发挥把关和统筹作用;计算机与信息管理部门既是电子文件的形成单位,又是设计和维护信息管理网络、管理电子信息的专业技术部门,在电子文件归档制度化、标准化的工作中处于举足轻重的地位。三个部门的职能应相互渗透,扬长避短,发挥各自的优势,在电子文件归档中集成一体,共同形成质量较好的电子文档。
三、“两套制”归档的必要性与适时简化合一的可能性
由于印章和
纸质档案的载体较为稳定安全,而电子文件的载体稳定性差,易损坏,因此归档方式的选择至关重要。经实践检验,利用磁盘,脱机采集数据的介质移交方式容易造成数据丢失。如遇质量较差的磁盘,会影响文件的可读性。为防止数据丢失需制作多份备份盘存档,这不仅加大了工作量,也增加了存贮磁盘的数量,简便而安全的方式是采用网络移交归档,并利用光盘存贮。网络移交的途径有两条:
(一)借助计算机信息管理网,开通电子文件归档专递网线。随着各单位计算机信息管理网的建立与发展,越来越多的重要文件被传输上网。这些文件经过各业务管理部门挑选,反映了职能活动的概貌,上网前,又按着信息管理部门的统一要求进行了文件格式的转换,在一定程度上保证了数据的可靠性和通用性,是归档的重点。对那些未输送到计算机信息管理网上的具有保存价值的电子文悠扬,应由电子文件形成部门编目整理,也利用网络技术向档案部门传输,可以借助信息管理网络在各业务管理机构与档案部门之间开通电子文件归档专递网线,建立依附在信息管理网上的归档专用子系统。将上网与未上网的具有保存价值的电子文件通过此系统传输给档案部门。档案部门经与办公自动化和信息管理部门协商后,要对归档的电子文件提出格式要求,但不能是唯一性的,应认可几种通用性较强的软件,如:.DBF、.DOC、.TXT、.EXE等文件。
(二)选择电子文件信息的汇集点,由计算机与信息管理部门负责归档。为适应办公自动化工作发展的需要,人们越来越注重信息工作的系统化和标准化水平,计算机信息系统的开发也从以往的“分散各异”转向“集中统一”,打破了立卷单位人界限,更趋向基于某一方面或几方面职能活动的内容而建立系统。计算机与信息管理部门负责规划、统筹本单位信息管理工作,是开发集中统一型信息系统的牵头部门,成为电子文悠扬信息的汇集点,又具有一定的技术设备及人才条件。由他们负责将日常工作中形成的具有保存价值的电子文件归档,无是最佳归档途径之一。清华大学计算机与信息管理中心计划利用网络技术建立校行政信息管理系统,共分为教学、科研、人事管理三个子系统,正在筹建的教学管理系统与学生注册中心、财务结算中心、教务处、研究生院构成数据交换网。注册中心负责学生注册、选课、排课、考表、成绩等数据的传递;结算中心负责学生交费信息的传递;教务处与研究生院负责学籍、教学计划、课程、毕业审查、学位授予数据的传输。计算机与信息中心接收这些数据后,进行集中处理,经汇总的数据通过信息中心又输送给各业务管理部门共享。随着每年数据的更新,过期数据应由信息中心按档案部门的统一要求,进行鉴定,编目整理,通过网络传输,移交给档案部门保存,或直接存入光盘,定期归档。
无论利用何种途径归档,必须由电子文件形成单位按统一格式编目整理后,传输给档案部门,不能由档案部门自行从网上下载,以保证电子文件形成部门对其数据的真实性、准确性负责。档案部门接收的电子文件一律应存入光盘,最好不用磁盘存贮。
二、依靠原纸质档案立卷工作骨干,实现相关部门职能的交融集成,建立电子文件归档制度。
纸质文件归档经过多年实践,已形成相对稳定的骨干队伍,有较好的工作基础,各立卷部门都设立了分管领导和立卷牵头人,负责督促检查立卷工作。开展电子文件归档也要以人为本,形成一支队伍,承担此项工作。由于大多数计算机与信息管理人员对档案工作较为陌生,不像立卷归档人员经与档案部门多年合作,建立了相对稳定的业务关系,容易与档案部门在电子文件归档上达成共识。所以,依靠原纸质档案立卷工作骨干,比以各单位计算机与信息管理保同为主体,重新建立归档工作队伍更为现实。由于整理纸质档案大多采用手工操作的方法,这与电子文件处理手法相差甚远,需要新的知识和技术手段,现有的立卷队伍尚不适应工作发展的需要,要通过组织业务学习和技术培训,尽快地使他们掌握信息管理自动化的基本知识和技能,担负起电子文件归档工作的重任。
电子文件来源广泛,形成者不仅有业务管理部门的承办人,还有数据录入员、信息管理与计算机技术人员等。将头绪如此之多的电子文件收集归档,必须靠制度约束,使制度变成归档人员的自觉行动。要将电子文件归档工作纳入本单位的立卷归档制度,并列入信息管理工作程序,在布置、检查、总结、考核信息管理工作的同时,布置、检查、总结、考核电子文悠扬归档工作。
清华大学档案馆从1995年底开始抓电子文悠扬归档工作,制定了《机读(电子)文件归档工作暂行规定(试行)》,分别对归档范围、归档单位与分工、归档的方法和要求做了具体规定,并设计了《机读(电子)文件归档目录》样式。为了使各单位主管档案工作的领导和立卷牵头人能够尽快地接受这一新生事物,还将探索电子文件归档工作列为1996年全校档案工作会议主要议题之一,会上,分管档案工作的副校长和档案馆馆长明确提出要将电子文件归档列入立卷归档程序,做为一项重要工作抓紧抓好。于1997年全校档案工作大会上,又提出加快电子文件归档进程的具体要求。在对电子文悠扬的来源进行广泛调研的基础上,本着“注重职能因素”的原则,选择了电子文件的信息综合性强,含“金”量高的校长办公室、党委办公室做为开展电子文件归档的重点和试点单位。先后三次与他们专门研究电子文悠扬归档工作,成立了两办电子文悠扬归档工作小组,由校办副主任任组长,并参照纸质文件归档范围,制定出党办、校办电子文件归档细目。经过努力,现已将部分电子文件归档。
与纸质文悠扬相比,电子文件归档所涉及的问题更加广泛,受制约因素多,仅靠档案部门独家很难完成,应采取电子文件形成部门、档案部门、计算机与信息管理部门三结合的方法。电子文悠扬形成部门熟悉各项管理业务,了解电子文件的自然形成规律和历史联系,是承担归档工作的主要责任者,在鉴定工作价值时最有发言权;档案部门掌握归档的原则、方法,又了解全局情况,可以发挥把关和统筹作用;计算机与信息管理部门既是电子文件的形成单位,又是设计和维护信息管理网络、管理电子信息的专业技术部门,在电子文件归档制度化、标准化的工作中处于举足轻重的地位。三个部门的职能应相互渗透,扬长避短,发挥各自的优势,在电子文件归档中集成一体,共同形成质量较好的电子文档。
三、“两套制”归档的必要性与适时简化合一的可能性
由于印章和
签署是文件生效的主要标志,在现在技术条件下,对一些具有凭证作用和法律效力的文件必须以纸介质形式保存。鉴于电子文件载体和信息技术的不稳定性,以及电子文件的易修改性,也有必要将重要的电子文件制成硬拷贝存档,以确保数据的安全。目前,电子文件、纸质文件转化为档案一般采取“双轨制”,归档内容形成“两套制”,即纸介质与磁、光介质两种文件一起归档,形成内容相同的两套档案。其归档时使用不同的编目方法和存贮装具。档案部门应在每一卷纸质档案的备考表或卷内目录“备注”项中注明相应的电子文件的编码及存址,同时,在电子文件归档目录“备注”项中注明相应的纸质文件的档号及存址,以便利用时参照互补。
对于纸质文件来说,内容的原始性附着在形式的原始性上,人们可以借助形式的原始性来证实和确认内容的原始性。纸质文件的原始性体现为内容和形式的统一,对于任何一项形式上的变化,人们都有理由对它的原始性表示怀疑。但电子文件的内容与形式是相对独立的,不仅内容易于变化,而且失去了固定的形式,因此,对电子文件的原始性进行认定是非常困难的。主要表现在以下几个方面:
(一)、电子文件易于修改,而且改动后可以不留任何痕迹。虽然已有一些技术可防止伪造电子文件和在“原稿”上增删改,但其内容发生变化的可能性总是比纸质文件要大得多,从而使人们感到把握其内容原貌的困难。在网络上传递的电子文件也有可能被非法截获或更改。
(二)、电子文件制作过程的虚拟化使得对其原件的界定难于实现。电子文件的制作者不一定像制作纸质文件那样必须制出一份或一批原件来行使其职责,有时它只不过制作一个“窗口”,将必要的信息集中在一起,并在需要的时候将其输出。这个“窗口”可以在众多的电子计算机上显示出来,也可被不同的“收文者”拷贝到他的电子计算机存储器上或转换成硬拷贝保存起来。在不同时间、不同地点、由不同人获得的同一内容文件可以毫无区别,无法区别其中哪个是“原件”,哪个是“复制件”。
(三)、电子计算机软硬件技术的不断更新换代,迫使电子文件必须不断地适应新的“生存环境”,这种适应往往需要以自身结构、格式的改变为代价。因此,长期保存的电子文件很可能在结构和格式上与最初形成的大不相同。
(四)、电子文件不再具有固定的存储载体,根据利用需要,人们可以采用不同的方式输出。对于长期保存的电子文件,还需要定期进行复制,转换载体,以防信息损失。电子文件没有了固定的载体,也就无法通过载体来判定电子文件的原始性。
(五)、电子文件不再具有特定的字迹,人们可以根据需要以不同的字体、字号将电子文件输出,无法从字迹上分辨其原始性。
(六)、目前电子文件的签署技术还不普及,我们还不能为每一份电子文件盖章或亲自签名,因此,也就无法借助印章或签署的字迹来判断一份电子文件是否为原件。
电子文件的这些特点使我们无法采用与纸质文件相同的标准和方法来判断它的原始性,需要为它建立一个新的“原始性”概念。对于一份电子文件来说,只要它的内容确确实实是在当时由原作者撰写或制作出来的,此后又从未修改过,我们就应该承认它是原始的,尽管它没有固定的载体,没有实在的物理形态,甚至因转换而失去了原来的格式。这种“原始性”概念与纸质文件原件的区别主要在于,它抛弃了文件形式上的原始性,仅以文件中所含信息的真实、准确,即内容的原始性为惟一标准。根据现代信息技术的特点和社会各方面对电子文件的需要,我们认为建立这样一个“原始性”的新概念是适当和必要的,它将是电子文件转化为电子档案,全面行使“历史记录”和“社会记忆”功能的根本,是电子档案具有凭证作用和法律效力的基础。但是,对这种看不见摸不着的原始性加以判断和维护却是一件十分困难的、涉及多方因素的事情,这个问题的解决有赖于信息技术的进步、电子文件管理水平的提高以及有关法律的建立和完善。
二、确保电子文件原始性的技术措施
电子文件是高科技的产物,它的各种性能是由技术决定的。随着电子文件的广泛使用,信息安全技术就显得特别重要,电子文件的制作者、管理者和档案工作者都应积极采用有关技术措施,提高电子文件的可靠性。
(一)、加密技术
电子通信系统中可采用“双密钥码”进行加密。在网络中的每一个加密通信者拥有一对密钥:一个是可以公开的加密密钥,另一个是严格保密的解密密钥,发方使用收方的公开密钥发文,收方用只有自已知道的解密密钥解密,这样任何人都可以利用公开密钥向收方发送电子文件,而只有收方才能识别这些加密的电子文件内容。由于加密和解密使用不同的密钥,因此第三者很难从截获的密文中解出原文内容来,无法对它进行篡改,从而保护电子文件在传输过程中的原始性、真实性。
(二)、签署技术
目前在电子文件上进行签署的技术主要有两种:一种是光笔签名;另一种是数字签名。光笔签名是签名者使用一种专用的光笔直接在输入板上签名,屏幕是显示出来的“笔迹”,如同在纸质文件上的亲笔签名一样,直观、易于辨认,计算机将这种“签名图像”接收下来,并确认签名者与电子文件的关系。在计算机系统中还可把这种签名设置为一种批准指令,经电子计算机审核签名有效后方可进入下一阶段的操作。另一种是利用“双密钥码”在电子文件上进行数字签名。数字签名是一种字母数字串,发方利用自己的不公开密钥对发出的电子文件进行加密处理,生成一个“数字签名”,与电子文件一起发出,同时还带走一个可使其生效的公开密钥。收方用发方的公开密钥运用特定的计算方法解码检验签名。假如结果位串与传输的一致,那么便有充足的理由相信两个事实:一是这份电子文件确实来自发方,其内容没有被人作过修改,从而证明其原始性;二是发方也必须承认这份电子文件确实是自己发出,对它的生效应负全部责任。和纸质文件一样,电子文件的签署可以表示作者对该电子文件的权力和责任,这种技术在电子文件管理中具有广泛的应用前景。
(三)、消息认证
电子文件的使用者,非常关心他所使用的信息在存储或传输过程中是否“完好如初”,是否被人篡改或替换过,消息认证技术可以消除使用者这个疑虑。比较常用的方法是利用分组密码进行消息认证。先把电子文件信息分成一定的长度,如64比特为一段,发方和收方共同选定一个64比特长的序列及密钥,发方运用这个序列和密钥对电子进行加密运算后得到这份电子文件的“认证字”,将电子文件和认证字一同发送出去。收方也同样运用这个序列和密钥计算该电子文件的认证字,如果计算结果和他所收到的认证字一致,即可认定这份电子文件的内容与发出时是一致的,进而证明这份电子文件的原始性、真实性。
(四)、身份验证
为了防止无关人员进入系统对电子文件或数据进行访问,有些系统需要对用户进行身份验证,如银行系统用户使用个人密码验证,有些文件管理系统使用管理员代码验证等。最常见的方法是给每个合法用户一个“通行字”,代表该用户身份。通行字可由数字、字母或特定的符号组成,只有用户本人和计算机系统知道。当合法用户要求进入系统访问时,首先输入自己的通行字,计算机自动将这个通行字与存储在机器内的有关该用户的资料进行相关的业务访问;如果一种验证不合格,该用户就会被拒绝于系统之外。身份验证技术可用于电子文件访问权限的控制。
(五)、防火墙
这是一种访问控制技术。在某个机构的网络和其它系统网络之间设置障碍,防止其它系统的网上用户对该机构信息资源的非法访问,也可以阻止该机构的机要信息、专利信息从机构的网络上非法输出。防火墙的安全保障能力仅限于网络边界,它是通过在网络边界上建立起来的相应的网络通信监控系统,监测所有通过防火墙的数据流,凡是符合事先制定的网络安全规定的信息允许通过,不符合的就拒于墙外。从而使被保护网络的信息、结构不受侵犯,实现网络的安全,保护网上电子文件的原始性、真实性。实现防火墙功能所用的技术主要有:数据包过滤、应用网关和服务等。据行家预测,在不远的将来,加密软件标记和数字签名等认证技术可能会直接做进防火墙中。
(六)、防写措施
目前在许多软件中可将电子文件设置为“只读”状态。在这种状态下,用户只能从电子计算机上读取信息,而不能对其做任何修改。在电子计算机外存储器中,只读式光盘(CD-ROM)只能供使用者读取信息而不能追加或擦除信息;一次写入式光盘(WORM)可供使用者一次写入多次读取,可以追加信息但不能擦除原来的信息。这些不可逆式的存储载体可以有效地防止用户更改电子文件,保持电子文件的原始性、真实性。
上述这些技术对于维护电子文件的真实、可靠都具有很好的效果,随着这些技术的完善和普及,电子文件的原始性、真实性可得到更为可靠的认定和更加有效的保护,从而确保电子文件的凭证作用。
三、确保电子文件原始性的管理措施
在电子文件的形成、处理、归档,电子档案的保管、利用等各个环节,信息都有被更改、丢失的可能,即使拥有完善的信息安全技术,也需要有相应的管理措施来保证其得以实施。建立并执行一整套科学、合理、严密的管理制度,从每一个环节堵塞信息失真的隐患,是维护电子档案原始性、真实性的最重要措施。电子文件全过程管理中有关维护其信息安全方面的措施,主要包括以下几方面:
(一)、加强对电子文件制作和管理人员的管理
电子文件是由人制作的,其存储、检索、传输等处理都是按人的意愿进行的,因此,对参加电子文件制作和管理的人进行审查是至关重要的。要禁止那些道德品质不好、工作不认真负责、没有良好的工作作风的人参加电子文件制作和管理工作。要建立一套审查制度,严格把关,这是从源头上保证电子文件原始性、真实性的最关键措施。人是活的因素,易受外界影响,任何一个好成份,在没有管理要求的情况下,也会逐渐懈怠甚至可能变坏。加强对电子文件制作和管理人员的管理,仅依靠审查制度是不够的,还必须提出严格要求,明确具体管理措施,这是在电子文件制作和处理过程中保证其原始性、真实性的重要措施。另外还要进行教育,不断地提高电子文件的制作者和管理人员的责任心,要使他们养成忠于职守的品质,认真负责的工作精神,一丝不苟的工作作风,精益求精的技术水平,这是保证电子文件原始性、真实性的根本措施。
(二)、电子文件的制作过程要职责分明
电子文件的制作人员,应对其制作的电子文件的真实性和能被保管、保存负有责任。为保证电子文件在制作阶段不出现失真现象,避免制作人员的相互推诿、扯皮,首先要明确职责范围。特别是合作制作的电子文件或大型辅助设计项目,更要注意划清制作人员的职责范围,使每一个参与人员负其分工范围内的责任。一般来说,不相干人员不能进入他人的责任范围,工作需要时可允许用只读式的载体调读,以防由于误操作或有意增删改等原因造成电子文件的失真。
(三)、建立电子文件全过程管理的制度
电子文件从形成到电子档案的开发利用,中间经过很多环节。哪一个环节的职责不清,制度不明,考虑不周,都可能影响电子文件的原始性、真实性。因此,及早地建立电子文件全过程管理制度,明确各方面的职责要求,就显得非常重要。如电子文件形成后就应及时进行收集、积累,以防在分散状态下发生信息丢失。因此,一开始就明确由谁进行收集、积累,如何进行收集、积累,建立收集、积累制度和严格的归档制度,是保证电子档案原始性、真实性和完整性的重要措施。电子文件的归档范围、归档内容、归档时间、归档要求等和纸质文件相比,都有很大区别,要明确无误地作出规定。归档时应对电子文件进行全面、认真的检查,凡不符合要求的,都要有明确的处理措施,不能有丝毫含糊,否则将会对电子文件的原始性、真实性和完整性造成极大危害。
电子文件归档应对存储载体有严格要求,并且明确保护措施,不致因载体原因而对电子文件的原始性、真实性和完整性造成危害。为实现电子档案长期保存所必须进行的载体转换也要采取明确的措施,防止在转换过程中造成信息的损失。电子档案的利用有许多便捷之处,但是各种用户和各种形式的利用活动,也会给电子档案管理带来一些不安全的隐患,因此必须加强对电子档案的开发利用活动的管理。
(四)、建立电子文件管理的记录系统
纸张的耐久性取决于纤维素的性质,尽管纤维素在一定的条件如高温、高湿、酸、酶、氧化剂等下,可发生水解和氧化反应,但只要我们在档案保护过程中,注意排除发生两大化学反应所需要的条件,就可以使纸质档案的寿命达到上百年甚至上千年。
电子文件的载体材料是磁性物质和光盘。聚酯底基是磁盘和磁带的支持体。聚酯底基具有易产生静电而吸引尘埃导致卷曲、易与磁粉脱离、伸长后不易恢复等缺点。粘和剂起着连接底基和磁粉的作用,它具有易热胀冷缩、磨损、脱落、粘连、生霉等缺点,直接影响信息再现。磁粉中的磁性氧化物颗粒的剩磁感应强度是记录和再现信息的决定因素,它极易受外磁场影响而导致退磁、消磁等。光盘是利用激光进行信息存取的,它呈圆盘状,由盘基、记录介质和保护层等部分组成。目前光盘常用的记录介质主要有碲、碲合金、硒、碳铝化合物以及一些在激光热效应作用下易产生物化性质变化的材料。这些材料不稳定、易氧化、易与碱溶液发生反应。与纸质档案载体相比,电子文件载体材料的寿命要短得多,一般仅为5—15年。
二、环境条件影响的差异
1、温湿度影响的差异。不适宜的温湿度对磁性载体、光盘和纸张均有影响。对纸张而言,高温高湿,可促进纸张发生水解-氧化反应,加速纸张内部不利化学成分对纸张的影响,也可使字迹材料发生扩散、洇化现象。而电子文件载体受温湿的影响方式截然不同。在温度过高或过低条件下,聚酯底基易膨胀或收缩变形,光盘载体中使用的塑料、铝和多碳材料也会弯曲变形,影响激光束精确定位和数据的读写。实验证明,保存纸质档案的标准温度为14℃—24℃,相对湿度为45%—60%,而保存电子文件的理想温度为16℃—20℃,相对湿度为40%±5%,可见,温湿度对电子文件和纸质档案的影响程度是不同的。
2、灰尘影响的差异。灰尘对纸张的危害主要是机械磨损纸张、使纸张发生粘结而形成“档案砖”、给纸张带来霉菌等。而灰尘对电子文件载体的损坏主要有物理损坏、化学损坏和生物损坏。物理损坏是指污染、划伤磁盘、磁带、光盘表面,造成记录信息的损毁;化学损坏是指灰尘中所含的化学成分会不同程度地引起磁盘、磁带、光盘载体腐蚀、降解等化学作用而毁坏,造成记录信息消失;生物损坏是指灰尘是霉菌孢子的传播者,也是霉菌的培养基、繁殖地,霉菌分泌的酶和有机酸会损坏磁性载体和光盘,使数据丢失。综上所述,灰尘均可以损坏纸张和电子文件载体。只是对纸张而言,即使灰尘已经对其产生实质性的损害,如磨损纸张、形成“档案砖”、产生色斑和霉斑等,也可通过修复手段在很大程度上恢复其所记录信息。而灰尘一旦对电子文件载体造成危害,载体上所记录的信息可能会局部丢失,在计算机系统上便无法读出原始信息,使电子文件失去保存价值。因此,防止灰尘对电子文件载体的危害有特别重要的意义,在电子文件形成和使用过程中,要采取严密的防灰尘措施。
3、外来磁场和机械震动影响的差异。磁场和机械震动对纸质档案无任何影响,而对电子文件的磁性载体则是最重要的影响因素。外来磁场作用于磁性载体,能使磁性涂层的剩磁发生消磁或磁化,造成信号失落或信噪比降低,破坏记录信息,影响读出效果。此外,强烈的机械震动也会影响磁性载体材料中磁分子的排列次序,造成剩磁衰减,从而破坏记录信号。因而要防止外磁场的影响,如远离强磁场,将磁性载体存放在有抗磁性的框架内或金属盒内等等,并避免强烈的机械震动。
4、光线和有害气体影响的差异。光线和有害气体对纸张的危害主要是促进纸张发生水解氧化反应,导致纸张强度的降低。而有害气体和光线特别是紫外线对电子文件的破坏力更大。有害气体主要是二氧化硫、硫化氢、二氧化氮和氯气等具有酸性和氧化性,在一定条件下,腐蚀、破坏磁性载体和光盘,致使盘基带基老化、变质和磁粉脱落,使电子文件信息丢失。光线能使电子文件载体材料发生光氧化反应,使盘基带基老化,强度下降。同时,紫外线的能量足以破坏磁性载体的剩磁的稳定性,导致信号衰减,影响磁性记录信息的读写效果。三、技术寿命的差异
纸质文件一旦形成,其制成材料——纸张、字迹材料、字迹三者永远结合在一起,它的寿命与其内部诸因素和保护环境条件有关。而电子文件的寿命不仅与其内部诸因素和保护环境条件有关,更与技术革新有关。因为电子文件是通过计算机将信息与载体结合在一起而形成的,必须通过计算机才能识读。一旦技术过时,则载体上的信息就无法读出。技术过时的表现有两个方面,一是技术革新,使旧的存贮技术消失。二是由于商业性的原因,使由单个厂家生产或销售的电子文件设备会由于厂家的破产或改变产品生产而很难找到配套产品。一般说来,大多数电子文件载体的预期寿命都超过了识读它的硬件和软件的技术期限,也就是说,技术过时对电子文件安全性的影响显得更为重要。因此,对于电子文件中数字化信息的长期存取而言,技术过时比载体损坏是更为严重的危害。针对技术过时,欧美国家在理论上提出三种解决办法:将阅读电子文件的设备与软件保存到某种技术博物馆中;在纸与缩微胶片上制作拷贝;将电子文件转换为尽可能中性格式的文档。这三种方法只能是在没有其它更好措施的情况下的暂时性办法,因为随着需要保存的电子文件数量的增大,这三种方法都将花费大量的人力物力。最近,信息专家提出了用标准化的方法,即用国际标准化组织用于连接开放系统的互连标准����麱?|銂ODA/ODLF,IRDS……,使不同系统和不同软件的数据可以进行互换。这种方法不失为解决技术过时的新途径。
二、电子文件对档案业务管理工作的影响
1传统的档案工作以纸质文件材料为工作对象,而应用计算机后,电子文件取代了以往的文字材料,它是由拟稿者直接写在磁盘上,并在磁盘上进行修改,一经形成后,马上存贮到办公信息数据中,由档案人员、技术人员所共享。这就使得文件与档案之间不再有明显的界限。纸质档案的管理工作经过长期实践,已总结出一套工作流程及方法、原则,如文件的立卷归档制度。文件的归档立卷工作是档案工作流程的起点,也是文书工作和档案工作的结合点,文件形成后,由文书部门收集立卷后,交档案部门管理,一般一年归档一次。而电子文件随时产生,随时更改,存贮在计算机磁盘或光盘中。因此,它对计算机有很强的依赖性。如果归档,必须以磁盘或光盘的形式移交,归档范围也不能只是“办理完毕,具有保存价值”的文件,还应包括该文件的读取软件甚至操作系统。
2由于电子文件信息与载体的可分离性,档案实体分类也可能将被概念分类整理所取代,因为实体分类的结果只能体现一种属性联系,这种单线排列的方式是手工操作管理档案的需要,但在当今电子文件的环境中,文件的形式特征和内容特征均发生了变化,电子文件可以通过计算机系统进行迅速、有效、多角度的整序,不再需要对它进行象纸质文件那样的分类整理。不同的用户可以根据不同的需要,利用办公自动化系统对电子文件进行自由组合分类。
3由于电子文件的保存价值同时取决于其自身价值和可读性,其鉴定的方法、内容、标准均将发生变化,原有的档案价值理论分析范围也将扩大,要分析电子文件的读取软件甚至操作系统。根据传统的档案价值鉴定理论,文件应根据其凭证价值和参考价值确定保管期限,而电子文件一方面由于制作方便,将产生比以往更多的文件,另一方面由于用户的需要,信息和数据不断地修改和补充,因此很难划定固定的保管期限,况且目前电子文件的凭证价值尚无法律保证。因此,其鉴定、管理方法亦无定论。此外,由于电子文件信息载体的特殊性,其保管方法、要求以及检索和对外利用等方面也与纸质文件有许多不同之处。
三、电子文件对档案学理论的影响
1对档案本质属性的影响
原始记录性是档案的本质属性。这种原始记录性一方面表现在档案的内容上,另一方面表现在档案的形式上,如当事人的亲笔手稿、领导者的亲笔签署等,都表现出真实的原始性。也正是档案的原始记录性,才使得档案区别于图书、情报、资料等其它信息,而具有法律凭证的作用。在办公自动化系统中,电子文件从起草、修改到印发都在计算机上进行,它便于修改、便于复制的特性,使得最能体现档案原始记录性的内容与形式特征不复存在。电子文件是计算机文字处理系统中的最后一个文本,没有草稿与印稿的区别,也没有正本与副本的差异,甚至文件与档案之间很难划定一条人为的界限。人们可以在机器上随时方便地复制电子文件,这样文件是档案的前身,档案是由文件有条件地转化而来这一档案概念就变得难以理解。电子文件的原始记录性和凭证作用如何确定电子文件能否作为档案是否具有法律凭证作用等等,便成为档案界的一系列新课题。这些课题是电子文件能否转化为档案的关键,也是赋予档案本质属性新的内涵的客观需要。对档案来源原则的影响
来源原则包括两个方面:从外部来看是尊重全宗,从内部来看是尊重原始顺序。目前,随着大量电子文件的产生,后者愈益受到普遍关注。传统的观点认为源于来源原则的档案检索系统必须一律建立在文件形成者或信息提供者的组织机构及其文件的基础上。只有根据其来源,从形成者的法律责任和行政管理的角度看问题,才能正确整理和理解档案文件。而电子文件在形成过程中,不再严格对应于现存的机关、组织、机构这一现象而产生,人们可以根据需要随时对文件信息复制、修改和重新组合、打乱或破坏文件的本来顺序。因此,要确定档案的来源,不可仅局限于寻找一个恰切的定义,或仅要求完整地保护全宗与文件系列,按照原始顺序进行整理等,而必须正确说明档案的原始联系,了解在整个生命周期中文件组合的变化,应随着客观实际的变化,丰富和发展来源原则。
3对档案学理论研究内容的影响
档案学理论研究的内容是由研究对象所决定的。以往的档案学理论研究是以纸质档案为主要对象,电子文件出现以后,档案工作的对象发生了变化,其理论研究的对象自然也就发生了变化。原有的一些定论、模式将被重新审视,原有的管理思想、管理原则将得到更新和补充,原有的档案学科体系也将得到充实和完善。所有这些研究课题都应围绕电子文件来开展。如电子文件的整理排序技术、信息安全保护技术、计算机病毒防治技术等等,都将成为档案学理论研究必不可少的内容。
四、档案界所应采取的对策
1做好归档电子文件的技术处理工作,实施电子文件管理战略。新型文件材料的归档势在必行,这就要求档案工作者必须深入到现行文件工作领域,对产生的大量电子文件的接收、处置乃至存储工作进行指导,保护电子文件的原始信息,了解文件信息重新组合的来龙去脉。也就是说,通过采取技术处理,将已归档的电子文件改为“只读性”文件,即只能读不能写的不可更改的文件,从而识别和保护电子文件的原始结构,保证电子文件的可靠性,使之与纸质文件一样发挥社会效用。
1.引言
本文所述的电子文件,指在文件管理体系中起到传送、鉴定和保存作用的以页面形式显示的数字文件。电子文件广泛应用于图书出版、档案管理、电子商务、电子政务等领域。目前,普遍接受的两种的电子文件格式是PDF和DiVu。PDF(PortableDocumentFormat,便携式文档格式)是由Adobe公司开发的格式。DjVu格式是由AT&T实验室开发的格式。从实现上来说,PDF和DjVu分别是有代表性的基于图形的格式和基于图像的格式。常见的电子文件格式还有微软的CHM和LIT、华康WDL、方正CEB、超星PDG、书生SEP等。
字处理文件格式有时也起到电子文件的作用,如RTF、微软DOC、金山WPS等;扩展标记语言XML经常用于信息的共享和交换,在附加样式单或经过转换后也能够以页面形式显示。因为使用它们的主要方式有所不同,本文的讨论将不涉及这些格式。
开源软件的历史不长,但是已经形成了一种潮流。开源软件对电子文件管理产生了显著的影响。向大众开放文件格式的源代码(包括读写、转换、加密等),有利于这种格式增强适用性和可靠性,有利于这种文件格式获得广泛接收。选用开源的文件格式有助于文件的长期保存,减少信息丢失的风险。
本文以PDF和DjVu为研究对象,对照国外的其他一些格式,从文件流通和文件保存两个方面比较它们各自的特点和在开源软件运动中所处的地位。本文指出支持开源的程度,将成为今后用户选用电子文件格式时的考虑的主要因素。
第2节分析文件格式的开源情况。第3节和第4节分别讨论开源软件对文件流通和文件保存环节的影响。第5节是对其他国外格式的一个简单调查。第6节是结论。
2.开源情况
开源软件(OpenSourceSoftware),也称为自由软件(FreeSoftware),其中的“Free”指自由地使用、学习、修改和分享软件。分享开源软件的自由意味着人们可以使用和翻译这些软件而不用支付任何费用。有些可以免费使用的软件,如共享软件(shareware)和免费软件(freeware),不能被用来研究、修改和分享,所以不是开源软件。
开源软件由一些志愿者发起,已经开发出了OS、GUI以及大量的应用程序。Linux是开源软件的典型代表,在质量、外观和健壮性上都能与私有软件(如Windows)媲美。著名的开源软件社区有SourceForge()等。像IBM和Sun这样的大型计算机公司也支持和开发开源软件。
越来越多的欧美地区的管理部门已经制定或正在制定提倡使用开源软件代替私有系统的政策。这不仅使它们不再依赖于商业软件供应商,而且也帮助扶持了自己的软件开发产业。由于开源软件成为潮流,而且质量上乘,许多政府选择开源软件进行本地化,为政府信息化服务。
PDF是商业公司开发的一种文件格式,已经有很长的历史。PDF的规范是公开的,如最新的PDF1.5规范可以网上免费获取。Adobe公司的电子文档阅读器AcrobatReader是免费的。但是,处理PDF文件的主要应用软件Acrobat、Distiller、Designer等是商业软件,价格比较昂贵。
由于PDF格式非常复杂,特别是使用了对象技术,开发PDF应用是一项复杂的工作。KPDF是Unix/Linux的第三方阅读器。一些免费的PDF库,如PDFlib和xpdf,是二进制的,而且功能不够完整。这就形成了一个技术壁垒。国内只有很少的商业公司有能力开发PDF应用软件。
近年来,随着开源运动的发展,出现了很多开源的PDF项目。其中,规模较大的是iText,它是一个由Java编写的开源的PDF库,带有简单的GUI。同时,这个项目组用C#编写了iTextSharp,供平台上的用户使用。iText对PDF的读写提供了全面的支持。
比较而言,DjVu最初是由实验室开发的,设计的出发点就支持开源。DjVu的主要资源网站有等。DjVu的参考库包含了由C++编写的解码程序和部分编码程序,其中解码程序具有基于Qt技术的GUI以及NS浏览器插件,编码程序是一些命令行子程序。另外,Windows平台上开源项目WinDjView是一个小巧的DjVu阅读器,功能较完善,并提供VisualC++的源代码。
AT&T实验室把DjVu的商业开发权利转让给了LizardTech公司()。LizardTech的主要DjVu产品有免费DjVuSolo,收费的DocumentExpressEditor和DocumentExpressEnterprise。DjVuSolo支持由图像制作单个DjVu文件。DocumentExpressEnterprise是一个工作流式的制作工具,目前最新的版本是5.1。它能够从图像文件或PDF/PS文件批量制作DjVu文件。另外,它支持中英文的OCR,以及添加数字水印。
3.文件流通
电子文件的流通,是指电子文件在机构业务活动中的发文、文件流转和收文等过程。在电子文件的生命周期中,文件的流通是很重要的环节。在现实中,各机构使用的平台和软件多种对样。如果发送方与接收方的软件不兼容,那么即使文件传送成功,接收方也未必能读取信息,为此,需要选择一种通用的文档格式,使电子文件能实现无障碍流通。
PDF文档由一系列的页面组成,每幅页面都包括正文、字形、边缘、版面、图形和背景等数据。PDF文件能够在各种软件中生成,并保留原有文件的内容和外观。PDF文档显示风格一致,能够满足政府、法律、财经和IT等行业对于文档或表单的严格规范要求。
PDF支持动态表单系统,提供加注释标记或数字签章的功能,为文件收发双方针对电子文件的交互流动提供了可能,适用于机构内部公文呈转或在线交易。PDF提供不同级别的安全控制,有利于文件的安全管理。PDF提供比较、鉴定工具,有利于确认文件的真实性、完整性。不过,这些功能只有Adobe的软件才能很好地支持。
DjVu格式将图像分为背景层(纹理和图片)、前景层(文本和线条)和掩码层(形状库)。DjVu用高分辨率来还原文字,从而最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。DjVu采用分层显示,而不是等到整幅图片都被解码之后才显示,使得图片显示的速度有很大提高。
DjVu具有与PDF类似的超链接、注释、元数据功能。DjVu的前景层能够被OCR识别,识别的结果入到可搜索的隐藏文本层中。目前,OCR引擎没有包含在DjVu的开源代码中。由于尚缺乏中文OCR的开源代码,这将成为DjVu进入中文市场的一个不利因素。
DjVu格式能够与数字水印系统相结合,保证数字文件的真实性和在网络上被合法使用。可以将一个标识图像与宿主图像数据进行叠加,形成带可见水印的图像,或者将一个特定的序列号经过加密算法嵌入宿主图像数据得到不可见水印。
开源对文件的流通和使用有下面两个方面的影响:
(1)适用性。开源软件能够按照具体的业务需求进行定制或进行有效的二次开发。Adobe公司并没有提供PDF的开源代码,因此相当长时期内PDF的定制就显得非常困难。需要指出的是,DjVu的开源代码数学性很强,修改起来并不容易。DjVu代码的可读性和可修改性都有提高的必要。
(2)可靠性。源代码对于理解文件格式的工作原理和修补文件格式的错误是很重要的。PDF是一种复杂的结构化文件格式,有理由对它的安全漏洞和“后门”问题给予更多的关注,特别是在敏感的应用场合。国内用户有时更愿意选择类似PDF的国产格式,如方正CEB等。
4.文件保存
电子文件格式的选
择对保证数字信息的可读性起到关键的作用。产生电子文件的部门处于不同的领域、有不同的事务处理需求,在工作中产生了各种各样格式的文件。软件开发商有针对性,很少考虑到文件格式的长期保存能力。为了使各种数字文件信息能够在将来继续被利用,必须在繁多的文件格式中进行选择,选取有利于长期保存的电子文件格式。
PDF在世界上拥有众多用户,有许多第三方公司支持。PDF有可能成为电子出版物的国际标准。广泛的支持者和众多的合作者,成为PDF格式长期发展的基础。PDF可以从任何支持标准印刷语言PostScript的应用系统中产生。AcrobatWriter支持把常见的字处理文件如.txt、rtf和.doc等转换为PDF文件。PDF还可以从扫描文档中产生,使传统文件数字化后得到外观非常接近于原件的电子文档。
迄今为止,已公布的PDF规范的版本都是向下兼容的。不过,由于数据迁移的窗口时间较短暂,对PDF文件仍需要合理规划以减少数据丢失。PDF采用CCITTGroup4无损压缩算法。由扫描文件制作的PDF文件体积较大,有时需要进一步压缩。
如今DjVu的用户数量远不如PDF。但是,AT&T开放参考库的做法为DjVu在开源社区争取到了很多支持。已经开发的项目有不同平台上的浏览器、图像转换器、javascript搜索引擎、在线格式转换服务器()等。在美国,DjVu已经拥有很多政府、企业以及档案部门等的客户。
DjVu对背景层采用小波压缩算法IW44,压缩后文件大小非常理想,能够显著地节省存储空间。对包括文字和图像的彩色文件来说,DjVu文件在同等质量下其大小通常只有JPEG文件的1/5-1/10。对由扫描文件制作的黑白PDF文件来说,DiVu文件只相当于它们的1/2-1/4。
文件保存方面与开源有关的两个关键问题是:
(1)保存成本。拥有源代码使用户可以自主控制应用中与文件格式有关的模块,而不必受制于格式的开发者。PDF本身很复杂,而且功能扩充很快,对第三方开源项目的升级来说是一个挑战。大多数PDF用户仍依赖于Adobe的技术支持。DjVu的发展时间还不长,已经转入了商业开发。未来DiVu能够继续保持完全开源的地位,存在一些不易预测的变数。
(2)信息耗损。作为一种长期保存的文件格式,要尽量降低格式转换或数据压缩造成的信息损耗。PDF的矢量图形元素不会耗损,图像采用无损压缩也不会耗损。DjVu技术同时支持无损压缩和有损压缩,采用无损压缩时压缩性能有较大的下降。需要注意的是,DjVu的开发者对开源代码有一定保留,公开的算法并不一定是最优的。
5.其他格式
与微软公司的字处理文件DOC不同,它的电子文件格式并不普及。CHM格式是微软的基于HTML的帮助文件。CHM支持与HTML相关的各种技术,并可以通过URL与Internet联系在一起。CHM可以直接在Windows系统上打开,制作工具有WinCHM和PowerCHM等。LIT格式是软件MicrosoftReader的专有格式。MicrosoftReader是一个易用的电子文件阅读器,但是目前还不支持中文。
此外,国外的电子文件格式还有SWB、EBX、EBK等。SWB格式是软件WinEbookCompiler的专有格式;EBX格式是软件GlassbookReader的专有格式;EBK格式是Voyager公司制定的格式。这几种格式主要用于电子图书,而且市场份额不大。
6.结论
开源软件对电子文件格式及其支持软件产生了深刻影响。PDF和DjVu是国外的两种主流电子文件格式。一方面,完整的第三方开源软件的出现,对Adobe的垄断地位提出了挑战。另一方面,PDF原先的技术壁垒降低了,这有利于PDF的进一步普及。DjVu作为一种技术先进的开源软件出现,近些年得到快速发展,已经转入大规模的商业开发。
从技术上看,基于图形的格式和基于图像的格式有互补性,分别侧重不同的应用场合。同时,文件格式的开发机构之间存在一定的协作关系,主流文件格式之间通常有可转换性。用户在选用格式时有很大的余地。可以预见,在国内市场上这两种格式以及其他格式将形成长期竞争的局面。
【参考文献】
[1]刘家真主编.电子文件管理——理论与实践.科学出版社,2003
[2]冯惠玲主编.电子文件管理教程.中国人民大学出版社,2001
[3]Adobe,PDFReference(fourthedition),/devnet/pdf/pdfs/PDFReference15_v5.pdf
[4]BottouL,etal.HighQualityDocumentImageCompressionwithDjVu.JournalofElectronicImaging,7(3):410-428,1998