当前位置: 首页»信息动态 »行业动态
纸质档案数字化基本流程与技术要求是怎样的?
来源:www.cqnuoxin.cn 发布时间:2022年03月31日
  纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。具体流程如下:

  (1)档案整理。

  扫描前,根据档案管理情况,按以下步骤适当整理档案,并根据需要进行标识,确保档案数字化质量。

  1.目录数据准备。

  根据《档案录制规则》(DA/T18)的要求,规范档案中的目录内容。包括确定档案目录的录制项目、字段长度和内容要求。如有错误或不规范的文件名称、文件名称、负责人、起止页号和页数,应进行修改。

  2.拆除装订。

  影响扫描工作的档案,不拆除装订,拆除装订,拆除原装订线,排列顺序,无遗漏页面和顺序错误,不损坏原件。

  3.区分扫描件和非扫描件。

  按要求区分同一档案中的扫描件和非扫描件。区分普通文件的原则是:不相关的重复文件应易于删除,有正式文件的文件不能扫描原稿。

  4.页面修改。

  (1)对损坏严重、不能直接扫描的档案,应先进行技术修复。

  (2)影响扫描质量的原件应在扫描前进行相应处理(压平或烫平等)。

  5.档案整理登记。

  制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。

  (2)档案扫描。

  1.扫描方法(扫描前必须准备专业的高速扫描仪,并带平板)

  (1)根据档案幅度(A4.A3.AO等)选择相应规格的扫描仪或专业担描仪。工程图纸可用0号图纸扫描仪扫描。

  (2)普通A4纸质文件,采用高速扫描仪自动进纸方式;

  (3)纸张过薄、透明(如信纸、便签纸)采用高速扫描仪平板扫描;

  (4)纸张过厚。照片等档案采用高速扫描仪平板扫描;

  (5)附属小页面贴在文件页面上。纸张时,将大小页面单独扫描到平板上;

  2.扫描模式(纸质档案扫描一般采用黑白、灰度、彩色三种模式)

  (1)页面为黑白,字迹清晰。无图片的档案材料,采用黑白方式;

  (2)页面为黑白,清晰度差或有图片的档案材料,页面多为彩色文字,采用彩色或灰度模式(视情况而定);

  (3)页面上有红头、印章或黑白照片、彩色照片、彩色插图档案,采用彩色模式扫描。

  3.分辨率选择。

  (1)采用黑白.256灰度模式扫描的文件,其分辨率选择不小于200DPI;

  (2)采用彩色模式扫描的24位文件的分辨率选择不小于100DPI(上述模式的分辨率设置以A4纸为标准,其他规格的纸张应酌情处理)

  (3)扫描的线数、阀值、亮度、灰度、对比度等值可根据扫描文件材料的清晰度适当调整;必要时,扫描分辨率可根据原件的清晰度进行调整。如果原件质量差,尺寸小,可以适当提高分辨率;相反,分辨率也可以相应降低。增减以扫描后图像是否按原尺寸显示清晰为准;

  (4)粘贴折叠和表格。对于粘贴折叠,可以用大型扫描仪扫描,也可以先部分扫描后拼接;对于一些字体很小、字迹密集的情况,可以适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决。对于字迹和表格颜色深度不同的,采用局部淡化技术解决。

  4.扫描登记。

  填写交接登记表,登记扫描页数。检查每份文件的实际扫描页数是否与整理文件时填写的文件页数一致注明具体原因和处理方法。

  (3)图像处理。

  处理图像以获得佳的图像质量,确保图像完整、正确、无扭曲区域、布局无暗影、无干扰信息,主要完成图像处理包括:去黑边、去污点、纠正偏差等,处理图像保存格式为PDF。

  1.纠正偏差:对扫描过程中的偏差图像进行整体纠正,包括自学和手校,确保数字图像的偏差角度小于1度(图像偏差不超过页面的一半);

  2.旋转:将图片按方向旋转到正确的方向,无文字图片,判断方向后左旋。右旋转。旋转。旋转等工具;

  3.去污:影响图像页面质量的杂质,去除影响数字图像可理解度的杂质,如去除黑边、多余边、污点;

  4.切边:彩色模式扫描的图像应切边,去除多余的白边,有效降低图像文件容量,节省存储空间。

  5.删除空白页:删除扫描后页面之间的空白页;

  6.断字修补:部分文字不清可修补;

  7.反白字修正:可描述部分反白字;

  8.分割:将A3幅面文件分为两个A4幅面文件;

  9.拼接:扫描大幅面档案形成的多幅图像应拼接成一个完整的图像,以确保档案数字图像的完整性。

  (4)图像处理质检。

  主要对完成图像深处理的检查,不符合要求的返回上一环节重新处理,如以下问题:

  1.由于操作不当,扫描图像文件不完整或无法清晰识别,应重新扫描;

  2.检查图像偏斜度、清晰度、失真度等。当发现不符合图像质量要求时,应重新进行图像处理;

  3.图像处理是否得当,严重应重扫,处理不当应重新处理;

  4.扫描图像页码顺序是否与原文件一致,是否有漏扫、多扫(重复)、纸张倒置等情况;

  5.顺序:如果页码不连续,与原文不一致,需要对页面进行排序;

  6.漏扫:重新扫描漏扫页面,插入正确位置;

  7.多扫:删除多扫页面;

  8.倒置:调整不符合要求的,与原文保持一致。

  (5)图像存储。

  纸质档案目录数据库中的每个文件都有一个相应的档号,以文件扫描后的图像文件命名。多页文件应合并为PDF,保存到指定路径,便于准确连接入库,并与文件管理软件中的目录建立相应的关系。然后将所有文档分批转换为可复制的双层PDF格式,然后进行光盘记录,以确保记录的光盘能够正确读取并标记标签。注:禁止使用Word文档保存扫描图像。

  (6)目录建库。

  按照《档案录制规则》(DA/T18)的要求进行录制,建立档案目录数据库。目录库应选择一般数据格式。所选数据格式应通过XML文档直接或间接进行数据交换。

  注:通过人工校对或软件自动校对,检查目录数据库的质量。检查记录项目是否完整。记录内容是否标准化、准确,需要修改或重录不合格数据。

  (7)数据挂接。

  1.挂接前的数据关联检查。

  基于纸质案目录数据库为基础,将扫描每个纸质档案文件获得的一个或多个图像存储为图像文件。将图像文件存储在相应的文件夹中时,应仔细检查每个图像文件的名称是否与档案目录数据库中的文件号相同,图像文件的页数是否与档案目录数据库中的页数相同,图像文件的总数是否与目录数据库中的文件相同。通过每个图像文件的文件名和档案目录数据库中文件号的一致性,建立相应的关联关系,为实现档案目录数据库与图像文件的批量连接提供条件。

  2、汇总挂接

  档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为"合格"后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。

  (八)数据验收

  一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为"不合格"。验收"通过"的结论,必须经分管领导审核、签字后方有效。填写纸质档案数字化交接登记表。

  (九)数据备份

  经验收合格的完整数据应及时进行备份。著录条目和全文数据进行一式两份DVD光盘刻录。移交前检测光盘读取性能,抽查刻录好的光盘影像质量,主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。不合格的需重新刻录。数据备份后应在备份介质上标注好盘内文件内容、类别、存入日期及光盘编号等,以便查找和管理。对保密的需标明密级。

  (十)装订

  扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。

  装订不能损害档案原件。装订时应按原有顺序装订,案卷不掉页、左边和底边整齐,保持拆卷前的原貌,并认真做好档案页码、页数的检查对较。

  (十一)扫描注意事项

  1、扫描前必需对文档进行拆除装订物,并检查文档内是否藏有干扰物(如钉书钉、碎纸等),以免产生卡纸、损坏扫描仪,务必保持文档干净送入扫描仪中;

  2、对破损严重、无法进行扫描的原件要先进行修复、裱糊;

  3、褶皱不平影响扫描质量的原件应先压平再进行扫描;

  4、对纸质过薄、透明的(如信纸、便签纸)、纸质过厚、照片等采用高速扫描仪的平板扫描;

  5、对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;

  6、扫描完每一份文件,要对照原文仔细检查扫描是否清晰、完整;

  7、按要求使用扫描仪、清洗,并对每次使用完扫描仪进行保洁,检查是否关闭电源;

  8、纸质档案数字化成果提供网上检索利用时,应有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。

相关文章