当前位置: 首页»信息动态 »行业动态
档案数字化如何加工?
来源:www.cqnuoxin.cn 发布时间:2023年09月15日
  如何加工档案数字化?

  一、定义

  随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像),档案数字化、随着数据库技术、多媒体技术和存储技术的发展,一种新的文件信息形式将其转化为存储在磁盘、光盘等载体上的数字图像或数字文本的处理过程,可以通过计算机识别。

  文件数字化是一种新型的文件信息管理模式,它将各种载体的文件资源转换为数字文件信息,以数字形式存储,以网络形式相互连接,利用计算机系统进行管理,形成有序结构的文件信息库,及时提供利用,实现资源共享。

  数字化步骤二

  前期档案整理

  档案借出

  从档案室接收,填写档案并移交清单,一式两份。拿到档案后,开始检查档案数量,检查数量后签字确认,将档案带回加工现场。

  准备目录数据

  根据各种档案整理规定的要求,在档案管理系统中记录目录数据。如有错误或不规范的文件标题、文件标题、责任人、日期、起止页号等。,应进行修改。

  拆除装订

  如果没有拆除装订物,会影响扫描工作的档案,装订物应该被拆除。拆除装订物时要注意保护档案不受损坏。

  页面修整

  对于损坏严重、无法直接扫描的档案,应先进行技术修复,扫描前应对影响扫描质量的原件进行相应处理(压平或熨平等)。).

  档案扫描

  扫描方式

  根据档案幅度的大小(A4)、A3、A0等。)选择相应规格的扫描仪或专业扫描仪进行扫描(例如,0号图纸扫描仪可以用于工程图纸)。大型文件可以用大型数字平台扫描,也可以用缩小拍摄后的电影数字转换设备扫描。

  (2)纸张状况不佳,档案太薄、太软或太厚,应采用平板扫描;对于纸张状况良好的档案,可以采用高速扫描来提高工作效率。

  颜色模式的扫描

  (1)扫描色彩模式一般包括黑白二值、灰度、色彩等。一般采用彩色。

  页面为黑白两色,且字迹清晰,无插图文件,可采用黑白二值模式扫描。

  (3)页面为黑色和白色,但字迹清晰度差或带插图的文件,以及页面为多色文本的文件,可以用灰度模式扫描。

  页面上有红头、印章或插有黑白照片、彩色照片、彩色插图的文件,可以通过彩色模式进行扫描。

  扫描分辨率

  原则上,扫描后的图像清晰、完整、不影响图像的使用效果,是扫描分辨率参数大小的选择。

  (2)扫描文件时,采用黑白二值、灰度、彩色等模式,其分辨率一般应设置为200-300dpi。特殊情况下,如文字小、密度大、清晰度差等。,可以适当提高分辨率。

  图像处理

  图像数据质量检验

  (1)检查图像的偏差、清晰度、失真等。当发现图像质量不符合要求时,应重新处理图像。

  如果由于操作不当,导致扫描的图像文件不完整或无法清晰识别,则应重新扫描。

  发现文件漏扫时,应及时补齐并正确插入图像。

  当发现扫描图像的排列顺序与档案原件不一致时,应及时调整。

  纠偏、去污、图像拼接、切边处理

  (1)对有偏差的图像进行偏差处理,以达到视觉上基本不感觉偏差为准。旋转还原方向不正确的图像,以满足阅读习惯。

  (2)对影响图像质量的杂质,如黑点、黑线、黑框、黑边等。,应进行去污处理。在处理过程中,应遵循在不影响可理解性的情况下展示文件原貌的原则。

  (3)分区扫描大型文件形成的多幅图像,应拼接合并成一个完整的图像,以保证文件数字图像的整体性。

  采用彩色模式扫描的图像应进行裁边处理,去除多余的白色边缘,以有效地减少图像文件的容量,节省存储空间。

  图像存储

  存储格式

  图像文件采用黑白二值模式扫描,一般采用PDF格式存储。

  采用灰度模式和彩色模式扫描的文件,一般采用PDF格式存储。

  图像文件命名

  (1)纸质档案目录数据库中的每个文件都有相应的档号,扫描后的图像文件被该档号命名为该档号。如果图像文件较大,不方便网络浏览,可以拆分成多个图像文件,文件名称后增加A、B、C等区别。

  分别设置文件夹,以文件档号命名,并存储相应的图像文件。

  数据挂接

  在将每个纸质文件扫描获得的图像存储在相应文件号的文件夹中后,仔细检查每个图像文件的名称是否与文件目录数据库中文件的文件号相同,图像文件的页数是否与文件目录数据库中文件的总页数相同。通过每个图像文件所在文件夹的名称与文件目录数据库中文件号的一致性,建立相应的关联关系,为实现文件目录数据库与图像文件的批量挂接提供条件。

相关文章