当前位置: 首页»信息动态 »行业动态
大数据时代档案信息安全管理的思考是怎样的?
来源:www.cqnuoxin.cn 发布时间:2022年10月21日
  “大数据”时代档案信息安全管理新思维

  继联合国之后“全球脉动”希望利用的项目“大数据”在推动全球经济发展后,2012年3月,美国奥巴马政府宣布推出六个联邦部门和机构,包括美国国防部、能源部和国家科学基金会“大数据研发计划”。该计划将“大数据”作为一个全球发展战略计划,它大力推动和完善与大数据相关的收集、组织、分析、决策工具和技术,并确立“大数据”作为未来信息技术发展的核心。值得注意的是,美国政府在大数据计划中特别提到了这一点“国家档案和文件署(NARA)”一项。虽然我国档案行业没有提出具体的规划,但研究人员和管理者的使命一直是关注新技术、新方法、提前思考档案工作的未来图景。实体安全和信息安全一直全和信息安全。信息安全迎来了大数据时代和云计算环境的新风险和新挑战。虽然这种新环境下的信息安全与以往的信息安全有着历史的逻辑延续,但它已经形成了一些新的特征。其风险链、风险范围和风险程度发生了许多新的变化,表现出隐藏的相关性、集群的风险和普遍性的模糊性,需要加强研究跨领域的渗透性和交叉的复杂性。在深入研究之前,区分相关概念:云计算是你正在做的事情,而大数据是你所拥有的。大数据是云计算基础设施的应用形式。

  1 安全的档案数据采集

  档案数据采集包括电子文件采集和纸质文件数字化处理两部分。

  1.1 扩大电子文档收集的范围,内容立即

  在某种意义上,“大数据”一个重要的概念是,数据越大,内容越丰富,从中推断出的信息就越多。具体到档案工作,无论是从档案的凭证价值和情报价值,还是档案的实际价值和长期价值,还是档案的一和第二价值,都可能需要重新考虑电子文件收集的范围和形式。

  大数据通常是样本数据集。例如,测量交通、行为、土壤酸碱、降雨、风等物理信号的监测设备,或其他类型设备的视频监控和持续积累的时间或实时数据,分别记录的活动片段,一旦数据丢失,片段将永远消失。考虑到完整、完整、真实、有效和数据安全,这些数据文档应实时在线归档,并保存离线副本。另一个典型的例子是美国政府«联邦政府Web2.使用情况及档案价值报告»。报告中提到,只要社交平台上产生的信息具有商业价值、证据价值和背景价值,就可以认定为归档文件。到目前为止,虽然中国对这类内容没有具体的归档规定,但从总体趋势来看,需要积极扩大档案收集的范围。

  1.2 纸质文件数字化过程和结果安全

  纸质档案数字化的过程安全是指在档案数字化过程中不危及档案实体和信息安全的行为。因此,需要一系列的规章制度和标准化的操作流程。首先,我们应该调查数字服务单位的资质和声誉。其次,要建立完善的管理制度。例如,案件文件不得擅自离开处理现场,当天的数字文件必须在同一天归档;进出图书馆有严格的交接和检查程序。在数字化过程中严格遵守国家标准«中华人民共和国行业标准(DA/T31-2005)纸质文件数字化技术规范»,在不破坏档案装订原貌的情况下,在扫描过程中保证档案的清洁,确保扫描图像与原件一致。

  纸质文件数字化结果的安全性是指数字文件数据的有效性和可用性。因此,档案数字化后,必须进行电子档案质量检查,这也是监控档案数字化结果安全的重要步骤。主要包括三个过程或环节:一是质量抽查,不合格数据应及时返工和重新清理;二是数据检测,主要包括病毒检测、运行检测和数据三个方面;第三是数据检测的使用,主要是将所有数据直接连接到档案管理系统,并提供外部使用。

  2 安全档案信息管理系统

  自20世纪90年代以来,中国早的档案管理软件经历了近20年的发展。随着计算机和网络技术的发展,数字档案管理模式从原来的单机版本分布(C/S架构),到网络版本(B/S架构),直到新的面向服务的数据平台(SOA架构);在功能上,从只实现简单档案管理的单一软件,到档案管理软件和OA系统集成的数据库已经渗透到当前的数字文件管理模式中(workflow)数据库平台。档案大数据涉及的数据量如此之大,以至于目前主流的软件工具无法在合理的时间内捕获、管理、处理并整理成信息,以帮助企业做出更积极的决策目的。因此,档案信息管理系统的安全性在很大程度上决定了档案信息的安全性。

  2.1 支持平台安全的数据

  美国政府的大数据计划“国家档案和文件署(NARA)”,计划为十亿电子记录(CI-BER)该网络基础设施是一个由联合机构赞助的测试平台。由多个机构赞助的网络基础设施收集了国家档案馆87万份多样化的数字记录文件和信息,可以称为计算机研究所的文艺复兴。该测试台将评估技术和方法,并收集大量数据,以支持可持续访问。

  在国内外实践中,建立至少四个层次的档案大数据平台:一是云服务提供商提供全面、可视化的服务,特别是档案大数据服务客户有权分析基础设施中发生的所有事项;二,收集大量档案数据,解决各数据库的兼容性问题;三,提高快速识别目标,锁定威胁来源和敌对事件的能力;四,基础设施可扩展,可进行短期和长期分析。监控管理、风险控制和规则合规性是档案云数据支持平台基本的要求。

  2.2 环境安全数据计算

  传统的数据库系统不能有效地处理大数据。首先,这些系统的设计无法应对当前的情况。如今,数据类型越来越复杂,结构化数据的比例越来越低;其次,它不能快速、经济地扩展系统。不仅是硬件编程环节,从数据管理的角度来看,由于少量数据样本易于单独测试和监控,存储在文件大数据计算平台上的数据应首先进行详细的类别划分,然后进行存储和计算。

  档案数据库据库进行数据分析后,有必要向不同的人展示结果。对于同一查询指令,不同角色的人应该看到不同的结果信息,即查询反馈的结果不同:技术人员阅读相关系统并设置管理数据;文件人员检查并操作与其业务范围相关的内容;普通用户可以获得经审公布的电子文本或目录。大数据时代的档案安全解决方案应该足够强大,可以为不同层次的人提供不同的显示界面和工具。

  同时,档案大数据系统必须有目录排序.档案采集.档案审核.系统维护等功能,并利用现代网络技术,实现多人多客户端操作。

  3 提供使用安全的档案

  通常,大数据实现的障碍来自文化,而不是技术。许多组织未能成功完成大数据项目,因为他们没有意识到大数据在改善其核心业务方面的作用。正如1893年立式文件柜的出现解决了纸质文件存储和检索的困难一样,档案大数据肯定会给档案信息的搜索和使用带来颠覆性的变化:档案大数据的核心不是拥有数据,而是对这些档案数据的影响。

  档案大数据技术的战略意义不在于掌握庞大的数据信息,而在于专业处理这些具有高价值和历史意义的数据。如果将大数据与一个行业进行比较,那么这个行业实现利润的关键是改善数据“加工能力”,通过“加工”实现数据的“增值”。这种主动提供和使用的文件信息不仅应提供原始文件信息,还应具有内容分析.结果预测.辅助决策等功能。例如,我们在购物网站上查询.购买内容被记录后,往往可以收到商家的产品推荐;搜索网站上的搜索历史被记录后,相关内容推送经常出现在网站界面上。对于这些“智能显示”,普通人往往有这样的理解:对我有利的人会觉得大数据方便实用;对于那些对我不利的人,他们会质疑是谁在后台收集了我的隐私。基于大多数人的行为是可以预测的,类似的产品和服务被推荐给我们,这在很多情况下是正确的,但这是真正的个性化和“长尾”失去为代价。截至2011年,各级国家档案馆藏品已达3.3亿卷,到2020年,各级国家档案馆藏品将达到6亿卷。如此大量的档案信息,如果档案管理软件能够在程序设计中实现数据的实时成功捕获,那么档案使用服务的水平必须与今天不同。

  大数据时代的档案信息安全是积极提供档案数据安全保障,而不是等待无法弥补的损失。目前,所有相关研究都是基于这一目的的先进考虑。随着科学技术的进步和相关技术的发展,这些研究成果将不断修正,以更好地服务于实际工作。

相关文章