您所在位置: 首页 >> 档案工作 >> 学会工作 >> 学术之窗

  • 浅谈数字档案资源建设
  • 文章日期:2017-08-22 11:36:59    文章点击数:    稿源:

     

    中共十八届五中全会的“十三五”规划建议提出:“实施国家大数据战略,推进数据资源开放共享。”随后国办印发《国务院关于印发促进大数据发展行动纲要的通知》(国发〔201550号)文件,“大数据”已成国家战略。20161月,江西省制定并印发了《促进大数据发展实施方案》(以下简称“《实施方案》”)。《实施方案》明确,2018年底前,建成省级政府数据统一开放平台,2020年底前,省级层面实现数据共享交换全覆盖。“大数据”时代的到来对数字档案资源建设来说即使机遇又是挑战,对档案系统内数字档案资源建设提出更高要求,南昌市档案馆将以此为契机将数字档案资源建设融入到“大数据”发展中去。

    一、现状及存在问题

    1、“数字档案馆”上线运行

    南昌数字档案馆项目建设启动于2011年,总投资319.67万元,分为中心机房改扩建项目、硬件项目、软件项目、声像系统项目四个子项目。2015116日,南昌数字档案馆项目正式通过竣工验收,正式上线运行。南昌数字档案馆项目的完成标志着南昌市档案工作进入一个全新阶段。数字档案馆集中存储南昌市档案馆各类数字档案,形成综合信息资源库,为本馆数字档案的收集、整理、鉴定、保管、编研和利用提供服务。南昌数字档案馆上线运行为本馆数字档案资源建设提供软、硬件基础。

    2、加速馆藏档案数字化进程

    档案工作正在由传统纸质档案向数字化扫描数字档案转变,馆藏档案数字化是大势所趋。南昌市档案部门要强化认识、跟上发展、切实抓好档案信息化建设,本馆档案信息化工作得到了市委、市政府的高度重视,也得到了市财政的大力支持。从2016年起,到2020年每年新增市档案馆档案数字化专项经费预算80万元,助力市档案局到“十三五”末全面完成馆藏重要纸质档案数字化转换。

    3、接入省级区域平台,实现数据大共享、大利用

    积极主动申请接入江西省区域性数字档案集成管理与共享利用平台(以下简称“区域平台”)、江西省民生档案远程共享利用平台(以下简称“民生共享平台”),并成为民生共享平台的先行试点单位。区域平台、民生共享平台是基于江西省电子政务外网构建全省档案纵向业务网,建立更加安全、可靠的数字档案馆网络通道与应用环境,为全省数字档案馆建设奠定坚实基础。本着“让数据多跑路、让群众少跑腿”的服务宗旨,南昌市档案局作为先行试点单位积极搭建民生档案远程共享利用平台,率先实现了省市县及部分乡镇(街道)便民服务中心互联共享,市民凭身份证就可以就近到便民服务中心免费查阅包括本人的知青、婚姻等民生档案信息,从而实现“跨馆查询、异地出证”。

    为了使民生数字档案资源库建设跟上民生档案远程省共享利用平台搭建的步伐,为了实现平台从原来的“可以查”到“查得到”的转变。南昌市档案局高度重视民生数字档案资源库建设,多次督促各县、区综合档案馆积极将已完成数字化的民生类电子档案目录数据上传至民生档案远程共享利用平台实现共享。

    2017年初,南昌市将青山湖区婚姻登记数字档案目录7余万条、东湖区婚姻登记数字档案目录数据20余万条、南昌县婚姻登记数字档案目录数据15余万条、下放知青数字档案目录数据17余万条,共计近60万条民生档案数字目录数据上传至江西省民生档案远程省共享利用平台。经此次集中上传大量民生类数字档案目录,南昌市民生类数字档案目录上传总数达到了80多万条,其中婚姻登记档案初步实现了市区内全覆盖。

    4、数字档案资源建设存在的问题

    数据大共享、大利用意识不强,少数档案馆基于保密和档案安全的角度考虑,在档案系统内部共享本馆藏档案资源积极性不高。部分档案馆资源共享、跨馆联动的新服务意识不强,坚持各自为政、不愿共享馆藏档案资源。

    档案基础工作薄弱,档案数字化率不高。数字化扫描工作对经费有很高的要求,我市部分档案馆存在档案基础工作薄弱、经费不足等问题,在一定程度上制约了数字档案资源建设,造成馆藏数字化扫描率不高的困境。就南昌市档案馆为例,藏数字化扫描率仅为近40%,未达到申请全国示范数字档案馆的标准——馆藏纸质档案在50万卷以下,数字化率不低于70%

    数字档案资源分布不均衡,档案门类单一,以文书档案为主,档案数字化后利用率不高。由于历史原因,新中国成立后入馆的档案内容单一、种类少,文书档案多、声像档案和实物档案相对较少,尤其是民生类档案占比更小。而且民生数字档案难齐全,以婚姻登记档案为例,由于各地民政局只需移交十年前的婚姻登记档案进档案馆,再加上入馆后开展数字化扫描的时间,南昌市多数县区档案局上传的婚姻登记档案截止于2004年度,近十多年的婚姻登记档案是空白。人民群众,尤其是年轻群众往往查不到自己的婚姻档案,这在一定程度上制约民生类数字档案便民、惠民的普及。

    二、多措并举建设数字档案资源

    “大数据”时代的到来对档案资源建设提出了更高的要求,南昌市档案馆必须加快了全面构建档案资源体系的推进步伐,紧跟时代的步伐。市档案采取“外部接收、内部整合、同级共享”多措并举加快数字档案资源建设,将数据体量做大做强,早日实现“数据大”。

    1、扩大接收范围,加强民生类档案接收力度

    介于馆藏档案内容单一、种类少,文书档案多、民生档案少的现状,基于服务群众的宗旨,南昌市档案馆加大了接收民生档案进馆的力度,加快了民生档案数字化进程,及时上传馆藏民生档案资源。

    近年来,在南昌市档案局的积极联系和争取下将地铁一号线、公证档案、涉外婚姻档案、公积金档案和殡葬档案接收进馆,并完成了公证档案、涉外婚姻档案的数字化扫描工作。本着应归尽归,应收尽收的原则,按照有关法律法规,督促相关单位和部门依法做好档案移交工作,根据民生档案的特点,积极和相关部门协商争取将部分档案提前接收进馆。

    深入挖掘现有馆藏民生档案资源,结合档案利用工作实际情况,本着“先用先扫”的原则,对本市知情下放、婚姻登记档案优先安排整理和数字化扫描。南昌市确定先将婚姻登记、知青档案电子目录两项民众查阅较多的民生档案上传至江西省民生档案远程共享利用平台供民众查阅。以此为基础推动民生类数字档案远程共享利用工作的发展,今后将陆续上传林权档案、招工档案等等电子档案目录。

    2、本市档案系统内部资源整合

    档案是凭证的同时也是一种文化资源,零散的分布在各级档案馆很难发挥档案资源的作用,不利于档案的利用。南昌市档案馆基于打破各级档案馆之间信息资源孤立的壁垒,整合系统内部档案资源、便于档案资源的开发与利用出发开展本市档案系统内部数字档案资源整合工作。

    南昌市档案局领导多次在全市档案工作会上强调档案系统内部资源整合的重要性,并将民生类数字档案目录数据共享情况纳入年终县区目标考核。借助江西省民生档案远程共享利用平台,南昌市各级档案馆一共上传民生类数字档案目录80多万条,初步实现南昌市民生类数字档案资源大共享、大利用。

    下一步将探讨如何基于南昌数字档案馆打造南昌市数字档案集成管理平台,实现各县区档案馆馆藏数字档案集中存储于南昌市档案馆“数字档案馆”中,统一管理、利用。要求县区档案馆跳出档案馆各自为阵的老服务模式,积极建立市、县(市)区两级国家综合档案馆资源共享、跨馆联动的新服务模式。

    3、实现同级档案馆之间资源共享

    2016425日,江西省档案局和江西省信息中心联合印发《关于建设政务外网全省档案纵向业务网与启用区域平台的通知》(以下简称“《通知》”)。《通知》中决定基于省电子政务外网构建全省档案纵向业务网,建立更加安全、可靠的数字档案馆网络通道与应用环境,为全省数字档案馆建设奠定坚实基础。目前,全省区域性数字档案集成管理与共享利用平台已经部署在全省档案纵向业务网上,存有各级综合档案馆自2012年以来上传至全省档案资料查阅平台的约1400万条目录数据。

    南昌市档案馆已接入区域平台,成为全省数字档案馆中的一份子,实现了与省内各档案馆之间的档案资源共享。2017年,南昌市档案馆将按省馆要求积极上传馆藏数字档案至区域平台,为全省数字档案资源建设添动能。

    三、未来数字档案资源建设展望

    1、“数字化”向“数据化”转变

    当前,档案馆多数处于数字化建设阶段,数字化工作实际上是以扫描图像的形式储存档案资源,但所得数字化图像没有建立档案全数据库,并不能通过关键词检索其内容,即档案数字化成果没有数据化。数据化的定义一般是指将数据结构化后存入计算机数据库系统中,从而实现可以利用数据库管理系统对数据进行管理和利用。虽然,近年来江西省档案局要求采用双层PDF格式扫描,初步实现全文检索,但由于识别转化率底下、全文检索数据量过于庞大和检索引擎不够优化等因素效果并不理想。

    2、“数据大”向“大数据”转变

    档案资源数据在分立分治的档案系统中快速堆积,这些数据互不相识互不来往,除了消耗资源,尚未产生任何价值。不断的接收、共享档案资源,数据体量的确越来越大,但这并不是“大数据”,只不过是“数据大”而已。

    数据只有通过算法模型才能被电脑解读,通过算法将海量分散的数据建立起联系;通过算法对海量数据进行分析;通过算法搜索隐藏于海量数据中的信息。运用大数据技术和数据挖掘技术将“死档案”变“活信息”, 提高档案资源的利用率,更好的服务民生。

    “数字化”到“数据化”,从“数据大”到“大数据”,从低级应用数据检索到高级应用数据挖掘,数字档案资源建设任重道远。

     

    南昌市档案局 陈悦