2022年,中国科学院深圳先进技术研究院(以下简称“深圳先进院”)科研团队和管理团队协同创新,联合申请并获批了国家档案局科技项目《DNA存储技术应用于档案信息存储流程构建与实践的探索研究》,该项目研究对于备份长期存储档案具有战略性作用。为迎接党的二十大的召开,项目组将中国共产党“入党誓词”存入体外合成DNA以及生物细胞中,希望将该“入党誓词”稳定的保存下来。目前,项目组仍将进一步探索档案方面的照片、视频、LOGO等用DNA技术进行长期存储。
质粒存储“入党誓词”
质粒测序局部图
带有存储“入党誓词”质粒的细菌细胞所构成的图案
数字档案资源长期保存对于国家历史文化传承、科技文明记录、社会发展参考具有重要价值。据国际数据咨询机构 IDC 及相关研究预测,到 2025 年,全球数据量将达到 175 ZB (1 ZB 等于 1 万亿 GB) ,30 年后,全球数据量甚至超过百万 ZB;档案数据,尤其是涉及国家历史文化、安全涉密、政治经济等方面的重要冷数据也将呈现规模化的增长。传统存储介质比如用于档案信息存储的纸质材料或者电子信息载体硬盘、光盘、磁带、云盘、服务器等将远远无法满足未来爆发性增长的数据存储需求。
新修订的《档案法》中指出,“采用先进技术,实现档案管理的现代化”。近年来发展起来的 DNA 数据存储技术,为未来大数据存储,尤其是包括档案信息在内的长期冷数据存储提供了一种极为重要的可选方案。利用 DNA 存储档案信息具备如下优势:
(1) 存储密度极高。1 g DNA 能够理论上存储高达 455 EB 的数据,高于传统的存储介质 6 个数量级以上。通过 DNA 存储技术存储档案信息,能够极大节省未来大规模档案数据的存储空间。1 个小拇指大小的空间,能够存储超过 1 个大型档案馆拥有的数据信息。
(2) 存储周期很长。利用 DNA 存储档案信息,可以保存 100 年以上,这比纸质档案要好,纸质材料占据实体空间较大,长时间保存易发霉、虫蛀,且易损坏、难修复;比光盘、硬盘、磁带等寿命长,光盘等在 10-20 年之间,翻新存储需要大量的工作量。
(3) 维护成本较低。以 DNA 形式存储的数据易于维护,与传统的数据中心不同,DNA 存储数据不需要大量的人力、财力投入,仅需要保存在低温环境中。在能耗方面,利用 DNA 存储百年数据运维成本低于传统介质 12 个数量级。
(4) 安全性能很高。纸质档案存储在库房,要是发生火灾、地震等不可抗力因素,不可还原。保存在硬盘等介质也易被篡改或受病毒袭击,该类介质存储档案信息具有不稳定性、不安全性。DNA 存储技术由于具备 IT 和 BT 双重加密功能,能够在更多元的维度保护信息安全,安全性高于目前其它存储介质。
基于 DNA 存储这些特点,DNA 在具有长期意义的档案数据信息存储上具有重要价值。近年来,以美国为首的西方国家率先开始利用 DNA 介质开展档案等长期数据信息存储工作;微软、Illumina 等行业领先的团队组成了 DNA 存储联盟,共同推进 DNA 数据存储领域的发展。
国家档案局科技项目介绍:国家档案局科技项目是国家档案局为促进档案领域的科技发展,面向各省、自治区、直辖市档案局,各计划单列市档案局,新疆生产建设兵团档案局,中央和国家机关各部委档案部门,中央军委办公厅保密和档案局,各人民团体档案部门,各中央企业档案部门,中国人民大学档案学院等设立的科技项目计划。2022年中国科学院深圳先进技术研究院获批项目《基于DNA数据存储技术的档案信息存储流程构建与实践研究》, 是全国范围内DNA数据存储新技术应用于档案存储首次获得国家档案局科技立项的项目。
项目团队介绍:本项目在深圳先进院领导的重视和支持下,在深圳合成生物学创新研究院/深圳先进院合成生物学研究所领导的指导和帮助下,建立项目领导小组、顾问小组和工作小组,综合科研管理、行政管理、档案工作等各领域能手,组成4位教授/研究员、本科以上学历占比100%、硕士以上占比70%的多学科项目团队。项目负责人黄小罗老师目前担任深圳先进院合成生物学研究所高级工程师,博士生导师;在DNA数据存储领域开展了系统的研究,主持承担国家重点研发计划项目,国家自然科学基金项目,国家档案局科技项目等,申请/授权合成生物学及DNA数据存储领域相关专利近30项,发表论文10余篇;项目负责人林明香老师目前担任深圳先进院综合处档案业务主办,重点参与国家档案局、广东省档案局等省部级档案项目多项,发表论文6篇。