当前位置:首页
> 工作动态 > 业务与新知
王平老师谈大数据与档案信息化

发布时间:2020-05-25 浏览次数:

5月19日,我们有幸邀请到武汉大学信息管理学院的王平老师进行“国际档案周学者谈”首次访谈。访谈主题为“大数据与档案信息化”。在紧张的一个小时中,不仅王平老师为我们带来了丰富内容,许多听众还提出了问题,王平老师也在此一一作了回答。快让我们一起去看看吧!


访谈问题一

Q:

2020年国际档案周的主题为“赋能知识社会”,围绕人工智能、数字保护和新兴技术、可持续知识、信任和证据等问题,您认为在大数据环境下档案管理工作会发生哪些转变?

A:

一是管理环境的转变。首先是管理环境由物理空间构建转向数字空间、内容空间管理转变。以往我在和许多档案馆负责人交流时,发现他们还是主要关注档案馆物理空间的构建,譬如档案建筑的布局,密集架如何采集等问题,而忽略了我们专业自身的本质、内容,因此我认为未来在数字中国的背景下管理环境要由物理空间构建转向数字空间、内容空间管理转变。其次就是数字化的趋势,从十二五到十三五时期,我国档案数字化投入成本很大,数字化程度有明显提升,但同时也存在档案开放利用程度不高,大多只是存储在服务器或数据中心的问题(当然这其中涉及到档案保密)。另外,单轨制的实行也是管理环境改变的一部分。

二是管理对象的改变。传统环境下我们更多专注于文本分析,而当前数据类型发生了很大的转变,包括非关系的数据类型的出现,特别是企业里涉及到的很多图纸、二维图、三维图如何去管理也是一个难题,我十分认同钱毅老师的观点:将档案归为三态——模拟态、数字态、数据态,未来档案管理很有可能从模拟数字、数字管控到三维体的管控转变。

三是管理手段的改变。从搜狗输入法中随处可见的AI应用来看,技术赋能给档案工作也带来了思考,比如我设想未来VR、AR的应用与档案工作可使档案领导亲临现场,再比如目前国家档案局与科大讯飞合作成立的人工智能实验基地等等。对于档案来说,我认为我们需要有更多元的思路、方式去理解档案工作。

四是管理职能的改变。就我以往经验来看,针对不同类型的档案的其管理聚焦、侧重点不同。譬如综合档案馆侧重于怎么收、怎么用,企业档案馆和专门档案馆侧重于怎么用。大数据环境下围绕档案管理环境、管理职能、管理手段、管理人员素养都会有更高的要求。比如现如今管理人员从整理、数字化加工、数字档案馆的平台建设到智慧服务,大部分都是采取外包的形式,而缺乏自主建设的能力。因此我们需要有宏观的规划与顶层设计与规划,形成一套蓝图设计与方案。总的来说,我们需要在档案管理体制层面、环境、技术本身、人员素养层面都要有更高的要求。


访谈问题二

Q:

您如何看待目前一些大数据机构与档案馆“抢”数据的现象?档案馆该如何应对?

A:

从背景来看,15年8月份国家颁布了一个大数据发展纲要政策,明确了大数据发展的战略,各省市也积极响应。18年3月份深化机构改革,推行局馆分离改革,使得档案馆行政职能归属党委管理,只留有保管利用的职能。如今面对一些大数据机构相继成立的现状,我们首先需要明确档案馆的核心职能、自身的职责范围,这具体到各个部门的关系、承担档案信息化的具体部门。

其次是在各部门职责分工的基础上融入信息化建设。大数据办公室主要承担的是关于数据产业的政策制定以及体制设计、智慧城市建设、信息化规划以及数据交易、流通规范制定。档案馆则主要承担档案保管利用的职能,涉及到在文件转化为档案的过程中要知道管什么,怎么管的问题。当前一些大数据机构与档案馆“抢”数据的现象其实体现出数据资源的束缚。但我们要认识到由于档案是文件的延伸,政务大背景下大数据机构与档案馆的职能既存在交叉,又存在差异。作为档案馆,应该自审,迎合趋势,提升自身专业素养与技能,主动去拥抱行业变化与趋势,在信息化建设中多参与、多贡献,比如说电子文件的一些归档、描述标准的制定、乃至整个安全框架的设计。档案馆不应退居幕后,而应站在前线,注重与其他行业的合作,不要过多纠结于它到底是数据还是档案,又或是文件,总之要树立大文件观、大数据观、大档案观去管控有保存价值的数据。



访谈问题三

Q:

目前智慧档案馆业内研究比较火热,您认为该如何理解数字档案馆与智慧档案馆,二者是何种关系,差异是什么?

A:

我认为两者的差异主要体现在数据内容本身的治理以及管理职能聚焦点维度。就档案数据本身而言,数字档案馆主要负责档案收存管用,更多的关注档案全文、档案目录以及文件级存放的问题。而智慧档案馆的业态、数据本身发生了很大的转变,其将数据上升到智慧层面,即细粒度、语义内容层面的描述,这包含了制作档案词表、标引、编码、分类以及元数据的抽取等一系列工作,以达到提升数据价值,挖掘数据关联,实现数据映射的目标。我之前了解到青岛市档案馆就尝试运用数据挖掘、可视化等情报学、计算机科学的技术赋能智慧档案馆服务。

就管理职能而言,数字档案馆更多的是应收尽收,应归尽归,但没有高效开发应用,甚至是停留在一种“死档”的状态,没有将它变成活态的,这是我认为传统数字档案馆做的远远不够的。回到上一题我所提到的管理环境的转变,即由物理空间构建转向数字空间、内容空间管理转变。所以智慧档案馆也是如此,我认为智慧档案馆应该把数据变活,解决数据到底怎么用、如何用的问题,进而以用户为中心提供一种智慧服务。尤其对于企业而言,他们就十分看重档案资源的价值,认为智慧档案馆的建设要能将档案资源转化为一种经济效益,辅助企业更好的决策。在实践中,智慧档案馆应从数据本身做文章,跟企业PDM平台以及它的业务平台做对接,开放接口,做好电子文件移交的接口设计,才能及时归档有保存价值的文件。总之,当前数字档案馆和智慧档案馆是一种并存状态,亦可认为数字档案馆是基础,更多关注收和藏,而智慧档案馆注重处于更高层次的挖掘利用。


访谈问题四

Q:

您认为未来智慧档案馆中的管理人员构成应该是怎样的?档案人员是否会被其他专业人员如技术人员或人工智能所取代?同时随着智慧档案馆的建设发展,是否意味着将来对档案人才的需求将更加偏向技术型的人才,偏历史型的档案人才该如何适应社会的需要或者该如何发挥自己的长处?

A:

在未来的档案馆中,管理人员的构成我觉得第一个是肯定离不开我们专业本身的培养趋势,这点是毋庸置疑的。我们档案专业的知识是我们开展相关工作、进行一些活动的基础,是立身之本。如果我们只拥有科技基础是做不了档案的,因为没有档案知识储备的人员是不懂档案本身的内容、结构,在档案的移交归档过程中或某些环节过程中他可能都不太清楚,从而无法进行相关的工作。

第二个是,档案基础是我们的立身之本,但是我们还需要顺势而为,去拥抱前沿技术。如在本科生的培养过程中我们应该让学生去了解一些前沿的技术,尤其是档案信息化背景下,这些技术是非常有用的,而且对于这些前沿技术的机理、原理我们也不能回避,因为我们可以看到我们行业中大部分的一些职能部门的相关技术工作都是利用外包的形式完成的,如建立一个高级的档案馆,我们不懂得相关技术就无法完成。

第三个是我们应该专注于这种行业的业务结合的复合型人才,将本专业知识与前沿技术融会贯通,将这种前沿的技术运用到专业业务中来,推动本专业的发展。我们要敢于尝试,哪怕这种尝试只是试验级别的。这三个方面是缺一不可的,将来对档案人才不一定的偏向技术或历史,但一定是一种复合型的人才,因此我们一定要顺势而为,趁势而成。


访谈问题五

Q:

您认为区块链在档案管理中有哪些应用前景?

A:

去年十月份,国家将区块链列入到了国家发展战略之中,在这个政策背景下,我们在电子文件以及电子文档管理中,会经常提到“四性”的问题:真实、可读、可用、完整,但实际上这是区块链可以解决的原生性的问题,区块链涉及到很多方方面面的学科知识——信息安全、计算机安全、密码学、经济学、博弈论等,其中有些知识挑战非常大,但是我们应该拥抱它,顺势而为,不能太浮躁,要踏踏实实的去琢磨一件事情。

在区块链中,一个非常重要的思想就是去中心化,是一种共享的经济与共享的模式,在这种模式下,并且在单套单轨的环境下,区块链在档案移交归档、鉴定销毁的流程中很有大的应用场景,同时也包括共识机制、合约框架等。我们团队目前在对于区块链的研究中,尝试着在行业中去推广、去示范、去打造可信的生态,去实现数据商业,在此过程中我们可以去保证原来的“四性”。



访谈问题六

Q:

您认为赋能知识社会对我们意味着什么?(或者我们档案行业在为知识社会赋能中可以做些什么或者如何应对?)以及知识社会的档案是什么?

A:

这个问题还有一点挑战。但确实今天我们之前也围绕着区块链提出了一些解决包括电子文件四性问题的一些思路。在ICA提到的重点中我所关注到的一个是关于AI,关于Data Curation,人工智能结合我们的档案到底如何使用;第二个是Sustainable Knowledge可持续性知识;第三个是Trust and Evidence问题,由于大数据背景下的数据价值密度相对较低并且不易考究数据来源,那未来我们有了区块链,有了我们智慧层面的底层描述以后,我们的数据实际上就是可以实现可信。所以说,我觉得这一点也映射了在赋能知识社会,我们如何去探讨“我们为什么管?管什么?如何管”的问题,我想这又回到了我们档案本身的核心问题上。那对于我们来讲作为知识社会的档案是什么,我认为我们要融入到我们社会的大数据治理体系当中,围绕我们档案本身为社会的建设以及响应当前数字中国的建设,发挥出档案的价值。要结合新的技术,利用好我们档案来强化国家的信息资源建设。


现场问题及回答

Q:

企业信息化中加入了档案信息化流程,但流程较为简单,工程类项目档案经项目负责人,核对完数据归档。档案工作者只需核对,检索、利用都通过系统实现。企业会发现档案工作者存在的意义不大,如何避免这样的问题?或者系统中该如何显示档案系统应有的功能,展示档案工作的价值。

A:

一方面,档案部门要主动出击,实行前端控制,积极参与电子文件归档的规划与设计,同时可以提供档案咨询报告来辅助企业战略与运营规划,帮助企业管理者优化分析决策。以此展示档案价值。另一方面,如前所述,此现状也对档案管理人员的素养提出了更高的要求,我们不仅需要具备扎实的档案基础理论知识,还需掌握一些计算机技术的辅助工具方法以及对行业业务知识的了解,这样才能更好地融入企业信息化建设过程中。

Q:

王老师,请问您说智慧档案馆是更偏向数据层面,那么可以理解为智慧是偏向档案利用方面吗?如,智慧服务?

A:

智慧档案馆中,在数据层面,尤其是在内容的层面上要下工夫,在内容层面做好了,可能才会有根据这种资源本身来提供个性化的或者知识化的、智慧化的服务,所以说这是智慧档案馆的一个核心所在,那么原来数字档案馆更强调移交归档与保存,智慧档案馆更多的与应用密切相关,而且在新型的智慧城市中,实际上档案的数据,比如说民生档案,可能已经被放在政务云平台上面了,这实际上就是关于利用这一问题,这种智慧应用是非常重要的。

Q:

请问王老师,1.怎样看待档案与开放数据的关系?2.开放数据背景下档案利用权利实现的障碍有哪些?3.怎样在开放数据的背景下保障公民利用档案的权利?4.王老师对于“档案数据”是如何理解的?

A:

这个问题是关于档案与开放数据的关系,实际上要明确档案是文件生成的,档案是一定是有价值的,具有考证作用和保存归档价值,那么对于数据来讲,开放数据是在公开的范围之内,是便于数据最终的生产流通交易和利用这些方面,所以从属性来讲,档案与开放数据是有区分的,那么政府里面所开放的数据和数据条目不一定是档案,所以说在实现档案利用的障碍中,最大的问题就是档案是一个保密与开放的矛与盾的过程。

在档案的利用过程中,开放是前提。开放应该是有一个开放鉴定的过程,但是在开放鉴定在体系下、在政策方面有些困难,有很多主管领导不愿意担责任,所以就不敢去开放。在这一部分应该成立一个开放鉴定委员会,认可档案开放、利用,由此来保障公民档案利用权。的确档案数据的概念是一个未来可能跟实质性的档案化为一体,在电子文件增量的情况下,可能数据化的程度越来越高。所以说在这个过程中,涉及到企业的秘书平台,对于政府、综合档案馆里面涉及到了OA,在这些平台里面,把可以回溯的电子文件保存起来,第二个就是我们自己本身,在网页层面、政府的新媒体层面中,也可能会把它作为档案数据,所以未来是一种大数据、大档案、大资源、大文件观,不局限于传统的档案。

Q:

王老师您好,区块链技术的去中心化与档案管理的中心化管理的矛盾如何调和?如何做到数据的销毁和修改?

A:

区块链中去中心化确实是一个最大的亮点,那么在管理的过程中,是收管存用,也是一个全流程的、全生命周期的过程,这个过程中我们对数据无论是销毁还是修改,需要有共识机制,需要有个合约体系,必须要有一个表决的机制在其中。公开的数据,每个成员,对档案随意改动或篡改,其他成员都会知道你的状态,所以说基本上是没办法改动、销毁和修改的。在这里面要把规则定好,规则定好了以后,就可以保障销毁修改的这样一个体系流程。

Q:

王老师您好,您提到区块链技术是可以用于检测资源元数据的变化,那么区块链技术在电子文件的长期保存中是否可以起到关键性作用?

A:

关于长期保存,区块链在这个过程中一定是非常核心的技术,那么,一方面可以通过区块链的时间戳、哈希值在电子档案的安全存储方面进行探讨,包括我们如何来利用哈希值加密,利用时间戳来标记电子档案,以实现链上的可追溯和可找回;另一方面,可以通过智能合约和共识机制,对我们的电子档案进行鉴定、封装、加密,尤其是在SIP、AIP、DIP的过程中,实际上不同的信息包里面可以做链上的同步存储,这其中可能会形成一些新的存储模型来保障这种长期的存放和储存的过程。


文章来源:国际档案理事会ICA微信公众号

文字整理/活动组织:牟胜男 姜璐 李跃 袁丽娜

排版:刘雨贺

审核:王平老师 王玉珏老师 刘贞伶 施玥馨

打印本页关闭窗口

Produced By 大汉网络 大汉版通发布系统