中国移动集团
统一数字档案管理系统
接口规范书
1 项目背景    1
2 范围    1
3 使用方法    1
4 规范组成文件    1
5 缩略语    2
6 系统接口概述    2
6.1 归档内容    3
6.2 归档过程描述    4
6.3 接口实现方式    8
6.4 接口概述    9
7 Web服务接口描述    10
7.1 数据归档接口    10
7.2 档案校验结果反馈    13
8 中间库接口描述    14
8.1 数据归档接口    14
8.2 数据迁移接口    16
9 FTP存储命名描述    18
9.1 目录命名规范    18
10 总结    18

前  言
管理信息系统作为辅助企业内部管理和运营支撑的后台保障力量,对企业高效运作起到至关重要的作用。从中国移动现实情况出发,完善的管理信息系统对组织融合、业务融合、机制融合等各个方面都是不可或缺的有益资源。
统一数字档案管理系统作为IT管理信息系统的重要组成部分,统一数字档案管理系统实现对公司各种介质、各种类型的档案全流程管理,支撑档案收集、档案保存、档案管理、档案利用、档案销毁的档案全生命周期管理,实现全集团档案数据共享,提高档案数据利用率,有效地为生产经营服务。
本规范为统一数字档案管理系统的接口规范,用于指导中国移动各系统实现与统一数字档案管理系统的电子化归档。

1 项目背景
中国移动为了实现“一个中国移动(OneCM)”的企业战略,目前在管理支撑域正在进行“一网多包”的建设和规划,升级现有的信息管理系统,以更好的支撑企业战略目标。作为一网多包的重点项目,中国移动统一数字档案的落地实施将为一网多包的建设提供经验。
2 范围
本规范仅针对统一数字档案管理一期系统与各省已有目标系统之间的接口关系提出规范要求。
本规范的制订旨在指导并规范中国移动总部、各省分公司及直属单位的统一数字档案管理系统建设,即本规范内容适用于总部、各省公司及相关直属单位。
3 使用方法
中国移动总部、各省分公司及直属单位的统一数字档案管理系统建设过程中,根据各自的具体情况,选择接口服务的类型,按规范要求实现相应的接口,实现档案归档。
4 规范组成文件
本规范由如下文件组成:
CMCC_统一数字档案系统_接口规范:描述了系统接口规范的要求和内容
CMCC_统一数字档案系统_电子文件封装规范:规范了档案外围系统向档案归档文件时,文件的著录项的封装格式
CMCC_统一数字档案系统_档案元数据规范:规范了档案外围系统向档案归档文件时,用于描述文件著录项的元数据信息
CMCC_统一数字档案系统_元数据与档案分类数据映射表:档案外围系统向档案归档文件时,7个档案分类的著录项的组成信息和要求。
5 缩略语
英文缩写
英文名称
中文名称
WSFL
Web Service Flow Language
叙述网络服务流程的语言
SOAP
Simple Object Access Protocol
简单对象访问协议
UDDI
Universal Description, Discovery, and Integration
统一描述、发现和集成。UDDI 允许动态发现相关的 Web 服务并将其集成到聚合的业务过程中。
WSDL
Web Services Description Language WEB
服务描述语言
XML
webservice实现Extensible Markup Language
可扩展标记语言
HTTP
Hypertext Transfer Protocol
超文本传输协议
FTP
File Transfer Protocol
文件传输协议
W3C
World Wide Web Consortium
互联网联合组织
SGML
Standard Generalized Markup Language
标准通用置标语言
6 系统接口概述
中国移动总部、各省分公司及直属单位的统一数字档案管理系统建设过程中,根据各自的具体情况,选择接口服务的类型。根据相应的服务接口的规范,开发相应的服务接口调用程序及FTP服务调用程序,分别处理档案正文(含WordPDF)、附件(压缩包,含WordPDF)、底稿、流转单、著录项的元数据。
本规范制定的接口包括档案归档接口和历史数据迁移接口两类,其中档案归档接口用于指导档案外围系统将统一数字档案一期系统支持的七类档案归档到档案系统中,历史数据迁移接口用于各省将已有档案系统的历史数据(七类档案的历史数据)迁移到统一数字档案一期系统中。
6.1 归档内容
本规范规定的采集归档的档案类型包括文书、招投标、合同、工程、会计、审计和特殊载体档案7个档案分类,其中归档档案的数据内容按不同档案分类将包括档案著录项以及正文、附件、底稿和流转单,档案数据包括档案新增数据和档案历史数据,其中正文包括PDFWor
d形式的两份、附件归档文件类型为压缩包(zip格式或RAR格式,含附件的Word形式和PDF形式),底稿归档文件类型为word文件,流转单归档文件类型为MHT文件(推荐)或HTML文件。档案著录项格式为XML文件,格式要求见电子文件封装规范及元数据规范,其中针对不同的档案类型的元数据要求,对应的XML文件封装要求也有区别,具体参见元数据规范。
6.2 归档过程描述
                           
接口前期设置:
统一数字档案归档接口过程
6.2.1 接口使用前配置
统一数字档案外围系统归档接口
1.接口在使用前,需要按集团档案业务分类规范,确认各系统对应的档案分类,以及其中各必填项字段的输入数据;
2.接口在使用前,根据待归档系统的类型和要求,配置归档数据归档到待归档库或归档库;
3.接口根据业务需要,支持业务系统采用按月、按天或实时的方式进行归档;
统一数字档案历史数据归档接口
1.接口在使用前,需要提供历史档案数据的数据结构,以及数据与现有档案分类元数据的映
射关系;
6.2.2 接口归档过程
统一数字档案外围系统归档接口:
上图中红区域中为各省需要将新增数据导入到统一数字档案系统而需要开发的程序,总共包括一个三个模块。
    档案文件同步模块:开发FTP客户端程序,负责调用接口机FTP服务。主要完成的功能是将前面所需的7类档案文件及著录项XML文件通过FTP协议的方式传送到部署在各省的接口机中。这个过程中需要记录接口调用的返回结果以备联调。
    档案信息同步模块:根据系统要求,选择采用WebService方式或中间表方式,开发客户端,负责调用接口机的服务端。主要完成的功能是将每个档案的属性信息(档案标识、档案名称、编写者、档案类型、档案附件数量、每个附件的大小、档案校验码等档案基本信息以及对应的调用接口的系统标识、系统名称等来源信息)传递给接口服务。这个过程中需要记录接口调用的返回结果以备联调。(步骤③)
错误档案退回模块:开发服务端,接收接口机传过来的数据校验结果。
程序调用过程:
1.    档案信息同步模块通过调用接口机提供的归档服务,同步需要传递的档案的信息。在接口调用失败的情况下,同步模块需要记录下失败的信息,并有重试的处理。
2.    档案文件同步模块通过调用接口机提供的FTP服务,同步需要传递的档案的档案内容。在接口调用失败的情况下需要相应的记录及重试的处理。
3.    (接口机完成过程)通过档案信息同步模块传递的档案信息,对档案文件同步接口传递的档案文件进行校验。针对每次档案信息同步接口调用所同步的档案信息进行校验,对失败的档案标识进行整理,调用错误档案退回接口。
4.错误档案退回模块收集接口机传递的数据校验结果,对错误的文件进行处理后,再通过档案信息同步模块进行归档处理。
5.系统管理员可以通过接口界面查看归档的情况,以及出错信息。
统一数字档案历史数据归档接口
对于历史数据而言,各省同样需要提供相应的程序处理历史数据的导入,与上面的处理过程类似,包含的主要模块为:
    历史档案文件导入模块:开发FTP客户端程序,负责调用接口机FTP服务。主要完成的功能是将历史档案文件及其著录项XML文件通过FTP协议的方式传送到部署在各省的接口机中。这个过程中需要记录接口调用的返回结果以备联调。
    历史档案信息导入模块:开发WebService客户端,负责调用接口机的WebService服务端。主要完成的功能是将每个档案的属性信息(档案标识、档案名称、编写者、档案类型、档案附件数量、每个附件的大小、档案校验码等档案基本信息以及对应的调用接口的系统标识、系统名称等来源信息)传递给接口机WebService服务。这个过程中需要记录接口调用的返回结果以备联调。(步骤③)
    历史错误档案退回模块:开发WebService服务端,接收接口机传过来的数据校验结果。
对于历史数据而言,由于历史数据的档案类型、数据结构等与现有的档案类型、数据结构之
间存在差异,需要整理历史档案类型与现有的档案类型的映射,同时针对每一类的档案类型映射,还需要整理具体的数据结构上的映射关系,并将整理后的映射关系导入到统一数字档案系统。
程序调用过程:
1.    档案历史信息导入模块通过调用接口机提供的WebService服务,导入需要传递的历史档案的信息。在接口调用失败的情况下需要相应的记录及重试的处理。
2.    档案文件导入模块通过调用接口机提供的FTP服务,导入需要传递的档案的档案内容。在接口调用失败的情况下需要相应的记录及重试的处理。
3.    (接口机完成过程)通过档案信息导入模块传递的档案信息,对档案文件导入模块传递的档案文件进行校验。针对档案信息导入模块调用所导入的档案信息进行校验,对失败的档案标识进行整理,调用错误档案退回接口。
4.错误档案退回模块收集接口机传递的数据校验结果。
6.3 接口实现方式
所建设的接口实现方式考虑到外部系统的复杂性,接口平台提供了两种实现方式:一是 “中间库”,二是“Web服务”模式。接下来将简单介绍两种方式实现。
(一) 中间库方式
由于domino 6.5以下版本不支持Web Service,所以引入了中间库接口方式。根据电子文件归档与管理规范 GB/T 18894-2002的要求,在各上游业务系统与统一数字档案管理系统之间建立一个中间逻辑数据库,该库包含一系列数据表及视图,在上游业务系统中提交归档的数据信息都存放在此中间逻辑数据库中,同时将档案正文(含WordPDF)、附件(压缩包含WordPDF)、著录项、底稿、流转单等相关文件放置到待归档的FTP服务器上,在此中间逻辑数据库和统一数字档案管理系统之间开发应用程序,该应用程序可以将此中间逻辑数据库中和FTP服务器中的信息转换到统一数字档案管理系统的数据库中。存放在统一数字档案管理系统的数据暂存库中,以便进行数据接收入库及文件归档工作。如下图: