成果产出

分布式数据资源管理与服务体系建设

放大 缩小 |

  数据资源作为重要的战略资源是驱动各领域创新发展的重要因素。随着信息化进程的发展,分布式多源异构数据的管理和应用问题凸显,如何有效地实现分布式数据的管理、整合、服务成为推动科研与应用的共性需求和必要手段。 

  中科院计算机网络信息中心大数据部自1986年起为科学数据资源建设和管理提供服务,从资源的积累到资源的深度整合与服务,经历了30年的积累和跨越,推动分布式科学数据资源技术与服务体系相关标准、技术、工具的研制和应用,始终是我国数据资源管理研究与实践的先锋,为数据资源的开放与共享提供了强劲的源动力。 

  随着国家《科学数据管理办法》的出台,结合国家建设科学数据中心的战略需求,大数据部提出面向科学数据中心体系的全生命周期体系化数据资源管理与服务解决方案。重点面向数据生成、管理和服务的全过程,面向多源异构数据多种应用场景提供数据资源管理和服务体系化工具集。 

  一、标准规范体系 

  科学数据标准体系覆盖了从数据资源建设到应用及效果评估全生命周期规范化管理内容,分为指导规范、数据采集与整理、元数据与元模型、系统与接口、数据管理、数据服务等多种类型,经过十余年的努力,大数据部参与12国家标准研制,其中牵头主研5项;完成45项各类科学数据标准建设,在科学数据资源建设和应用服务中发挥了积极的助推作用。 

  表1 参与完成的国家标准列表 

序号 

国家标准名称 

国家标准号 

1 

生态科学数据元数据(第一完成单位) 

GB/T 20533-2006 

2 

检测资源信息共享体系建设指南 (第二完成单位) 

GB/Z 27414-2012 

3 

科技平台 元数据注册与管理 

GB/T 30524-2014 

4 

科技平台 资源核心元数据 

GB/T 30523-2014 

5 

科技平台 一致性测试的原则与方法 

GB/T 31071-2014 

6 

科技平台 服务核心元数据 

GB/T 31073-2014 

7 

土壤科学数据元数据(第二完成单位) 

GB/T 32739-2016 

8 

信息技术 科学数据引用(第一完成单位) 

GB/T 35294-2017 

9 

信息技术 数据溯源描述模型(第一完成单位) 

GB/T 34945-2017 

10 

信息技术 大数据 术语 

GB/T 35295-2017 

11 

信息技术 数据交易服务平台 交易数据描述 

GB/T 36343-2018 

12 

信息技术 数据质量评价指标 

GB/T 36344-2018 

  二、工具与技术体系 

  面向科学数据中心体系化、系统化建设及管理的需求,大数据部研发重点包括分布式数据资源自主管理与服务,数据资源集成整合管理与服务,数据资源与服务监控、统计分析及评估管理,数据资源统一发布、共享、服务及应用等;同时面向不同类型数据提供数据资源管理,并提供统一的管理和外延服务。

  目前大数据部已经服务和正在研发的工具集如下表: 

  表2 科学数据管理与服务工具体系建设列表 

  三、优势与特色 

  1、体系化的解决方案。采用体系化的设计理念,提供自顶向下的总体设计,协同策略、系统、规则、设施等各方面,保障数据资源高效、安全、可靠、敏捷的管理与服务。 

  2、完备的服务平台和软件体系。提供包括集成化数据服务、数据资源的监控与管理、数据资源的整合、分布式数据资源的自主管理在内的数据资源管理、整合与服务平台及完备的软件体系,并可为个性化需求提供定制和支持。 

  3、统一的管理和外延服务。基于标准化的数据资源管理机制,提供一整套有效的管理办法,并提供包括数据库建设、系统运维、服务咨询在内的多项外延服务。 

  4、丰富的建设经验。30年来,为中科院各科研单位的数据资源建设与服务有效助力,在地理、生态、环境等领域深入探索,为60多家科研单位提供服务。重点负责了国家生态系统研究网络体系建设、国防资源服务体系建设,为相关领域科研信息化建设,提供了体系架构、系统设计、开发、服务一体化的建设方案。 

附件下载