成果产出

科学数据中心软件栈

放大 缩小 |

  科学数据中心软件栈(FairStack)是中国科学院科学数据总中心推出的一套可私有化部署、可领域适配的基础软件栈。重点面向科学数据中心在科学数据全生命周期管理中的共性需求,提供科学数据汇聚、管理、分析、共享全流程服务以及安全防护等支撑保障,致力于推进科学数据中心的FAIR化(可发现Findable、可访问Accessible、可互操作Interoperable、可重用Reusable)。

  截止目前科学数据中心软件栈已推出数据协同管理工具DataSpace、机构数据存储库InstDB、科学数据分析软件DataLab、大数据流水线系统πFlow、科学数据质量管理工具DataQ、数据门户安全防护软件DPGuard6个自主研发的软件工具,同时集成生信领域开源分析工具Galaxy和数十个数据处理分析组件。目前已在20余家研究机构和科学数据中心完成部署和应用,有效提升了科学数据中心体系的服务能力。

  1)机构数据协同管理工具DataSpace面向科研团队数据协作需求,为科研人员、科研团队提供安全、便捷的仓储式科研数据协同管理服务。科研人员可以在DataSpace创建空间,邀请成员进入空间,形成范围可控、多人协作的数据管理工作台,支撑团队内部的项目数据汇交、日常科研数据归档和管理工作。并与机构存储库工具InstDB无缝集成,可以实现团队内部数据快捷发布。 

        2)机构数据存储库工具InstDB面向机构科研团队的数据公开发布需求,提供科学数据发布审核、资源发现、资源访问和用户支持等核心功能服务,通过构建科学数据中心标准化服务接口,实现多元数据的互操作,并实现数据资源唯一标识(DOICSTR)。

              

         3)科学数据分析软件DataLab:面向算法工程师、数据分析师以及科研人员,从底层算法开发调试到上层分析应用的一套软件框架。内置众多跨学科通用分析组件,具备组件分类管理和扩展能力,基于Kubernetes强大的资源调度能力为科研团队提供交互式分析和在线编程分析服务。

       4)科学数据质量管理工具DataQ:面向科学数据领域,提供数据校验服务,用于解决科学数据中心系统建设、运行及数据治理过程中的各种数据质量问题。

      5)数据门户安全防护软件DPGuard基于开源技术构建,为科学数据中心应用系统提供防注入、防篡改、防泄漏等安全防护,助力各院属法人单位和各科学数据中心建立网络安全保障体系,也为落实《科学数据管理办法》、《中国科学院科学数据管理与开放共享办法(试行)》、《数据安全法》等提供有力支撑。 

      (6)大数据流水线系统πFlow:该系统是一个基于分布式计算框架技术开发的大数据流水线处理与调度系统,将大数据采集、清洗、存储与分析进行抽象和组件化开发,以所见即所得、拖拽配置的方式实现大数据处理流程化配置、运行与智能监控。

更多软件工具访问科学数据软件市场:https://market.casdc.cn/

附件下载