工作动态

大数据部支持微生物领域数据库及其分析系统建设取得新进展

2021-10-18 17:22 | 放大 缩小 |

  大数据技术与应用发展部与中国科学院微生物研究所等团队在微生物领域数据库及其分析系统建设取得新进展,相继联合发表两篇相关研究成果在国际知名学术期刊《核酸研究(Nucleic Acids Research)》。

  模式菌株(type strains)是在给微生物定名、分类记载和发表时,以纯菌状态所保存的菌种,是微生物分类学的标准参考物质,也是理想的生物技术研究工具,具有重要的科研和产业价值。模式菌株长期以来分散在全球各国超过100余个保藏中心,是各个保藏中心甚为珍贵的资源。2018年,中科院微生物所牵头组织发起了全球模式微生物基因组测序计划,从全球微生物资源保藏中心选择目前未进行测序的模式微生物菌株(包括细菌、古菌和可培养真菌),预计5年内完成超过10,000种的细菌、真菌、古菌模式菌株基因组测序,建立全球微生物模式菌株基因组测序合作网络,现已有来自美国的ATCC、日本JCMNBRC、韩国的KCTC等超过12个国家的26个微生物资源保藏中心正式加入该计划并形成了重要了阶段性成果。 

全球模式微生物基因组数据库分析流程(gcType)

  大数据部与中科院微生物研究所马俊才研究员团队合作构建了全球模式微生物基因组数据库(Global Catalogue of Type Strain, gcType整合了16701个有效发表的原核生物的超过13944个基因组数据,是目前在模式微生物基因组方面数据最为全面,功能最为完善的数据平台,为用户提供一站式的数据管理和基因组注释、新种鉴定等分析,合作成果发表在国际知名学术期刊核酸研究Nucleic Acids Research 

  随着全球新冠疫控的持续,新型冠状病毒基因组在流行过程中持续发生变异。迄今,在全球科学技术人员的共同努力下,已经对超过400万例病毒基因组进行了测序,并构建了多个病毒基因组数据库。这些数据库在收集、展示数据的基础上,包含了病毒分型、溯源分析等功能,为全球疫情的监测追踪提供了重要的信息。然而,随着对变异研究的深入,对变异造成的功能影响日渐成为关注的焦点。目前,在全球多个国家和地区均发现了包括AlphaBetaDelta在内的多种感染力增强的变异毒株,尤其是关键位点积累的氨基酸变异,极大地改变了病毒的免疫学特征,增加了病毒免疫逃逸的风险,可能会降低现有疫苗、抗体、药物等疫情控制方法的保护性,影响核酸诊断试剂的适用性,对疫情的防控构成了严峻挑战。因此,现有的以收集、展示数据为主的基本数据库已经难以满足未来疫情防控的需求,亟需一个基于大数据的病毒变异风险评估及预警系统,对现有及未来可能出现的各种变异造成的影响进行系统性评估和解读,从而实施更加精准有效的疫情防控策略。 

 新型冠状病毒变异评估和预警系统入口(VarEPS)

  大数据部与中科院微生物研究所马俊才研究员等团队合作发布了“新型冠状病毒变异评估和预警系统”(SARS-CoV-2Variations Evaluation and Prewaning System),简称VarEPS数据库。VarEPS是全球首个对SARS-CoV-2基因组已知变异及虚拟变异进行多维度风险评估和预警的系统。VarEPS从基因组学和结构生物学角度入手,在基于变异位点频率评估的基础上,从核苷酸变异发生难易程度、氨基酸替换难度、变异对蛋白质二级结构的影响、单个氨基酸突变引起的ACE2及中和抗体结合自由能变化等参数对变异进行多维度的评估,全面对已知变异和潜在的虚拟变异对病毒的功能造成的影响进行综合分析。在此基础上,该系统采用人工智能分类器算法,将变异株从传播性和对中和抗体亲和力两方面进行有效分组,实现了基于病毒序列的风险评估和预警。合作成果发表在国际知名学术期刊核酸研究Nucleic Acids Research。(撰稿:孟珍) 

  相关成果:

         1. gcType: a high-quality type strain genome database for microbial phylogenetic and functional research. Nucleic Acids Research, Volume 49, Issue D1, 8 January 2021, Pages D694–D705.  

         2. VarEPS: an evaluation and prewarning system of known and virtual variations of SARS-CoV-2 genomes. Nucleic Acids Research, 11 October 2021, gkab921. 

附件下载