科研进展

大数据部在大数据与食源性疾病监测交叉研究领域取得系列进展

2021-07-27 10:04 | 放大 缩小 |

  食源性疾病是全球重要的公共卫生和食品安全问题,近年来,食源性疾病呈现出跨区域传播、变化快、难预测的特点。依托国家重点研发计划课题“基于多源数据的食源性疾病实时预警技术体系研究”,大数据部将大数据与机器学习技术与食源性疾病预测的实际需求进行深度融合,在该交叉领域取得多项研究成果,在食品科技类期刊Food ControlFoodborne Pathogens and Disease、医学信息类期刊JMIR Medical Informatics发表多篇论文。

  食源性疾病致菌是导致食源性疾病的主要原因,使用数据挖掘、机器学习的方法挖掘食源性疾病因素之间潜在的关联,从而对致病菌进行识别,能够为食源性疾病的诊疗起到辅助作用。课题组提出了一种利用机器学习来识别食源性疾病致病菌的方法,从空间、时间、患者信息、暴露食品等方面提取特征,使用合适的机器学习模型来对特征进行训练和学习,从而对重要的食源性疾病致病菌进行识别,以为食源性疾病的诊疗提供辅助支持。进一步,针对食源性疾病发病情况的时空预测问题,提出了基于多图结构化 LSTM 的时空风险预测模型,该模型能够通过构造多种空间相关性并进行动态融合,利用基于 Encoder-Decoder 的结构化 LSTM 模型同时对数据的时间依赖性和空间依赖性进行建模,实现对疾病风险的多步预测。
食源性疾病时空风险预测模型架构
  食源性疾病暴发指发生两例及以上具有共同暴露和症状相似的食源性疾病病例,目前食源性疾病报告监测系统基于筛选规则来发现疑似食源性疾病暴发事件,然而该方法普遍存在误判的现象。为了进一步提高暴发识别和预测的准确性,课题组设计了一种基于机器学习的食源性疾病暴发识别模型。在识别暴发的同时分析了各类特征和致病因素对判别结果的影响,对医学工作者具有借鉴意义。
基于机器学习方法的食源性疾病暴发优化
  基于上述系列研究成果,课题组发现大数据与机器学习技术可以在病例报告、疾病诊断、暴发识别和风险预测阶段,极大地改善现有的食源性疾病监控系统,并在此基础上总结了出机器学习驱动的食源性疾病监控系统框架,以促进未来对食源性疾病监测系统做出更智能的改进。(撰稿:张鹏、杜一)
  相关成果:
附件下载