工作动态

中心在科研图表智能解析领域取得进展

2026-06-05 17:08 | 放大 缩小 |

科研图表是承载实验数据和科学结论的重要载体,海量学术文献中的散点图、柱状图蕴含着丰富的原始实验数据。

为突破传统数据提取工具依赖人工交互和现有自动化技术停留在元素识别阶段的困境,中心人工智能技术与应用发展部研发了科研图表智能解析深度学习框架ChartRecover,实现了从科研图表图像到结构化科学数据的自动化提取与高精度重构。研究团队提出刻度线-刻度值对齐算法,实现坐标轴语义信息与空间位置的精准匹配。在国际权威评测数据集上的测试结果表明,ChatRecover在图表元素检测和真实数据恢复任务中均达到国际先进水平。

该成果为科研文献中海量“沉睡数据”的自动挖掘提供了重要技术支撑,可广泛应用于科研数据汇聚、知识图谱构建、科学数据库建设和AI for Science应用场景。成果发表在《Communications Engineering》期刊,第一作者为人工智能技术与应用发展部袁扬,通讯作者为王宗国副研究员。

该成果受到了国家重点研发计划(2025YFE0102600)、赣江创新研究院自主部署项目(E455F001)和中国科学院战略性先导科技专项(XDA0410404)的支持。

图表数据提取框架流程

相关成果:Yang Yuan, Sihan Liang, Ji Zhang, Yangang Wang, Zongguo Wang. A deep learning framework for scientific chart data extraction and reconstruction. Communications Engineering (2026).https://doi.org/10.1038/s44172-026-00691-8.

责任编辑:郎杨琴

附件下载