在全球人工智能与科学研究深度融合的浪潮下,科学数据的规模与复杂性持续增长,如何高效转化为科研洞察力成为核心挑战。为破解传统数据工具复杂、分析门槛高的瓶颈,中国科学院计算机网络信息中心致力于打造国际领先的科学数据开放共享平台,正式推出数据集智能问答服务。这一功能将改变科研人员与数据的交互范式,从被动检索迈向智能问答。

ScienceDB AI(科学数据银行AI)是中国科学院计算机网络信息中心自主研发的科学数据智能服务系统,融合了国际首创的科学数据可信推荐智能体与数据集智能分析问答等创新能力。
01 跨越“数据推荐”:迈向内容级理解与问答的必然之路
为破解传统数据工具复杂、分析门槛高的瓶颈,中国科学院计算机网络信息中心基于国际领先的科学数据开放共享平台科学数据银行,自主研发并正式推出了科学数据银行AI 数据集智能分析问答服务。科研人员需要的不仅是数据“在哪里”,更是数据“说明了什么”。
该服务的上线,是ScienceDB在“AI for Science”战略布局中的又一重要里程碑。这一创新不仅是一个技术功能的增加,更是科研工作方式的根本性革新。
02 三大核心突破,重新定义数据智能服务
· 多模态文件解析与处理
· 数据集智能问答具备强大的多格式文件兼容与处理能力,其内置的智能解析器已覆盖16类科研高频文件格式,包括但不限于HDF5、PDF、CSV、TSV、SAV、TAB、ODS、XLS/XLSX、PPTX及DOCX等。这一能力打破了传统数据分析工具在格式支持上的局限。
· 智能表格理解与操作
· 数据集智能问答服务能够深入理解表格的语义结构和数值关系,而不仅是简单预览。系统集成了智能统计与筛选功能,能够根据用户问题自动执行复杂的数据操作。例如,当研究人员询问“实验组与对照组在pH值大于7的条件下,生长率差异是否显著?”时,系统会自动识别“实验组”、“对照组”、“pH值”、“生长率”等变量,筛选出符合条件的数据子集,并进行统计显著性检验,最终给出明确的科学结论。
· 语义驱动答案输出
· 基于内容级的深度理解,数据集智能问答能够精准识别科研问题的核心意图,从二维表格中智能抽取相关信息,并以最合适的形式组织答案。系统不仅能够提取离散的文字和数字,更能理解数据间的关联,生成汇总表格、趋势图表。
03 共建智能科学数据新生态
科学数据银行AI 的研发与部署,是中国科学院计算机网络信息中心在“AI for Science”战略布局中的又一重要里程碑。未来,平台将持续优化算法模型、拓展学科覆盖、深化国际合作,进一步推动科学数据的开放共享与智能应用。
我们诚挚邀请广大科研人员、数据平台机构与技术团队持续关注并体验科学数据银行AI,共同探索智能时代科学数据管理与服务的新范式!
科学数据银行AI :https://ai.scidb.cn/
科学数据银行主站:https://scidb.cn/
责任编辑:郎杨琴