-
公开(公告)号:CN115357682A
公开(公告)日:2022-11-18
申请号:CN202210871371.1
申请日:2022-07-22
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种面向多版本非结构化数据的语义信息查询方法及装置。所述方法包括:获取查询语句;将所述查询语句解析为抽象语法树;在节点查找节点运行所述节点查找算子,获取指定的对象属性计算节点;在版本抽取节点基于所述查询语句,得到非结构化数据对象和语义信息名称的版本号;在指定的对象属性计算节点根据所述非结构化数据对象的版本号与所述非结构化数据对象,计算所述非结构化数据对象的属性值;在语义信息计算节点基于所述非结构化数据对象的属性值、所述语义信息名称以及所述语义信息名称的版本号,得到语义信息查询结果。本发明能够支持多版本非结构化数据语义信息的查询。
-
公开(公告)号:CN119202016A
公开(公告)日:2024-12-27
申请号:CN202411159312.7
申请日:2024-08-22
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/2458 , G06F16/26 , G06F16/29 , G06F16/215 , G06F16/22 , G06Q10/04
Abstract: 本发明公开一种基于时空分割的异构多源冰冻圈大数据探查分析方法及系统,属于数据分析技术领域。所述方法包括:收集并预处理冰冻圈数据;将研究区域划分为时空格网单元;对每一时空格网单元内的冰冻圈数据进行异构数据的融合;基于融合后的冰冻圈数据识别时空格网单元中的模式和异常,和/或预测冰冻圈的未来变化趋势。本发明实现对冰冻圈大数据的高效探查和分析。
-
公开(公告)号:CN118673081A
公开(公告)日:2024-09-20
申请号:CN202410753369.3
申请日:2024-06-12
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/27 , G06F16/22 , G06F16/2458 , G06F16/248
Abstract: 本发明公开一种海量科学数据高效检索的方法及系统,属于数据搜索领域。通过数据存储、数据索引、检索引擎、数据统计和用户界面等模块之间的相互配合,实现了对海量科学数据的高效、准确检索,并提供了用户友好的界面。本发明不仅提高了科学数据检索的效率和准确性,还帮助用户发现新的研究领域和交叉学科的机会,满足了科学研究人员的需求。
-
公开(公告)号:CN118035190A
公开(公告)日:2024-05-14
申请号:CN202410036687.8
申请日:2024-01-10
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/176 , G06F8/30 , G06F9/445 , G06F21/62 , G06F11/34
Abstract: 本发明公开一种科学数据内容级细粒度可控供给方法及系统,该方法包括:构建科学数据解析器的热加载运行环境;建设科学数据解析器资源池,所述科学数据解析器资源池中的科学数据解析器包括:为所有数据文件提供的默认数据解析器、为常见数据格式的数据文件提供的通用格式数据文件解析器和为特定领域数据文件提供的领域专用数据解析器;建立每一数据文件和科学数据解析器的对应关系,并在所述科学数据解析器资源池更新时,对所述对应关系进行更新;基于所述对应关系组装所述数据文件和所述科学数据解析器,以实现数据文件的线上内容级供给服务。本发明实现了数据利用的安全可控、可用不可见以及可计量可评价。
-
公开(公告)号:CN115438146A
公开(公告)日:2022-12-06
申请号:CN202210871372.6
申请日:2022-07-22
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种面向多版本非结构化数据语义信息的查询方法及装置。所述方法包括:获取各版本的非结构化数据;针对每一版本的非结构化数据,基于提取语义信息使用的人工智能模型,获取所述语义信息的版本;基于各人工智能模型之间的修改关系,构建并保存非结构化数据的语义信息版本树;依据所述语义信息版本树的存储方式,建立所述语义信息版本树中父节点与子节点之间的表达方式;查询非结构化数据的语义信息时,基于查询过滤条件与所述表达方式,对所述语义信息版本树进行检索,得到语义信息的查询结果。本发明可以实现可以管理并查询多版本的非结构化数据语义信息。
-
公开(公告)号:CN117932078A
公开(公告)日:2024-04-26
申请号:CN202311761090.1
申请日:2023-12-20
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种面向文档型数据库的图查询方法、系统、装置及介质,及图数据、大数据技术、数据库技术等领域,本发明将文档映射为图模型节点,将文档中的引用映射为图模型关系,将文档中的字段和值映射为图模型属性;根据用户的图查询请求的id、标签、属性条件或关联关系信息,在目标文档型数据库中查询节点或关系并返回给用户。本发明提供了一种全面的、可配置的面向文档型数据库的图查询的技术方案,具备灵活性、性能优化、安全性和可配置性等多重优点,能够满足各种复杂查询场景的需求。
-
公开(公告)号:CN119782456A
公开(公告)日:2025-04-08
申请号:CN202411635374.0
申请日:2024-11-15
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/3329 , G06F16/3332 , G06N3/042
Abstract: 本发明公开一种基于图神经网络和大语言模型的数据问答方法及系统,属于数据库与自然语言处理技术领域。所述方法包括:构建用户问题和数据库模式的对齐关系图,并基于图神经网络,在数据库中获取与用户问题相关的数据集表项;利用大语言模型生成所述数据集表项的SQL查询语句;连接数据库并执行所述SQL查询语句;基于用户问题和所述SQL查询语句的查询结果,生成所述用户问题的答案。本发明可以增强数据问答能力。
-
公开(公告)号:CN118887997A
公开(公告)日:2024-11-01
申请号:CN202410853044.2
申请日:2024-06-28
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了基因序列压缩方法、检索方法及装置,属于生物信息学领域。本发明的基因序列压缩方法通过MapReduce框架实现基于2bit的基因序列压缩,包括解析序列文件、序列化处理和拼接存储。本发明的检索方法包括目标序列读取、查询序列预处理、距离表计算和匹配。本发明的装置部分包括导入、导出、查询和功能拓展模块。本发明采用分布式MapReduce框架和无索引字节流匹配,实现大规模基因数据的高效处理和检索,显著提高了压缩速度和检索效率。
-
公开(公告)号:CN118885160A
公开(公告)日:2024-11-01
申请号:CN202410837842.6
申请日:2024-06-26
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开一种基于云原生的科学数据软件部署方法及系统,属于科学数据研究领域。所述方法包括:抽取科学数据软件的组件信息后,将该组件信息推送到应用市场,并展示该组件信息的元数据信息;基于应用市场中展示的组件信息的元数据信息进行科学数据软件的选择,并将对应的组件信息整合为应用安装流程,以完成科学数据软件的部署。本发明可以大大降低容器化技术和容器编排技术的使用门槛,用户可以完全不了解容器化技术和容器编排技术,即可通过可视化页面或开放接口进行软件部署。
-
公开(公告)号:CN118245605A
公开(公告)日:2024-06-25
申请号:CN202211626468.2
申请日:2022-12-16
Applicant: 中国烟草总公司郑州烟草研究院 , 中国科学院计算机网络信息中心
IPC: G06F16/36 , G06F16/215 , G06F16/2458 , G06Q10/0631 , G06Q50/02 , G06Q50/04
Abstract: 本发明公开了一种用于烟草科研全场景的标准任务流水线方法及装置,所述方法包括:对分布在烟草科学研究领域的异构数据进行审核与统一汇交,生成烟草科研数据集;基于烟草科研数据集,关联烟草科研领域积累的异构数据的数据资产,得到烟草科研数据关联图谱;基于烟草科研数据关联图谱,维护并使用烟草科研数据资产。本发明为研究人员的跨领域数据需求提供更高效和精准的数据获取,增强了烟草科学数据的质量和应用效果。
-
-
-
-
-
-
-
-
-