-
公开(公告)号:CN115017217B
公开(公告)日:2024-11-01
申请号:CN202210566652.6
申请日:2022-05-23
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种流式地理轨迹数据的治理方法,属于大数据领域。本发明针对流式地理轨迹数据的特点,提供了一种基于大数据的实时关联计算方法,能够有效对极大峰值的地理轨迹数据进行“消峰”处理、并发计算、实时转发、高效读写等服务。同时,通过引入轨迹目标字典完成了对实时流式地理轨迹数据的匹配,使杂乱的流式地理轨迹数据可按目标分类存储到数据库中形成历史数据。在历史轨迹数据处理过程中,通过轨迹合并,解决了批号突变问题。在目标维护模块,通过巧妙的缓冲时间设计和关键字拆分,视图映射,完成了同义词匹配和高效的数据同步功能。本发明对外提供高精度实时数据推送服务和多维度的历史数据查询服务。
-
公开(公告)号:CN119830200A
公开(公告)日:2025-04-15
申请号:CN202411743406.9
申请日:2024-11-30
Applicant: 北京计算机技术及应用研究所
IPC: G06F18/25 , G06F18/22 , G06F18/2131 , G06F18/15 , G06F18/211 , G06F18/2415 , G06F18/20 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/047 , G06N3/092 , G06N3/096 , G06N3/088 , G06N3/0895 , G06N3/09
Abstract: 本发明涉及一种基于人工智能和多模态数据处理的动态数据管道构建方法,属于数据融合治理和人工智能技术领域。本发明采用多模态深度学习模型,对业务文档、用户需求和功能规格说明进行语义解析,提取关键指标、数据需求和逻辑约束;构建多模态知识图谱,对结构化和非结构化数据资源进行统一表示和特征提取,利用图神经网络进行嵌入学习;基于深度语义匹配模型和混合推荐系统,实现业务需求与数据资源的精准匹配;采用强化学习策略,将数据处理流程的生成建模为马尔可夫决策过程,自动生成优化的数据处理工作流;利用元学习算法提高模型对新业务需求的适应性;通过工作流引擎实现任务的动态调度与执行。本发明能提高数据处理的效率。
-
公开(公告)号:CN119848039A
公开(公告)日:2025-04-18
申请号:CN202411743422.8
申请日:2024-11-30
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种面向复杂场景的专有领域数据资源目录构建方法,属于数据融合治理领域。本发明对组织内部的所有数据资产进行系统性地识别、分类、描述、标记和组织,形成数据资产目录;设计数据资源体系框架模板,通过跨主题数据资源汇总聚合、数据资源归并去重与总体集成,通过类目维度及数据资源体系框架模板实现不同领域、不同层级数据资源框架的集成,类目维度支持依据要集成的多种业务领域进行扩展创建,数据资源体系框架模板支持基于系统统一的框架标准集成不同领域、不同层级的数据资源框架,最终实现不同领域、不同层级、不同系统的数据资源框架在本系统中集成为全局统一、标准的数据资源框架体系。
-
公开(公告)号:CN115481110A
公开(公告)日:2022-12-16
申请号:CN202211176712.X
申请日:2022-09-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/21 , G06F16/23 , G06F16/25 , G06F16/215 , G06F16/901 , G06F16/906 , G06F16/907 , G06Q10/10
Abstract: 本发明涉及一种基于元数据的资源共享交换设计方法,属于软件工程领域。本发明通过对数据资源交换过程的分析,建立与其实际情况相适应的数据资源目录发布审批流程,将数据资源目录的发布审批与工作流相结合,对粗放管理模式下的审批规则及过程进行细化,落实权责;按部门、数据业务类型等不同维度建立相关知识库、专题库进行分类管理、标签管理,支持通过关键字进行资源检索,同时建立以按需分配和主动推送相结合的方式对数据资源进行共享;对数据资源目录进行版本管理,实现数据资源目录的可追溯;对数据资源目录进行生命周期全过程管理。本发明满足了指挥控制领域高动态化、实时性场景下对数据共享交换效率和数据质量控制管理需求。
-
公开(公告)号:CN119720991A
公开(公告)日:2025-03-28
申请号:CN202411699658.6
申请日:2024-11-26
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/194 , G06F16/353 , G06F40/279 , G06F40/186 , G06F40/30 , G06F40/12 , G06F40/216 , G06F18/22 , G06N3/045
Abstract: 本发明涉及一种基于语义相似度对文本提取数据相似度匹配方法,属于自然语言处理领域。本发明获取并处理实体数据作为实体数据的标准词库,初始语义相似度模型训练,选取文档中的候选文本,获得文档主题及其分布,计算文档主题和各个事件领域的主题相似度来确定文档的类别,利用标准的事件领域划分方法,创建事件抽取模板,根据文档主题类别抽取文档数据至对应的事件抽取模板,将非结构化数据转化为结构化数据,从结构化数据中,识别实体数据作为待匹配文本,利用语义相似度模型确定待匹配文本和目标文本之间的相似度。本发明实现了对非结构化文档中的名词类文本与标准实体文本的自动匹配。
-
公开(公告)号:CN116932685A
公开(公告)日:2023-10-24
申请号:CN202310911137.1
申请日:2023-07-24
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/31 , G06F16/2457 , G06F18/22 , G06F18/23 , G06F16/36
Abstract: 本发明涉及一种基于规则算法抽取和实体消歧算法构建实体画像的方法,属于数据融合处理领域。本发明通过规则算法将非结构化数据涉及到的实体、实体与实体之间的关系、属性的信息抽取到结构化数据库中。本发明采用实体消歧算法解决信息重复或者歧义的信息,对于实体重复信息,通过构建实体画像,建立多维度的特征模型的方法建立一套标准的实体数据。本发明通过实体画像建模将各类实体表间的字段关联匹配、信息融合,从多维度、多特征构建成实体画像模型,助于用户快速、高效、直观了解实体的多维特征,更好的理解实体数据含义。
-
公开(公告)号:CN116910663A
公开(公告)日:2023-10-20
申请号:CN202310838184.8
申请日:2023-07-10
Applicant: 北京计算机技术及应用研究所
IPC: G06F18/243 , G06F18/214 , G06F16/215 , G06F16/28
Abstract: 本发明涉及一种军事领域内可视化的多模态数据质量校验系统,属于数据融合治理领域。本发明的系统包括:校验规则管理模块、校验任务管理模块、质量问题修正模块、质量报告管理模块和质量问题分析模块。该系统以客户业务系统数据为数据来源,引接多种类型的数据,包含结构化数据、非结构化数据、半结构化数据和流式数据,将这些数据进行归集处理,统一存储后再进行数据治理。本发明能提供较好的数据质量,会改善客户体验、提高生产力、大大降低成本。
-
公开(公告)号:CN115017217A
公开(公告)日:2022-09-06
申请号:CN202210566652.6
申请日:2022-05-23
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种流式地理轨迹数据的治理方法,属于大数据领域。本发明针对流式地理轨迹数据的特点,提供了一种基于大数据的实时关联计算方法,能够有效对极大峰值的地理轨迹数据进行“消峰”处理、并发计算、实时转发、高效读写等服务。同时,通过引入轨迹目标字典完成了对实时流式地理轨迹数据的匹配,使杂乱的流式地理轨迹数据可按目标分类存储到数据库中形成历史数据。在历史轨迹数据处理过程中,通过轨迹合并,解决了批号突变问题。在目标维护模块,通过巧妙的缓冲时间设计和关键字拆分,视图映射,完成了同义词匹配和高效的数据同步功能。本发明对外提供高精度实时数据推送服务和多维度的历史数据查询服务。
-
-
-
-
-
-
-