-
公开(公告)号:CN119886103A
公开(公告)日:2025-04-25
申请号:CN202411953722.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/194 , G06F40/30 , G06F40/205
Abstract: 本发明提出了一种语义解析与关键词驱动的文档前后一致性比对方法。该方法首先通过解析输入文档的目录构建目录结构与权重模型,优先定位关键章节并提取内容。随后,利用预训练语言模型生成语义向量,并结合多层语义解析技术,对文档进行关键词捕捉与相似语义搜索。通过在词汇、句子、段落三个层级进行多层次语义比对,结合语义链路追踪与智能调整机制,精确识别文档间的差异,确保内容一致性。利用余弦相似度、欧氏距离等方法对内容进行匹配与验证,识别逻辑矛盾和信息遗漏,最终输出结构化文本。本发明能够有效提高文档比对的精度与效率,确保文档内容的准确性与一致性。
-
公开(公告)号:CN119919542A
公开(公告)日:2025-05-02
申请号:CN202510371608.3
申请日:2025-03-27
Applicant: 北京市大数据中心
IPC: G06T11/60 , G08B31/00 , G16H50/70 , G16H50/80 , G06N5/02 , G06F18/231 , G06F18/23213 , G06F18/2415 , G06F18/26 , G06F123/02
Abstract: 本公开的实施例公开了基于大数据的传染病传播路径生成和预警方法、装置。该方法的一具体实施方式包括:根据城市传染病数据,生成确诊人员集和接触人员组集;确定每个确诊人员的活动点序列,得到确诊人员活动点序列集;对各个确诊人员活动点序列进行聚类,得到高风险地区集;将满足预设高风险人群条件的城市人员确定为高风险人员,得到高风险人员集;确定每个高风险地区对应的关联节点,得到高风险关联节点集;生成传染病传播图谱;根据传染病传播图谱,生成传染病传播路径集,以及根据传染病传播路径集生成传染病传播热力图。该实施方式可以追踪传染病传播途径,减少传染病扩散风险和社会防控成本。
-
公开(公告)号:CN119885086A
公开(公告)日:2025-04-25
申请号:CN202510370376.X
申请日:2025-03-27
Applicant: 北京市大数据中心
Abstract: 本公开的实施例公开了多源异构数据融合方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:获取传染病监测数据;生成传染病结构化数据;生成传染病标签结构化数据;生成传染病监测标准化数据;对传染病监测标准化数据进行数据清洗处理,得到传染病监测清洗数据;对各个传染病清洗数据中满足预设匹配条件的每两个传染病清洗数据进行相似度匹配;生成目标传染病结构化数据;确定各个待提示人员信息;将预设的提示信息发送至各个待提示人员信息对应的各个终端。该实施方式可以减少在数据融合时所消耗的计算资源,可以提高数据融合时的处理效率。
-
公开(公告)号:CN119884313A
公开(公告)日:2025-04-25
申请号:CN202411953517.2
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F16/3329 , G06F16/334 , G06F16/35 , G06F18/241 , G06F18/214 , G06F18/22
Abstract: 本发明公开了一种基于多层次意图识别与对比学习的政策溯源动态检索方法,涉及自然语言处理、信息检索与生成技术领域,引入多层次意图识别、动态领域分类、嵌入式多轮检索、对比学习机制和生成优化策略,本发明能够精确捕捉查询意图、动态选择最相关的知识库,并通过多层次验证与优化生成高精度的溯源结果,显著提升检索的准确性、相关性和附加价值,满足复杂政策追溯和合规性检查等高精度场景需求。
-
-
-