-
公开(公告)号:CN119886103A
公开(公告)日:2025-04-25
申请号:CN202411953722.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/194 , G06F40/30 , G06F40/205
Abstract: 本发明提出了一种语义解析与关键词驱动的文档前后一致性比对方法。该方法首先通过解析输入文档的目录构建目录结构与权重模型,优先定位关键章节并提取内容。随后,利用预训练语言模型生成语义向量,并结合多层语义解析技术,对文档进行关键词捕捉与相似语义搜索。通过在词汇、句子、段落三个层级进行多层次语义比对,结合语义链路追踪与智能调整机制,精确识别文档间的差异,确保内容一致性。利用余弦相似度、欧氏距离等方法对内容进行匹配与验证,识别逻辑矛盾和信息遗漏,最终输出结构化文本。本发明能够有效提高文档比对的精度与效率,确保文档内容的准确性与一致性。
-
公开(公告)号:CN119169643A
公开(公告)日:2024-12-20
申请号:CN202411679083.1
申请日:2024-11-22
Applicant: 北京市大数据中心
IPC: G06V30/19 , G06V10/80 , G06V10/82 , G06V30/146 , G06N3/0455 , G06N3/0464
Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的标注文本信息,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展的文本描述;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。
-
公开(公告)号:CN119919542A
公开(公告)日:2025-05-02
申请号:CN202510371608.3
申请日:2025-03-27
Applicant: 北京市大数据中心
IPC: G06T11/60 , G08B31/00 , G16H50/70 , G16H50/80 , G06N5/02 , G06F18/231 , G06F18/23213 , G06F18/2415 , G06F18/26 , G06F123/02
Abstract: 本公开的实施例公开了基于大数据的传染病传播路径生成和预警方法、装置。该方法的一具体实施方式包括:根据城市传染病数据,生成确诊人员集和接触人员组集;确定每个确诊人员的活动点序列,得到确诊人员活动点序列集;对各个确诊人员活动点序列进行聚类,得到高风险地区集;将满足预设高风险人群条件的城市人员确定为高风险人员,得到高风险人员集;确定每个高风险地区对应的关联节点,得到高风险关联节点集;生成传染病传播图谱;根据传染病传播图谱,生成传染病传播路径集,以及根据传染病传播路径集生成传染病传播热力图。该实施方式可以追踪传染病传播途径,减少传染病扩散风险和社会防控成本。
-
公开(公告)号:CN119885086A
公开(公告)日:2025-04-25
申请号:CN202510370376.X
申请日:2025-03-27
Applicant: 北京市大数据中心
Abstract: 本公开的实施例公开了多源异构数据融合方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:获取传染病监测数据;生成传染病结构化数据;生成传染病标签结构化数据;生成传染病监测标准化数据;对传染病监测标准化数据进行数据清洗处理,得到传染病监测清洗数据;对各个传染病清洗数据中满足预设匹配条件的每两个传染病清洗数据进行相似度匹配;生成目标传染病结构化数据;确定各个待提示人员信息;将预设的提示信息发送至各个待提示人员信息对应的各个终端。该实施方式可以减少在数据融合时所消耗的计算资源,可以提高数据融合时的处理效率。
-
公开(公告)号:CN119884313A
公开(公告)日:2025-04-25
申请号:CN202411953517.2
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F16/3329 , G06F16/334 , G06F16/35 , G06F18/241 , G06F18/214 , G06F18/22
Abstract: 本发明公开了一种基于多层次意图识别与对比学习的政策溯源动态检索方法,涉及自然语言处理、信息检索与生成技术领域,引入多层次意图识别、动态领域分类、嵌入式多轮检索、对比学习机制和生成优化策略,本发明能够精确捕捉查询意图、动态选择最相关的知识库,并通过多层次验证与优化生成高精度的溯源结果,显著提升检索的准确性、相关性和附加价值,满足复杂政策追溯和合规性检查等高精度场景需求。
-
公开(公告)号:CN119169643B
公开(公告)日:2025-04-01
申请号:CN202411679083.1
申请日:2024-11-22
Applicant: 北京市大数据中心
IPC: G06V30/19 , G06V10/80 , G06V10/82 , G06V30/146 , G06N3/0455 , G06N3/0464
Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的架构图文本部分,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展后的架构图文本部分;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。
-
公开(公告)号:CN118779437A
公开(公告)日:2024-10-15
申请号:CN202411273311.5
申请日:2024-09-12
Applicant: 北京市大数据中心
IPC: G06F16/332 , G06F16/31 , G06F16/33
Abstract: 本发明提供了一种基于分层索引、混合检索的大模型RAG方法。主要包括以下步骤:S1、语料库构建;S2、构建RAG模型,将RAG模型分为Retriever和Generator两部分,其中Retriever基于分层索引机制、引入假设性问题、HyDE以及多检索器混合排名负责快速定位相关文档或段落,而Generator负责生成答案或摘要;S3、信息补充机制,旨在为系统提供及时动态的知识更新能力。该机制能够及时收集用户在查询过程中提出的注释、修改的查询问题及其对应的回答调整。通过这一机制,内容管理者可以对系统反馈进行及时的信息标注和修改,从而确保知识库内容的准确性和时效性。
-
-
-
-
-
-