-
公开(公告)号:CN119919542A
公开(公告)日:2025-05-02
申请号:CN202510371608.3
申请日:2025-03-27
Applicant: 北京市大数据中心
IPC: G06T11/60 , G08B31/00 , G16H50/70 , G16H50/80 , G06N5/02 , G06F18/231 , G06F18/23213 , G06F18/2415 , G06F18/26 , G06F123/02
Abstract: 本公开的实施例公开了基于大数据的传染病传播路径生成和预警方法、装置。该方法的一具体实施方式包括:根据城市传染病数据,生成确诊人员集和接触人员组集;确定每个确诊人员的活动点序列,得到确诊人员活动点序列集;对各个确诊人员活动点序列进行聚类,得到高风险地区集;将满足预设高风险人群条件的城市人员确定为高风险人员,得到高风险人员集;确定每个高风险地区对应的关联节点,得到高风险关联节点集;生成传染病传播图谱;根据传染病传播图谱,生成传染病传播路径集,以及根据传染病传播路径集生成传染病传播热力图。该实施方式可以追踪传染病传播途径,减少传染病扩散风险和社会防控成本。
-
公开(公告)号:CN119885086A
公开(公告)日:2025-04-25
申请号:CN202510370376.X
申请日:2025-03-27
Applicant: 北京市大数据中心
Abstract: 本公开的实施例公开了多源异构数据融合方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:获取传染病监测数据;生成传染病结构化数据;生成传染病标签结构化数据;生成传染病监测标准化数据;对传染病监测标准化数据进行数据清洗处理,得到传染病监测清洗数据;对各个传染病清洗数据中满足预设匹配条件的每两个传染病清洗数据进行相似度匹配;生成目标传染病结构化数据;确定各个待提示人员信息;将预设的提示信息发送至各个待提示人员信息对应的各个终端。该实施方式可以减少在数据融合时所消耗的计算资源,可以提高数据融合时的处理效率。
-
公开(公告)号:CN119884313A
公开(公告)日:2025-04-25
申请号:CN202411953517.2
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F16/3329 , G06F16/334 , G06F16/35 , G06F18/241 , G06F18/214 , G06F18/22
Abstract: 本发明公开了一种基于多层次意图识别与对比学习的政策溯源动态检索方法,涉及自然语言处理、信息检索与生成技术领域,引入多层次意图识别、动态领域分类、嵌入式多轮检索、对比学习机制和生成优化策略,本发明能够精确捕捉查询意图、动态选择最相关的知识库,并通过多层次验证与优化生成高精度的溯源结果,显著提升检索的准确性、相关性和附加价值,满足复杂政策追溯和合规性检查等高精度场景需求。
-
公开(公告)号:CN118779437A
公开(公告)日:2024-10-15
申请号:CN202411273311.5
申请日:2024-09-12
Applicant: 北京市大数据中心
IPC: G06F16/332 , G06F16/31 , G06F16/33
Abstract: 本发明提供了一种基于分层索引、混合检索的大模型RAG方法。主要包括以下步骤:S1、语料库构建;S2、构建RAG模型,将RAG模型分为Retriever和Generator两部分,其中Retriever基于分层索引机制、引入假设性问题、HyDE以及多检索器混合排名负责快速定位相关文档或段落,而Generator负责生成答案或摘要;S3、信息补充机制,旨在为系统提供及时动态的知识更新能力。该机制能够及时收集用户在查询过程中提出的注释、修改的查询问题及其对应的回答调整。通过这一机制,内容管理者可以对系统反馈进行及时的信息标注和修改,从而确保知识库内容的准确性和时效性。
-
公开(公告)号:CN119169643A
公开(公告)日:2024-12-20
申请号:CN202411679083.1
申请日:2024-11-22
Applicant: 北京市大数据中心
IPC: G06V30/19 , G06V10/80 , G06V10/82 , G06V30/146 , G06N3/0455 , G06N3/0464
Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的标注文本信息,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展的文本描述;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。
-
公开(公告)号:CN119886103A
公开(公告)日:2025-04-25
申请号:CN202411953722.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/194 , G06F40/30 , G06F40/205
Abstract: 本发明提出了一种语义解析与关键词驱动的文档前后一致性比对方法。该方法首先通过解析输入文档的目录构建目录结构与权重模型,优先定位关键章节并提取内容。随后,利用预训练语言模型生成语义向量,并结合多层语义解析技术,对文档进行关键词捕捉与相似语义搜索。通过在词汇、句子、段落三个层级进行多层次语义比对,结合语义链路追踪与智能调整机制,精确识别文档间的差异,确保内容一致性。利用余弦相似度、欧氏距离等方法对内容进行匹配与验证,识别逻辑矛盾和信息遗漏,最终输出结构化文本。本发明能够有效提高文档比对的精度与效率,确保文档内容的准确性与一致性。
-
公开(公告)号:CN119415571A
公开(公告)日:2025-02-11
申请号:CN202510026856.4
申请日:2025-01-08
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/2457 , G06F16/242 , G06F16/22
Abstract: 本发明提供基于权重分配和实体标注的数据发现方法、系统、设备及介质,属于数据搜索处理技术领域,对数据进行预处理操作;根据数据的实际特征,采用机器学习算法动态调整各数据项的权重;配置自适应权重分配模型,并采用多层实体标注方式对数据中的实际特征进行标注;构建倒排索引检索模型,根据自适应权重分配模型,提取每个数据项提取特征,分配相应的权重,并进行评分计算,根据得分,进行排序,反馈给用户;通过收集并分析用户搜索数据,动态调整自适应权重分配、搜索与排序算法及索引性能优化策略,并迭代执行评估与优化,结合用户反馈机制形成闭环。本发明能够准确反映不同特征对搜索结果的重要性。能够更好地满足用户多样化的搜索需求。
-
公开(公告)号:CN120012784A
公开(公告)日:2025-05-16
申请号:CN202510486492.8
申请日:2025-04-18
Applicant: 北京市大数据中心
IPC: G06F40/30 , G06F40/186 , G06F40/194 , G06F18/22 , G06N5/04 , G06N3/042 , G06N3/096 , G06Q10/0635 , G06Q10/10
Abstract: 本发明涉及人工智能技术领域,具体提供一种项目文件风险分析方法及系统,包括:获取项目文件,并利用大语言模型识别所述项目文件的语义向量;筛选出与标准语义向量不一致的差异语义向量;利用思维链推理模型基于用户问题对项目文件的语义向量进行逻辑推理,得到异常语义向量;将所述差异语义向量和异常语义向量依次输入对话预训练模型,得到相应的风险分析文本和修改建议文本;将所述差异语义向量和异常语义向量转换为语句,将所述语句与相应的风险分析文本和修改建议文本写入预先设置的报告模板,得到风险分析报告。本发明实现对项目文件语义的准确精准识别、风险点的全面分析以及修改建议的精准生成补充。
-
公开(公告)号:CN120012759A
公开(公告)日:2025-05-16
申请号:CN202510486491.3
申请日:2025-04-18
Applicant: 北京市大数据中心
IPC: G06F40/205 , G06F40/30 , G06F40/258 , G06F18/22 , G06F16/36 , G06N5/022 , G06N3/045 , G06N3/042 , G06N3/084
Abstract: 本发明涉及人工智能技术领域,具体提供一种复杂文档的全局语境分析方法及系统,包括:为所述目标文档生成目录;建立图片与文字内容的关联关系;基于所述目录的标题构建基础知识图谱,并逐步对标题对应的段落进行语义分析,为基础知识图谱添加实体和关系,得到全局知识图谱;利用知识图谱嵌入方法将全局知识图谱中的实体和关系映射为低维向量,并利用图注意力网络模型对嵌入后的全局知识图谱进行全局关系提取;基于所述全局关系构建全局语境链条,并基于所述全局语境链条对全局知识图谱的关系进行更新。本发明不仅降低了用户在文档管理方面的负担,还提高了文档信息的利用效率和价值。
-
公开(公告)号:CN119169643B
公开(公告)日:2025-04-01
申请号:CN202411679083.1
申请日:2024-11-22
Applicant: 北京市大数据中心
IPC: G06V30/19 , G06V10/80 , G06V10/82 , G06V30/146 , G06N3/0455 , G06N3/0464
Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的架构图文本部分,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展后的架构图文本部分;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。
-
-
-
-
-
-
-
-
-