一种基于分层索引、混合检索的大模型RAG方法

    公开(公告)号:CN118779437A

    公开(公告)日:2024-10-15

    申请号:CN202411273311.5

    申请日:2024-09-12

    Abstract: 本发明提供了一种基于分层索引、混合检索的大模型RAG方法。主要包括以下步骤:S1、语料库构建;S2、构建RAG模型,将RAG模型分为Retriever和Generator两部分,其中Retriever基于分层索引机制、引入假设性问题、HyDE以及多检索器混合排名负责快速定位相关文档或段落,而Generator负责生成答案或摘要;S3、信息补充机制,旨在为系统提供及时动态的知识更新能力。该机制能够及时收集用户在查询过程中提出的注释、修改的查询问题及其对应的回答调整。通过这一机制,内容管理者可以对系统反馈进行及时的信息标注和修改,从而确保知识库内容的准确性和时效性。

    一种基于多模态特征融合的架构图合理性分析判断方法

    公开(公告)号:CN119169643A

    公开(公告)日:2024-12-20

    申请号:CN202411679083.1

    申请日:2024-11-22

    Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的标注文本信息,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展的文本描述;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。

    语义解析与关键词驱动的文档前后一致性比对方法

    公开(公告)号:CN119886103A

    公开(公告)日:2025-04-25

    申请号:CN202411953722.9

    申请日:2024-12-27

    Abstract: 本发明提出了一种语义解析与关键词驱动的文档前后一致性比对方法。该方法首先通过解析输入文档的目录构建目录结构与权重模型,优先定位关键章节并提取内容。随后,利用预训练语言模型生成语义向量,并结合多层语义解析技术,对文档进行关键词捕捉与相似语义搜索。通过在词汇、句子、段落三个层级进行多层次语义比对,结合语义链路追踪与智能调整机制,精确识别文档间的差异,确保内容一致性。利用余弦相似度、欧氏距离等方法对内容进行匹配与验证,识别逻辑矛盾和信息遗漏,最终输出结构化文本。本发明能够有效提高文档比对的精度与效率,确保文档内容的准确性与一致性。

    基于权重分配和实体标注的数据发现方法系统、设备及介质

    公开(公告)号:CN119415571A

    公开(公告)日:2025-02-11

    申请号:CN202510026856.4

    申请日:2025-01-08

    Abstract: 本发明提供基于权重分配和实体标注的数据发现方法、系统、设备及介质,属于数据搜索处理技术领域,对数据进行预处理操作;根据数据的实际特征,采用机器学习算法动态调整各数据项的权重;配置自适应权重分配模型,并采用多层实体标注方式对数据中的实际特征进行标注;构建倒排索引检索模型,根据自适应权重分配模型,提取每个数据项提取特征,分配相应的权重,并进行评分计算,根据得分,进行排序,反馈给用户;通过收集并分析用户搜索数据,动态调整自适应权重分配、搜索与排序算法及索引性能优化策略,并迭代执行评估与优化,结合用户反馈机制形成闭环。本发明能够准确反映不同特征对搜索结果的重要性。能够更好地满足用户多样化的搜索需求。

    项目文件风险分析方法及系统
    8.
    发明公开

    公开(公告)号:CN120012784A

    公开(公告)日:2025-05-16

    申请号:CN202510486492.8

    申请日:2025-04-18

    Abstract: 本发明涉及人工智能技术领域,具体提供一种项目文件风险分析方法及系统,包括:获取项目文件,并利用大语言模型识别所述项目文件的语义向量;筛选出与标准语义向量不一致的差异语义向量;利用思维链推理模型基于用户问题对项目文件的语义向量进行逻辑推理,得到异常语义向量;将所述差异语义向量和异常语义向量依次输入对话预训练模型,得到相应的风险分析文本和修改建议文本;将所述差异语义向量和异常语义向量转换为语句,将所述语句与相应的风险分析文本和修改建议文本写入预先设置的报告模板,得到风险分析报告。本发明实现对项目文件语义的准确精准识别、风险点的全面分析以及修改建议的精准生成补充。

    复杂文档的全局语境分析方法及系统

    公开(公告)号:CN120012759A

    公开(公告)日:2025-05-16

    申请号:CN202510486491.3

    申请日:2025-04-18

    Abstract: 本发明涉及人工智能技术领域,具体提供一种复杂文档的全局语境分析方法及系统,包括:为所述目标文档生成目录;建立图片与文字内容的关联关系;基于所述目录的标题构建基础知识图谱,并逐步对标题对应的段落进行语义分析,为基础知识图谱添加实体和关系,得到全局知识图谱;利用知识图谱嵌入方法将全局知识图谱中的实体和关系映射为低维向量,并利用图注意力网络模型对嵌入后的全局知识图谱进行全局关系提取;基于所述全局关系构建全局语境链条,并基于所述全局语境链条对全局知识图谱的关系进行更新。本发明不仅降低了用户在文档管理方面的负担,还提高了文档信息的利用效率和价值。

    一种基于多模态特征融合的架构图合理性分析判断方法

    公开(公告)号:CN119169643B

    公开(公告)日:2025-04-01

    申请号:CN202411679083.1

    申请日:2024-11-22

    Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的架构图文本部分,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展后的架构图文本部分;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。

Patent Agency Ranking