一种基于分层索引、混合检索的大模型RAG方法

    公开(公告)号:CN118779437A

    公开(公告)日:2024-10-15

    申请号:CN202411273311.5

    申请日:2024-09-12

    Abstract: 本发明提供了一种基于分层索引、混合检索的大模型RAG方法。主要包括以下步骤:S1、语料库构建;S2、构建RAG模型,将RAG模型分为Retriever和Generator两部分,其中Retriever基于分层索引机制、引入假设性问题、HyDE以及多检索器混合排名负责快速定位相关文档或段落,而Generator负责生成答案或摘要;S3、信息补充机制,旨在为系统提供及时动态的知识更新能力。该机制能够及时收集用户在查询过程中提出的注释、修改的查询问题及其对应的回答调整。通过这一机制,内容管理者可以对系统反馈进行及时的信息标注和修改,从而确保知识库内容的准确性和时效性。

    一种基于多模态特征融合的架构图合理性分析判断方法

    公开(公告)号:CN119169643B

    公开(公告)日:2025-04-01

    申请号:CN202411679083.1

    申请日:2024-11-22

    Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的架构图文本部分,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展后的架构图文本部分;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。

    基于深度学习的多模态数据特征处理方法、系统及介质

    公开(公告)号:CN119418142B

    公开(公告)日:2025-05-16

    申请号:CN202510026855.X

    申请日:2025-01-08

    Abstract: 本申请公开了一种基于深度学习的多模态数据特征处理方法、系统及介质,主要涉及多模态数据技术领域,用以解决由于传统技术无法识别多种类型的数据图像,进而无法在用户查找数据时提供多类型数据图像的问题。包括:获取各个类型的数据图像,将数据图像转化为结构化数据,确定对应的特征提取算法,获得特征数据;根据对齐因子,获取同属于相同对齐因子的特征数据,拼接成一个特征向量,获得降维后的数据矩阵;通过降维后的数据矩阵和对应的标签数据,训练预设深度学习模型;根据用户检索信息对应的降维后的数据矩阵;将降维后的数据矩阵作为训练好的预设深度学习模型的输入,获得标签数据;进而获取标签数据对应的各个类型的数据图像。

    语义解析与关键词驱动的文档前后一致性比对方法

    公开(公告)号:CN119886103A

    公开(公告)日:2025-04-25

    申请号:CN202411953722.9

    申请日:2024-12-27

    Abstract: 本发明提出了一种语义解析与关键词驱动的文档前后一致性比对方法。该方法首先通过解析输入文档的目录构建目录结构与权重模型,优先定位关键章节并提取内容。随后,利用预训练语言模型生成语义向量,并结合多层语义解析技术,对文档进行关键词捕捉与相似语义搜索。通过在词汇、句子、段落三个层级进行多层次语义比对,结合语义链路追踪与智能调整机制,精确识别文档间的差异,确保内容一致性。利用余弦相似度、欧氏距离等方法对内容进行匹配与验证,识别逻辑矛盾和信息遗漏,最终输出结构化文本。本发明能够有效提高文档比对的精度与效率,确保文档内容的准确性与一致性。

    基于深度学习的多模态数据特征处理方法、系统及介质

    公开(公告)号:CN119418142A

    公开(公告)日:2025-02-11

    申请号:CN202510026855.X

    申请日:2025-01-08

    Abstract: 本申请公开了一种基于深度学习的多模态数据特征处理方法、系统及介质,主要涉及多模态数据技术领域,用以解决由于传统技术无法识别多种类型的数据图像,进而无法在用户查找数据时提供多类型数据图像的问题。包括:获取各个类型的数据图像,将数据图像转化为结构化数据,确定对应的特征提取算法,获得特征数据;根据对齐因子,获取同属于相同对齐因子的特征数据,拼接成一个特征向量,获得降维后的数据矩阵;通过降维后的数据矩阵和对应的标签数据,训练预设深度学习模型;根据用户检索信息对应的降维后的数据矩阵;将降维后的数据矩阵作为训练好的预设深度学习模型的输入,获得标签数据;进而获取标签数据对应的各个类型的数据图像。

    一种基于多模态特征融合的架构图合理性分析判断方法

    公开(公告)号:CN119169643A

    公开(公告)日:2024-12-20

    申请号:CN202411679083.1

    申请日:2024-11-22

    Abstract: 本发明涉及智能架构图设计合理性判断领域,公开了一种基于多模态特征融合的架构图合理性分析判断方法,获取待分析架构图;识别并提取出架构图中的标注文本信息,并记录;通过R‑CNN模型识别并获取图像元素的感兴趣区域特征图集合,并记录;建立OCR模块文本信息与R‑CNN模型图像元素的位置及逻辑信息对应关系,生成扩展的文本描述;对扩展的架构图文本进行分词处理和语义编码,得到词粒度特征向量集合;进行语义编码,得到其词粒度特征向量集合;生成同一维度的综合特征向量;计算其语义匹配系数,判断待分析架构图设计是否符合整体规划的合理性要求。可以有效地评估架构图的设计和功能是否符合整体规划要求,提高解析和评审的准确性和效率。

Patent Agency Ranking