一种基于知识图谱和大语言模型的问答方法和系统

    公开(公告)号:CN116775847A

    公开(公告)日:2023-09-19

    申请号:CN202311040643.4

    申请日:2023-08-18

    摘要: 本发明属于自然语言处理技术领域,提供一种基于知识图谱和大语言模型的问答方法和系统。该方法包括:接收待处理情报问题,进行实体特征抽取,得到初始特征实体;在向量数据库进行向量空间查找,确定扩展实体;基于初始特征实体查询自建立的图数据库,构建查询辅助信息,以生成初始中间答案;判断初始中间答案是否出现新实体,以确定是否执行下一轮实体特征抽取,每执行一轮实体特征抽取,生成一个中间答案,直到确定中间答案中未出现新实体为止;对经一轮或多轮实体特征抽取所有中间答案进行去重融合,以得到所述待处理情报问题相匹配的最终答案。本发明能够从海量的答案文本中高效地抽取和利用知识,能够为用户提供准确、完整、有效的答案。

    一种利用上下文将文本中实体关联到知识库的方法

    公开(公告)号:CN115994199A

    公开(公告)日:2023-04-21

    申请号:CN202211368508.8

    申请日:2022-11-03

    IPC分类号: G06F16/31 G06F16/36

    摘要: 本发明涉及一种利用上下文将文本中实体关联到知识库的方法,属于自然语言处理技术领域,该方法包括:建立知识库;建立知识库索引;对输入文本中实体指称的字符预处理,获取实体指称对应的候选实体集合;建立 对;选取与实体指称的上下文相关度较高的多个候选实体描述句子作为选择依据;根据选择依据判断实体指称对应的知识库中的实体名词或判断知识库中没有实体指称对应的实体名词。本申请提供的方法可以扩充匹配范围、有效提升关联的准确性;通过在预测结果标记处添加无法链接分类标签的MLP多层感知模型进行实体指称对应的实体名词判断,解决了现有技术中实体不在知识库中时,仅通过找出关联度最大的一项导致错误的关联这一问题。

    负载均衡控制方法和系统

    公开(公告)号:CN102984079A

    公开(公告)日:2013-03-20

    申请号:CN201210552141.5

    申请日:2012-12-18

    IPC分类号: H04L12/803

    摘要: 本发明公开了一种负载均衡控制方法和系统,所述方法包括:通过负载均衡器查询各个应用系统的访问量以生成带宽分配策略;接收用户反馈的评价信息,以根据所述评价信息对所述带宽分配策略进行调整以生成最终的负载均衡策略。本发明可以根据用户反馈的体验信息来动态生成带宽分配策略,并根据各个应用系统的访问量来动态调整所述带宽分配策略,以生成最终的负载均衡策略。本发明能够更加整体、全面、均衡的实现资源的有效利用和分配,实现提升多个应用系统整体的用户友好度,进而提高用户忠诚度。

    基于资源流量和置信度融合的内容生成方法和系统

    公开(公告)号:CN117743568A

    公开(公告)日:2024-03-22

    申请号:CN202410182149.X

    申请日:2024-02-19

    摘要: 本发明属于文本生成处理技术领域,提供一种基于资源流量和置信度融合的内容生成方法和系统。该方法包括:将科技情报问题输入预训练模型,生成与科技情报问题相对应的科技情报内容,进行科技实体和科技实体关系提取,得到科技实体集合和科技关系集合;获取待处理科技实体对,基于所得到的实体集合路径,计算待处理科技实体对所生成的每一个三元组的资源流量,计算所述待处理科技实体对所生成的每一个三元组的置信度以得到融合置信度,与指定阈值进行判断,以确定输出与待处理科技实体对相对应的幻觉内容。本发明提升了大模型生成内容的可靠性和可信度。

    一种信息汇集实时形成主题的方法

    公开(公告)号:CN116303869A

    公开(公告)日:2023-06-23

    申请号:CN202310075485.X

    申请日:2023-02-07

    摘要: 本发明涉及一种信息汇集实时形成主题的方法,属于大数据技术领域,该方法包括:获取输入文本中的关键句;将输入文本中的关键句作为输入文档,获取N个与输入文档相似的候选文档;构建N个 对,获取输入文档对应的主题或判断k‑d树中没有输入文档对应的主题;将输入文档的内容特征向量以及输入文档对应的主题存储到k‑d树中。本申请提供的方法通过获取输入文本中的关键句,避免了多余文本干扰;同时,基于k‑d树来存储所有待使用文档的内容特征向量,获取k‑d树中N个与输入文档相似的候选文档,可充分利用所有特征;此外,借助深度学习强大的语义提取能力,选择文档所属主题,从而达到实时、有效的文档主题自动生成能力。

    基于科技情报分析知识图谱的因果关系确定方法和系统

    公开(公告)号:CN117057421A

    公开(公告)日:2023-11-14

    申请号:CN202311053965.2

    申请日:2023-08-21

    IPC分类号: G06N5/02 G06F18/24

    摘要: 本发明属于科技情报信息处理技术领域,提供一种基于科技情报分析知识图谱的因果关系确定方法和系统。该方法包括:确定待处理科技情报文本段中的第一动词、第二动词、待处理科技情报文本段,进行向量转换,得到第一动词嵌入向量、第二动词嵌入向量、第一句子嵌入向量,并进行向量合并、注意力操作,得到第一变换矩阵,对第一变换矩阵进行第一变换处理,得到第二句子嵌入向量;对第一句子嵌入向量和第二句子嵌入向量进行第二变换处理后,进行SVD分解处理,将得到的左奇异矩阵输入动词因果关系预测模型,输出第一动词和第二动词的因果关系分析结果。本发明能侧重学习第一动词和第二动词相关关键信息、减少信息冗余,提高因果关系分类精度。

    基于语义证据提示和置信度的内容生成方法和系统

    公开(公告)号:CN117725231A

    公开(公告)日:2024-03-19

    申请号:CN202410175413.7

    申请日:2024-02-08

    摘要: 本发明属于文本生成处理技术领域,提供一种基于语义证据提示和置信度的内容生成方法和系统。该方法包括:对所生成的科技情报内容进行科技实体三元组提取,得到科技实体集合和科技关系集合;采用已知的知识图谱,查询确定与待处理科技实体对相关的关联关系路径;计算所述待处理科技实体对的资源总量,以用于评估所述待处理科技实体对的关系路径的可靠性;计算所述待处理科技实体对的实体三元组的综合置信度,并将计算得到的综合置信度与指定阈值进行判断;根据所计算的语义证据值,确定与待处理科技实体对相对应的提示三元组,以最终生成相应科技情报内容。本发明提升了大模型生成内容的可靠性和可信度。

    科技情报数据分类方法、装置、电子设备和存储介质

    公开(公告)号:CN117473407A

    公开(公告)日:2024-01-30

    申请号:CN202311566428.8

    申请日:2023-11-22

    摘要: 本公开实施例提供了一种科技情报数据分类方法、装置、电子设备和存储介质,应用于数据处理技术领域。所述方法包括采集各待分类科技情报数据;对各所述待分类科技情报数据进行特征提取,得到对应的特征向量;将各所述特征向量进行拼接,得到融合向量;将所述融合向量映射到预设分区空间,得到映射向量;通过预设聚类模型对所述映射向量进行聚类,得到各质心及其对应的分类结果;根据所述映射向量和各所述质心之间的距离,得到目标分类结果。以此方式,实现质心的灵活分布,提高对科技情报数据进行分类的效率。

    基于语义的关联词查找方法及装置、电子设备、存储介质

    公开(公告)号:CN113268569B

    公开(公告)日:2021-11-16

    申请号:CN202110810574.5

    申请日:2021-07-19

    摘要: 本发明涉及一种基于语义的关联词查找方法及装置,属于计算机技术领域。本发明的基于语义的关联词查找方法,包括:从互联网数据库中获取文本文档;利用深度学习实体识别模型识别文本文档以得到实体名词及实体名词位置;根据实体名词位置确定的实体名词所在句子上下文的文本计算实体名词的词向量;对实体名词进行构词分析以确定实体名词的实体类型;根据实体名词的词向量、实体名词的实体类型在词向量库中进行相似检索以查找相似的实体名词。本发明的基于语义的关联词查找方法解决了一词多义的问题,其不依赖于已有词库、能够处理未知的实体名词。