基于资源流量和置信度融合的内容生成方法和系统

    公开(公告)号:CN117743568A

    公开(公告)日:2024-03-22

    申请号:CN202410182149.X

    申请日:2024-02-19

    摘要: 本发明属于文本生成处理技术领域,提供一种基于资源流量和置信度融合的内容生成方法和系统。该方法包括:将科技情报问题输入预训练模型,生成与科技情报问题相对应的科技情报内容,进行科技实体和科技实体关系提取,得到科技实体集合和科技关系集合;获取待处理科技实体对,基于所得到的实体集合路径,计算待处理科技实体对所生成的每一个三元组的资源流量,计算所述待处理科技实体对所生成的每一个三元组的置信度以得到融合置信度,与指定阈值进行判断,以确定输出与待处理科技实体对相对应的幻觉内容。本发明提升了大模型生成内容的可靠性和可信度。

    基于科技情报分析知识图谱的因果关系确定方法和系统

    公开(公告)号:CN117057421A

    公开(公告)日:2023-11-14

    申请号:CN202311053965.2

    申请日:2023-08-21

    IPC分类号: G06N5/02 G06F18/24

    摘要: 本发明属于科技情报信息处理技术领域,提供一种基于科技情报分析知识图谱的因果关系确定方法和系统。该方法包括:确定待处理科技情报文本段中的第一动词、第二动词、待处理科技情报文本段,进行向量转换,得到第一动词嵌入向量、第二动词嵌入向量、第一句子嵌入向量,并进行向量合并、注意力操作,得到第一变换矩阵,对第一变换矩阵进行第一变换处理,得到第二句子嵌入向量;对第一句子嵌入向量和第二句子嵌入向量进行第二变换处理后,进行SVD分解处理,将得到的左奇异矩阵输入动词因果关系预测模型,输出第一动词和第二动词的因果关系分析结果。本发明能侧重学习第一动词和第二动词相关关键信息、减少信息冗余,提高因果关系分类精度。

    一种基于知识图谱和大语言模型的问答方法和系统

    公开(公告)号:CN116775847A

    公开(公告)日:2023-09-19

    申请号:CN202311040643.4

    申请日:2023-08-18

    摘要: 本发明属于自然语言处理技术领域,提供一种基于知识图谱和大语言模型的问答方法和系统。该方法包括:接收待处理情报问题,进行实体特征抽取,得到初始特征实体;在向量数据库进行向量空间查找,确定扩展实体;基于初始特征实体查询自建立的图数据库,构建查询辅助信息,以生成初始中间答案;判断初始中间答案是否出现新实体,以确定是否执行下一轮实体特征抽取,每执行一轮实体特征抽取,生成一个中间答案,直到确定中间答案中未出现新实体为止;对经一轮或多轮实体特征抽取所有中间答案进行去重融合,以得到所述待处理情报问题相匹配的最终答案。本发明能够从海量的答案文本中高效地抽取和利用知识,能够为用户提供准确、完整、有效的答案。

    基于语义证据提示和置信度的内容生成方法和系统

    公开(公告)号:CN117725231A

    公开(公告)日:2024-03-19

    申请号:CN202410175413.7

    申请日:2024-02-08

    摘要: 本发明属于文本生成处理技术领域,提供一种基于语义证据提示和置信度的内容生成方法和系统。该方法包括:对所生成的科技情报内容进行科技实体三元组提取,得到科技实体集合和科技关系集合;采用已知的知识图谱,查询确定与待处理科技实体对相关的关联关系路径;计算所述待处理科技实体对的资源总量,以用于评估所述待处理科技实体对的关系路径的可靠性;计算所述待处理科技实体对的实体三元组的综合置信度,并将计算得到的综合置信度与指定阈值进行判断;根据所计算的语义证据值,确定与待处理科技实体对相对应的提示三元组,以最终生成相应科技情报内容。本发明提升了大模型生成内容的可靠性和可信度。

    科技情报数据分类方法、装置、电子设备和存储介质

    公开(公告)号:CN117473407A

    公开(公告)日:2024-01-30

    申请号:CN202311566428.8

    申请日:2023-11-22

    摘要: 本公开实施例提供了一种科技情报数据分类方法、装置、电子设备和存储介质,应用于数据处理技术领域。所述方法包括采集各待分类科技情报数据;对各所述待分类科技情报数据进行特征提取,得到对应的特征向量;将各所述特征向量进行拼接,得到融合向量;将所述融合向量映射到预设分区空间,得到映射向量;通过预设聚类模型对所述映射向量进行聚类,得到各质心及其对应的分类结果;根据所述映射向量和各所述质心之间的距离,得到目标分类结果。以此方式,实现质心的灵活分布,提高对科技情报数据进行分类的效率。

    基于资源流量和置信度融合的内容生成方法和系统

    公开(公告)号:CN117743568B

    公开(公告)日:2024-04-26

    申请号:CN202410182149.X

    申请日:2024-02-19

    摘要: 本发明属于文本生成处理技术领域,提供一种基于资源流量和置信度融合的内容生成方法和系统。该方法包括:将科技情报问题输入预训练模型,生成与科技情报问题相对应的科技情报内容,进行科技实体和科技实体关系提取,得到科技实体集合和科技关系集合;获取待处理科技实体对,基于所得到的实体集合路径,计算待处理科技实体对所生成的每一个三元组的资源流量,计算所述待处理科技实体对所生成的每一个三元组的置信度以得到融合置信度,与指定阈值进行判断,以确定输出与待处理科技实体对相对应的幻觉内容。本发明提升了大模型生成内容的可靠性和可信度。

    基于语义证据提示和置信度的内容生成方法和系统

    公开(公告)号:CN117725231B

    公开(公告)日:2024-04-23

    申请号:CN202410175413.7

    申请日:2024-02-08

    摘要: 本发明属于文本生成处理技术领域,提供一种基于语义证据提示和置信度的内容生成方法和系统。该方法包括:对所生成的科技情报内容进行科技实体三元组提取,得到科技实体集合和科技关系集合;采用已知的知识图谱,查询确定与待处理科技实体对相关的关联关系路径;计算所述待处理科技实体对的资源总量,以用于评估所述待处理科技实体对的关系路径的可靠性;计算所述待处理科技实体对的实体三元组的综合置信度,并将计算得到的综合置信度与指定阈值进行判断;根据所计算的语义证据值,确定与待处理科技实体对相对应的提示三元组,以最终生成相应科技情报内容。本发明提升了大模型生成内容的可靠性和可信度。

    一种基于知识图谱和大语言模型的问答方法和系统

    公开(公告)号:CN116775847B

    公开(公告)日:2023-11-28

    申请号:CN202311040643.4

    申请日:2023-08-18

    摘要: 本发明属于自然语言处理技术领域,提供一种基于知识图谱和大语言模型的问答方法和系统。该方法包括:接收待处理情报问题,进行实体特征抽取,得到初始特征实体;在向量数据库进行向量空间查找,确定扩展实体;基于初始特征实体查询自建立的图数据库,构建查询辅助信息,以生成初始中间答案;判断初始中间答案是否出现新实体,以确定是否执行下一轮实体特征抽取,每执行一轮实体特征抽取,生成一个中间答案,直到确定中间答案中未出现新实体为止;对经一轮或多轮实体特征抽取所有中间答案进行去重融合,以得到所述待处理情报问题相匹配的最终答案。本发明能够从海量的答案文本中高效地抽取和利用知识,能够为用户提供准确、完整、有效的答案。