一种大模型增强的半开放知识抽取方法和系统

    公开(公告)号:CN118966203A

    公开(公告)日:2024-11-15

    申请号:CN202411456385.2

    申请日:2024-10-18

    Abstract: 本发明公开了一种大模型增强的半开放知识抽取方法和系统,能够精准地筛选高质量且与关注问题相关的语料,并实现高效且准确的知识抽取。包括:首先,基于给定的种子实体检索包含这些种子实体的相关语料;接着,基于知识抽取的目的和关注的问题,计算检索到的语料和关注点之间的关联程度,筛选出关联度高的语料作为知识抽取的源语料;随后,利用大模型从源语料中抽取将种子实体作为头实体的三元组;再利用大模型判断抽取出来的三元组的置信度,筛选出置信度超过阈值的三元组;进一步检查所得三元组的语法、词性等,筛选出符合规范的三元组;最后,通过实体、关系标准化对齐、同义词提取融合等技术,实现知识的去重和规范化,得到最终需要的三元组。

    一种基于云原生技术的图计算平台

    公开(公告)号:CN117009038B

    公开(公告)日:2024-02-13

    申请号:CN202311283918.7

    申请日:2023-10-07

    Abstract: 本发明公开一种基于云原生技术的图计算平台,该平台包括使用云原生架构设计的软硬件协同系统、图存储系统、图计算引擎和图开发工场系统;其中,软硬件协同系统、图存储系统、图计算引擎运行在后端,图开发工场运行在前端。软硬件协同系统提供硬件计算资源和软硬件适配环境,图存储系统包括图划分模块、分布式持久化存储模块和分布式共享内存池模块,图计算引擎包括图查询引擎、图分析引擎和图学习引擎,图开发工场系统为基于图计算引擎构建的面向图计算领域的可视化操作系统,以K8s容器化的技术部署,用于将图计算算法的整个开发过程组件化、流程化和可视化。本发明的平台架构清晰、可扩展性强、使用门槛低、计算效率高。

    一种基于图聚类的基因编码育种预测方法和装置

    公开(公告)号:CN115691661A

    公开(公告)日:2023-02-03

    申请号:CN202211185464.5

    申请日:2022-09-26

    Abstract: 本发明提供了一种基于图聚类的基因编码育种预测方法及装置,本发明基于基因间相关性强弱构建基因图谱;对基因图谱进行聚类求解,得到共同调控基因组个数和每个基因的基因组聚类编号信息;融合基因等位信息和基因组聚类编号信息,得到样本的基因聚类编码;基于基因聚类编码信息和待预测生物表型信息,构建深度卷积神经网络,以优化基因育种预测性能。本发明充分利用基因图谱蕴含的基因间相互作用关系网络,能够有效提取用于控制生物表型输出的调控基因特征,解决经典模型输入编码层对基因图谱间基因相互作用关系编码不足的问题,保障生物表型的基因育种预测精准性,进而提高基因育种的速度、效率和质量,尤其产量的提高。

    一种基于知识迁移的多领域情感分类方法及系统

    公开(公告)号:CN118606480B

    公开(公告)日:2024-11-05

    申请号:CN202411084396.2

    申请日:2024-08-08

    Abstract: 本发明提供了一种基于知识迁移的多领域情感分类方法及系统。本发明从每个领域挖掘出先验频数作为领域知识,并基于本地字典将挖掘出的知识保存在知识库中,再使用存储在知识库中的知识修正目标领域的模型参数,最后基于修正结果利用训练好的情感分类器模型获得面向目标领域的情感分类预测结果。本发明充分考虑了多领域评论数据中蕴含的共性情感知识,以联邦学习的方式利用其它领域的知识来帮助目标领域的分类任务,从而提高目标领域的情感分类性能,避免了对领域原始数据的访问和使用,能够有效应对样本选择偏差、领域情感特异、数据隐私等问题,保障了各领域数据的隐私性和安全性,具有复杂度低、效率高、准确度高、安全性强、可实施性强的优点。

    一种同义词挖掘方法、装置、存储介质及电子设备

    公开(公告)号:CN116340469B

    公开(公告)日:2023-08-11

    申请号:CN202310615472.7

    申请日:2023-05-29

    Abstract: 本说明书公开了一种同义词挖掘方法、装置、存储介质及电子设备,本说明书实施例基于用户同一会话下的搜索词序列所产生的搜索日志序列中的曝光日志和点击日志,确定出搜索日志序列的编码字符串和搜索词序列的搜索词串。基于“换词搜索后点击”代表换词之前的搜索词与换词后点击时的搜索词很大可能是同义词的原理,根据预设的编码字符模式,从搜索词串中提取子搜索词串,基于子搜索词串,挖掘出候选同义词对,并基于候选同义词对,确定出最终同义词对。在此方法中,采用用户针对搜索词的上下文日志,以及结合用户执行点击行为前后的搜索词来挖掘同义词,可以避免同一搜索词在不同语境下的不同意思,从而提高挖掘同义词对的准确性。

    一种同义词挖掘方法、装置、存储介质及电子设备

    公开(公告)号:CN116340469A

    公开(公告)日:2023-06-27

    申请号:CN202310615472.7

    申请日:2023-05-29

    Abstract: 本说明书公开了一种同义词挖掘方法、装置、存储介质及电子设备,本说明书实施例基于用户同一会话下的搜索词序列所产生的搜索日志序列中的曝光日志和点击日志,确定出搜索日志序列的编码字符串和搜索词序列的搜索词串。基于“换词搜索后点击”代表换词之前的搜索词与换词后点击时的搜索词很大可能是同义词的原理,根据预设的编码字符模式,从搜索词串中提取子搜索词串,基于子搜索词串,挖掘出候选同义词对,并基于候选同义词对,确定出最终同义词对。在此方法中,采用用户针对搜索词的上下文日志,以及结合用户执行点击行为前后的搜索词来挖掘同义词,可以避免同一搜索词在不同语境下的不同意思,从而提高挖掘同义词对的准确性。

    一种大模型增强的半开放知识抽取方法和系统

    公开(公告)号:CN118966203B

    公开(公告)日:2025-02-11

    申请号:CN202411456385.2

    申请日:2024-10-18

    Abstract: 本发明公开了一种大模型增强的半开放知识抽取方法和系统,能够精准地筛选高质量且与关注问题相关的语料,并实现高效且准确的知识抽取。包括:首先,基于给定的种子实体检索包含这些种子实体的相关语料;接着,基于知识抽取的目的和关注的问题,计算检索到的语料和关注点之间的关联程度,筛选出关联度高的语料作为知识抽取的源语料;随后,利用大模型从源语料中抽取将种子实体作为头实体的三元组;再利用大模型判断抽取出来的三元组的置信度,筛选出置信度超过阈值的三元组;进一步检查所得三元组的语法、词性等,筛选出符合规范的三元组;最后,通过实体、关系标准化对齐、同义词提取融合等技术,实现知识的去重和规范化,得到最终需要的三元组。

    一种预测模型的训练方法、装置、存储介质及电子设备

    公开(公告)号:CN116757278B

    公开(公告)日:2024-01-09

    申请号:CN202311053464.4

    申请日:2023-08-21

    Abstract: 本说明书公开了一种预测模型的训练方法、装置、存储介质及电子设备,通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。

    一种预测模型的训练方法、装置、存储介质及电子设备

    公开(公告)号:CN116757278A

    公开(公告)日:2023-09-15

    申请号:CN202311053464.4

    申请日:2023-08-21

    Abstract: 本说明书公开了一种预测模型的训练方法、装置、存储介质及电子设备,通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。

Patent Agency Ranking