基于大语言模型信息增强和反译学习的零样本实体关系抽取方法及系统

    公开(公告)号:CN119721038A

    公开(公告)日:2025-03-28

    申请号:CN202411792002.9

    申请日:2024-12-06

    Abstract: 本发明公开了一种基于大语言模型信息增强和反译学习的零样本实体关系抽取方法及系统,属于自然语言处理的技术领域,关系抽取是自然语言处理中的一个核心任务,旨在从非结构化的文本数据中识别并提取实体之间的语义关系。它通常作为信息抽取的一个重要组成部分,广泛应用于知识图谱构建、问答系统、信息检索等领域。本发明旨在克服现有技术的限制,提供一种创新的基于大语言模型信息增强和反译学习的零样本实体关系抽取方法,该方法利用大语言模型的丰富语义分析能力和检索能力,引入外部知识。同时,通过反译学习模块,在零样本环境下生成有效的伪标签对模型进行训练,以提高模型性能和可解释性。

    一种基于联邦学习与差分隐私的糖尿病视网膜病变图像识别方法

    公开(公告)号:CN119128979A

    公开(公告)日:2024-12-13

    申请号:CN202411242547.2

    申请日:2024-09-05

    Abstract: 本发明提供一种基于联邦学习与差分隐私的糖尿病视网膜病变图像识别方法,属于联邦学习领域。本发明通过步骤:对糖尿病视网膜病变图像数据集进行预处理和泊松采样初始化位于中央服务器的全局模型;本地客户端从中央服务器获取全局模型的参数,构建本地模型;本地客户端利用本地数据对本地模型进行训练和差分隐私处理;中央服务器接收各客户端上传的参数进行安全聚合,利用安全聚合后参数更新全局模型;训练迭代次数未达到用户指定的阈值,将结果传递至本地模型继续进行训练过程;训练迭代次数达到用户指定的阈值,终止进一步的迭代过程,得到完成训练的模型。平衡了联邦学习中引入差分隐私进行隐私保护可能存在梯度泄露以及数据损失的问题。

    面向固体核径迹探测器的二阶段辐射粒子径迹自动化采集方法及系统

    公开(公告)号:CN118426027A

    公开(公告)日:2024-08-02

    申请号:CN202410507427.4

    申请日:2024-04-25

    Abstract: 本发明公开了一种面向固体核径迹探测器的二阶段辐射粒子径迹自动化采集方法及系统,包括:对辐射粒子数据集进行预处理,修正人工标记的长短轴点,对重离子的径迹数据进行归一化;使用yolov7模型作为检测器对图片特征进行抽取,得到多个辐射粒子的外接矩形;提取粗略定位到的矩形框所在位置图片,利用ROIAglin实现不同大小的矩形框规范到同一表达空间,并将矩形框所在的辐射粒子特征进行放大;使用测量器提取辐射粒子的特征信息,对辐射粒子的径迹进行预测;对预测出的相对中心点和长短轴以及角度进行还原,还原为相对图片的绝对中心点和长短轴以及角度。本发明能够在短时间内对辐射粒子进行定位以及测量。

    基于对比学习和图神经网络的药物重定位预测方法及装置

    公开(公告)号:CN117219291A

    公开(公告)日:2023-12-12

    申请号:CN202311146042.1

    申请日:2023-09-06

    Abstract: 本发明公开了基于对比学习和图神经网络的药物重定位预测方法及装置,涉及生物医学和自然语言技术交叉领域。本发明从嵌入层角度进行简单数据扩充从而摒弃了现有对比学习任务大多数采用的复杂图形增强,使模型更加轻便有效;为了更加有效地挖掘语义空间中潜在的邻域关系,将位于语义邻域内的相似疾病合并到原型对比目标中,将潜在的邻域明确地结合到对比对中,从而可以利用不同结构信息,充分提取信息,更好地对结果进行预测,提升预测性能;同时考虑到原始数据集中存在的噪声,使用自适应去噪方法,在训练过程中自适应地修剪噪声交互,大大提高了模型的预测质量。

    一种基于句法和图卷积网络的方面级情感分析方法及装置

    公开(公告)号:CN114417823A

    公开(公告)日:2022-04-29

    申请号:CN202210023639.6

    申请日:2022-01-10

    Abstract: 本发明公开了一种基于句法依赖和图卷积网络的方面级情感分析方法及装置,涉及自然语言处理技术领域。本发明使用的方面融合图卷积网络模型能融入更多的语义信息,更好的利用句子中的句法信息和单词依赖性,从而提高模型的训练质量。首先,通过引入依赖树和依赖位置图来增强每个句子实例的句法依赖。然后,使用两个图卷积网络融合依赖树和依赖位置图以生成方面的交互情感特征。最后,通过注意力机制充分整合卷积层和掩蔽层的状态向量中与方面语义相关的重要特征。本发明解决了情感分析领域容易忽略的依赖树拓扑结构与依赖距离之间存在密切关系的问题,不仅增强了情感分类的效果,对于其他涉及到图卷积的分类任务也有较好的帮助。

    基于联合学习和去噪机制的ICD代码预测方法及系统

    公开(公告)号:CN114023412A

    公开(公告)日:2022-02-08

    申请号:CN202111396853.8

    申请日:2021-11-23

    Abstract: 本发明公开了一种基于联合学习和去噪机制的ICD代码预测方法及系统,涉及自然语言处理技术领域,使用clinicalBERT预训练,设计了基于提示的微调方法,提升冗长句子的表征效果,加快预训练的速度;使用双路注意力机制处理电子病历和医疗代码的文档,同时兼顾两部分数据,有效处理不平衡分类问题;将不同的注意力矩阵馈送到联合学习模块,引入两个权重系数,来自适应的确定这两个系数,通过这两个系数构建特定于ICD的注意力矩阵;设计了新型的去噪损失函数,引入损失阈值,计算样本损失,并进行排序,从超过阈值的样本开始截断,丢弃迭代过程中超过动态阈值的样本,最终识别和清洗嘈杂的样本,提高分类器的训练质量。

    基于人脸识别和分层融合策略的多模态恶意迷因图检测方法

    公开(公告)号:CN114419409B

    公开(公告)日:2024-11-26

    申请号:CN202210036924.1

    申请日:2022-01-12

    Abstract: 本发明公开了一种基于人脸识别和分层融合策略的多模态恶意迷因图检测方法,涉及自然语言处理技术领域。本发明引入了一种新的多模态融合模型,并对图像和文本进行多模态训练。这个多特征融合网络首先使用ResNet和YOLO‑v5提取图像特征和属性特征,然后使用属性特征和双向LSTM网络提取文本特征。在提取属性特征的同时,引入了人脸识别器来获取迷因图中人脸的种族和性别信息,这样可以更好地捕捉到仇恨情绪。然后将三种模态的特征重建并融合到一个特征向量中进行预测。评估结果表明,该模型在检测仇恨迷因图方面的性能达到了更高的水平。

    基于高斯增强及辅助任务的蛋白质相互作用关系抽取方法

    公开(公告)号:CN114373512B

    公开(公告)日:2024-11-22

    申请号:CN202111627067.4

    申请日:2021-12-28

    Abstract: 本发明公开了基于高斯增强及辅助任务的蛋白质相互作用关系抽取方法,涉及自然语言处理的技术领域。本发明使用生物医学领域预训练模型BioBERT生成文本文档的高质量上下文表示,从而对单词进行更加近乎实际语义的词向量表示,解决了生物医学文本中单词的一词多义问题;在BioBERT的基础上使用高斯概率分布可以提高目标蛋白质实体及其邻近词的权重,得到目标实体的增强表示,使模型学习到了实例的局部结构。使用文档分类作为辅助任务改善了从模型中获得的文档的表示,并隐含的增加了数据信息。本发明解决了目前蛋白质相互作用关系抽取中存在的输入文本长,目标蛋白质实体在数据集中分布散乱的问题,提高了该任务上性能的精度。

    一种基于异质信息网络和自适应去噪的推荐方法及系统

    公开(公告)号:CN114372206B

    公开(公告)日:2024-09-13

    申请号:CN202111627159.2

    申请日:2021-12-28

    Inventor: 张益嘉 靳思晨

    Abstract: 本发明公开了一种基于异质信息网络和自适应去噪的推荐方法及系统,属于推荐系统的技术领域。本发明中,采用异质信息网络作为模型的输入,可以更好地处理等复杂的输入,更好的建模真实世界,解决了同质信息网络无法模拟的现实情况,大幅提高了推荐的精度。加入了自适应去噪模块,可以有效的去除数据集中的噪声,更好地保留了异质信息网络数据集的有效数据。同时辅以深度图卷积神经网络,可以有效的提高推荐模型的精度,同时适应更复杂的现实世界。解决了当前推荐系统中大多只关注推荐精度问题,不仅可以从数据集的角度改变模型的推荐效果,同时由于加入了去噪模块,模型的时间复杂度也变得较低,可以有效的应用在实际的工业环境中。

Patent Agency Ranking