基于依存句法预训练模型的篇章级关系抽取方法及系统

    公开(公告)号:CN114417824B

    公开(公告)日:2024-09-10

    申请号:CN202210045155.1

    申请日:2022-01-14

    Abstract: 本发明公开了基于依存句法预训练模型的篇章级关系抽取方法及系统,涉及自然语言处理技术领域,分别采用直接转换、双仿射转换和分解线性变换将依存句法信息引入到预训练模型中,分别比较不同引入方式的特点,分析依存句法信息对预训练模型的作用,同时探索图结构对预训练模型的辅助作用;将实体特征表示与实体间的距离特征进行拼接,丰富了实体的信息,有利于后续的篇章级关系抽取任务。本发明解决了目前预训练模型在篇章级关系抽取中处理长距离文本困难以及弱依赖的问题,不仅提高了预训练模型在篇章级关系抽取任务中处理长文本的能力和性能的精度,并且也探索出了图结构本身对预训练模型具有的辅助作用。

    基于稀疏注意力机制和图表示学习的鲁棒性药物推荐方法及系统

    公开(公告)号:CN118098634A

    公开(公告)日:2024-05-28

    申请号:CN202410262689.9

    申请日:2024-03-07

    Inventor: 张益嘉 魏杰栋

    Abstract: 本发明公开了基于稀疏注意力机制和图表示学习的鲁棒性药物推荐方法及系统,属于自然语言处理技术领域。本发明使用稀疏注意力网络学习患者历史就诊中不同类型的医疗信息去除患者历史就诊中噪音数据得到更好的患者表示。使用图表示学习模块增强不同类型医学知识对推荐结果的指导。最后通过多任务联合学习进一步提升方法的鲁棒性。本发明解决了当前药物推荐任务中患者历史数据中存在噪音的问题、不同类型医学知识考虑不足和面临数据缺失等复杂医疗环境下推荐的鲁棒性问题。不仅提升了该任务上性能的精度增强了模型的鲁棒性,对于其他具有类似问题的任务同样具有借鉴意义。

    一种基于多跳邻居负采样策略的推荐方法及系统

    公开(公告)号:CN117851673A

    公开(公告)日:2024-04-09

    申请号:CN202410033772.9

    申请日:2024-01-09

    Abstract: 本发明公开了一种基于多跳邻居负采样策略的推荐方法及系统,基于对比学习实现推荐,对比学习中采用基于高阶邻居的负采样策略,节点的多跳邻居被用作候选负样本,对于节点的结构邻居,选择k层图卷积神经网络(GCN)聚合的k跳邻居信息作为负样本(其中k为奇数),该目标提取节点(用户或项目)的表示并嵌入邻居的表示。因此,本发明使用了一种更加简单高效的图对比学习方法来进行数据增强,结合图卷积网络获取邻居节点的嵌入来丰富自身节点的信息。该方法选择可靠、真实的硬负样本进行动态训练,从而减少选择假负样本的可能性,提高模型的泛化能力和鲁棒性。

    基于对比学习与一致性检测的多目标立场检测方法及系统

    公开(公告)号:CN116992873A

    公开(公告)日:2023-11-03

    申请号:CN202310959805.8

    申请日:2023-07-31

    Abstract: 本发明公开一种基于对比学习与一致性检测的多目标立场检测方法及系统,属于自然语言处理的技术领域。本发明在对比学习上应用一致性检测方法,它使模型能够学习目标的更多特征信息,并加强目标之间语义信息的联系,使目标之间互相辅助检测自身立场。此外,本发明中微调BERT并嵌入BiLSTM作为编码器,以更充分地利用隐藏上下文之间的语义信息。本发明还将联合训练作为一种多任务学习方法,允许模型基于数据集共享特定领域的信息。本发明解决了多目标立场检测中数据集嘈杂、目标孤立、特定领域信息不足的问题。不仅提高了该任务上性能的精度,对于其他具有类似问题的多目标文本分类任务同样有借鉴意义。

    一种放射学临床医学影像报告生成方法及系统

    公开(公告)号:CN119028509A

    公开(公告)日:2024-11-26

    申请号:CN202411050224.3

    申请日:2024-08-01

    Abstract: 本发明公开了一种放射学临床医学影像报告生成方法及系统,涉及自然语言处理的技术领域,本发明使用重校准视觉抽取器去提高模型对异常病灶区域的细粒度视觉特征的提取。使用弱监督对比学习策略去有效地识别并强化医学图像间的相似性,获取医学影像中关键信息的特征表示。使用跨模态门控记忆模块去保留不同模态信息之间有效的交互特征,进而准确捕捉文本和图像信息之间的关联,实现对不同模态信息之间的深入理解和对齐。本发明解决了医学影像中数据分布不平衡导致关键特征信息学习能力降低的问题,以及图像和文本信息之间跨模态信息之间融合和对齐的问题,不仅提高了医学影像中关键特征的学习能力,同时增强了多模态信息之间的交互和融合能力。

    海事领域大模型的训练数据生成方法、系统、设备及存储介质

    公开(公告)号:CN118503698A

    公开(公告)日:2024-08-16

    申请号:CN202410576929.2

    申请日:2024-05-10

    Abstract: 本发明提供了一种海事领域大模型的训练数据生成方法、系统、设备及存储介质,涉及大语言模型技术领域,本发明旨在克服现有技术的限制,通过对多种来源,格式不同的海事知识进行多层次优化,分类、清洗、转换、审查以及筛选后进行人工修改,实现针对不同应用场景下海事领域问答对的质量提升,为海事领域大模型提供专业性和安全性好,并且对齐人类偏好程度高的数据,进而训练出更专业的海事大模型,为海事领域内的海事法律法规问答、海事教育培训、海事专业知识问答等海事领域实际应用场景提供更好的支持。

    基于跨模态融合和记忆监督放射学报告生成方法及系统

    公开(公告)号:CN117789911A

    公开(公告)日:2024-03-29

    申请号:CN202410070219.2

    申请日:2024-01-17

    Abstract: 本发明公开一种基于跨模态融合和记忆监督放射学报告生成方法及系统,属于自然语言处理的技术领域。本发明使用跨模态融合模块,促进医学影像视觉特征和医疗报告文本特征的信息交互,并解决多模态特征交互不充分的问题。使用记忆监督模块,将文本信息合并到解码器的归一化层中,为放射学报告生成提供针对性的指导和参考。使用多类别对比损失,增强多模态特征的学习。本发明解决了当前放射学报告生成文物中视觉和文本的数据偏差,难以生成长文本的问题。不仅提高了该任务上性能的精度,对于其他具有类似问题的放射学报告生成任务同样有借鉴意义。

    一种药物靶标结合亲和力预测方法及系统

    公开(公告)号:CN117594116A

    公开(公告)日:2024-02-23

    申请号:CN202311615746.9

    申请日:2023-11-28

    Abstract: 本发明公开了一种药物靶标结合亲和力预测方法及系统,分别对药物的SMILE序列和蛋白质的氨基酸序列进行预处理,得到药物和蛋白质的二维数据结构;对药物的二维数据结构使用图神经网络进行特征提取,对蛋白质的二维数据结构使用栈卷积神经网络进行特征提取,并且分别将提取到的特征输入到注意力层;对提取出的药物特征和蛋白质特征进行特征融合;将融合后的特征向量通过全连接层进行亲和力值的预测。本发明的方法通过图增强网络和栈卷积神经网络技术,能够更好地聚合药物分子的邻域信息,尤其是对于连接较少的节点,同时提供了模型决策的可解释性,从而解决了这些问题。

    利用药物知识和句法依存关系的药物相互作用关系抽取方法

    公开(公告)号:CN114373554A

    公开(公告)日:2022-04-19

    申请号:CN202111630392.6

    申请日:2021-12-28

    Abstract: 本发明公开了一种利用药物知识和句法依存关系的药物相互作用关系抽取方法,涉及自然语言处理技术领域。生物医学文献的爆炸式增长产生了大量关于药物相互作用的信息,药物实体名称大多是特定领域的名词,大多数现有模型忽略了专业领域知识和语法信息的重要性。本发明可以充分利用药物知识来获得更广泛的药物实体表示,以便模型理解药物相互作用文本语义。另一方面,句法特征对于从长而复杂的句子中抽取药物相互作用关系是有价值的,本发明可以应用句法图神经网络来有效地捕捉句子的句法信息,有效解决了药物实体复杂难以理解和药物相互作用文本过长的问题。

    一种基于异质信息网络和自适应去噪的推荐方法及系统

    公开(公告)号:CN114372206A

    公开(公告)日:2022-04-19

    申请号:CN202111627159.2

    申请日:2021-12-28

    Inventor: 张益嘉 靳思晨

    Abstract: 本发明公开了一种基于异质信息网络和自适应去噪的推荐方法及系统,属于推荐系统的技术领域。本发明中,采用异质信息网络作为模型的输入,可以更好地处理等复杂的输入,更好的建模真实世界,解决了同质信息网络无法模拟的现实情况,大幅提高了推荐的精度。加入了自适应去噪模块,可以有效的去除数据集中的噪声,更好地保留了异质信息网络数据集的有效数据。同时辅以深度图卷积神经网络,可以有效的提高推荐模型的精度,同时适应更复杂的现实世界。解决了当前推荐系统中大多只关注推荐精度问题,不仅可以从数据集的角度改变模型的推荐效果,同时由于加入了去噪模块,模型的时间复杂度也变得较低,可以有效的应用在实际的工业环境中。

Patent Agency Ranking