基于图卷积的长文本匹配方法

    公开(公告)号:CN116304749A

    公开(公告)日:2023-06-23

    申请号:CN202310565214.2

    申请日:2023-05-19

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于图卷积的长文本匹配方法,包括获取现有的长文本数据集;构建关键词图;获取节点的网络特征向量和概率统计特征,得到各个节点的初始特征表示;构建语义超图;构建长文本匹配模型;采用长文本数据集及得到的结果训练长文本匹配模型得到训练后的长文本匹配模型;采用训练后的长文本匹配模型进行实际的长文本匹配。本发明不仅实现了长文本的匹配,而且简化了任务难度,实现了文本对之间细粒度的语义对齐,实现了对匹配信号更准确的语义划分,保证了训练过程中超边节点间的特征相似性,可靠性高、精确性好且客观科学。

    基于编码器的长文本匹配方法

    公开(公告)号:CN116186562A

    公开(公告)日:2023-05-30

    申请号:CN202310466350.6

    申请日:2023-04-27

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于编码器的长文本匹配方法,包括获取现有的文档数据集;提取关键句;构建匹配数据集;构建长文本匹配初始模型;采用匹配数据集训练长文本匹配初始模型得到长文本匹配模型;采用长文本匹配模型进行实际的长文本对的匹配判定。本发明通过关键句提取方案和文本匹配框架,不仅能够更好地提取输入的长文本的关键信息,而且融合了交叉编码器和双编码器各自的优势,在长文本匹配任务中表现优异,尤其是在匹配描述同一事件的长文本时具有更高的准确性和鲁棒性;而且本发明的可靠性高、精确性好且效率较高。

    基于图卷积的长文本匹配方法

    公开(公告)号:CN116304749B

    公开(公告)日:2023-08-15

    申请号:CN202310565214.2

    申请日:2023-05-19

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于图卷积的长文本匹配方法,包括获取现有的长文本数据集;构建关键词图;获取节点的网络特征向量和概率统计特征,得到各个节点的初始特征表示;构建语义超图;构建长文本匹配模型;采用长文本数据集及得到的结果训练长文本匹配模型得到训练后的长文本匹配模型;采用训练后的长文本匹配模型进行实际的长文本匹配。本发明不仅实现了长文本的匹配,而且简化了任务难度,实现了文本对之间细粒度的语义对齐,实现了对匹配信号更准确的语义划分,保证了训练过程中超边节点间的特征相似性,可靠性高、精确性好且客观科学。

    基于知识增强的胸部X光图像分类方法及成像方法

    公开(公告)号:CN116543208A

    公开(公告)日:2023-08-04

    申请号:CN202310502016.1

    申请日:2023-05-06

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于知识增强的胸部X光图像分类方法,包括获取基准数据集,构造知识图谱;针对构造的知识图谱进行节点类型区分和节点关系建模处理;基于获取的数据集构建局部分类器,针对处理后的知识图谱进行局部分类处理;基于获取的数据集和局部分类器,构建全局分类器,并针对处理后的知识图谱进行全局分类处理;采用训练后的全局分类器,完成对实际输入X光图像的分类处理;本发明还公开了包括所述基于知识增强的胸部X光图像分类方法的成像方法。本发明方法通过基于胸部X光数据集,创建KG知识图谱,将现有知识融入建立的模型中,有效的改善胸部X光局部分类和全局分类的分类效果;同时本发明的有效性高、精准度提升、泛化性增强。

    一种基于文本分割的再入院预测方法

    公开(公告)号:CN113192630A

    公开(公告)日:2021-07-30

    申请号:CN202110503150.4

    申请日:2021-05-10

    Applicant: 中南大学

    Inventor: 刘叶 段俊文

    Abstract: 本发明公开了一种基于文本分割的再入院预测方法。本发明方法从深度学习方法存在医疗文本输入长度限制以及现有再入院方法没有考虑文本中不同内容的影响等问题出发,对医学文本进行分割,将分割得到的医疗文本段作为输入,同时考虑了诊断编码以及不同文本段的内容对预测的影响。该方法首先对每一个文本段进行表示学习,得到每一部分的向量表征;随后利用Attention机制给对应文本段的向量表征赋权值,通过加权组合得到文本整体特征表示;最后通过全连接层预测再入院可能性。该方法利用文本中不同内容的重要性提高了模型的预测性能,并通过可视化的方式解释了预测结果。

    一种基于双仿射的生物医学文档结构化方法

    公开(公告)号:CN116595179A

    公开(公告)日:2023-08-15

    申请号:CN202310609957.5

    申请日:2023-05-26

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于双仿射的生物医学文档结构化方法,包括获取生物医学文档数据集,并针对数据集进行数据预处理;采用预处理后的数据,通过双仿射方法构建生物医学文档分类初步模型;采用构建的初步模型,通过对抗训练完成初步模型的参数更新,构建最终的文档分类模型;采用构建的最终文档分类模型,完成生物医学文档的分类结构化处理;本发明通过双放射直接计算出每个跨度的分类分数,能够降低模型的时间开销;而且本发明的分类效率提升、分类准确度增加。

    基于编码器的长文本匹配方法

    公开(公告)号:CN116186562B

    公开(公告)日:2023-07-21

    申请号:CN202310466350.6

    申请日:2023-04-27

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于编码器的长文本匹配方法,包括获取现有的文档数据集;提取关键句;构建匹配数据集;构建长文本匹配初始模型;采用匹配数据集训练长文本匹配初始模型得到长文本匹配模型;采用长文本匹配模型进行实际的长文本对的匹配判定。本发明通过关键句提取方案和文本匹配框架,不仅能够更好地提取输入的长文本的关键信息,而且融合了交叉编码器和双编码器各自的优势,在长文本匹配任务中表现优异,尤其是在匹配描述同一事件的长文本时具有更高的准确性和鲁棒性;而且本发明的可靠性高、精确性好且效率较高。

    一种基于语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质

    公开(公告)号:CN113157907B

    公开(公告)日:2022-05-03

    申请号:CN202110279942.8

    申请日:2021-03-16

    Applicant: 中南大学

    Abstract: 本发明公开了一种语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质,所述方法包括:步骤1:将待处理的文档中句子的单词编码成词向量,并针对每个句子,利用Bi‑LSTM模型以及自注意力机制构建句子编码器得到句子向量;步骤2:针对待处理的文档,利用Bi‑LSTM模型以及自注意力机制构建篇章编码器得到篇章向量;步骤3:基于所述篇章向量对句子进行分类得到候选句子;步骤4:将候选句子输入基于RST构建的摘要提取器提取出核心EDU,并将所有候选句子的核心EDU拼接为文本摘要;其中,将候选句子分割为文档单元,再利用文本单元构成语篇结构的层次树,层次树的叶子节点EDU表示被分割的文档单元。本发明引入自注意力机制以及语篇结构提高了摘要提取的准确性。

    基于稀疏网络的生物医疗命名实体识别方法

    公开(公告)号:CN115293164A

    公开(公告)日:2022-11-04

    申请号:CN202210961613.6

    申请日:2022-08-11

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于稀疏网络的生物医疗命名实体识别方法,包括获取文本数据;构建初始模型;采用所有任务的数据对初始模型进行训练,构建一个共享的稀疏子网络,为每个任务构建一个私有的稀疏子网络;进行对抗训练得到识别模型;采用识别模型对当前的文本进行识别,完成生物医疗命名实体识别。本发明提供的这种基于稀疏网络的生物医疗命名实体识别方法,通过创新的模型构建和训练过程,不仅实现了生物医疗命名实体的识别,而且本发明方法能够提高模型参数的利用效率,可靠性高、精确性好且效果较好。

    基于Xlnet模型的类案检索方法、系统及设备

    公开(公告)号:CN114490946A

    公开(公告)日:2022-05-13

    申请号:CN202210142076.2

    申请日:2022-02-16

    Applicant: 中南大学

    Abstract: 本公开实施例中提供了一种基于Xlnet模型的类案检索方法、系统及设备,属于数据处理技术领域,具体包括:将目标案件文本与案件检索数据库内的文本进行预处理;根据预设算法计算预处理后的目标案件文本与案件检索数据库内文本的案件文本相似度特征,以及,利用Xlnet模型提取语义特征;将案件文本相似度特征与语义特征融合后输入全连接神经网络,输出检索结果。通过本公开的方案,对案件文本数据预处理时进行数据清洗,使原始数据包含的信息更加规范精确,然后计算案件文本相似度特征,以及,利用Xlnet模型将文本转为词向量,得到语义特征并进行融合,输入全连接神经网络得到检索结果,提高了类案检索的效率、精准度和适应性。

Patent Agency Ranking