一种主题约束表示的关键词抽取方法及装置

    公开(公告)号:CN115687576B

    公开(公告)日:2023-04-07

    申请号:CN202211706894.7

    申请日:2022-12-29

    Applicant: 安徽大学

    Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。

    一种主题约束表示的关键词抽取方法及装置

    公开(公告)号:CN115687576A

    公开(公告)日:2023-02-03

    申请号:CN202211706894.7

    申请日:2022-12-29

    Applicant: 安徽大学

    Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。

    基于序列级前缀提示的生成式文本摘要方法和装置

    公开(公告)号:CN115965033A

    公开(公告)日:2023-04-14

    申请号:CN202310253057.1

    申请日:2023-03-16

    Applicant: 安徽大学

    Abstract: 本申请提出一种基于序列级前缀提示的生成式文本摘要方法和装置,该方法包括:获取文本和文本的参考摘要进行预处理;将经过预处理的文本输入第一预训练模型生成多条候选摘要,根据参考摘要使用Rouge指标对生成的候选摘要进行评估得到Rouge分值,并对多条候选摘要进行排序;对排序后的多条候选摘要进行预处理,根据经过预处理的文本、参考摘要和多条候选摘要利用多损失联合调优方式对摘要生成模型进行训练,得到具有序列级前缀提示的摘要生成模型;获取待处理文本进行预处理,并输入具有序列级前缀提示的摘要生成模型,通过序列级前缀提示以自回归方式生成待处理文本的摘要。本申请能够加快摘要生成模型训练过程并大大降低计算量,同时更准确生成摘要。

    基于序列级前缀提示的生成式文本摘要方法和装置

    公开(公告)号:CN115965033B

    公开(公告)日:2023-07-11

    申请号:CN202310253057.1

    申请日:2023-03-16

    Applicant: 安徽大学

    Abstract: 本申请提出一种基于序列级前缀提示的生成式文本摘要方法和装置,该方法包括:获取文本和文本的参考摘要进行预处理;将经过预处理的文本输入第一预训练模型生成多条候选摘要,根据参考摘要使用Rouge指标对生成的候选摘要进行评估得到Rouge分值,并对多条候选摘要进行排序;对排序后的多条候选摘要进行预处理,根据经过预处理的文本、参考摘要和多条候选摘要利用多损失联合调优方式对摘要生成模型进行训练,得到具有序列级前缀提示的摘要生成模型;获取待处理文本进行预处理,并输入具有序列级前缀提示的摘要生成模型,通过序列级前缀提示以自回归方式生成待处理文本的摘要。本申请能够加快摘要生成模型训练过程并大大降低计算量,同时更准确生成摘要。

Patent Agency Ranking