摘要提取和摘要抽取模型训练方法及相关装置、存储介质

    公开(公告)号:CN111241267A

    公开(公告)日:2020-06-05

    申请号:CN202010025465.8

    申请日:2020-01-10

    Abstract: 本申请公开了一种摘要提取和摘要抽取模型训练方法及相关装置、存储介质,其中,摘要提取方法包括:对文本进行分句得到句子列表,按照预设长度对句子列表按照顺序进行窗口划分得到多个窗口,且预设长度为摘要抽取模型支持的最大序列长度,每个窗口包括多个连续的句子且长度小于或等于预设长度,相邻的两个窗口包括至少一个相同的句子,利用摘要抽取模型分别对每个窗口进行预测,得到每个窗口中每个句子的重要性得分,利用每个窗口中每个句子的重要性得分确定文本中每个句子的重要性得分,选择按重要性得分从高到低排序靠前的至少一个句子作为文本的摘要。上述方案,能够提高摘要提取的质量。

    摘要提取和摘要抽取模型训练方法及相关装置、存储介质

    公开(公告)号:CN111241267B

    公开(公告)日:2022-12-06

    申请号:CN202010025465.8

    申请日:2020-01-10

    Abstract: 本申请公开了一种摘要提取和摘要抽取模型训练方法及相关装置、存储介质,其中,摘要提取方法包括:对文本进行分句得到句子列表,按照预设长度对句子列表按照顺序进行窗口划分得到多个窗口,且预设长度为摘要抽取模型支持的最大序列长度,每个窗口包括多个连续的句子且长度小于或等于预设长度,相邻的两个窗口包括至少一个相同的句子,利用摘要抽取模型分别对每个窗口进行预测,得到每个窗口中每个句子的重要性得分,利用每个窗口中每个句子的重要性得分确定文本中每个句子的重要性得分,选择按重要性得分从高到低排序靠前的至少一个句子作为文本的摘要。上述方案,能够提高摘要提取的质量。

    实体链接的方法、装置、电子设备和存储介质

    公开(公告)号:CN114969358A

    公开(公告)日:2022-08-30

    申请号:CN202210499774.8

    申请日:2022-05-09

    Abstract: 本申请提出一种实体链接的方法、装置、电子设备和存储介质,方法包括分别计算待链接实体与实体库中的各个候选实体的字相似度、词相似度和语义相似度;根据待链接实体与各个候选实体的字相似度、词相似度和语义相似度,确定待链接实体与各个候选实体的实体相似度;将与待链接实体的实体相似度最高的候选实体,确定为与待链接实体对应的链接实体,本申请能够从字相似度、词相似度和语义相似度三个维度确定待链接实体与候选实体的实体相似度,有效提高短文本的相似度计算的准确率,满足短文本实体链接需求。

Patent Agency Ranking