-
公开(公告)号:CN114969358A
公开(公告)日:2022-08-30
申请号:CN202210499774.8
申请日:2022-05-09
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06F40/279 , G06F40/30 , G06K9/62
Abstract: 本申请提出一种实体链接的方法、装置、电子设备和存储介质,方法包括分别计算待链接实体与实体库中的各个候选实体的字相似度、词相似度和语义相似度;根据待链接实体与各个候选实体的字相似度、词相似度和语义相似度,确定待链接实体与各个候选实体的实体相似度;将与待链接实体的实体相似度最高的候选实体,确定为与待链接实体对应的链接实体,本申请能够从字相似度、词相似度和语义相似度三个维度确定待链接实体与候选实体的实体相似度,有效提高短文本的相似度计算的准确率,满足短文本实体链接需求。
-
公开(公告)号:CN112527992B
公开(公告)日:2023-01-17
申请号:CN202011492809.2
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/34
Abstract: 本申请公开了一种长文本处理方法、相关设备及可读存储介质,对于长度大于预设长度的长文本,可以基于预置的文本处理模型的处理类型,将该长文本分割成多个文本片段,每个文本片段的长度不超过该文本处理模型所能处理最大文本的长度,然后针对文本片段,利用该文本处理模型进行处理,得到该文本片段对应的处理结果,最后基于各个文本片段对应的处理结果,即可得到与该长文本对应的处理结果。上述方案中,通过基于文本处理模型所能处理最大文本的长度,将长文本的处理转化为对多个短文本的处理,基于多个短文本的处理结果得到长文本的处理结果的方式,从而实现了基于文本处理模型对长文本的处理。
-
公开(公告)号:CN112527992A
公开(公告)日:2021-03-19
申请号:CN202011492809.2
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/34
Abstract: 本申请公开了一种长文本处理方法、相关设备及可读存储介质,对于长度大于预设长度的长文本,可以基于预置的文本处理模型的处理类型,将该长文本分割成多个文本片段,每个文本片段的长度不超过该文本处理模型所能处理最大文本的长度,然后针对文本片段,利用该文本处理模型进行处理,得到该文本片段对应的处理结果,最后基于各个文本片段对应的处理结果,即可得到与该长文本对应的处理结果。上述方案中,通过基于文本处理模型所能处理最大文本的长度,将长文本的处理转化为对多个短文本的处理,基于多个短文本的处理结果得到长文本的处理结果的方式,从而实现了基于文本处理模型对长文本的处理。
-
-