-
公开(公告)号:CN115758168A
公开(公告)日:2023-03-07
申请号:CN202211415096.9
申请日:2022-11-11
Applicant: 安徽讯飞医疗股份有限公司 , 安徽讯飞医疗股份有限公司武汉分公司
IPC: G06F18/22 , G06F18/214 , G06F40/295 , G06F40/30
Abstract: 本发明提供一种术语的标准化方法、装置、设备以及计算机可读介质,该方法通过获取原术语,将原术语输入至目标语言表征模型中,由目标语言表征模型得到并输出原术语的词向量;目标语言表征模型通过多个术语三元组对初始语言表征模型进行对比学习训练后得到;术语三元组包括:术语样本、正样本以及负样本,根据原术语的词向量和标准术语的词向量,计算得到原术语和标准术语之间的相似度,然后将与原术语之间的相似度最高的标准术语,确定为与原术语相匹配的标准术语。由于目标语言表征模型通过多个术语三元组对比学习得到,提高了匹配标准术语的准确度,避免了将与原术语的文本重合程度高、但实际却不相匹配的标准术语确定为相匹配的标准术语。