-
公开(公告)号:CN112800775A
公开(公告)日:2021-05-14
申请号:CN202110117912.7
申请日:2021-01-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/284
Abstract: 本申请公开了一种语义理解方法、装置、设备及存储介质,本申请对于待理解文本,在其所属场景下的各类型实体词中获取与待理解文本相匹配的实体词,以及获取待理解文本所属语种的语种特征,基于待理解文本与匹配实体词确定融合文本,基于融合文本及语种特征,确定待理解文本的语义理解结果。本申请能够针对不同语种、不同场景下的待理解文本进行语义的理解,并且过程中考虑待理解文本所属语种,能够区分不同语种特性,保障对各种不同语种的待理解文本的语义理解效果。同时,通过引入待理解文本所属语种及场景下的匹配实体词,使得本申请的语义理解方案能够适用于对不同语种、不同场景下待理解文本的语义理解,提升待理解文本的语义理解准确度。
-
公开(公告)号:CN112507718A
公开(公告)日:2021-03-16
申请号:CN202011487631.2
申请日:2020-12-16
Applicant: 科大讯飞股份有限公司
IPC: G06F40/295 , G06F16/33
Abstract: 本申请提供了一种跨语种实体标注方法、装置、设备及存储介质,方法包括:获取标注出实体词的源语种文本和对应的目标语种文本,根据源语种文本和目标语种文本获取正样例集、负样例集和候选数据集,正样例集中的每个正样例表征源语种文本中的一个实体词,负样例集中的每个负样例表征源语种文本中的一个非实体词,候选数据集中的每个候选数据表征目标语种文本中的一个候选实体词,通过将候选数据集中的候选数据与正样例集和负样例集中的样例匹配,从候选数据集中的候选数据所表征的候选实体词中确定出实体词,并对确定出的实体词进行标注。本申请可从目标语种文本中标注出实体词,且标注过程不需要人工参与,具有较高的标注效率和标注质量。
-