-
公开(公告)号:CN115249018A
公开(公告)日:2022-10-28
申请号:CN202111582918.8
申请日:2021-12-22
Applicant: 华为云计算技术有限公司
IPC: G06F40/30 , G06F40/253 , G06K9/62 , G06N3/08 , G06N5/04
Abstract: 本申请提供了一种语料标注方法,语料标注装置获取用户通过客户端提供的语料集合,该语料集合包括用户期望被标注的多种语义类别的语料,并确定语料集合中属于目标语义类别的人工标注语料以及自动标注语料,并获取针对该人工标注语料的人工标注结果,从而根据该人工标注语料的人工标注结果,对自动标注语料进行自动标注,该人工标注结果以及自动标注语料对应的自动标注结果用于作为训练数据对推理模型进行训练。如此,通过对部分语料进行自动标注,可以提高生成标注语料的效率、降低人力成本,同时,领域专家可以仅需对每一语义类别下的少量语料进行人工标注,从而可以减少人工标注的语料数量。此外,本申请还提供了对应的装置及相关设备。