-
公开(公告)号:CN117034863A
公开(公告)日:2023-11-10
申请号:CN202311148797.5
申请日:2023-09-06
Applicant: 科大讯飞股份有限公司
IPC: G06F40/117 , G06F40/30 , G06F18/214
Abstract: 本申请公开了一种标点预测方法、装置、设备及存储介质,获取待标注文本的向量表示送入预训练的标点预测模型,模型采用注意力机制针对输入的向量表示进行特征提取,并基于提取的特征预测待标注文本中标点所在位置及标点类型。本申请设计了一种位置编码机制,使得模型在基于注意力机制提取特征时,按照各文本单元间的相对距离与影响程度呈负相关的关系,确定各文本单元的相对位置编码,并利用相对位置编码对各文本单元的注意力权重进行偏移处理,使得模型建模了文本单元之间的相对位置关系,能够进一步提高标点预测的准确度。
-
公开(公告)号:CN116052672A
公开(公告)日:2023-05-02
申请号:CN202211529976.9
申请日:2022-11-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种标点预测方法、装置、设备及存储介质,其中,方法包括:每当语音识别系统对目标语音中一语音段进行识别输出一识别结果时,获取识别结果作为目标文本;获取目标文本中每个词的局部上下文信息,并基于目标文本中每个词的局部上下文信息,预测目标文本中的标点,得到的预测结果作为目标文本的初步标点预测结果;基于目标文本的识别结果属性以及目标文本的初步标点预测结果,确定目标文本的最终标点预测结果。采用本发明提供的标点预测方法对目标文本进行标点预测,能够获得较为准确且稳定的标点预测结果,且本发明提供的标点预测方法预测效率较高,用户体验较好。
-