标点预测方法及装置
    1.
    发明授权

    公开(公告)号:CN111241810B

    公开(公告)日:2023-08-01

    申请号:CN202010046714.1

    申请日:2020-01-16

    Inventor: 梁鸣心 付晓寅

    Abstract: 本申请公开了标点预测方法及装置,涉及文本标注技术领域。具体实现方案为:获取待预测的文本;将文本输入预设的序列标注模型,获取文本中各个字符对应的第一标点预测结果;第一标点预测结果包括:至少一种预测结果,以及每种预测结果对应的第一得分;针对文本中的每个字符,针对字符的每种预测结果,结合文本以及预测结果,生成预测结果对应的待输入文本;将待输入文本输入预设的语言模型,得到预测结果对应的第二得分;结合字符的各种预测结果对应的第一得分和第二得分,确定字符的标点存在情况;结合文本中各个字符的标点存在情况,对文本进行标点处理,得到文本对应的标点文本,从而能够综合序列标注模型和语言模型的优点,提高标点预测效率。

    标点预测方法及装置
    2.
    发明公开

    公开(公告)号:CN111241810A

    公开(公告)日:2020-06-05

    申请号:CN202010046714.1

    申请日:2020-01-16

    Inventor: 梁鸣心 付晓寅

    Abstract: 本申请公开了标点预测方法及装置,涉及文本标注技术领域。具体实现方案为:获取待预测的文本;将文本输入预设的序列标注模型,获取文本中各个字符对应的第一标点预测结果;第一标点预测结果包括:至少一种预测结果,以及每种预测结果对应的第一得分;针对文本中的每个字符,针对字符的每种预测结果,结合文本以及预测结果,生成预测结果对应的待输入文本;将待输入文本输入预设的语言模型,得到预测结果对应的第二得分;结合字符的各种预测结果对应的第一得分和第二得分,确定字符的标点存在情况;结合文本中各个字符的标点存在情况,对文本进行标点处理,得到文本对应的标点文本,从而能够综合序列标注模型和语言模型的优点,提高标点预测效率。

    基于截断注意力的实时语音识别的方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN111429889B

    公开(公告)日:2023-04-28

    申请号:CN201910016861.1

    申请日:2019-01-08

    Abstract: 本公开提供了一种基于截断注意力的实时语音识别的方法、装置、设备以及计算机可读存储介质。方法包括获得用于截断输入的语音信号的特征序列的截断信息,然后基于截断信息来将特征序列截断成多个子序列。方法还包括针对每个子序列,通过注意力机制来获得实时识别结果。本公开的实施例通过在传统的注意力模型中引入根据语音信号而确定的截断信息,能够指导注意力模型针对每个截断分别进行注意力建模,不仅能够实现实时的语音识别,而且能够保证很高的识别准确率。此外,可选地,本公开的一些实施例所提出的双头结构能够保证实时语音识别过程的计算量较小,本公开的一些实施例所提出的多级注意力结构能够进一步提升语音识别的准确率。

    基于截断注意力的实时语音识别的方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN111429889A

    公开(公告)日:2020-07-17

    申请号:CN201910016861.1

    申请日:2019-01-08

    Abstract: 本公开提供了一种基于截断注意力的实时语音识别的方法、装置、设备以及计算机可读存储介质。方法包括获得用于截断输入的语音信号的特征序列的截断信息,然后基于截断信息来将特征序列截断成多个子序列。方法还包括针对每个子序列,通过注意力机制来获得实时识别结果。本公开的实施例通过在传统的注意力模型中引入根据语音信号而确定的截断信息,能够指导注意力模型针对每个截断分别进行注意力建模,不仅能够实现实时的语音识别,而且能够保证很高的识别准确率。此外,可选地,本公开的一些实施例所提出的双头结构能够保证实时语音识别过程的计算量较小,本公开的一些实施例所提出的多级注意力结构能够进一步提升语音识别的准确率。

Patent Agency Ranking