语种无关的关键词识别方法及系统

    公开(公告)号:CN103559881B

    公开(公告)日:2016-08-31

    申请号:CN201310553073.9

    申请日:2013-11-08

    Abstract: 本发明公开了一种语种无关的关键词识别方法及系统,该方法包括:接收待检测语音信号;根据预先构建的解码网络对所述语音信号解码,得到候选关键词;采用不同方式对所述候选关键词进行置信度评价;对不同方式的置信度评价结果进行融合,得到所述候选关键词的有效置信度;根据所述有效置信度确定输出的关键词。

    有监督数据构建方法、装置、电子设备和存储介质

    公开(公告)号:CN119830987A

    公开(公告)日:2025-04-15

    申请号:CN202411882981.7

    申请日:2024-12-19

    Abstract: 本发明提供一种有监督数据构建方法、装置、电子设备和存储介质,其中方法包括:获取有监督任务的任务描述文本、种子指令和输入数据;基于任务描述文本,对种子指令进行指令扩写,得到扩写指令;基于输入数据,对扩写指令进行指令泛化,得到任务指令;将任务指令输入到问答模型中,得到问答模型输出的任务指令的输出数据;基于任务指令和输出数据,构建有监督数据。本发明提供的方法、装置、电子设备和存储介质,通过自动化的指令优化,大大降低了模型合成方式的使用门槛,且仅需输入任务描述文本,即可保证有监督数据和有监督任务的贴合度,有效保证了有监督数据构建的通用性,实现了有监督数据的构建效率和数据质量的均衡优化。

    一种语音识别方法、装置、设备及存储介质

    公开(公告)号:CN113724713B

    公开(公告)日:2024-07-05

    申请号:CN202111042821.8

    申请日:2021-09-07

    Inventor: 方昕 刘俊华

    Abstract: 本申请提供了一种语音识别方法、装置、设备及存储介质,其中,方法包括:获取目标混合语音的语音特征以及指定说话人的说话人特征;以趋于目标语音特征为提取方向,根据目标混合语音的语音特征以及目标说话人的说话人特征,从目标混合语音的语音特征中提取目标说话人的语音特征,以得到目标说话人的提取语音特征,其中,目标语音特征为用于获得与目标说话人的真实语音内容一致的语音识别结果的语音特征;根据指定说话人的提取语音特征,获取指定说话人的语音识别结果。经由本申请提供的语音识别方法可从包含指定说话人语音的混合语音中较为准确的识别出指定说话人的语音内容,用户体验较好。

    语音处理方法、装置、设备及存储介质

    公开(公告)号:CN112735392B

    公开(公告)日:2024-04-16

    申请号:CN202011634031.4

    申请日:2020-12-31

    Abstract: 本申请实施例公开了一种语音处理方法、装置、设备及存储介质,通过对用于解码文本单元的权重序列进行改进,使得每一文本单元对应的权重序列与各语音帧的时间信息的关联关系趋近于目标函数关系,由于每一文本单元对应的目标函数关系表示,该文本单元与各个语音帧的时间信息的关联度,与各个语音帧的时间信息间的关联关系,这就使得,利用权重序列进行解码得到的文本单元与语音帧的时间信息是强相关的,因此,利用各个语音帧的时间信息,以及各文本单元对应的目标函数能够准确实现语音帧的时间信息与文本单元的对应关系,也就是将语音帧的时间信息与文本单元准确对齐,从而提高了将语音识别结果与音频对齐的准确率。

    翻译质量评估方法、装置、电子设备和存储介质

    公开(公告)号:CN113609875B

    公开(公告)日:2024-02-20

    申请号:CN202110901225.4

    申请日:2021-08-06

    Abstract: 本发明提供一种翻译质量评估方法、装置、电子设备和存储介质,其中方法包括:确定原文文本及其对应的待评估译文文本;对所述待评估译文文本进行句级别翻译质量评估,得到句级评估结果;所述句级评估结果包括所述待评估译文文本的语义忠实度和/或语义流利度;对所述待评估译文文本进行词级别翻译质量评估,得到词级评估结果;所述词级评估结果包括所述待评估译文文本中各个分词的翻译准确度和/或对齐匹配度;基于所述句级评估结果和所述词级评估结果,确定所述待评估译文文本的质量评估结果。本发明提高了翻译质量评估的准确性。

    事件抽取方法、系统以及设备

    公开(公告)号:CN113111649B

    公开(公告)日:2024-02-20

    申请号:CN202110396979.9

    申请日:2021-04-13

    Abstract: 本发明公开了一种事件抽取方法,包括:依据至少一个预设的参数类型对待抽取文本进行第一参数抽取,获得第一参数信息;若第一参数信息的数量大于两个,则依据所有第一参数信息获得第一抽取结果,并将第一抽取结果作为事件抽取结果,其中,第一抽取结果包括至少一个参数信息组合;本发明还公开了基于上述方法的系统以及设备。本发明通过独立的参数抽取避免了触发词抽取对参数抽取带来的级联误差,提高了事件抽取的准确性和效率。

    语音识别方法、装置、设备以及计算机可读介质

    公开(公告)号:CN116994591A

    公开(公告)日:2023-11-03

    申请号:CN202311130675.3

    申请日:2023-09-04

    Abstract: 本发明提供一种语音识别方法、装置、设备以及计算机可读介质,该方法通过获取语音信号;将语音信号输入到初始系统的预训练模型中,由预训练模型将语音信号转化为语音表示向量;将语音表示向量输入至初始系统中的说话人识别模型,得到嵌入向量;将语音表示向量输入至初始系统的语音识别模型中,由语音识别模型对嵌入向量和语音表示向量进行融合处理,得到融合特征向量;根据融合特征向量和实际的语音识别结果对初始系统中的模型进行训练,得到语音识别系统。由于嵌入向量是通过语音表示向量得到的,因此嵌入向量和语音表示向量的融合不存在特征不匹配现象,进而提升了训练出的语音识别系统的准确性。

    一种信息分类方法及装置、信息分类模型训练方法及装置

    公开(公告)号:CN113178189B

    公开(公告)日:2023-10-27

    申请号:CN202110461596.5

    申请日:2021-04-27

    Abstract: 本发明提供了一种信息分类方法和装置、信息分类模型的训练方法和装置。首先对第一模型进行训练。在训练过程中,对第一模型的第一参数进行迭代的第一调整和迭代的第二调整。其中,第一调整的每次迭代包括该迭代的第二调整,第二调整的每次迭代基于第一模型对第一样本集的处理,第一调整的每次迭代基于经迭代的第二调整的第一模型对第二样本集的处理。其中,第一样本集包含一个或多个第一样本,第二样本集包含一个或多个第二样本,各第二样本均具有对应的第一原始标签,该第一原始标签用于表征第二样本的类别。然后,调用已训练的第一模型处理待分类样本得到其第一特征,调用第二模型处理第一特征,以得到待分类样本的第一标签。

    一种翻译质量评价方法及装置

    公开(公告)号:CN109062912B

    公开(公告)日:2023-07-28

    申请号:CN201810898744.8

    申请日:2018-08-08

    Abstract: 本申请公开了一种翻译质量评价方法及装置,该方法包括:在获取到对给定文本进行正确翻译后的参考翻译文本后,将其按照预设文本单位进行切分,得到各个参考单位文本,然后确定每一参考单位文本在该参考翻译文本中的重要度,接着,关于对给定文本进行翻译后的待评价文本即目标翻译文本,便可以根据每一参考单位文本对应的重要度,确定出目标翻译文本的翻译质量。可见,本申请不再只进行目标翻译文本与参考翻译文本中词语的遍历式匹配,而是根据该参考翻译文本中每一参考单位文本对应的重要度,确定出目标翻译文本的翻译质量,即,在进行翻译质量评价时考虑了参考翻译文本中每一词语本身的内容,从而提高了翻译质量评价结果的可信度。

Patent Agency Ranking