-
公开(公告)号:CN117935768A
公开(公告)日:2024-04-26
申请号:CN202211304557.5
申请日:2022-10-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L13/08 , G10L13/027 , G10L25/18
Abstract: 本公开提供了一种由电子设备执行的方法,包括:获取待处理的数据;基于与目标说话人对应的注册数据来提取目标说话人的口音表示;以及基于所提取的口音表示,将待处理的数据生成与目标说话人对应的语音。多个模块中的至少一个可以通过AI模型来实现。可以通过非易失性存储器、易失性存储器和处理器来执行与AI相关联的功能。
-
公开(公告)号:CN110751260B
公开(公告)日:2024-08-20
申请号:CN201810822023.9
申请日:2018-07-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06N3/045 , G06N3/0464 , G06N3/044 , G06N3/084 , G06N3/09 , G06N3/096 , G06F40/279 , G06V40/16 , G06V10/82 , G10L25/18 , G10L25/30 , G10L25/63
Abstract: 本申请实施例提供了一种电子设备、任务处理的方法以及训练神经网络的方法。该方法包括:获取任务对应的输入数据,然后通过任务对应的各神经网络,分别对输入数据进行相应处理,然后基于各神经网络的处理结果以及任务对应的神经网络权重信息,确定任务对应的处理结果。本申请实施例实现了降低神经网络的计算成本以及存储成本,进而降低任务的处理复杂度。
-
公开(公告)号:CN113628612A
公开(公告)日:2021-11-09
申请号:CN202110292651.2
申请日:2021-03-18
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种语音识别方法、装置、电子设备及计算机可读存储介质,涉及信号处理技术领域。该方法包括:获取待处理的语音片段;基于识别网络对语音片段进行识别;基于识别网络提取所述语音片段的特征图,并对所提取的特征图进行分类,得到所述语音片段包含关键词的概率。本申请实施例提供的语音识别方法可以有效减少识别过程中的运算量,提高识别效率。本申请实施例提供的语音识别方法、装置、电子设备及计算机可读存储介质可以由人工智能(Artificial Intelligence,AI)模型实现。
-
公开(公告)号:CN110751260A
公开(公告)日:2020-02-04
申请号:CN201810822023.9
申请日:2018-07-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种电子设备、任务处理的方法以及训练神经网络的方法。该方法包括:获取任务对应的输入数据,然后通过任务对应的各神经网络,分别对输入数据进行相应处理,然后基于各神经网络的处理结果以及任务对应的神经网络权重信息,确定任务对应的处理结果。本申请实施例实现了降低神经网络的计算成本以及存储成本,进而降低任务的处理复杂度。
-
公开(公告)号:CN117524263A
公开(公告)日:2024-02-06
申请号:CN202210887903.0
申请日:2022-07-26
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种数据处理方法、设备唤醒方法、电子设备及存储介质,该方法中,待处理语音被转换成关键词音素序列,采用相似发音序列生成器,以序列生成的方式获得关键词音素序列对应的相似音素序列,从而得到待处理语音对应的第一数据处理结果。通过这种生成的方式来替代大规模的语音数据库的搜索方式,用较小的模型,便可实现对现实生活中可能出现的声音进行有效覆盖,从而提升区分易混淆发音的能力。其中,由电子设备执行的上述数据处理方法可以使用人工智能模型来执行。
-
公开(公告)号:CN115512684A
公开(公告)日:2022-12-23
申请号:CN202110696106.X
申请日:2021-06-23
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L13/04 , G10L13/033 , G10L25/48
Abstract: 提供一种音频处理模型的训练方法及装置、音频处理方法及装置。该音频处理模型的训练方法包括:对训练数据进行特征提取,得到训练数据的特征;基于训练数据的特征预测训练数据的颤音程度,得到训练数据的预测颤音程度;基于训练数据的预测颤音程度预测训练数据的基频,得到训练数据的预测基频;基于训练数据的预测颤音程度和预测基频以及训练数据的真实颤音程度和真实基频对音频处理模型进行训练。该音频处理方法包括:提取音频数据的特征;基于音频数据的特征预测音频数据的颤音程度;基于音频数据的颤音程度预测音频数据的基频;基于音频数据的基频对音频数据进行处理。通过使用该音频处理方法及装置,可提高音频处理的效果。
-
公开(公告)号:CN115132175A
公开(公告)日:2022-09-30
申请号:CN202110736466.8
申请日:2021-06-30
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种语音识别方法、装置、电子设备及计算机可读存储介质,方法包括:获取待识别语音的第一语音识别结果;获取第一语音识别结果中目标文本单元的上下文信息和发音特征信息;基于上下文信息和发音特征信息,获取待识别语音的第二语音识别结果,其中该方案中多个步骤可以通过人工智能方法实现。该方案在修正语音识别结果的错误时,由于结合了目标文本单元的上下文信息和发音特征信息,使得修正过程中可以覆盖更多的错误类型,且修正结果准确性高。
-
-
-
-
-
-