一种语音识别方法、装置和电子设备

    公开(公告)号:CN117809627A

    公开(公告)日:2024-04-02

    申请号:CN202311022913.9

    申请日:2023-08-14

    Inventor: 马志强

    Abstract: 本公开涉及人机交互技术领域,尤其涉及一种语音识别方法、装置和电子设备,用于解决如何提升电子设备的语音识别的准确率的问题。该方法包括:获取电子设备发送的待识别音频流;对待识别音频流的音频特征进行识别,得到待识别音频流对应的声学特征,以及声学特征对应的实际得分;对声学特征进行预测,确定包含声学特征的至少一个理论文本;基于理论文本查询用户账号对应的用户实体字典,得到理论文本中包含的实体词的配置信息,以及用户实体字典中的最小词频;基于当前时刻、实际得分、配置信息和最小词频,确定每个理论文本的理论得分;基于理论得分,确定待识别音频流的实际识别结果为最大的理论得分对应的理论文本。

    一种语音识别方法、装置和电子设备

    公开(公告)号:CN117809626A

    公开(公告)日:2024-04-02

    申请号:CN202311020425.4

    申请日:2023-08-14

    Inventor: 马志强

    Abstract: 本公开涉及人机交互技术领域,尤其涉及一种语音识别方法、装置和电子设备,用于解决如何提升电子设备的语音识别的准确率的问题。该方法包括:基于待识别音频数据实际得分、待识别音频数据实际长度、待识别音频数据预测长度、待识别音频数据理论长度和待识别音频数据理论得分五者,得到每个待识别音频数据候选识别结果的融合得分;基于待识别音频数据融合得分,确定待识别音频数据候选识别结果的实际识别结果。

    一种语音识别方法、装置和电子设备

    公开(公告)号:CN117809623A

    公开(公告)日:2024-04-02

    申请号:CN202311210860.3

    申请日:2023-09-19

    Inventor: 马志强

    Abstract: 本公开涉及语音识别技术领域,尤其涉及一种语音识别方法、装置和电子设备,用于解决如何提升电子设备的语音识别的准确率的问题。该方法包括:接收待识别语音数据;对待识别语音数据进行识别,得到待识别语音数据对应的目标识别结果,以及目标识别结果的识别得分;对背景语音数据和待识别语音数据进行匹配,得到待识别语音数据和背景语音数据之间的匹配得分;基于识别得分和匹配得分,得到融合得分;基于融合得分,确定目标识别结果的提示状态;按照提示状态,生成提示信息。其中,提示信息包括目标识别结果和融合得分小于第一阈值的目标识别结果中的任一项。

    标点预测方法、装置及语音识别设备

    公开(公告)号:CN115662432A

    公开(公告)日:2023-01-31

    申请号:CN202211184502.5

    申请日:2022-09-27

    Abstract: 本公开涉及一种标点预测方法、装置及语音识别设备。该方法包括:基于标点预测模型获取转录文本中每个字符后出现标点标签的概率和非标点标签的概率,获取原始音频对应的第一文本信息和第二文本信息,根据第一文本信息和第二文本信息对转录文本中每个字符后出现非标点标签的概率进行修正,获取修正后的非标点标签的预测概率信息。转录文本为对原始音频进行语音识别处理得到的文本序列;第一文本信息为对原始音频进行音频截断处理得到的文本信息,包括原始音频对应的语音特征信息和非语音特征信息;第二文本信息为对原始音频进行解码处理得到的文本信息,包括原始音频对应的转录文字字符和转录空字符。采用本方法能提高标点预测的准确性。

Patent Agency Ranking