Patent search ap:("海信视像科技股份有限公司") AND inv:"张宝军" Page 1

1.

发明公开
标点预测方法、装置及语音识别设备审中-实审

公开(公告)号：CN115662432A

公开(公告)日：2023-01-31

申请号：CN202211184502.5

申请日：2022-09-27

Applicant: 海信视像科技股份有限公司

Inventor： 马志强 , 岳文浩 , 张宝军

IPC: G10L15/26 , G10L15/18 , G10L15/16 , G10L15/06 , G10L15/05 , G10L25/78 , G06F40/216 , G06F40/30 , G06F18/2415

Abstract: 本公开涉及一种标点预测方法、装置及语音识别设备。该方法包括：基于标点预测模型获取转录文本中每个字符后出现标点标签的概率和非标点标签的概率，获取原始音频对应的第一文本信息和第二文本信息，根据第一文本信息和第二文本信息对转录文本中每个字符后出现非标点标签的概率进行修正，获取修正后的非标点标签的预测概率信息。转录文本为对原始音频进行语音识别处理得到的文本序列；第一文本信息为对原始音频进行音频截断处理得到的文本信息，包括原始音频对应的语音特征信息和非语音特征信息；第二文本信息为对原始音频进行解码处理得到的文本信息，包括原始音频对应的转录文字字符和转录空字符。采用本方法能提高标点预测的准确性。

2.

发明公开
一种语音识别方法、装置和电子设备审中-实审

公开(公告)号：CN117809664A

公开(公告)日：2024-04-02

申请号：CN202310998810.X

申请日：2023-08-09

Applicant: 海信视像科技股份有限公司

Inventor： 张宝军 , 张晓明

IPC: G10L19/16 , G10L15/02 , G10L15/26

Abstract: 本公开涉及语音识别技术领域，尤其涉及一种语音识别方法、装置和电子设备，用于解决如何保证电子设备在对音频流进行解码的过程中，所提示解码的结果的实时率和识别精度的问题。包括：基于待识别音频流中已识别的数据块的识别结果，确定当前周期的数据块的数据块大小；按照数据块大小对音频特征进行打包，得到当前周期的数据块；基于上一周期的数据块对应的声学信息的第一文本长度和上一周期的数据块对应的语言信息的第二文本长度，确定目标解码算法；基于目标解码算法对当前周期的数据块进行解码，得到至少一个理论识别结果；对理论识别结果进行重打分，得到每个理论识别结果对应的理论得分；基于理论得分，确定当前周期的数据块的识别结果。

3.

发明公开
一种显示设备及语音识别方法审中-实审

公开(公告)号：CN118828083A

公开(公告)日：2024-10-22

申请号：CN202410797978.9

申请日：2024-06-19

Applicant: 海信视像科技股份有限公司

Inventor： 张宝军

IPC: H04N21/422 , G10L15/22 , G10L15/08

Abstract: 本申请一些实施例提供一种显示设备及语音识别方法，所述方法可以响应于语音交互指令，获取语音数据。并基于第一解码图，对语音数据执行解码，获得第一解码结果，如果第一解码结果中含有包含类别符号对应中间弧的目标路径，加载第二解码图，以及基于第二解码图，对语音数据执行解码，获得第二解码结果；再通过拼接第一解码结果和第二解码结果，以获得最优解码路径。其中，所述第一解码图中的至少一个中间弧的输入标签被设置为类别符号。所述第二解码图为基于新词集合对所述类别符号执行扩展构建的解码图。所述方法可以基于当前新词集合，动态构建解码图，并在解码时动态的插入解码图，提高在特定的句式中对特定实体的识别准确率和识别速度。

4.

发明公开
一种显示设备及基于唤醒词声纹的指令识别方法审中-实审

公开(公告)号：CN118609575A

公开(公告)日：2024-09-06

申请号：CN202410772645.0

申请日：2024-06-14

Applicant: 海信视像科技股份有限公司

Inventor： 潘程 , 马明 , 肖炳环 , 张宝军

IPC: G10L17/24 , G10L17/04 , G10L15/22 , G06F3/16 , G10L17/02

Abstract: 本申请提供一种显示设备及基于唤醒词声纹的指令识别方法，所述方法通过声音采集器获取待提取音频后，通过语音提取模型在待提取音频中识别唤醒词音频，并通过语音提取模型提取唤醒词音频的目标声纹向量，根据目标声纹向量在待提取音频中提取目标指令词音频，根据目标指令词音频生成控制指令，以及，响应于控制指令，控制显示器显示执行控制指令后的目标用户界面。本申请通过对唤醒词音频对应的声纹向量进行识别，并基于声纹向量获取有效的指令词音频以生成对应的控制指令，减少待提取音频中的其他指令词音频对有效指令词音频的干扰，提高显示设备识别指令的准确性。

Patent Agency Ranking