-
公开(公告)号:CN114299916B
公开(公告)日:2025-04-04
申请号:CN202111677651.0
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G10L13/033 , G10L21/02 , G10L21/0232 , G10L25/03 , G10L25/30
Abstract: 本申请涉及语音处理技术领域,并公开了一种语音增强方法、计算机设备及存储介质,通过提取目标场景中的语音信号,将语音信号中的第一声学特征信号输入训练完毕的的语音增强模型中进行语音增强,得到第一目标声学特征信号后,将第一目标声学特征信号和第一声学特征信号的相位进行合成,得到目标语音信号;由于训练完毕的的语音增强模型包括预设数量的短时记忆模块,预设数量的短时记忆模块堆叠成具有堆叠结构的网络结构,而具有堆叠结构的网络结构的损失函数包括频域损失部分、信号约束损失部分和跨域约束损失部分,经训练完毕的的语音增强模型对第一声学特征信息进行语音增强,不仅能够抑制或消除平稳噪声以及非平稳噪声,同时能够抑制或消除冲击噪声。
-
公开(公告)号:CN114360059A
公开(公告)日:2022-04-15
申请号:CN202111669916.2
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了导播系统的交互方法以及相关装置、设备,其中,导播系统的交互方法包括:采集目标对象的待识别图像;确定当前的任务类型;响应于基于待识别图像检测到目标对象的预设动作指令,基于预设动作指令利用导播系统显示与任务类型对应的目标区域的图像。上述方案,能够实现导播系统的自适应显示切换以及体感互动,进而提高导播系统的交互便捷度和操作简化性。
-
公开(公告)号:CN114299916A
公开(公告)日:2022-04-08
申请号:CN202111677651.0
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G10L13/033 , G10L21/02 , G10L21/0232 , G10L25/03 , G10L25/30
Abstract: 本申请涉及语音处理技术领域,并公开了一种语音增强方法、计算机设备及存储介质,通过提取目标场景中的语音信号,将语音信号中的第一声学特征信号输入训练完毕的的语音增强模型中进行语音增强,得到第一目标声学特征信号后,将第一目标声学特征信号和第一声学特征信号的相位进行合成,得到目标语音信号;由于训练完毕的的语音增强模型包括预设数量的短时记忆模块,预设数量的短时记忆模块堆叠成具有堆叠结构的网络结构,而具有堆叠结构的网络结构的损失函数包括频域损失部分、信号约束损失部分和跨域约束损失部分,经训练完毕的的语音增强模型对第一声学特征信息进行语音增强,不仅能够抑制或消除平稳噪声以及非平稳噪声,同时能够抑制或消除冲击噪声。
-
公开(公告)号:CN219758968U
公开(公告)日:2023-09-26
申请号:CN202223327217.2
申请日:2022-12-09
Applicant: 科大讯飞股份有限公司
IPC: G09B5/06
Abstract: 本实用新型涉及远程互动教学技术领域,提供一种课堂互动教学系统,应用于主讲教室和听课教室,包括:用于设于主讲教室的第一拾音器和第一主机,以及用于设于听课教室的第一音箱、音频矩阵、第二拾音器、第三拾音器和第二主机;第一拾音器与第一主机电性连接,第一主机和第二主机通讯连接;第二拾音器与音频矩阵电性连接,第三拾音器与第一音箱电性连接,第一音箱与音频矩阵电性连接,音频矩阵与第二主机电性连接。本实用新型的课堂互动教学系统,通过网络将主讲教室以及听课教室连接,能够实现课堂互动,并且能够促进优质教学资源共享。
-
-
-