一种基于多说话人语音分离方法的质控报告自动生成系统

    公开(公告)号:CN118782074A

    公开(公告)日:2024-10-15

    申请号:CN202411002842.0

    申请日:2024-07-25

    Abstract: 本发明公开了一种基于多说话人语音分离方法的质控报告自动生成系统,包括基于超文本传输协议和网络应用服务器技术的语音接收模块、基于时频幅度掩蔽和卷积神经网络的语音分离模块、基于双向状态空间扩充变换器块的语音识别模块、质控报告生成模块、基于超文本传输协议和网络应用服务器技术的质控报告上传模块和基于容器引擎容器化部署和超文本传输协议的分布式部署模块,所述基于超文本传输协议和网络应用服务器技术的语音接收模块用于接收待处理语音,所述基于时频幅度掩蔽和卷积神经网络的语音分离模块用于分离出目标对象的单独语音,所述基于双向状态空间扩充变换器块的语音识别模块用于对语音进行识别并生成文本,所述质控报告生成模块用于对文件进行分析并生成所需质控报告,所述基于超文本传输协议和网络应用服务器技术的质控报告上传模块用于质控报告上传到后台系统,所述基于容器引擎容器化部署和超文本传输协议的分布式部署模块用于系统在多台服务器上实现分布式部署和互联。

Patent Agency Ranking