-
公开(公告)号:CN118800236A
公开(公告)日:2024-10-18
申请号:CN202311605192.4
申请日:2023-11-28
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明提供一种音频转文本方法、装置、电子设备及可读存储介质,属于人工智能技术领域,包括:获取待识别音频相关的梅尔频谱输入至音频转文本模型中的音频编码器,获取多模态音频特征;将多模态音频特征输入至扩散模型,得到其输出的文本编码特征;再将文本编码特征输入至音频解码器,获取该待识别音频对应的识别文本。本发明设计并训练了一种新的音频转文本模型,利用音频编码器提取出待识别的音频相关的多模态音频特征,然后利用扩散模型的多模态空间中关联的多模态音频特征与多模态文本编码特征之间的强相关性,生成文本编码特征,在利用音频解码器进行解码得到识别文本,泛化性强、鲁棒性更强。
-
公开(公告)号:CN118802888A
公开(公告)日:2024-10-18
申请号:CN202311066892.0
申请日:2023-08-22
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例提供了一种文件传输方法、装置、设备及计算机存储介质,其中方法包括:接收业务后端发送的第一请求,所述第一请求用于生成第一格式令牌;基于所述第一请求生成所述第一格式令牌;向所述业务后端发送所述第一格式令牌,以使所述业务后端将所述第一格式令牌发送至业务前端;接收所述业务前端基于所述第一格式令牌发送的目标文件;基于所述目标文件,向所述业务后端发送回调请求,所述回调请求用于校验OSS接收到的所述目标文件与所述业务前端的待传输的目标文件是否一致;基于所述业务后端根据所述回调请求反馈的校验结果,对所述目标文件进行处理。本申请实施例能够提高业务前端上传文件方式的安全性。
-
公开(公告)号:CN119690606A
公开(公告)日:2025-03-25
申请号:CN202411555730.8
申请日:2024-11-01
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种算法调度方法、装置、设备、存储介质及产品。其中,方法包括:确定对待审核内容进行审核所需的算法的算法类型;根据所述算法类型,在机器资源集群中确定符合所述算法的第一服务器集合,所述第一服务器集合中包括至少一个第一服务器,且每个第一服务器中均布置有所述算法;根据所述待审核内容和所述第一服务器集合,设计算法调度模型;对所述算法调度模型进行计算,得到所述算法调度模型的策略调度参数;采用所述策略调度参数对所述待审核内容进行算法调度。本申请实施例能够提高待审核内容的效率。
-
-