-
公开(公告)号:CN118400527A
公开(公告)日:2024-07-26
申请号:CN202410484423.9
申请日:2024-04-22
Applicant: 南京大学 , 北京三星通信技术研究有限公司
IPC: H04N19/124 , G06V10/44 , G06V10/82 , G06N3/045 , G06N3/092 , H04N19/132 , H04N19/172 , H04N19/503
Abstract: 本发明提供了一种基于强化学习的自适应采样视频编码方法和装置,所述方法包括:步骤1,得到训练好的动作网络Actor;步骤2,将状态State输入到动作网络Actor,得到子图像组的合理的动作对决策;步骤3,单个子图像组编码时,将全部帧按照动作对决策进行下采样和量化参数偏移设置后,输入到编码器编码;步骤4,相邻的子图像组按照编码顺序送进编码器中;步骤5,进行后处理增强,按播放顺序组合输出全部帧。本发明方法添加到AVS3的标准参考软件HPM 15.3后,最终测试能够在AVS的CTC序列中在4K分辨率,1080p分辨率,720p分辨率可以分别获得9.69%,11.82%,11.99%的BD‑Rate增益。
-
公开(公告)号:CN112885363A
公开(公告)日:2021-06-01
申请号:CN202010988943.5
申请日:2020-09-18
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本公开提供了一种语音发送方法和装置以及语音接收方法和装置、电子设备,所述语音发送方法包括:利用第一特征提取网络从输入的语音信号中提取低频特征信息;以及将与所述低频特征信息对应的语音信号发送给接收端。
-
公开(公告)号:CN110767244A
公开(公告)日:2020-02-07
申请号:CN201810827229.0
申请日:2018-07-25
Applicant: 中国科学技术大学 , 北京三星通信技术研究有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/30
Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。
-
公开(公告)号:CN107968984A
公开(公告)日:2018-04-27
申请号:CN201610916256.6
申请日:2016-10-20
Applicant: 中国科学院声学研究所 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种5-2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。
-
公开(公告)号:CN103971692A
公开(公告)日:2014-08-06
申请号:CN201310031782.0
申请日:2013-01-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L19/008
Abstract: 本申请公开了一种音频处理方法、装置及系统,其中,该方法包括:获取左声道信号和右声道信号的平均值,对得到的下混合信号进行编码得到主码流;对左声道信号和右声道信号分别进行MLT得到左声道MLT系数序列和右声道MLT系数序列,将左声道MLT系数序列和右声道MLT系数序列分别划分为低频序列和高频序列;根据左声道MLT系数序列的低频序列与右声道MLT系数序列的低频序列之差获取低频边带信号,对低频边带信号的幅度和位置进行量化编码得到低频码流;根据左声道MLT系数序列的高频序列和右声道MLT系数序列的高频序列获取强度立体声系数,对强度立体声系数的幅度进行量化编码得到高频码流;将主码流和由低频码流和高频码流组成的辅助码流进行混合后输出。
-
公开(公告)号:CN101211561A
公开(公告)日:2008-07-02
申请号:CN200610156615.9
申请日:2006-12-30
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 一种音乐信号质量增强方法,包括步骤:对输入信号进行高通滤波和噪声抑制;计算音频信号的自相关和长时预测参数;对当前帧进行速率判决;对不同的速率进行编码,得到LSP、自适应码本和固定码本的编码信息;对LSP、自适应码本和固定码本的编码信息进行量化;使用与量化相同的方法解量化。根据本发明,通过改进的固定码本的增益量化方法,使得在用手机听音乐信号时,比如采用彩铃业务时,音乐的质量得到明显的提高。
-
-
公开(公告)号:CN109754817B
公开(公告)日:2025-02-18
申请号:CN201810401796.X
申请日:2018-04-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本发明涉及语音识别技术领域,提供一种信号处理方法及终端设备,该信号处理方法包括:从输入的信号中提取特征信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号。本发明中,通过根据输入的信号中提取的特征信息来确定该输入的信号是否为非正常语音信号的处理过程,实现了对非正常语音信号的有效识别,提高了识别的精准度,并且为用户的语音交互提供了安全保障,提升了用户的使用感受。
-
公开(公告)号:CN117935840A
公开(公告)日:2024-04-26
申请号:CN202310671720.X
申请日:2023-06-07
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/0388 , G10L19/005 , G10L25/30 , G06N3/045 , G06N3/044 , G06N3/08
Abstract: 本公开提供了由终端设备执行的方法、电子设备及计算机可读存储介质,涉及音频信号处理和人工智能。由终端设备执行的方法包括:基于音频信号的缺失帧之前的第一指定数量的第一已知帧的时频信息,通过第一神经网络生成缺失帧的低频分量;基于缺失帧之前第二指定数量的第二已知帧确定缺失帧为过渡帧时,基于缺失帧之前第三指定数量的第三已知帧的时频信息,通过第二神经网络生成缺失帧的高频分量;根据缺失帧的低频分量和高频分量恢复缺失帧。
-
公开(公告)号:CN110120229A
公开(公告)日:2019-08-13
申请号:CN201810114171.5
申请日:2018-02-05
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本发明提供了一种虚拟现实VR音频信号的处理方法及相应设备,该方法包括:获取VR音频信号对应的冗余运动信息;根据所述冗余运动信息,对所述VR音频信号进行调整处理。本发明与现有技术相比,能够根据获取到的VR音频信号对应的冗余运动信息,对VR音频信号进行调整处理,从而消除冗余运动对VR音频信号的影响,提升VR音频信号的稳定性和准确性。
-
-
-
-
-
-
-
-
-