-
公开(公告)号:CN113284504A
公开(公告)日:2021-08-20
申请号:CN202010725583.X
申请日:2020-07-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L19/02 , G10L25/30 , H04M1/72454
Abstract: 本申请提供了一种姿态检测方法、装置、电子设备及计算机可读存储介质,其中方法包括:通过至少两个语音采集设备采集语音通话过程中的语音信号;获取语音信号对应的姿态能量信息;根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态,其中,在获取姿态能量信息的步骤中可以采用人工智能模块进行相关处理。通过预先设定多种预定姿态,再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息,从预先设定的多种预定姿态中确定出用户在通话过程中的姿态,即得到了用户姿态检测结果,可以为通话语音质量增强提供参考,优化噪声抑制处理的效果。
-
公开(公告)号:CN110931027A
公开(公告)日:2020-03-27
申请号:CN201811090353.X
申请日:2018-09-18
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/02 , G10L21/0208 , G10L21/0216
Abstract: 本申请实施例提供了一种音频处理的方法、装置、电子设备及计算机可读存储介质,涉及语音增强技术领域,该方法包括:获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号,然后基于第一音频信号以及第二音频信号之间的信号相关性,对第一音频信号以及第二音频信号进行语音增强处理,得到语音增强处理后待输出的音频信号。本申请实施例实现了对耳机的音频采集设备采集到的信号进行音频增强,可以得到效果更好的音频信号,以进行语音传输或者语音识别等应用。
-
公开(公告)号:CN110896509A
公开(公告)日:2020-03-20
申请号:CN201811069738.8
申请日:2018-09-13
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: H04R1/10
Abstract: 本申请实施例提供了一种耳机佩戴状态确定方法、电子设备控制方法及电子设备,该方法包括:获取耳机的体传导音频采集设备采集到的音频信号;基于体传导音频采集设备采集到的音频信号,确定耳机的佩戴状态。本申请实施例所提供的方案,基于耳机自身的体传导音频采集设备采集到的音频信号,即可实现耳机佩戴状态的检测,而无需增加新的硬件结构。
-
公开(公告)号:CN108346432A
公开(公告)日:2018-07-31
申请号:CN201710056192.1
申请日:2017-01-25
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L19/008 , G10L21/028 , G10L25/84
Abstract: 本发明提供了一种虚拟现实VR音频处理的方法及相应设备,包括VR音频的发送端获取高保真立体声Ambisonics信号旋转角度,其中,Ambisonics信号旋转角度是根据VR音频的接收端对应的第一设备旋转角度确定出的,然后根据获取的Ambisonics信号旋转角度,对Ambisonics信号进行旋转,和/或,VR音频的发送端获取根据VR音频的相关信息确定的混合阶高保真立体声MOA信号的阶数,然后依据MOA信号的阶数,从高保真立体声Ambisonics信号中提取出MOA信号。本发明实施例适用于根据设备的旋转角度确定Ambisonics信号旋转角度,进行旋转,并提取出MOA信号。
-
公开(公告)号:CN107479810A
公开(公告)日:2017-12-15
申请号:CN201610399484.0
申请日:2016-06-07
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F3/0488
CPC classification number: G06F3/04886
Abstract: 本发明实施例提供了基于辅助显示区域的操作方法及终端设备,所述方法包括:检测到针对对象的触发操作,在辅助显示区域中显示对象的相关内容;基于针对所述辅助显示区域中的对象的相关内容的操作,对所述对象的相关内容进行相应处理。本发明实施例中,基于针对辅助显示区域显示的对象的相关内容进行的操作,可以对该对象的深层次内容和/或隐藏内容进行深入处理,大大增强了辅助显示区域与应用涉及的对象之间的交互深度,扩展了辅助显示区域的功能,提升了利用辅助显示区域的水平,有助于满足用户对深层次交互的需要,简化深层次交互的复杂度,从而提升用户的体验。
-
公开(公告)号:CN101242595A
公开(公告)日:2008-08-13
申请号:CN200710000413.X
申请日:2007-02-05
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 一种调节手机音量的方法,包括步骤:手机检测本机或对方手机的噪声水平;如果本机或对方手机处于安静环境时,适当调低音量;如果本机或对方手机处于噪杂环境下时,适当调高音量。采用本发明,将使手机具有智能的调整本机的听筒音量和发送给对方的语音的音量的功能,使得手机能够适应不同的环境噪音。
-
公开(公告)号:CN118400527A
公开(公告)日:2024-07-26
申请号:CN202410484423.9
申请日:2024-04-22
Applicant: 南京大学 , 北京三星通信技术研究有限公司
IPC: H04N19/124 , G06V10/44 , G06V10/82 , G06N3/045 , G06N3/092 , H04N19/132 , H04N19/172 , H04N19/503
Abstract: 本发明提供了一种基于强化学习的自适应采样视频编码方法和装置,所述方法包括:步骤1,得到训练好的动作网络Actor;步骤2,将状态State输入到动作网络Actor,得到子图像组的合理的动作对决策;步骤3,单个子图像组编码时,将全部帧按照动作对决策进行下采样和量化参数偏移设置后,输入到编码器编码;步骤4,相邻的子图像组按照编码顺序送进编码器中;步骤5,进行后处理增强,按播放顺序组合输出全部帧。本发明方法添加到AVS3的标准参考软件HPM 15.3后,最终测试能够在AVS的CTC序列中在4K分辨率,1080p分辨率,720p分辨率可以分别获得9.69%,11.82%,11.99%的BD‑Rate增益。
-
公开(公告)号:CN110767244A
公开(公告)日:2020-02-07
申请号:CN201810827229.0
申请日:2018-07-25
Applicant: 中国科学技术大学 , 北京三星通信技术研究有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/30
Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。
-
公开(公告)号:CN107968984A
公开(公告)日:2018-04-27
申请号:CN201610916256.6
申请日:2016-10-20
Applicant: 中国科学院声学研究所 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种5-2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。
-
公开(公告)号:CN107968984B
公开(公告)日:2019-08-20
申请号:CN201610916256.6
申请日:2016-10-20
Applicant: 中国科学院声学研究所 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种5‑2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。
-
-
-
-
-
-
-
-
-