-
公开(公告)号:CN103971692A
公开(公告)日:2014-08-06
申请号:CN201310031782.0
申请日:2013-01-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L19/008
Abstract: 本申请公开了一种音频处理方法、装置及系统,其中,该方法包括:获取左声道信号和右声道信号的平均值,对得到的下混合信号进行编码得到主码流;对左声道信号和右声道信号分别进行MLT得到左声道MLT系数序列和右声道MLT系数序列,将左声道MLT系数序列和右声道MLT系数序列分别划分为低频序列和高频序列;根据左声道MLT系数序列的低频序列与右声道MLT系数序列的低频序列之差获取低频边带信号,对低频边带信号的幅度和位置进行量化编码得到低频码流;根据左声道MLT系数序列的高频序列和右声道MLT系数序列的高频序列获取强度立体声系数,对强度立体声系数的幅度进行量化编码得到高频码流;将主码流和由低频码流和高频码流组成的辅助码流进行混合后输出。
-
公开(公告)号:CN113284504B
公开(公告)日:2024-11-08
申请号:CN202010725583.X
申请日:2020-07-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L19/02 , G10L25/30 , H04M1/72454
Abstract: 本申请提供了一种姿态检测方法、装置、电子设备及计算机可读存储介质,其中方法包括:通过至少两个语音采集设备采集语音通话过程中的语音信号;获取语音信号对应的姿态能量信息;根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态,其中,在获取姿态能量信息的步骤中可以采用人工智能模块进行相关处理。通过预先设定多种预定姿态,再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息,从预先设定的多种预定姿态中确定出用户在通话过程中的姿态,即得到了用户姿态检测结果,可以为通话语音质量增强提供参考,优化噪声抑制处理的效果。
-
公开(公告)号:CN117475994A
公开(公告)日:2024-01-30
申请号:CN202211305751.5
申请日:2022-10-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L15/02 , G10L21/0272 , G10L25/03 , G10L25/30
Abstract: 本申请提供一种音频信号处理方法、装置、计算机设备及存储介质,涉及人工智能技术领域。本申请提供的音频信号处理方法,通过基于第一音频信号,使用语音注册模块,获取该语音注册模块对应的第一隐状态,从而快速得到所关注声源的隐式特征;并基于该第一隐状态,从第二音频信号中提取目标音频信号,从而无需基于较长时间的注册声源的音频来提取显式特征,也可完成对目标音频信号的提取,节省了注册时间,提高了音频信号处理的效率,提高了音频信号处理方法的实用性。
-
公开(公告)号:CN108346432B
公开(公告)日:2022-09-09
申请号:CN201710056192.1
申请日:2017-01-25
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L19/008 , G10L21/028 , G10L25/84
Abstract: 本发明提供了一种虚拟现实VR音频处理的方法及相应设备,包括VR音频的发送端获取高保真立体声Ambisonics信号旋转角度,其中,Ambisonics信号旋转角度是根据VR音频的接收端对应的第一设备旋转角度确定出的,然后根据获取的Ambisonics信号旋转角度,对Ambisonics信号进行旋转,和/或,VR音频的发送端获取根据VR音频的相关信息确定的混合阶高保真立体声MOA信号的阶数,然后依据MOA信号的阶数,从高保真立体声Ambisonics信号中提取出MOA信号。本发明实施例适用于根据设备的旋转角度确定Ambisonics信号旋转角度,进行旋转,并提取出MOA信号。
-
公开(公告)号:CN113687758A
公开(公告)日:2021-11-23
申请号:CN202110852838.3
申请日:2016-06-07
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F3/0488
Abstract: 本发明实施例提供了基于辅助显示区域的操作方法及终端设备,所述方法包括:检测到针对对象的触发操作,在辅助显示区域中显示对象的相关内容;基于针对所述辅助显示区域中的对象的相关内容的操作,对所述对象的相关内容进行相应处理。本发明实施例中,基于针对辅助显示区域显示的对象的相关内容进行的操作,可以对该对象的深层次内容和/或隐藏内容进行深入处理,大大增强了辅助显示区域与应用涉及的对象之间的交互深度,扩展了辅助显示区域的功能,提升了利用辅助显示区域的水平,有助于满足用户对深层次交互的需要,简化深层次交互的复杂度,从而提升用户的体验。
-
公开(公告)号:CN107479810B
公开(公告)日:2021-08-10
申请号:CN201610399484.0
申请日:2016-06-07
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F3/0488
Abstract: 本发明实施例提供了基于辅助显示区域的操作方法及终端设备,所述方法包括:检测到针对对象的触发操作,在辅助显示区域中显示对象的相关内容;基于针对所述辅助显示区域中的对象的相关内容的操作,对所述对象的相关内容进行相应处理。本发明实施例中,基于针对辅助显示区域显示的对象的相关内容进行的操作,可以对该对象的深层次内容和/或隐藏内容进行深入处理,大大增强了辅助显示区域与应用涉及的对象之间的交互深度,扩展了辅助显示区域的功能,提升了利用辅助显示区域的水平,有助于满足用户对深层次交互的需要,简化深层次交互的复杂度,从而提升用户的体验。
-
公开(公告)号:CN112446242A
公开(公告)日:2021-03-05
申请号:CN201910810000.0
申请日:2019-08-29
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 提供了一种声学场景分类方法、装置及相应设备,所述方法包括:获取音频对应的第一音频特征信号;将第一音频特征信号输入卷积神经网络以获得第二音频特征信号,将第二音频特征信号输入循环神经网络以获得第三音频特征信号,将第二音频特征信号与第三音频特征信号进行融合处理以获得第四音频特征信号;使用第四音频特征信号进行声学场景分类以获得所述音频所属场景类别。
-
公开(公告)号:CN109754817A
公开(公告)日:2019-05-14
申请号:CN201810401796.X
申请日:2018-04-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本发明涉及语音识别技术领域,提供一种信号处理方法及终端设备,该信号处理方法包括:从输入的信号中提取特征信息;根据提取的特征信息,确定输入的信号是否为非正常语音信号。本发明中,通过根据输入的信号中提取的特征信息来确定该输入的信号是否为非正常语音信号的处理过程,实现了对非正常语音信号的有效识别,提高了识别的精准度,并且为用户的语音交互提供了安全保障,提升了用户的使用感受。
-
公开(公告)号:CN103838458A
公开(公告)日:2014-06-04
申请号:CN201210487045.7
申请日:2012-11-26
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Inventor: 杨磊
IPC: G06F3/0481 , G06F17/24
Abstract: 本申请公开了一种移动终端及其输入法的控制方法,检测用户在拼写区域中已输入字符的字符选择操作,并根据操作选取相应的字符;检测用户对于选取字符的有效字符移位操作,并判断字符移位的目标位置是否在拼写区域内,若是,则将选取字符移动到目标位置上。在编辑输入区域,检测出用户对已显示文字的选择操作后,反查选择的各文字对应的拼音或字根,在拼写区域显示该查询结果,供用户重新选择确认,并利用重新选择确认的文字替换所选择的文字或作为新的输入。应用本申请,能够大大提高输入法的编辑效率。
-
公开(公告)号:CN119601034A
公开(公告)日:2025-03-11
申请号:CN202311168345.3
申请日:2023-09-11
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本公开实施例提供一种由电子设备执行的方法、电子设备、存储介质及程序产品,涉及人工智能技术领域。该方法包括:针对目标音频的第一音频特征进行划分,得到至少两组子音频特征;针对每一子音频特征,通过对应的神经网络进行块间和/或帧间的特征处理,得到与该子音频特征对应的第二音频特征;基于第二音频特征得到目标音频特征。可选地,由电子设备执行的上述方法可以使用人工智能模型来执行。
-
-
-
-
-
-
-
-
-