实现多语言会议的方法、装置和系统

    公开(公告)号:CN101631032B

    公开(公告)日:2011-08-10

    申请号:CN200910169397.6

    申请日:2009-08-27

    发明人: 詹五洲 王东琦

    IPC分类号: H04L12/18 H04M3/56

    摘要: 本发明实施例公开了一种实现多语言会议的方法,所述实现多语言会议的方法,包括:接收由终端输出的至少两种语言信号,根据每种语言信号的定向传播区域,对所述至少两种语言信号进行定向传播处理,生成至少两组音频信号;对所述至少两组音频信号进行组合处理,通过音频接口传输给扬声器进行播放。本发明实施例还公开了一种实现多语言会议的装置和系统,本发明适用于在多语言会议系统中,为不同语言的参会者提供多语言服务。

    一种实现丢包隐藏的方法和装置

    公开(公告)号:CN101833954A

    公开(公告)日:2010-09-15

    申请号:CN201010158666.1

    申请日:2007-06-14

    发明人: 詹五洲 王东琦

    IPC分类号: G10L19/00 G10L11/04

    摘要: 本发明实施例公开了实现丢包隐藏的方法和装置,通过结合丢失帧之前的数据和丢失帧之后的数据恢复丢失帧的技术方案增强了恢复的丢失帧数据与丢失帧之后的数据之间的相关性,进而改善了恢复的丢失帧数据与丢失帧之后的数据之间相位的连续性,提高了语音数据的质量。

    多视点媒体内容的发送和播放方法、装置及系统

    公开(公告)号:CN101662693B

    公开(公告)日:2014-03-12

    申请号:CN200810146721.8

    申请日:2008-08-27

    摘要: 本发明实施例公开一种多视点媒体内容的播放和发送方法、装置及系统,涉及媒体内容播放技术。为解决现有技术在进行视点切换以后,音频信号与切换后的视点所对应的视频图像可能不匹配的问题而发明。本发明提供的技术方案为:一种多视点媒体内容的播放方法,包括:接收多视点媒体内容;当进行视点切换时,生成切换后的视点信息;根据所述视点信息和多视点媒体内容,生成与该视点信息对应的视频信号和对应的音频信号;同步输出所述视频信号和音频信号。本发明实施例提供的多视点媒体内容的播放和发送方法、装置及系统可以应用在具有多视点媒体内容播放功能的系统中。

    视频信号的辅助信息叠加方法及装置

    公开(公告)号:CN102006453B

    公开(公告)日:2013-08-07

    申请号:CN201010574447.1

    申请日:2010-11-30

    发明人: 詹五洲 王东琦

    IPC分类号: H04N7/15 H04N5/262

    CPC分类号: H04N7/15

    摘要: 本发明提供一种视频信号的辅助信息叠加方法及装置,方法包括:获取第一会场的音频信号及第一会场的至少一个视频信号,该至少一个视频信号包含第一会场中的多个视频对象;获取指示信息,该指示信息用于指示在上述至少一个视频信号的多个视频对象中、与获取到的音频信号对应的视频对象所处的视频区域;根据指示信息将与第一会场的音频信号对应的文本信息与视频信号进行叠加处理,以使该文本信息在指示信息所指示的视频区域中显示。本发明实施例保证了多图像的视频会议应用场景下,音频信号能够以字幕的形式显示在对应的视频信号所在的显示屏幕中,从而保证了图像与字幕的显示方位的一致性。

    混音方法、装置及系统

    公开(公告)号:CN103050124A

    公开(公告)日:2013-04-17

    申请号:CN201110309836.6

    申请日:2011-10-13

    发明人: 王东琦 詹五洲

    IPC分类号: G10L19/20 G10L19/008

    摘要: 本发明实施例公开了一种混音方法、装置及系统,涉及通信技术领域,能够保证混音后的音质,并降低计算资源的消耗。本发明的方法包括:接收各个会场的音频码流,并分别对各个会场的音频码流进行分析,得到声源对象的声音特征值;按照声源对象声音特征值从大到小的顺序,从声源对象中选取预定数量的声源对象作为主要声源对象;确定主要声源对象所在会场;根据目标会场和主要声源对象所在会场之间的关系,确定目标会场需要进行混音的音频码流;将目标会场需要进行混音的音频码流进行混音,并将混音后的音频码流发送给目标会场;或者将目标会场需要进行混音的音频码流发送给目标会场,并在目标会场进行混音。本发明实施例主要用于混音的过程中。

    视频通信中视频对象切换的方法、装置及系统

    公开(公告)号:CN101442654B

    公开(公告)日:2012-05-23

    申请号:CN200810188926.2

    申请日:2008-12-26

    发明人: 詹五洲 王东琦

    IPC分类号: H04N7/15

    CPC分类号: H04N7/147 H04N7/15

    摘要: 本发明实施例公开了一种视频通信中视频对象切换的方法、装置及系统,涉及到视频会议技术领域,用以实现视频会议过程中视频图像的自动切换。本发明实施例提供的视频通信中视频对象切换的方法,包括:获取会场视频图像信号以及声音信息,所述会场视频图像信号中包含当前会场中所有与会者的图像;根据所述会场视频图像信号以及声音信息,从所述会场视频图像信号中选取并确定需要切换的包含视频对象的视频图像信号;将所述切换后的视频图像信号发送到其他会场。本发明实施例提供的方法、装置及系统实现了视频会议过程中视频图像信号的自动切换,从而可避免人为因素导致的切换错误且提高了会议效率。

    一种音频编码方法以及音频编码设备

    公开(公告)号:CN102737635B

    公开(公告)日:2014-04-30

    申请号:CN201110087704.3

    申请日:2011-04-08

    发明人: 詹五洲 王东琦

    IPC分类号: G10L19/008 G10L19/032

    摘要: 本发明实施例公开了一种音频编码方法以及音频编码设备,能够有效提高多声道的音质效果。本发明实施例方法包括:获取各扬声器的位置信息以及听众位置信息;按照各声道对应的空间传输参数以及待编码的原始音频信号计算听众位置处所接收到的目标音频信号的掩蔽参数,所述各声道对应的空间传输参数由所述各扬声器的位置信息以及听众位置信息得到,各扬声器与各声道一一对应;根据所述掩蔽参数计算各声道的量化噪声,使得所述目标音频信号的音频质量满足预置条件;根据所述各声道的量化噪声对所述原始音频信号进行量化编码。本发明实施例还提供一种音频编码设备。本发明实施例能够有效提高多声道的音质效果。

    一种单讲状态下回声抵消的方法、装置及系统

    公开(公告)号:CN102387269B

    公开(公告)日:2013-12-04

    申请号:CN201010268880.2

    申请日:2010-08-27

    发明人: 詹五洲 王东琦

    IPC分类号: H04M9/08 H04N7/14

    CPC分类号: H04M9/082

    摘要: 本发明实施例提供了一种回声抵消的方法、装置和系统,包括:接收远端会场发送的声音信号和与所述声音信号所对应的方位信息;根据所述方位信息判断所述声音信号在本端会场中的所属播放区域;对所述声音信号进行双讲状态检测,如果处于单讲状态,则更新所述声音信号的所属播放区域对应回声路径的虚拟滤波器系数;利用所述虚拟滤波器系数进行回声抵消。本发明实施例在进行回声抵消时,只需要更新声音信号所属区域所对应回声路径的虚拟滤波器系数,即同一时刻最多只需要更新和麦克风阵列数量相同的虚拟滤波器系数,因此大幅降低了回声抵消时的运算复杂度,从而降低了回声抵消中对处理器性能的需求,减少了硬件成本的付出。