一种播放远端与会人员音频的方法、装置及远程视频会议系统

    公开(公告)号:CN102281425A

    公开(公告)日:2011-12-14

    申请号:CN201010205022.3

    申请日:2010-06-11

    发明人: 詹五洲 王东琦

    IPC分类号: H04N7/15 H04L12/18

    摘要: 一种播放远端与会人员音频的方法、装置及远程视频会议系统,包括接收远端会场与会人员的音频,通过本地会场的远端影像呈现设备上下两端分别设置的两个或多个扬声器,将所述两个或多个扬声器和本地会场与会人员之间的传播路径通过预定的算法进行虚拟,所述虚拟为将所述传播路径虚拟在远端影像呈现设备中的远端会场与会人员的头部和本地与会人员的头部之间。本发明通过将所述两个扬声器和本地会场与会人员之间的传播路径通过预定的算法进行虚拟,能够使本地会场的与会人员在与远端会场的与会人员进行视频会议时,准确的感觉到远程影像呈现设备显示的远端会场的与会人员的声音与实际看到的图像之间的水平方向和垂直方向的位置。

    麦克风间距测量方法和装置

    公开(公告)号:CN101685153B

    公开(公告)日:2011-11-16

    申请号:CN200810216622.2

    申请日:2008-09-28

    发明人: 詹五洲 王东琦

    IPC分类号: G01S5/30

    摘要: 本发明实施例公开了一种麦克风间距的测量方法,具体地,选择多个音源参考点,方法包括:分别测量相邻麦克风接收到音源参考点发出的信号的时延差;根据测得的时延差以及声音传播速率C计算音源参考点到相邻麦克风的距离差;获取各音源参考点与其中一个麦克风的连线以及各麦克风之间连线的夹角;根据各音源参考点与相邻麦克风的位置关系的公式、夹角以及距离差计算相邻麦克风的间距。本发明实施例还提供了一种用于测量麦克风间距的装置,使用本发明实施例提供的方法和装置,提高了声源定位的精度。

    视频信号的辅助信息叠加方法及装置

    公开(公告)号:CN102006453A

    公开(公告)日:2011-04-06

    申请号:CN201010574447.1

    申请日:2010-11-30

    发明人: 詹五洲 王东琦

    IPC分类号: H04N7/15 H04N5/262

    CPC分类号: H04N7/15

    摘要: 本发明提供一种视频信号的辅助信息叠加方法及装置,方法包括:获取第一会场的音频信号及第一会场的至少一个视频信号,该至少一个视频信号包含第一会场中的多个视频对象;获取指示信息,该指示信息用于指示在上述至少一个视频信号的多个视频对象中、与获取到的音频信号对应的视频对象所处的视频区域;根据指示信息将与第一会场的音频信号对应的文本信息与视频信号进行叠加处理,以使该文本信息在指示信息所指示的视频区域中显示。本发明实施例保证了多图像的视频会议应用场景下,音频信号能够以字幕的形式显示在对应的视频信号所在的显示屏幕中,从而保证了图像与字幕的显示方位的一致性。

    混音方法、装置及系统

    公开(公告)号:CN103050124B

    公开(公告)日:2016-03-30

    申请号:CN201110309836.6

    申请日:2011-10-13

    发明人: 王东琦 詹五洲

    IPC分类号: G10L19/20 G10L19/008

    摘要: 本发明实施例公开了一种混音方法、装置及系统,涉及通信技术领域,能够保证混音后的音质,并降低计算资源的消耗。本发明的方法包括:接收各个会场的音频码流,并分别对各个会场的音频码流进行分析,得到声源对象的声音特征值;按照声源对象声音特征值从大到小的顺序,从声源对象中选取预定数量的声源对象作为主要声源对象;确定主要声源对象所在会场;根据目标会场和主要声源对象所在会场之间的关系,确定目标会场需要进行混音的音频码流;将目标会场需要进行混音的音频码流进行混音,并将混音后的音频码流发送给目标会场;或者将目标会场需要进行混音的音频码流发送给目标会场,并在目标会场进行混音。本发明实施例主要用于混音的过程中。

    一种3D音频会议的信号处理方法、设备以及系统

    公开(公告)号:CN101547265B

    公开(公告)日:2014-07-30

    申请号:CN200810217091.9

    申请日:2008-10-20

    发明人: 詹五洲 王东琦

    摘要: 本发明实施例提供一种3D音频会议的信号处理的方法、系统与设备,其实现过程为:针对一个终端获取相对于所述终端的音频流;给所述获取到的相对于所述终端的音频流分配标识;将所述获取到的相对于所述终端的音频流以及所述音频流对应的所述标识进行组合并发送给所述终端。采用本发明的技术方案,能够解决现有技术中存在的传输通道需求过多,且终端无法对其他终端的声像位置进行自由定位的问题。

    一种音频编码方法以及音频编码设备

    公开(公告)号:CN102737635A

    公开(公告)日:2012-10-17

    申请号:CN201110087704.3

    申请日:2011-04-08

    发明人: 詹五洲 王东琦

    IPC分类号: G10L19/00 G10L19/02

    摘要: 本发明公开了一种音频编码方法以及音频编码设备,能够有效提高多声道的音质效果。本发明实施例方法包括:获取各扬声器的位置信息以及听众位置信息;按照各声道对应的空间传输参数以及待编码的原始音频信号计算听众位置处所接收到的目标音频信号的掩蔽参数,所述各声道对应的空间传输参数由所述各扬声器的位置信息以及听众位置信息得到,各扬声器与各声道一一对应;根据所述掩蔽参数计算各声道的量化噪声,使得所述目标音频信号的音频质量满足预置条件;根据所述各声道的量化噪声对所述原始音频信号进行量化编码。本发明实施例还提供一种音频编码设备。本发明实施例能够有效提高多声道的音质效果。

    一种实现丢包隐藏的方法和装置

    公开(公告)号:CN101833954B

    公开(公告)日:2012-07-11

    申请号:CN201010158666.1

    申请日:2007-06-14

    发明人: 詹五洲 王东琦

    IPC分类号: G10L19/00 G10L11/04

    摘要: 本发明实施例公开了实现丢包隐藏的方法和装置,通过结合丢失帧之前的数据和丢失帧之后的数据恢复丢失帧的技术方案增强了恢复的丢失帧数据与丢失帧之后的数据之间的相关性,进而改善了恢复的丢失帧数据与丢失帧之后的数据之间相位的连续性,提高了语音数据的质量。

    对中英文语音信号进行识别的方法和装置

    公开(公告)号:CN101826325B

    公开(公告)日:2012-04-18

    申请号:CN201010123191.2

    申请日:2010-03-10

    IPC分类号: G10L15/02

    摘要: 本发明提供了一种对中英文语音信号进行识别的方法和装置。该方法主要包括:通过搜索算法对待识别的中英文语音信号进行特征提取,获取所述待识别的语音信号的特征信息;将所述特征信息与混合发音数据库中的每一个音素序列对应的声学模型进行比较,根据比较结果确定所述特征信息对应的音素序列,获取该音素序列对应的中英文混合短语,将该中英文混合短语作为所述待识别的中英文语音信号的识别结果。利用本发明,可以建立混淆度更小的声学模型,并且不需要大量的标注好的语音训练数据,节约系统资源。可以有效地提高中英文语音信号的识别率。

    回声信号处理方法及装置

    公开(公告)号:CN102223456A

    公开(公告)日:2011-10-19

    申请号:CN201010147597.4

    申请日:2010-04-14

    发明人: 詹五洲 王东琦

    IPC分类号: H04M9/08

    摘要: 本发明涉及一种回声信号处理方法及装置,其中方法包括:根据第一参考信号各子带能量和估计出的包络自适应滤波系数,得到回声信号各子带能量,第一参考信号与第一麦克风信号中的第一回声信号相对应;根据第一麦克风信号各子带能量和回声信号各子带能量,获取增益系数;根据增益系数对第一麦克风信号进行调整,得到消除第一回声信号后的麦克风信号。本发明实施例对相位不敏感,当回声路径发生变化时,不会影响估计结果的正确性,提高了消除回声信号的效果。