一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统

    公开(公告)号:CN108419174B

    公开(公告)日:2020-05-22

    申请号:CN201810066540.8

    申请日:2018-01-24

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统。本方法为:1)构建目标环境的几何模型的包围体层次结构树;2)利用该包围体层次结构树和给定声源的位置计算声源的声场分布;3)根据声源的声场分布,计算声源到该目标环境中目标位置的房间冲激响应;4)将计算得到的房间冲激响应转化为HOA系数向量;5)根据重放环境中扬声器的实际摆放位置,对该HOA系数向量进行解码,得到各个扬声器的增益,称为多通道房间冲激响应;6)将解码得到的多通道房间冲激响应与任意声源信号卷积作为扬声器的信号重构该声源信号在该目标位置处的声场。本发明实现了非标准播放环境下,虚拟声学环境的重放。

    一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统

    公开(公告)号:CN108419174A

    公开(公告)日:2018-08-17

    申请号:CN201810066540.8

    申请日:2018-01-24

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统。本方法为:1)构建目标环境的几何模型的包围体层次结构树;2)利用该包围体层次结构树和给定声源的位置计算声源的声场分布;3)根据声源的声场分布,计算声源到该目标环境中目标位置的房间冲激响应;4)将计算得到的房间冲激响应转化为HOA系数向量;5)根据重放环境中扬声器的实际摆放位置,对该HOA系数向量进行解码,得到各个扬声器的增益,称为多通道房间冲激响应;6)将解码得到的多通道房间冲激响应与任意声源信号卷积作为扬声器的信号重构该声源信号在该目标位置处的声场。本发明实现了非标准播放环境下,虚拟声学环境的重放。

    一种基于声道间传递函数的参数立体声编码、解码方法

    公开(公告)号:CN105405445A

    公开(公告)日:2016-03-16

    申请号:CN201510915572.7

    申请日:2015-12-10

    Applicant: 北京大学

    CPC classification number: G10L19/008 G10L19/04

    Abstract: 本发明公开了一种基于声道间传递函数的参数立体声编码、解码方法。本发明编码方法为:1)编码端利用左右声道信号生成下混信号;2)将输入的下混信号和一单声道信号分别分帧后,提取每一帧的声道间传递函数系数;然后将提取的传递函数系数拼成一二维矩阵;其中,所述单声道信号为左声道信号或右声道信号;3)对该二维矩阵依次进行二维压缩、游程编码、熵编码,将该二维矩阵中的系数压缩生成边信息,然后与下混信号形成比特流。本发明保留了信号的低高频空间信息,同时实现了帧内和帧间的压缩。

    高速公路音频车辆检测装置及其方法

    公开(公告)号:CN102682765A

    公开(公告)日:2012-09-19

    申请号:CN201210129754.8

    申请日:2012-04-27

    Abstract: 本发明是一种高速公路音频车辆检测装置及其方法。检测装置由麦克风阵列信号采集模块采集车道上的音频信号,音频信号经噪声抑制模块去噪处理后,再经信号处理模块分带滤波、分帧以及子带信号间做互相关处理,得到音频空间谱图,车辆检测模块追踪音频空间谱图上最大值的轨迹,判断是否有车辆通过,在有车时,经车型识别模块和车速识别模块获得车型和车速。检测方法基于所述装置,采用自适应窗长的最小统计噪声估计方法,并对经过噪声抑制处理后的信号分带滤波、分帧处理后,将相同子带信号间做互相关,互相关结果经过幅度压缩后加和,再沿时间轴展开,得到音频信号时空谱。本发明具有低成本、低功耗、易施工、抗干扰、全天候工作等优点。

    基于音频的隐藏通信系统和通信方法

    公开(公告)号:CN1863039B

    公开(公告)日:2012-03-21

    申请号:CN200510069126.5

    申请日:2005-05-11

    Applicant: 北京大学

    Abstract: 本发明提供一种以音频信号为载体,以模拟音频通道为信道的隐藏通信系统。本发明的系统是以在模拟音频通道中传输隐藏信息为目的,并具体解决了系统对载体噪声干扰的抵抗和信息传输的接收同步等技术关键。在发送子系统中,系统通过改进的扩展谱方法,即“双相调制”扩展谱技术,将隐藏信息嵌入到普通的音频信号中。该技术的采用能够有效地减小音频载体信号对隐藏信息解调的干扰。同时针对隐藏信息的编码方式,系统引用了RS信道编码方案,以增强对噪声干扰的鲁棒性。另外,利用上述改进的扩展谱技术,系统在载体的高频段中嵌入信号帧同步信息,并在接收方子系统中对其进行相关提取,并通过同步信号的相位调整信号帧同步点来实现信息的接收同步。

    自动加配字幕的方法和系统

    公开(公告)号:CN100536532C

    公开(公告)日:2009-09-02

    申请号:CN200510011770.7

    申请日:2005-05-23

    Applicant: 北京大学

    Abstract: 本发明基于统计模式识别的理论,设计并实现了字幕自动加配系统及其解决方案。针对非现场直播类型的影视节目和现场直播型电视节目。本发明的字幕加配分别采用如下的技术方案:针对非现场直播类型的影视节目,字幕自动加配系统包括三个模块:字幕自动识别模块,用于自动识别影视作品中与视频流相对应的字幕脚本;字幕辅助校对模块,进行字幕校对;以及,字幕大段对齐模块,用于将得到的音频和字幕脚本在时间尺度上按照一定的语言单元自动对齐,在播放影视节目时可以准确地同步显示相应字幕。针对现场直播型电视节目,字幕自动加配系统即为实时对齐模块,用于将事先准备好的节目文稿与实时输入的音频流在时间轴上对齐,并且实时地显示字幕。

    用于助听器的语音增强方法

    公开(公告)号:CN1967659A

    公开(公告)日:2007-05-23

    申请号:CN200510086877.8

    申请日:2005-11-14

    Abstract: 本发明提供一种在噪声环境中抑止含噪语音中的噪声成分,提高语音质量和可懂度的语音增强方法。根据本发明的方法,具体包括以下步骤:1)首先利用端点检测技术对语音中的噪声谱进行估计;2)利用两步维纳滤波技术去除噪声;3)同时根据听觉掩蔽曲线对滤波参数进行调整。本发明中的去噪方法,在信号层次和听觉感知层次均进行了充分的研究与考虑。对于估计噪声,采用鲁棒性很好的端点检测方法,用之尽可能的准确估计出噪声谱。进一步采用了两步维纳滤波进一步解决这个问题。同时,考虑到人耳的特点,运用听觉掩蔽曲线,使得得到的信号失真减小。这样,最终增强后的信号,在语音质量与可懂度上都有比较大的提高。

    针对老年性聋的数字助听器语音时长拉伸方法

    公开(公告)号:CN1870134A

    公开(公告)日:2006-11-29

    申请号:CN200510011781.5

    申请日:2005-05-24

    Abstract: 本发明提出了一种语音时长拉伸方法,它应用在数字助听器中,解决了老年性聋患者由于感知能力缓慢,导致语音可懂度下降的问题。本发明采用语音时长拉伸方法,在不改变采样率和基音周期的情况下,通过复制、插入整周期的基音信号,扩展浊音信号的波形,以降低输入语音的速率,提高老年性聋患者的语音可懂度。具体技术包括:能量比较,基音周期检测,波形扩展等。本发明中采用的方法有效的解决了老年性聋患者感知能力缓慢,在语音速率较快时,语音可懂度明显下降的问题。其优点体现在拉长了语音信号的持续时间,降低了语音的速率,这些都是在不改变采样率和基音周期的情况下完成的,因而引入的失真较小。

Patent Agency Ranking