小尺度麦克风阵列语音增强系统和方法

    公开(公告)号:CN100535992C

    公开(公告)日:2009-09-02

    申请号:CN200510086876.3

    申请日:2005-11-14

    Abstract: 本发明提出一种小尺度麦克风阵列语音增强系统和方法,根据本发明的系统主要分为信号采集和信号处理两个子部分。信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号,通过AD转换器转化成数字信号,在DSP处理芯片中进行信号增强,然后再通过usb口传输到计算机上进行保存。信号处理部分由麦克风一致性校正模块,自适应噪声消除模块,信噪比估计模块和声源位置自适应模块等组成。本发明的系统和分可以去除采集过程中引入的环境噪声,使得采集到的声源信号信噪比提高,从而获得更好的声源信号,在大多情况之下声源信号为语音信号,经过去噪处理对语音的可懂度有所提高。

    一种用于信息检索的查询语句分析方法与系统

    公开(公告)号:CN101510221A

    公开(公告)日:2009-08-19

    申请号:CN200910131826.0

    申请日:2009-04-08

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于自然语言理解的查询语句分析方法与系统,属于信息检索技术领域。本发明的方法为:1)对输入的中文查询语句进行自动分词、命名实体识别和词性标注;2)对分词后的句子进行句法结构分析,得到句法结构树;根据词性标注后的句子确定每个词的词义;3)根据句子的句法结构和每个词的词义,对句子中谓词进行语义角色标注;4)根据上述对句子在词法、句法和语义层上的分析结果扩充关键词,提取能反映用户信息检索需求的关键词。本发明的系统包括词法分析模块、句法分析模块、语义分析模块和关键词提取模块。本发明可以大大提高查询结果的准确率,使用户得到想要的查询结果。

    数字助听器语音频率压缩方法

    公开(公告)号:CN100440317C

    公开(公告)日:2008-12-03

    申请号:CN200510011780.0

    申请日:2005-05-24

    Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。

    自动加配字幕的方法和系统

    公开(公告)号:CN1870728A

    公开(公告)日:2006-11-29

    申请号:CN200510011770.7

    申请日:2005-05-23

    Applicant: 北京大学

    Abstract: 本发明基于统计模式识别的理论,设计并实现了字幕自动加配系统及其解决方案。针对非现场直播类型的影视节目和现场直播型电视节目。本发明的字幕加配分别采用如下的技术方案:针对非现场直播类型的影视节目,字幕自动加配系统包括三个模块:字幕自动识别模块,用于自动识别影视作品中与视频流相对应的字幕脚本;字幕辅助校对模块,进行字幕校对;以及,字幕大段对齐模块,用于将得到的音频和字幕脚本在时间尺度上按照一定的语言单元自动对齐,在播放影视节目时可以准确地同步显示相应字幕。针对现场直播型电视节目,字幕自动加配系统即为实时对齐模块,用于将事先准备好的节目文稿与实时输入的音频流在时间轴上对齐,并且实时地显示字幕。

    基于掩蔽曲线的数字助听器频响补偿方法

    公开(公告)号:CN1870135A

    公开(公告)日:2006-11-29

    申请号:CN200510011782.X

    申请日:2005-05-24

    Abstract: 助听器是帮助聋人听力康复的主要设备,频响补偿是助听器中不可缺少的信号处理技术。以往的听力补偿技术只考虑聋人自身听阈升高,动态范围变窄的问题;没有考虑由于人耳的听觉掩蔽效应引起的听阈上升现象。本发明根据人耳听觉掩蔽阈值,提出一种新的频响补偿方法,将它应用在数字助听器中,解决现有方法由于忽视听觉掩蔽效应,过分放大不可感知的信号成分,导致语音清晰度和可懂度下降的问题。根据本发明的数字助听器频响补偿方法包括一下技术:时频域转换,临界带的划分,掩蔽阈值的计算,频响补偿等。

    基于音频的隐藏通信系统和通信方法

    公开(公告)号:CN1863039A

    公开(公告)日:2006-11-15

    申请号:CN200510069126.5

    申请日:2005-05-11

    Applicant: 北京大学

    Abstract: 本发明提供一种以音频信号为载体,以模拟音频通道为信道的隐藏通信系统。本发明的系统是以在模拟音频通道中传输隐藏信息为目的,并具体解决了系统对载体噪声干扰的抵抗和信息传输的接收同步等技术关键。在发送子系统中,系统通过改进的扩展谱方法,即“双相调制”扩展谱技术,将隐藏信息嵌入到普通的音频信号中。该技术的采用能够有效地减小音频载体信号对隐藏信息解调的干扰。同时针对隐藏信息的编码方式,系统引用了RS信道编码方案,以增强对噪声干扰的鲁棒性。另外,利用上述改进的扩展谱技术,系统在载体的高频段中嵌入信号帧同步信息,并在接收方子系统中对其进行相关提取,并通过同步信号的相位调整信号帧同步点来实现信息的接收同步。

    一种基于脑磁图的连续语音流语义解码方法

    公开(公告)号:CN118098242A

    公开(公告)日:2024-05-28

    申请号:CN202410168446.9

    申请日:2024-02-06

    Abstract: 本发明公开了一种基于脑磁图的连续语音流语义解码方法,本发明在受试者听连续语音流故事的实验范式下,采集受试者的脑磁信号。使用经过微调的预训练语言模型提取语音对应文本的连续词嵌入,构建神经网络模型并使用对比学习训练网络,以脑磁信号和受试者ID为输入,连续词嵌入为监督,输出重构的连续词嵌入。随后,使用语言模型和波束搜索的方法从重构的连续词嵌入中生成文本。结果显示,本发明提出的神经网络模型可以同时利用受试者之间的共性和个性的信息,实现对连续词嵌入的有效重构;此外,文本生成算法可以帮助实现从脑磁信号解码文本序列,优于现有的从闭集中有限条目进行挑选的闭集解码。

    基于内部预演的机械手臂趋近规划方法及装置

    公开(公告)号:CN116038708A

    公开(公告)日:2023-05-02

    申请号:CN202310045314.2

    申请日:2023-01-30

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于内部预演的机械手臂趋近规划方法及装置,所述方法包括:定义目标位姿附近的采样点集合,所述采样点集合中的任一点与所述目标位姿的距离小于设定值;快速移动机器手臂,且当机械手臂末端的附近位姿点进入所述采样点集合的情况下,停止所述机器手臂的快速移动;对机器手臂的后续移动轨迹进行内部预演,以得到所述机器手臂中各关节的角变化向量;基于所述各关节的角变化向量,将所述机器手臂的末端移动至所述目标位姿。本发明可以有效提高机械臂在趋近过程中的位置、姿态准确度以及减少实体机械臂在空间中采样的次数。

    引入基频线索的生成式语音分离方法和装置

    公开(公告)号:CN115910091A

    公开(公告)日:2023-04-04

    申请号:CN202211184016.3

    申请日:2022-09-27

    Applicant: 北京大学

    Abstract: 本发明公开了一种引入基频线索的生成式语音分离方法和装置。本发明开创性地利用基频线索作为条件,结合混合语音提供的频谱细节信息,使用生成式神经网络生成目标说话人语音,与传统通过估计混合语音的时频掩膜来提取目标语音的方法相比,分离语音的音质和可懂度得到提高。相比于同时分离所有说话人语音的方法,本发明通过引入基频线索解决了现有方法中说话人数目不确定和难以确定网络输出与真实说话人之间对应关系的问题。本发明依托于听觉加工机制和神经网络结构,取得了与当前最优方法可比的性能,为机器在复杂场景中解决语音分离任务提供了可能。

    一种两阶段的多说话人基频轨迹提取方法

    公开(公告)号:CN115631744A

    公开(公告)日:2023-01-20

    申请号:CN202211084602.0

    申请日:2022-09-06

    Applicant: 北京大学

    Abstract: 本发明一种两阶段的多说话人基频轨迹提取方法,其步骤包括:1)对给定的多说话人混合语音进行处理,得到所述多说话人混合语音中每一帧的频谱;2)利用卷积神经网络获取所述幅度谱的局部特征;3)将各帧的局部特征输入全连接层,得到每一帧对应的所有基频估计值;4)将所得各帧的基频估计值作为输入,迭代预测每一说话人的基频序列;其中第i轮迭代的处理方法为:a)将第i‑1轮分离的基频序列输入编码器得到基频序列的特征表示;b)将基频序列特征表示与基频估计值输入到条件链式模块中,得到第i轮迭代对应的隐层输出向量;c)解码器将第i轮迭代对应的隐层输出向量解码为第i个说话人的基频序列。本发明提出的方法无需预设输出数目。

Patent Agency Ranking