用于快速音乐分类和检索的方法和设备

    公开(公告)号:CN101398825A

    公开(公告)日:2009-04-01

    申请号:CN200710151768.9

    申请日:2007-09-29

    Abstract: 本发明公开了一种用于快速音乐分类和搜索的方法和设备。所述方法包括以下步骤:输入音乐文件;提取输入的音乐文件的每一帧的基于MDCT的声学特征;计算每一帧的能量;按照能量大小将每一帧的声学特征进行排序。所述方法还包括以下步骤:将排序后的声学特征划分为多个段;针对所述多个段中的一个或多个计算均值和标准偏差;将计算的均值和标准偏差组合成向量。本发明使用的短时音乐特征,即MFCC和音色特征,直接从MDCT系数中得到。所以特征提取的速度非常快。为了分类一首音乐,仅需对音乐文件的12秒长度的部分进行解码。

    更新语言模型的系统和方法

    公开(公告)号:CN102236639B

    公开(公告)日:2016-08-10

    申请号:CN201010171102.1

    申请日:2010-04-28

    Abstract: 本发明提供了一种更新语言模型的系统和方法。所述系统包括:本地文集产生单元,通过使用输入到移动装置的文本数据和移动装置接收的文本数据来产生本地文集;和LM更新单元,基于本地文集更新移动装置中预先安装的初始LM。本发明解决了现有技术中的LM和应用需求之间的不匹配的问题,根据本发明的更新LM的系统和方法能够根据特定用户的语言习惯和关心的话题以及出现的语言现象动态并经常更新LM。

    音乐信息搜索方法及其设备

    公开(公告)号:CN103810236A

    公开(公告)日:2014-05-21

    申请号:CN201310571089.2

    申请日:2013-11-13

    CPC classification number: G06F16/683

    Abstract: 提供了一种音乐信息搜索方法及其设备,所述音乐信息搜索方法包括:从音频数据提取调制频谱;通过使用与预设峰值点相关的位置信息从提取出的调制频谱产生调制频谱峰值点音频指纹;经由哈希函数将产生的调制频谱峰值点音频指纹转换为指示哈希表的地址的哈希键和存储在哈希表上的哈希值;通过提取与音频查询剪辑相关的哈希键并将提取出的哈希键与哈希表指示的地址进行比较来搜索音乐信息。

    用于语音识别设备的补偿装置和方法

    公开(公告)号:CN102237086A

    公开(公告)日:2011-11-09

    申请号:CN201010173715.9

    申请日:2010-04-28

    Abstract: 提供了一种用于语音识别设备的补偿装置和方法,所述补偿装置包括:模型训练模块,使用期望最大化算法对预置声学模型执行训练,输出非特定说话人的声学模型;全局补偿模块,使用声学模型对影响声学数据的特性的特定域和特定装置进行补偿,输出全局适应的声学模型;目标补偿模块,使用全局适应的声学模型对特定说话人的变化进行补偿,输出说话人适应的声学模型;环境补偿模块,使用说话人适应的声学模型对特定环境的变化进行补偿,输出环境适应的声学模型。

Patent Agency Ranking