-
公开(公告)号:CN102682763B
公开(公告)日:2014-07-16
申请号:CN201110063938.4
申请日:2011-03-10
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
CPC classification number: G10L15/22 , G10L15/08 , G10L15/1815 , G10L2015/221
Abstract: 本发明公开了修正语音输入文本中命名实体词汇的方法及装置,有针对性的定位识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加便捷、丰富。
-
公开(公告)号:CN101398825B
公开(公告)日:2013-07-03
申请号:CN200710151768.9
申请日:2007-09-29
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种用于快速音乐分类和搜索的方法和设备。所述方法包括以下步骤:输入音乐文件;提取输入的音乐文件的每一帧的基于MDCT的声学特征;计算每一帧的能量;按照能量大小将每一帧的声学特征进行排序。所述方法还包括以下步骤:将排序后的声学特征划分为多个段;针对所述多个段中的一个或多个计算均值和标准偏差;将计算的均值和标准偏差组合成向量。本发明使用的短时音乐特征,即MFCC和音色特征,直接从MDCT系数中得到。所以特征提取的速度非常快。为了分类一首音乐,仅需对音乐文件的12秒长度的部分进行解码。
-
公开(公告)号:CN101399035A
公开(公告)日:2009-04-01
申请号:CN200710152350.X
申请日:2007-09-27
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 一种从音频文件的MDCT音频数据估计节拍的方法,包括(1)将MDCT音频数据划分为多个子带,检测每个子带中的冲击起始点信号;(2)计算每个子带中冲击起始点信号的周期;(3)从周期冲击起始点信号估计出谐波节拍组;以及(4)从所述谐波节拍组中选择所述音频文件的节拍。
-
公开(公告)号:CN101471068B
公开(公告)日:2013-01-23
申请号:CN200710301762.5
申请日:2007-12-26
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 本发明提供了一种通过哼唱音乐旋律来搜索基于波形的音乐文件的方法和系统。通过哼唱音乐旋律来搜索基于波形的音乐文件的方法,包括:输入基于波形的音乐文件和哼唱旋律信号;从输入的基于波形的音乐文件中分割出演唱片段;分别对演唱片段和哼唱旋律信号估计旋律泛音,获得掩蔽音符图;将演唱片段的掩蔽音符图和哼唱旋律信号的掩蔽音符图矢量化,以获得演唱片段的矢量序列和哼唱旋律信号的矢量序列;和将演唱片段的矢量序列和哼唱旋律信号的矢量序列进行比较,以确定演唱片段与哼唱旋律信号是否匹配。
-
公开(公告)号:CN101399036A
公开(公告)日:2009-04-01
申请号:CN200710164132.8
申请日:2007-09-30
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 本发明提供一种将语音转换为说唱音乐的设备和方法。所述设备包括:伴奏音乐生成部分,用于生成说唱伴奏音乐;语音转换部分,基于伴奏音乐生成部分所生成的伴奏音乐,将用户输入的语音转换为说唱形式;音乐混合器,将伴奏音乐生成部分所生成的说唱伴奏音乐以及由语音转换部分所转换的说唱形式的语音相混合,以形成说唱音乐。
-
公开(公告)号:CN101398827B
公开(公告)日:2013-01-23
申请号:CN200710151896.3
申请日:2007-09-28
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 提供了一种用于哼唱检索的方法和装置,所述方法包括:输入从哼唱中提取的检索序列;输入按照音乐小节进行切分的模板序列组,所述模板序列组包含与音乐库中每首音乐对应的模板序列;将检索序列和模板序列进行匹配;如果模板序列和检索序列匹配,则将与该模板序列对应的音乐输出作为检索结果。根据本发明,可以提高哼唱检索的准确率和速度。
-
公开(公告)号:CN102682763A
公开(公告)日:2012-09-19
申请号:CN201110063938.4
申请日:2011-03-10
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
CPC classification number: G10L15/22 , G10L15/08 , G10L15/1815 , G10L2015/221
Abstract: 本发明公开了修正语音输入文本中命名实体词汇的方法及装置,有针对性的定位识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加便捷、丰富。
-
公开(公告)号:CN101398827A
公开(公告)日:2009-04-01
申请号:CN200710151896.3
申请日:2007-09-28
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 提供了一种用于哼唱检索的方法和装置,所述方法包括:输入从哼唱中提取的检索序列;输入按照音乐小节进行切分的模板序列组,所述模板序列组包含与音乐库中每首音乐对应的模板序列;将检索序列和模板序列进行匹配;如果模板序列和检索序列匹配,则将与该模板序列对应的音乐输出作为检索结果。根据本发明,可以提高哼唱检索的准确率和速度。
-
公开(公告)号:CN101398825A
公开(公告)日:2009-04-01
申请号:CN200710151768.9
申请日:2007-09-29
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种用于快速音乐分类和搜索的方法和设备。所述方法包括以下步骤:输入音乐文件;提取输入的音乐文件的每一帧的基于MDCT的声学特征;计算每一帧的能量;按照能量大小将每一帧的声学特征进行排序。所述方法还包括以下步骤:将排序后的声学特征划分为多个段;针对所述多个段中的一个或多个计算均值和标准偏差;将计算的均值和标准偏差组合成向量。本发明使用的短时音乐特征,即MFCC和音色特征,直接从MDCT系数中得到。所以特征提取的速度非常快。为了分类一首音乐,仅需对音乐文件的12秒长度的部分进行解码。
-
公开(公告)号:CN101399036B
公开(公告)日:2013-05-29
申请号:CN200710164132.8
申请日:2007-09-30
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
IPC: G10H1/00
Abstract: 本发明提供一种将语音转换为说唱音乐的设备和方法。所述设备包括:伴奏音乐生成部分,用于生成说唱伴奏音乐;语音转换部分,基于伴奏音乐生成部分所生成的伴奏音乐,将用户输入的语音转换为说唱形式;音乐混合器,将伴奏音乐生成部分所生成的说唱伴奏音乐以及由语音转换部分所转换的说唱形式的语音相混合,以形成说唱音乐。
-
-
-
-
-
-
-
-
-