-
公开(公告)号:CN103229232B
公开(公告)日:2015-02-18
申请号:CN201080070373.6
申请日:2010-11-30
Applicant: 三菱电机株式会社
CPC classification number: G10L15/04 , G01C21/3608 , G10L15/10
Abstract: 本发明的声音识别装置及导航装置对从作为声音识别对象词汇的地址数据中分割出来的单词的出现频度在规定值以上的单词生成声音识别词典,并将输入声音的声学特征的时间序列与声音识别词典进行对照,并从声音识别词典中确定出最有可能成为输入声音的单词序列,并对确定出的单词序列与地址数据进行部分一致的对照,将部分一致的语句作为声音识别结果。
-
公开(公告)号:CN103650034A
公开(公告)日:2014-03-19
申请号:CN201180071882.5
申请日:2011-07-05
Applicant: 三菱电机株式会社
IPC: G10L15/32
CPC classification number: G10L15/32
Abstract: 本发明所涉及的语音识别装置包括:语音获取部(1),该语音获取部(1)对所输入的语音进行数字转换,并作为语音数据来获取该数据;语音数据存储部(2),该语音数据存储部(2)对语音获取部(1)所获取的语音数据进行存储;第一~第M语音识别部,该第一~第M语音识别部从语音数据存储部(2)所存储的语音数据中检测语音区间,提取出语音区间的语音数据的特征量,基于所提取出的特征量并参照识别词典来进行识别处理;语音识别切换部(4),该语音识别切换部(4)对第一~第M语音识别部进行切换;识别控制部(5),该识别控制部(5)对语音识别切换部(4)所进行的语音识别部的切换进行控制,以获取切换后的语音识别部的识别结果;以及识别结果选择部(6),该识别结果选择部(6)从识别控制部(5)所获取的识别结果中选择提示给用户的提示对象的识别结果。
-
公开(公告)号:CN102725790A
公开(公告)日:2012-10-10
申请号:CN201080062593.4
申请日:2010-02-05
Applicant: 三菱电机株式会社
IPC: G10L15/06
CPC classification number: G10L15/06 , G10L2015/025
Abstract: 对所输入的登记对象文本的读音的语言进行辨识,利用辨识出的语言的音素来对登记对象文本赋予读音,并且,生成登记有将登记对象文本的读音从辨识出的语言的读音变换成声音识别中处理的识别对象语言后的读音的识别词典。
-
公开(公告)号:CN102301419A
公开(公告)日:2011-12-28
申请号:CN200980156033.2
申请日:2009-10-08
Applicant: 三菱电机株式会社
IPC: G10L15/06
CPC classification number: G10L15/06 , G10L17/04 , G10L2015/0631
Abstract: 本发明提供一种声音识别装置,包括:声音输入部(11),该声音输入部(11)输入多次发声的声音;登记声音数据存储部(12),该登记声音数据存储部(12)对声音输入部(11)输入的多次发声的声音数据进行存储;发声稳定性检验部(13),该发声稳定性检验部(13)求出从登记声音数据存储部(12)读取的多次发声的声音数据之间的相似度,在相似度大于阈值T1的情况下,判定声音数据能够登记;以及标准模式生成部(14),该标准模式生成部(14)使用由发声稳定性检验部(13)判定为能够登记的声音数据来生成标准模式。
-
公开(公告)号:CN111566732B
公开(公告)日:2023-04-04
申请号:CN201880085821.6
申请日:2018-01-15
Applicant: 三菱电机株式会社
IPC: G10L21/0308 , G10L15/10 , G10L25/30
Abstract: 在声音信号分离装置(1)中,判定部(6)判定在由信号再生成部(5)再生成的每个成分的声音信号中是否混合存在来自多个声源的成分,当判定为混合存在多个成分时,反复执行特征量提取部(2)、数据估计部(3)、数据分类部(4)以及信号再生成部(5)的一系列处理,直到再生成了每个声源的成分的声音信号为止。
-
公开(公告)号:CN111566732A
公开(公告)日:2020-08-21
申请号:CN201880085821.6
申请日:2018-01-15
Applicant: 三菱电机株式会社
IPC: G10L21/0308 , G10L15/10 , G10L25/30
Abstract: 在声音信号分离装置(1)中,判定部(6)判定在由信号再生成部(5)再生成的每个成分的声音信号中是否混合存在来自多个声源的成分,当判定为混合存在多个成分时,反复执行特征量提取部(2)、数据估计部(3)、数据分类部(4)以及信号再生成部(5)的一系列处理,直到再生成了每个声源的成分的声音信号为止。
-
公开(公告)号:CN105659316A
公开(公告)日:2016-06-08
申请号:CN201480057853.7
申请日:2014-08-06
Applicant: 三菱电机株式会社
CPC classification number: G10L15/22 , G06F17/2755 , G10L13/027 , G10L15/1815 , G10L15/1822 , G10L15/265 , G10L2015/223
Abstract: 意图估计权重决定部(9)根据意图层次图数据(8)和激活的意图,决定意图估计权重。迁移节点决定部(10)根据意图估计权重对意图估计结果进行修正后,决定要新迁移而激活的意图。对话话轮生成部(13)根据激活后的意图来生成对话的话轮。对话控制部(2)在通过对话的话轮被赋予了新的输入的情况下,控制意图估计部(7)、意图估计权重决定部(9)、迁移节点决定部(10)和对话话轮生成部(13)中的至少任意处理,通过反复进行该控制,最终执行所设定的命令。
-
公开(公告)号:CN103038816A
公开(公告)日:2013-04-10
申请号:CN201080068341.2
申请日:2010-10-01
Applicant: 三菱电机株式会社
CPC classification number: G06F17/28 , G10L15/005 , G10L15/26
Abstract: 本发明的声音识别装置包括:使用与设定语言对应的声音识别引擎,参照在声音识别词典中所登记的识别对象语,来对输入声音进行声音识别的声音识别部(23a);登记有表示单词的读音信息在多种语言之间的对应关系的读音信息转换规则(L)的读音信息转换数据库;基于读音信息转换数据库的读音信息转换规则(L),在语言之间转换单词的读音信息的读音信息转换部(27a);以及声音识别控制部(24a),该声音识别控制部(24a)进行控制,使得在由声音识别部(23a)对识别对象语信息(E)进行参照的识别对象词汇中包含有与设定语言不同的其它语言的单词的情况下,由读音信息转换部(27a)将其它语言的读音信息转换成设定语言的读音信息,声音识别部(23a)参照将转换后的设定语言的读音信息包含在内的该单词的识别对象语信息来进行声音识别。
-
公开(公告)号:CN108885618A
公开(公告)日:2018-11-23
申请号:CN201680084170.X
申请日:2016-03-30
Applicant: 三菱电机株式会社
IPC: G06F17/27
CPC classification number: G06F17/27
Abstract: 补充信息估计部(108)在意图估计部(106)的估计对象单句中存在意图估计失败的单句的情况下,使用补充信息估计模型存储部(107)的补充信息估计模型,根据该单句估计补充信息。意图补充部(109)在意图估计部(106)的估计对象单句中存在不完整意图估计结果的单句的情况下,使用由补充信息估计部(108)估计出的补充信息对不完整意图估计结果进行补充。
-
公开(公告)号:CN104221012A
公开(公告)日:2014-12-17
申请号:CN201280067066.1
申请日:2012-12-27
Applicant: 三菱电机株式会社
IPC: G06F17/30
CPC classification number: G10L15/1822 , G06F17/30011
Abstract: 发声内容估计部(14)基于学习了询问文档(1)的内容的设想提问与成为其回答的文档ID的对应关系的发声估计模型(9),从文档(1)内估计与用户输入分析结果(11)的回答相当的文档ID。结果合并部(16)将发声估计模型(9)的文档估计结果(15)与搜索索引(5)的文档搜索结果(13)进行合并来生成最终搜索结果(17)。
-
-
-
-
-
-
-
-
-