-
公开(公告)号:CN102388416B
公开(公告)日:2014-12-10
申请号:CN201180001707.9
申请日:2011-01-24
申请人: 松下电器产业株式会社
IPC分类号: G10L25/48
CPC分类号: G10L17/005 , G10L15/20 , G10L17/00 , G10L21/0272 , G10L25/48 , H04R25/407 , H04R2225/43
摘要: 本发明提供了即使在日常的环境下也能准确地检测对话的成立的信号处理装置及信号处理方法。在信号处理装置(100)中,激励分离单元(130)将混入了多个激励的混合音信号分离为各个激励。语音检测单元(140)对分离出的多个激励信号的各个激励信号进行语音检测,判断多个激励信号是否为语音,对每个激励信号生成表示语音/非语音信息的语音区间信息。识别参数提取单元(150)基于多个激励信号或语音区间信息,提取表示日常对话特征量的识别参数。对话成立度计算单元(160)基于提取出的所述识别参数,计算并输出对话成立度。对话对方判定单元(170)使用对话成立度,判定哪个激励是对话对方。
-
公开(公告)号:CN102474697B
公开(公告)日:2015-01-14
申请号:CN201180002942.8
申请日:2011-06-16
申请人: 松下电器产业株式会社
CPC分类号: H04R25/407 , H04R25/405 , H04R25/505 , H04R25/552 , H04R25/554 , H04R25/558 , H04R2225/41 , H04R2225/43 , H04R2460/13 , H04S2400/13
摘要: 公开了助听器、信号处理方法和程序,其在助听器用户希望观看电视时容易听见电视声音,在希望跟他人谈话时容易听见他人的声音。助听器(100)具备:使用检测出的声源方向信息、自身发声检测结果和电视声音检测结果,检测助听器佩戴者以外的说话者的发声的他人发声检测单元(150);以及使用自身发声检测结果、电视声音检测结果、他人发声检测结果和声源方向信息,计算各声源的频度的各声源频度计算单元(160)。场景判别单元(170)使用声源方向信息和所述各声源的频度,判别“交谈场景”、“视听电视场景”和“一边交谈一边视听电视场景”,输出声音控制单元(180)根据判定出的场景来控制助听器(100)输出的声音。
-
公开(公告)号:CN102474681B
公开(公告)日:2014-12-10
申请号:CN201180003168.2
申请日:2011-06-24
申请人: 松下电器产业株式会社
CPC分类号: H04R25/407 , G10L25/00 , G10L2021/065 , H04R1/406 , H04R2225/43
摘要: 公开了能够使用头部佩戴式的话筒阵列,高精度地判定前方的说话者是否为交谈对象的交谈检测装置。交谈检测装置(100)包括:自身发声检测单元(102),检测话筒阵列(101)佩戴者的自身发声;前发声检测单元(103),检测位于佩戴者的前方的说话者的发声作为前方向的发声;侧发声检测单元(104),检测位于佩戴者的左右的至少一侧的说话者的发声作为侧发声;侧方向交谈成立度导出单元(105),基于自身发声和侧发声的检测结果,对自身发声和侧发声之间的交谈成立度进行运算;前方向交谈检测单元(106),基于前发声的检测结果和侧方向交谈成立度的运算结果,检测有无前方向的交谈;以及输出音控制单元(107),基于判定出的前方向的交谈的有无,控制使助听器佩戴者听见的声音的指向性。
-
公开(公告)号:CN102428716B
公开(公告)日:2014-07-30
申请号:CN201080021517.9
申请日:2010-06-16
申请人: 松下电器产业株式会社
CPC分类号: H04R25/407 , G01S3/803 , H04R25/552 , H04R25/554 , H04R2225/43 , H04S2420/01
摘要: 没有在语音识别精度上的降低,通过使用从多个麦克风输入的声音信号检测由除了会话对方之外的某人的呼叫和其他各种声音。助听器装置基于除了会话对方之外的某人的呼叫语音到来的方向,校正除了会话对方之外的某人的呼叫语音的频率特性,基于通过多个麦克风转换的声音信号来估计该方向。然后,基于通过使用具有一个特性的麦克风记录的其他语音数据,助听器装置将其频率特性已经被频率特性调整处理单元校正的、除了会话对方之外的某人的呼叫语音与用于表示音素和音节特征的呼叫词标准模式作比较。通过这个比较,该助听器装置确定除了会话对方之外的某人的呼叫语音是否是呼叫词。然后,基于呼叫词确定部件的确定结果,助听器装置相对于除了会话对方的语音到来的方向之外的方向形成定向。另外,该助听器装置校正除了会话对方之外的某人的呼叫语音的频率特性,使得该频率特性可以与在准备声音标准模式时的麦克风的特性相同。
-
公开(公告)号:CN103155036A
公开(公告)日:2013-06-12
申请号:CN201180043770.9
申请日:2011-09-14
申请人: 松下电器产业株式会社
IPC分类号: G10L25/78
CPC分类号: G10L25/48 , G10L25/00 , G10L25/06 , G10L25/78 , G10L2021/02087 , G10L2021/065 , G10L2025/783 , H04R25/407 , H04R25/552 , H04R25/558 , H04R2225/43
摘要: 提供语音处理装置,即使在存在由三人以上组成的会话组的情况下,也能够从多个说话者中高精度提取会话组。该装置(400)包括:自发话检测单元(420)和分向语音检测单元(430),从音响信号单独地检测多个说话者的发话语音;会话成立度计算单元(450),其基于检测到的发话语音,对于多个说话者中的所有两人组合,对划分了判定对象时间的每个区段计算会话成立度;长时间特征量计算单元(460),其对每个组合计算判定对象时间内的会话成立度的长时间特征量;以及会话对方判定单元(470),其基于计算出的长时间特征量,从多个说话者中提取形成会话的会话组。
-
公开(公告)号:CN100583236C
公开(公告)日:2010-01-20
申请号:CN200480006231.8
申请日:2004-04-27
申请人: 松下电器产业株式会社
IPC分类号: G10L13/00
CPC分类号: G06F3/16
摘要: 一种声音输出装置,它能够把利用文字和声音的信息准确地传达给用户,提高与用户之间的联系的完善性,其中具有:显示部(107),它利用文字来显示应向用传达的装置传达信息;延迟部(105),它推断出用户为识别该显示部(107)进行显示的文字的动作所需要的延迟时间(T),在该文字显示后延迟时间(T)已过去时,用声音来输出该装置传达信息;以及声音输出部(106)。
-
公开(公告)号:CN101542592A
公开(公告)日:2009-09-23
申请号:CN200880000290.2
申请日:2008-03-14
申请人: 松下电器产业株式会社
CPC分类号: G10L15/04 , G10L17/00 , G10L2015/088
摘要: 提取会话的关键词而不是提前预测并准备会话的关键词。关键词提取装置,包括:音频输入部分(101),用于输入说话者的讲话;讲话片段确定部分(102),用于确定每个说话者的输入讲话的讲话片段;讲话识别部分(103),用于识别在所确定的讲话片段的讲话;中断检测部分(104),基于另一个说话者对说话者的讲话的响应检测暗示关键词存在的另一个说话者的讲话响应特征,即,在前讲话和后续讲话相互重叠的中断;关键词提取部分(105),用于从根据中断所指定的讲话部分中的讲话中提取关键词;关键词搜索部分(106),用于通过关键词执行关键词搜索;以及显示部分(107),用于显示关键词搜索的结果。
-
公开(公告)号:CN102474681A
公开(公告)日:2012-05-23
申请号:CN201180003168.2
申请日:2011-06-24
申请人: 松下电器产业株式会社
CPC分类号: H04R25/407 , G10L25/00 , G10L2021/065 , H04R1/406 , H04R2225/43
摘要: 公开了能够使用头部佩戴式的话筒阵列,高精度地判定前方的说话者是否为交谈对象的交谈检测装置。交谈检测装置(100)包括:自身发声检测单元(102),检测话筒阵列(101)佩戴者的自身发声;前发声检测单元(103),检测位于佩戴者的前方的说话者的发声作为前方向的发声;侧发声检测单元(104),检测位于佩戴者的左右的至少一侧的说话者的发声作为侧发声;侧方向交谈成立度导出单元(105),基于自身发声和侧发声的检测结果,对自身发声和侧发声之间的交谈成立度进行运算;前方向交谈检测单元(106),基于前发声的检测结果和侧方向交谈成立度的运算结果,检测有无前方向的交谈;以及输出音控制单元(107),基于判定出的前方向的交谈的有无,控制使助听器佩戴者听见的声音的指向性。
-
公开(公告)号:CN1759436A
公开(公告)日:2006-04-12
申请号:CN200480006231.8
申请日:2004-04-27
申请人: 松下电器产业株式会社
IPC分类号: G10L13/00
CPC分类号: G06F3/16
摘要: 一种声音输出装置,它能够把利用文字和声音的信息准确地传达给用户,提高与用户之间的连系的完善性,其中具有:显示部(107),它利用文字来显示应向用传达的装置传达信息;延迟部(105),它推断出用户为识别该显示部(107)进行显示的文字的动作所需要的延迟时间(T),在该文字显示后延迟时间(T)已过去时,用声音来输出该装置传达信息;以及声音输出部(106)。
-
公开(公告)号:CN1663249A
公开(公告)日:2005-08-31
申请号:CN03814902.8
申请日:2003-06-23
申请人: 松下电器产业株式会社
IPC分类号: H04N5/76
CPC分类号: H04N21/435 , G06F17/3082 , H04N21/235 , H04N21/42203 , H04N21/4223 , H04N21/4334 , H04N21/439 , H04N21/440236 , H04N21/8106 , H04N21/84
摘要: 本发明涉及一种元数据生成装置,具有再现内容并输出的内容再现部(1)、用于监视内容再现部再现的内容的监视器(3)、声音输入部(4)、识别声音输入部输入的声音信号的声音识别部(5)、将声音识别部识别的信息转换成元数据的元数据生成部(6),以及识别信息附加部(7),该识别信息附加部(7)从内容再现部供给的再现后的内容获取用于识别所述内容中的各部分的识别信息,并赋予所述元数据;该元数据生成装置使生成的所述元数据与所述内容内的各部分建立关联。
-
-
-
-
-
-
-
-
-