-
公开(公告)号:CN104167211A
公开(公告)日:2014-11-26
申请号:CN201410391254.0
申请日:2014-08-08
Applicant: 南京大学
IPC: G10L19/022 , G10L19/02 , G10L25/48
Abstract: 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。
-
公开(公告)号:CN104167211B
公开(公告)日:2017-03-22
申请号:CN201410391254.0
申请日:2014-08-08
Applicant: 南京大学
IPC: G10L19/022 , G10L19/02 , G10L25/48
Abstract: 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。(56)对比文件Antti J. Eronen et al“.Audio-BasedContext Recognition”《.IEEE TRANSACTIONSON AUDIO, SPEECH, AND LANGUAGEPROCESSING》.2006,第14卷(第1期),赵丕锡等“.视频概要的分类与综合评价方法”《.计算机应用研究》.2004,(第11期),戴玉名.“基于分层代表帧提取的视频摘要研究_”《.中国优秀硕士学位论文全文数据库信息科技辑》.2010,(第10期),Toni Heittola et al“.Sound EventDetection in Multisource EnvironmentsUsing Source Separation”《.Workshop OnMachine Listening in MultisourceEnvironment 2011》.2011,
-