-
公开(公告)号:CN104835128A
公开(公告)日:2015-08-12
申请号:CN201510186012.2
申请日:2015-04-17
Applicant: 南京大学
IPC: G06T5/20
Abstract: 本发明公开了一种用于模糊视频文本信息增强的多光谱融合方法,包括以下步骤:步骤1,输入一个待增强文字信息的模糊视频帧;步骤2,将输入视频帧分别转化为灰度图、R值图、G值图和B值图,并分别进行简单的增强操作;步骤3,将灰度图、R值图、G值图和B值图的增强图按照最小值、最大值、和值、均值、中值操作融合成五幅图;步骤4,将五幅融合图分别进行k等于2的k-means操作,得到五幅二值图;步骤5,将五幅二值图按照中值操作融合成增强图,完成增强工作。
-
公开(公告)号:CN104167211A
公开(公告)日:2014-11-26
申请号:CN201410391254.0
申请日:2014-08-08
Applicant: 南京大学
IPC: G10L19/022 , G10L19/02 , G10L25/48
Abstract: 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。
-
公开(公告)号:CN104835128B
公开(公告)日:2017-05-24
申请号:CN201510186012.2
申请日:2015-04-17
Applicant: 南京大学
IPC: G06T5/20
Abstract: 本发明公开了一种用于模糊视频文本信息增强的多光谱融合方法,包括以下步骤:步骤1,输入一个待增强文字信息的模糊视频帧;步骤2,将输入视频帧分别转化为灰度图、R值图、G值图和B值图,并分别进行简单的增强操作;步骤3,将灰度图、R值图、G值图和B值图的增强图按照最小值、最大值、和值、均值、中值操作融合成五幅图;步骤4,将五幅融合图分别进行k等于2的k‑means操作,得到五幅二值图;步骤5,将五幅二值图按照中值操作融合成增强图,完成增强工作。
-
公开(公告)号:CN104167211B
公开(公告)日:2017-03-22
申请号:CN201410391254.0
申请日:2014-08-08
Applicant: 南京大学
IPC: G10L19/022 , G10L19/02 , G10L25/48
Abstract: 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。(56)对比文件Antti J. Eronen et al“.Audio-BasedContext Recognition”《.IEEE TRANSACTIONSON AUDIO, SPEECH, AND LANGUAGEPROCESSING》.2006,第14卷(第1期),赵丕锡等“.视频概要的分类与综合评价方法”《.计算机应用研究》.2004,(第11期),戴玉名.“基于分层代表帧提取的视频摘要研究_”《.中国优秀硕士学位论文全文数据库信息科技辑》.2010,(第10期),Toni Heittola et al“.Sound EventDetection in Multisource EnvironmentsUsing Source Separation”《.Workshop OnMachine Listening in MultisourceEnvironment 2011》.2011,
-
-
-