发明授权
CN103137137B 一种会议音频中的精彩说话人发现方法
失效 - 权利终止
- 专利标题: 一种会议音频中的精彩说话人发现方法
- 专利标题(英): Eloquent speaker finding method in conference audio
-
申请号: CN201310061167.4申请日: 2013-02-27
-
公开(公告)号: CN103137137B公开(公告)日: 2015-07-01
- 发明人: 李艳雄 , 吴伟 , 贺前华 , 李广隆
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州粤高专利商标代理有限公司
- 代理商 何淑珍
- 主分类号: G10L25/24
- IPC分类号: G10L25/24 ; G10L25/78 ; H04M3/56
摘要:
一种会议音频中的精彩说话人发现方法,步骤如下:读入会议音频;检测上述音频中的掌声音频段,将各个掌声音频段前面5秒语音段提取出来作为精彩语音段,同时得到精彩语音段在会议音频中出现的位置;对上述精彩语音段进行说话人聚类,得到精彩说话人个数及其精彩语音段。本发明的有益效果是:基于掌声检测和说话人聚类,快速有效地估计出会议音频中的精彩说话人个数、精彩语音段及其在会议音频中出现的位置,为会议音频的快速浏览、摘要提取、说话人检索等奠定基础。
公开/授权文献
- CN103137137A 一种会议音频中的精彩说话人发现方法 公开/授权日:2013-06-05