- 专利标题: 基于声源定位和面部检测的PBL课堂记录方法和系统
-
申请号: CN202011161783.3申请日: 2020-10-26
-
公开(公告)号: CN112396887B公开(公告)日: 2022-01-11
- 发明人: 许炜 , 刘威 , 向敏 , 徐晶 , 程文青
- 申请人: 华中科技大学
- 申请人地址: 湖北省武汉市洪山区珞喻路1037号
- 专利权人: 华中科技大学
- 当前专利权人: 华中科技大学
- 当前专利权人地址: 湖北省武汉市洪山区珞喻路1037号
- 代理机构: 华中科技大学专利中心
- 代理商 胡秋萍; 李智
- 主分类号: G09B5/06
- IPC分类号: G09B5/06 ; H04N5/76 ; G01S5/18 ; G06K9/00 ; G06N3/04
摘要:
本发明公开基于声源定位和面部检测的PBL课堂记录方法和系统,属于智能教学领域。包括:将PBL教学过程中采集到的音频数据和视频数据上传至处理服务器;通过定位算法对采集到的音频数据进行处理,估算出不同时刻的音频发言人和音频定位角;对采集到的视频数据抽取I帧和鱼眼图像展开后,采用神经网络检测图像中人脸,采用残差网络对人脸发言状态进行二分类,得到不同时刻的视频发言人和视频定位角;通过音视频角度校准,将音频定位角度和视频定位角度转换到同一坐标系;在音频定位角的误差范围内搜索是否存在视频定位角,对视频定位角赋予权值,由此对音频角度的权值进行再次调整,通过音频定位角和视频定位角的权值幅值相加,得到最终的发言人角度。
公开/授权文献
- CN112396887A 基于声源定位和面部检测的PBL课堂记录方法和系统 公开/授权日:2021-02-23