基于声源定位和面部检测的PBL课堂记录方法和系统
摘要:
本发明公开基于声源定位和面部检测的PBL课堂记录方法和系统,属于智能教学领域。包括:将PBL教学过程中采集到的音频数据和视频数据上传至处理服务器;通过定位算法对采集到的音频数据进行处理,估算出不同时刻的音频发言人和音频定位角;对采集到的视频数据抽取I帧和鱼眼图像展开后,采用神经网络检测图像中人脸,采用残差网络对人脸发言状态进行二分类,得到不同时刻的视频发言人和视频定位角;通过音视频角度校准,将音频定位角度和视频定位角度转换到同一坐标系;在音频定位角的误差范围内搜索是否存在视频定位角,对视频定位角赋予权值,由此对音频角度的权值进行再次调整,通过音频定位角和视频定位角的权值幅值相加,得到最终的发言人角度。
0/0