Invention Grant
- Patent Title: 基于声源定位和面部检测的PBL课堂记录方法和系统
-
Application No.: CN202011161783.3Application Date: 2020-10-26
-
Publication No.: CN112396887BPublication Date: 2022-01-11
- Inventor: 许炜 , 刘威 , 向敏 , 徐晶 , 程文青
- Applicant: 华中科技大学
- Applicant Address: 湖北省武汉市洪山区珞喻路1037号
- Assignee: 华中科技大学
- Current Assignee: 华中科技大学
- Current Assignee Address: 湖北省武汉市洪山区珞喻路1037号
- Agency: 华中科技大学专利中心
- Agent 胡秋萍; 李智
- Main IPC: G09B5/06
- IPC: G09B5/06 ; H04N5/76 ; G01S5/18 ; G06K9/00 ; G06N3/04

Abstract:
本发明公开基于声源定位和面部检测的PBL课堂记录方法和系统,属于智能教学领域。包括:将PBL教学过程中采集到的音频数据和视频数据上传至处理服务器;通过定位算法对采集到的音频数据进行处理,估算出不同时刻的音频发言人和音频定位角;对采集到的视频数据抽取I帧和鱼眼图像展开后,采用神经网络检测图像中人脸,采用残差网络对人脸发言状态进行二分类,得到不同时刻的视频发言人和视频定位角;通过音视频角度校准,将音频定位角度和视频定位角度转换到同一坐标系;在音频定位角的误差范围内搜索是否存在视频定位角,对视频定位角赋予权值,由此对音频角度的权值进行再次调整,通过音频定位角和视频定位角的权值幅值相加,得到最终的发言人角度。
Public/Granted literature
- CN112396887A 基于声源定位和面部检测的PBL课堂记录方法和系统 Public/Granted day:2021-02-23
Information query