一种面向会议室场景的音视频定位系统

    公开(公告)号:CN118301279A

    公开(公告)日:2024-07-05

    申请号:CN202410434380.3

    申请日:2024-04-11

    Abstract: 本发明公开了一种面向会议室场景的音视频定位系统,系统分为数据存储与可视化模块、视频采集与处理模块、音频采集与处理模块。数据存储与可视化模块,包括前端和后端两部分。前端搭建主要可视化网页,用户登录系统后可进行观看回放、查询说话人定位信息等操作。后端包括登录用户模块和数据查询模块,并将数据库中的存储数据显示在前端展示的页面中。视频采集与处理模块,通过鱼眼全景摄像头进行视频采集,将采集后的视频进行正畸后根据人脸检测和张口识别算法进行定位。音频采集与处理模块,可依次进行数据采集、音频预处理、音频定位。最终数据和定位结果在可视化界面显示。本发明可有效提高会议记录与回顾会议内容效果,满足了会议场景中基于参会人员定位等拓展性功能的需要。

Patent Agency Ranking