-
公开(公告)号:CN117678017A
公开(公告)日:2024-03-08
申请号:CN202280049225.9
申请日:2022-04-22
Applicant: 三菱电机株式会社
IPC: G10L25/57 , G06F16/901 , G06N3/045 , G06N3/0985 , G10L25/30
Abstract: 实施方式公开了一种用于场景的场景‑感知音频‑视频表示的方法和系统。场景‑感知音频‑视频表示对应于通过边连接的节点的图。图中的节点表示场景中的对象的视频特征。图中的连接两个节点的边表示场景中的相应两个对象的交互。在图中,至少一个或更多个边与由相应两个对象的交互发出的声音的音频特征相关联。场景的音频‑视频表示的图可以被用于执行各种不同任务。任务的示例包括动作识别、异常检测、声音定位和增强、噪声背景音去除和系统控制中的一者或组合。