-
公开(公告)号:CN113627301A
公开(公告)日:2021-11-09
申请号:CN202110882648.6
申请日:2021-08-02
Applicant: 科大讯飞股份有限公司
Inventor: 冯军
Abstract: 本发明提供一种实时视频信息提取方法、装置和系统,其中方法包括:确定音视频交互产生的第一方的实时音频和实时视频,以及第二方的实时音频;提取第一方和/或第二方的实时音频中的实时语义信息;基于实时语义信息,对第一方的实时视频进行目标检测,得到包含目标的视频帧;从至少一个视频帧中识别目标的信息。本发明通过提取第一方和/或第二方的实时音频的实时语义信息,可以预估第一方提供数据的时间,据此对第一方的实时视频进行目标检测,得到包含目标的视频帧后,对视频帧进行图像处理,可以实现数据的自动获取,使得整个交互过程中,数据提供方仅需在摄像头前展示需提供的数据,而无需另行收集数据并传输给对方,提高了数据获取的效率。
-
公开(公告)号:CN115457429A
公开(公告)日:2022-12-09
申请号:CN202210995330.3
申请日:2022-08-18
Applicant: 科大讯飞股份有限公司
IPC: G06V20/40 , G06V30/10 , G06F3/0484 , G06Q30/00
Abstract: 本申请公开了一种视频信息提取方法、系统以及相关装置,该视频信息提取方法包括:接收第一方触发的识别指令;其中,所述识别指令包含对应的识别时刻;基于所述识别时刻从所述第一方和第二方交互时产生的视频流中获得包含待识别目标的待识别视频数据;从所述待识别视频数据中获得与所述待识别目标对应的识别结果。通过上述方式,本申请能够在视频交互的过程中完成相应目标的识别,以提高信息录入的效率。
-
公开(公告)号:CN113627301B
公开(公告)日:2023-10-31
申请号:CN202110882648.6
申请日:2021-08-02
Applicant: 科大讯飞股份有限公司
Inventor: 冯军
Abstract: 本发明提供一种实时视频信息提取方法、装置和系统,其中方法包括:确定音视频交互产生的第一方的实时音频和实时视频,以及第二方的实时音频;提取第一方和/或第二方的实时音频中的实时语义信息;基于实时语义信息,对第一方的实时视频进行目标检测,得到包含目标的视频帧;从至少一个视频帧中识别目标的信息。本发明通过提取第一方和/或第二方的实时音频的实时语义信息,可以预估第一方提供数据的时间,据此对第一方的实时视频进行目标检测,得到包含目标的视频帧后,对视频帧进行图像处理,可以实现数据的自动获取,使得整个交互过程中,数据提供方仅需在摄像头前展示需提供的数据,而无需另行收集数据并传输给对方,提高了数据获取的效率。
-
-