-
公开(公告)号:CN116631447A
公开(公告)日:2023-08-22
申请号:CN202310909882.2
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G10L25/57 , G10L25/78 , G10L15/22 , H04N21/439 , H04N21/44 , H04N21/435
Abstract: 本申请公开了一种噪声提取方法、装置、设备及可读存储介质,在获取待进行噪声提取的视频;先确定视频中的各个有效音频片段以及与有效音频片段对应的子视频片段;再针对每个有效音频片段,基于有效音频片段对应的子视频片段的字幕信息,从有效音频片段中提取噪声。在本方案中,考虑到实际应用场景下的有效音频片段中往往包含噪声,在确定有效音频片段之后,进一步利用有效片段对应的子视频片段的字幕信息,确定有效音频片段中是否有噪声,进而实现对有效音频片段中的噪声的提取,因此,能够提升噪声的提取效果。
-
公开(公告)号:CN116631447B
公开(公告)日:2023-12-01
申请号:CN202310909882.2
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G10L25/57 , G10L25/78 , G10L15/22 , H04N21/439 , H04N21/44 , H04N21/435
Abstract: 本申请公开了一种噪声提取方法、装置、设备及可读存储介质,在获取待进行噪声提取的视频;先确定视频中的各个有效音频片段以及与有效音频片段对应的子视频片段;再针对每个有效音频片段,基于有效音频片段对应的子视频片段的字幕信息,从有效音频片段中提取噪声。在本方案中,考虑到实际应用场景下的有效音频片段中往往包含噪声,在确定有效音频片段之后,进一步利用有效片段对应的子视频片段的字幕信息,确定有效音频片段中是否有噪声,进而实现对有效音频片段中的噪声的提取,因此,能够提升噪声的提取效果。
-
公开(公告)号:CN116644212A
公开(公告)日:2023-08-25
申请号:CN202310908926.X
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V20/62
Abstract: 本申请公开了一种视频检测方法、装置、设备及可读存储介质。在确定待检测视频以及待对比视频之后;先确定待检测视频的文本片段信息;待检测视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;然后,获取待对比视频的文本片段信息;待对比视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;最后,比较待检测视频的文本片段信息以及待对比视频的文本片段信息,确定待检测视频与待对比视频是否重复。基于该方案,由于视频的文本片段,相对于视频的图像帧来说,数量要少很多,而且,文本片段信息仅仅包含文本信息和其时间戳,比对文本片段信息相对于比对图像帧要更为简单,因此,采用本方案能够提升视频检测的效率。
-
公开(公告)号:CN116644212B
公开(公告)日:2023-12-01
申请号:CN202310908926.X
申请日:2023-07-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V20/62
Abstract: 本申请公开了一种视频检测方法、装置、设备及可读存储介质。在确定待检测视频以及待对比视频之后;先确定待检测视频的文本片段信息;待检测视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;然后,获取待对比视频的文本片段信息;待对比视频的每个文本片段信息包括一个文本信息,以及文本信息的时间戳;最后,比较待检测视频的文本片段信息以及待对比视频的文本片段信息,确定待检测视频与待对比视频是否重复。基于该方案,由于视频的文本片段,相对于视频的图像帧来说,数量要少很多,而且,文本片段信息仅仅包含文本信息和其时间戳,比对文本片段信息相对于比对图像帧要更为简单,因此,采用本方案能够提升视频检测的效率。
-
-
-