生成视频语料的方法、装置及相关设备

    公开(公告)号:CN115269884A

    公开(公告)日:2022-11-01

    申请号:CN202110905684.X

    申请日:2021-08-06

    Abstract: 本申请提供了一种生成视频语料的方法,具体为获取待处理视频,该待处理视频对应语音内容,并且待处理视频的部分视频图像包括语音内容对应的字幕。然后,根据该语音内容,从待处理视频中获取目标视频片段,并将该目标视频片段中的视频图像包括的字幕作为该目标视频片段的标注文本,得到视频语料。如此,可以实现自动生成视频语料,从而不仅可以避免人工标注过程中因为主观认知误差而导致对于切分精度的影响,而且生成视频语料的效率通常也较高。并且,可以避免生成的视频语料中出现语音内容播放不完整的问题,同时,视频语料的标注文本的准确性更高。此外,本申请还提供了一种视频语料生成装置及相关设备。

Patent Agency Ranking