-
公开(公告)号:CN113642420A
公开(公告)日:2021-11-12
申请号:CN202110843573.0
申请日:2021-07-26
Applicant: 华侨大学
Abstract: 本发明提供了一种唇语的识别方法、装置及设备,包括:获取视频数据,并对所述视频数据进行处理,以获得唇部图像序列;对所述图像序列进行双向时序的特征提取,生成所述唇部图像序列的表观特征;调用LSTM模型,对所述表观特征的变化进行镜头转换的边界检测并生成检测结果,根据所述检测结果初始化所述LSTM模型的隐含层和记忆层;提取所述隐含层的编码特征,并根据所述编码特征获取单词预测序列。减少现有的唇语识别算法的复杂度、时间复杂度的同时保持较高的准确率。
-
公开(公告)号:CN113642420B
公开(公告)日:2024-04-16
申请号:CN202110843573.0
申请日:2021-07-26
Applicant: 华侨大学
Abstract: 本发明提供了一种唇语的识别方法、装置及设备,包括:获取视频数据,并对所述视频数据进行处理,以获得唇部图像序列;对所述图像序列进行双向时序的特征提取,生成所述唇部图像序列的表观特征;调用LSTM模型,对所述表观特征的变化进行镜头转换的边界检测并生成检测结果,根据所述检测结果初始化所述LSTM模型的隐含层和记忆层;提取所述隐含层的编码特征,并根据所述编码特征获取单词预测序列。减少现有的唇语识别算法的复杂度、时间复杂度的同时保持较高的准确率。
-
公开(公告)号:CN111327949B
公开(公告)日:2021-12-21
申请号:CN202010129341.4
申请日:2020-02-28
Applicant: 华侨大学
Abstract: 本发明公开了一种视频的时序动作检测方法、装置、设备及计算机存储介质,方法包括:对视频进行特征提取,以获得视频特征向量;将所述视频特征向量输入至时序概率卷积神经网络中,以获得时序点概率分数;去除所述时序点概率分数的冗余时序点,以获得第一开始时序点和第一结束时序点;根据所述第一开始时序点和第一结束时序点,生成初始时序动作提名;根据初始时序动作提名,以获得时序动作提名的评价分数;根据时序动作提名的评价分数对时序提名进行分类,以完成视频的时序动作检测。本发明解决了现有技术视觉特征表达力不足的问题,以及提高时序动作检测准确度。
-
公开(公告)号:CN111327949A
公开(公告)日:2020-06-23
申请号:CN202010129341.4
申请日:2020-02-28
Applicant: 华侨大学
Abstract: 本发明公开了一种视频的时序动作检测方法、装置、设备及计算机存储介质,方法包括:对视频进行特征提取,以获得视频特征向量;将所述视频特征向量输入至时序概率卷积神经网络中,以获得时序点概率分数;去除所述时序点概率分数的冗余时序点,以获得第一开始时序点和第一结束时序点;根据所述第一开始时序点和第一结束时序点,生成初始时序动作提名;根据初始时序动作提名,以获得时序动作提名的评价分数;根据时序动作提名的评价分数对时序提名进行分类,以完成视频的时序动作检测。本发明解决了现有技术视觉特征表达力不足的问题,以及提高时序动作检测准确度。
-
-
-