基于自适应多尺度注意力时序网络的连续手语识别方法

    公开(公告)号:CN115188079A

    公开(公告)日:2022-10-14

    申请号:CN202210884237.5

    申请日:2022-07-25

    Abstract: 本发明为基于自适应多尺度注意力时序网络的连续手语识别方法,该方法包括:对输入手语图像序列调整图像大小并进行预处理;将预处理的手语图像序列输入到残差网络Resnet18中进行空间特征提取,得到空间特征;将空间特征输入到自适应多尺度注意力时序网络提取空间特征的多尺度时空特征,将多尺度时空特征输入到串联的两层的双向长短时记忆网络中,提取其长期时间联系的时空特征;利用全连接层和softmax激活函数将长期时间联系的时空特征转换为分类概率矩阵;利用分类概率矩阵进行训练解码,得到手语序列的标签。该方法解决了之前工作中使用固定时间感受野带来的手语词时间特征提取不足的问题,提升了网络的识别性能。

    一种连续手语识别方法
    2.
    发明授权

    公开(公告)号:CN111339837B

    公开(公告)日:2022-05-03

    申请号:CN202010083258.8

    申请日:2020-02-08

    Abstract: 本发明一种连续手语识别方法,涉及用于识别图形的记录载体的处理,是基于对多模态图像序列特征融合和自注意力机制的编码解码网络的连续手语识别的方法,首先获得光流图像序列,通过原始手语图像序列和光流图像序列时空特征的提取和多模态图像序列时空特征融合,和手语句子标签的文本特征序列的提取,将融合后的多模态图像序列时空特征和提取的手语句子标签的文本特征序列输入到基于自注意力机制的编码解码网络中进行手语标签预测输出,克服了现有技术存在的特征单一、视频需要分割的缺陷。

    基于信息构建和多密集残差块的循环视频超分辨率方法

    公开(公告)号:CN113487481A

    公开(公告)日:2021-10-08

    申请号:CN202110746815.4

    申请日:2021-07-02

    Abstract: 本发明为基于信息构建和多密集残差块的循环视频超分辨率方法,该方法利用引入信息构建模块对初始的循环神经网络进行先验信息构建和填充,使得序数靠前的循环神经网络有足够的信息去重建靠前帧,同时利用多密集残差块提取代表深层次信息的特征,在循环神经网络中以隐藏状态的方式进行传播;包括以下内容:对视频数据进行预处理,获得对应的低分辨率帧序列;构建信息构建模块,输入为前m帧低分辨率帧序列,输出为初始的隐藏信息h0和初始的预输出信息o0;构建多密集残差块的循环神经网络,将信息构建模块的两个输出输入到多密集残差块的循环神经网络中,得到超分辨率帧序列。可以胜任在线超分辨率任务。

    基于信息构建和多密集残差块的循环视频超分辨率方法

    公开(公告)号:CN113487481B

    公开(公告)日:2022-04-12

    申请号:CN202110746815.4

    申请日:2021-07-02

    Abstract: 本发明为基于信息构建和多密集残差块的循环视频超分辨率方法,该方法利用引入信息构建模块对初始的循环神经网络进行先验信息构建和填充,使得序数靠前的循环神经网络有足够的信息去重建靠前帧,同时利用多密集残差块提取代表深层次信息的特征,在循环神经网络中以隐藏状态的方式进行传播;包括以下内容:对视频数据进行预处理,获得对应的低分辨率帧序列;构建信息构建模块,输入为前m帧低分辨率帧序列,输出为初始的隐藏信息h0和初始的预输出信息o0;构建多密集残差块的循环神经网络,将信息构建模块的两个输出输入到多密集残差块的循环神经网络中,得到超分辨率帧序列。可以胜任在线超分辨率任务。

    一种连续手语识别方法
    9.
    发明公开

    公开(公告)号:CN111339837A

    公开(公告)日:2020-06-26

    申请号:CN202010083258.8

    申请日:2020-02-08

    Abstract: 本发明一种连续手语识别方法,涉及用于识别图形的记录载体的处理,是基于对多模态图像序列特征融合和自注意力机制的编码解码网络的连续手语识别的方法,首先获得光流图像序列,通过原始手语图像序列和光流图像序列时空特征的提取和多模态图像序列时空特征融合,和手语句子标签的文本特征序列的提取,将融合后的多模态图像序列时空特征和提取的手语句子标签的文本特征序列输入到基于自注意力机制的编码解码网络中进行手语标签预测输出,克服了现有技术存在的特征单一、视频需要分割的缺陷。

Patent Agency Ranking