基于高低频强化的全景图像分割方法、计算机系统和介质

    公开(公告)号:CN113592790B

    公开(公告)日:2023-08-29

    申请号:CN202110806328.2

    申请日:2021-07-16

    Abstract: 基于高低频强化的全景图像分割方法、计算机系统和介质,属于深度学习图像处理领域,为了解决传统时域卷积神经网络对前背景特征频率的忽视问题,读取数据集图像,对图像预处理获取四层残差特征,对四层残差特征进行特征维度调整,实施高低频特征分离,得到高频特征和低频特征,将高频特征进行高频强化,得到高频强化特征,将低频特征进行低频强化,得到低频强化特征,将高频强化特征和低频强化特征分别进行分割预测,并得到两种分割结果进行融合,得到全景分割结果,效果是根据频域特性分离高低频特征,以频率需求为导向提取前背景特征,并通过强化前背景特征的频域显著性差异来加速场景分析和理解过程。

    全面特征捕捉型时间卷积网络、视频动作分割方法、计算机系统和介质

    公开(公告)号:CN113536898B

    公开(公告)日:2023-08-29

    申请号:CN202110603903.9

    申请日:2021-05-31

    Abstract: 全面特征捕捉型时间卷积网络、视频动作分割方法、计算机系统和介质,属于视频理解与分析中的视频动作分割技术领域,为了解决动作分割网络对于目标动作的漏检、错检会导致其在实际应用中的可靠性降低的问题,将两特征矩阵拼接后的特征矩阵作为后一基本单元的感受野递增时间卷积和感受野递减时间卷积的输入,分别提取特征后将两特征矩阵拼接;S6.重复步骤S5直至最后一个基本单元的感受野递增时间卷积和感受野递减时间卷积分别提取特征后将两特征矩阵拼接,使用通道调整卷积获取第二特征矩阵,识别动作分类输出,效果是提高视频特征提取能力。

    时频域联合全景分割卷积神经网络及应用

    公开(公告)号:CN113536905B

    公开(公告)日:2023-08-25

    申请号:CN202110617619.7

    申请日:2021-06-03

    Abstract: 时频域联合全景分割卷积神经网络及应用,属于深度学习图像处理领域,包括频域变换网络,将输入变换为频域信息,提取图像的高低频特征;时域变换网络,将输入变换为时域信息,提取图像中的实例特征和语义特征;时频域联合网络,为频域变换网络和时域变换网络分别对应输出的高频特征、低频特征、实例特征和语义特征依次分配乘积系数;分割融合网络,融合前背景分割结果,生成全景分割结果,效果是能够应用于自主汽车、辅助驾驶、机器人以及公共安全天眼监控系统等多个领域。

    一种基于深度学习的虚拟试衣系统

    公开(公告)号:CN115619888A

    公开(公告)日:2023-01-17

    申请号:CN202211388923.X

    申请日:2022-11-08

    Abstract: 一种基于深度学习的虚拟试衣系统,属于人工智能领域,为了解决通过机器学习方法实现虚拟试穿的问题,风格编码器E1、风格编码器E2、风格融合器H和风格译码器D,风格融合器H包括第一输入端和第二输入端,所述风格编码器E1的输出与风格融合器H的第一输入连接,所述风格编码器E2的输出与风格融合器H的第二输入连接;所述风格融合器H的输出与所述风格译码器D的输入连接,所述风格译码器D输出图片的风格迁移特征,效果是实现了基于深度学习的虚拟试衣系统,能够快速适用于视频平台主播的衣着更换应用以及购物平台服装搭配的衣着更换应用。

    一种泛化增强的少数民族舞蹈视频动作分割方法

    公开(公告)号:CN114937228A

    公开(公告)日:2022-08-23

    申请号:CN202210675171.9

    申请日:2022-06-15

    Inventor: 毛琳 曹哲 杨大伟

    Abstract: 本发明公开了一种泛化增强的少数民族舞蹈视频动作分割方法,属于深度学习视频动作分割领域。其提出多阶段域泛化视频动作分割网络,包含多个单阶段域泛化时间卷积。每个单阶段域泛化时间卷积内,通过捕捉帧间关系、动作内关系和动作间关系,获得多层次特征,通过多层次关系推理动作类别,提升准确性。并利用多层次关系执行对抗性数据增强的域泛化方法,获得增广域样本,将增广域样本与源域样本共同作为训练集参与网络训练过程,提升网络的泛化能力。通过多阶段网络结构实现增广域样本和动作分割结果的逐步优化。本发明适用于少数民族舞蹈视频教学、安防监控等领域。

    少数民族舞蹈视频描述中视觉互参考语义检测方法

    公开(公告)号:CN114898280A

    公开(公告)日:2022-08-12

    申请号:CN202210675177.6

    申请日:2022-06-15

    Inventor: 杨大伟 高航 毛琳

    Abstract: 本发明公开了一种少数民族舞蹈视频描述中视觉互参考语义检测方法,其将输入视觉特征经过视觉互参考语义检测结构进行处理,输出表达能力较强的视频语义信息。所述视觉互参考语义检测结构以3D卷积神经网络和2D卷积神经网络处理得到的视频3D视觉特征和2D视觉特征为输入,分别经3D语义检测支路和2D语义检测支路提取语义特征,在语义提取过程中将3D视觉特征引入2D语义检测支路,将2D视觉特征引入3D语义检测支路,实现3D和2D信息的交互作用,同时采用多阶段迭代操作进一步提升语义特征表达能力,将两支路最终输出的3D语义特征和2D语义特征拼接融合来表达视频语义。将该语义特征输入至长短时记忆网络进行解码,可以得到较准确的视频文本描述。

    一种结构引导的风格偏差校正型风格迁移方法及系统

    公开(公告)号:CN114757819A

    公开(公告)日:2022-07-15

    申请号:CN202210403483.4

    申请日:2022-04-18

    Inventor: 毛琳 王萌 杨大伟

    Abstract: 本发明公开了一种结构引导的风格偏差校正型风格迁移方法及系统,属于深度学习风格迁移领域。为实现风格特征精确映射,本发明提出结构引导模块,包含特征优化单元和风格校正单元。特征优化单元利用网络深度提取能力保证单特征通道风格特征完整传递和精确分类,风格校正单元为语义形式的风格特征增添空间结构位置信息,借助注意力分组交互方式将风格语义与内容结构重新匹配,为后续寻找合适的风格和内容表达提供帮助。将赋予了空间结构信息的风格特征与特征优化单元处理的风格特征相乘,校准风格特征映射偏差。本发明适用于自动驾驶、安防监控等领域。

    基于边缘特征融合的3D点云分割目标检测系统

    公开(公告)号:CN113538474A

    公开(公告)日:2021-10-22

    申请号:CN202110786257.4

    申请日:2021-07-12

    Abstract: 本发明公开了基于边缘特征融合的3D点云分割目标检测系统,涉及深度学习3D点云分割技术领域;其采用多层感知机提取边缘特征,将点云保持特征与点云提取特征相融合,生成点云边缘融合特征,增强边缘特征的提取能力,将得到的边缘特征应用于目标检测任务,提升点云分割模型的精度,获得准确的点云目标检测结果,可以很好地应用于无人驾驶、机械手感知等领域。

    视频描述中视觉特征融合语义检测方法及系统

    公开(公告)号:CN113269253A

    公开(公告)日:2021-08-17

    申请号:CN202110580006.0

    申请日:2021-05-26

    Abstract: 本发明公开了一种视频描述中视觉特征融合语义检测方法及系统,其在多层感知机的特征处理过程中融合视觉信息,丰富特征内容的多样性,复用视觉特征融合结构得到视觉特征融合语义检测单元,获取具备视觉信息和语义信息双重表达的语义特征,提升语义特征的表达能力。将视觉保持支路得到的视觉特征和语义增强支路得到的语义特征,级联后作为视频编码特征,输入到长短时记忆网络进行解码,得到视频的文本描述,该方法得到的语义特征可以提升视频描述的准确度。

Patent Agency Ranking