-
公开(公告)号:CN119169308A
公开(公告)日:2024-12-20
申请号:CN202411199385.9
申请日:2024-08-29
Applicant: 江南大学
IPC: G06V10/44 , G06V10/34 , G06V10/46 , G06V10/52 , G06V10/80 , G06V10/62 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明提供基于可选择多尺度图卷积网络的骨架行为识别方法,其可以提高骨架行为识别的准确率,尤其能够在大型骨架数据集上取得优异的识别准确率,并具备有良好的泛化性能。其在空间域上,构造多尺度通道拓扑细化邻接矩阵并参与图卷积,实现对更多代表性关节特征的充分提取;在时间域上,提出可选择多尺度时序卷积模块,实现对有用的时间信息的充分关注;然后,结合多尺度图卷积模块和可选择多尺度时序卷积模块,构建可选择多尺度图卷积模型,在多流网络下进行端到端的训练,有效地捕获更多的关节特征和学习有用的时间信息。
-
公开(公告)号:CN117422876A
公开(公告)日:2024-01-19
申请号:CN202311422678.4
申请日:2023-10-31
Applicant: 江南大学
IPC: G06V10/26 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明提供一种基于增强型一次性聚合网络的实例分割方法,其在处理图像数据时能提供丰富、有效的特征信息,模型有较强的泛化能力,进行图像实例分割时可以有更好的检测精度和实时性。本方法基于VoVNet模型构建骨干网络模型,在骨干网络中加入多维注意力通道混洗模块2D‑SA;2D‑SA注意力增强结构首先通过对特征进行分组计算图像特征序列的权重,其次,将每个子模块拆分通道注意力和空间注意力两个分支,以实现多维度特征提取;然后对多维度特征进行连接和聚合,并引入通道混洗运算符以实现沿通道维度的跨组信息流。
-
公开(公告)号:CN119207467A
公开(公告)日:2024-12-27
申请号:CN202411274992.7
申请日:2024-09-12
Applicant: 江南大学
Abstract: 本发明提供一种基于分频段减小混响的声音事件分类方法,其可以有效地减少混响等背景噪音的影响,提高声音分类识别的准确率来。其将待处理音频信号从时域转到频域,得到待处理频谱信号,对待处理频谱信号通过分频比控制频段带宽,对选定频段减小混响,得到减小混响后的频谱信号,将其和其他信号合并,得到减小混响后的最终输出的频谱信号,再将频谱信号转为时域信号输出;基于最终输出时域信号构成数据增强后的训练集,对声音事件分类模型训练,间接增强了声音事件分类模型对特征的表征能力。
-
公开(公告)号:CN118587479A
公开(公告)日:2024-09-03
申请号:CN202410636133.1
申请日:2024-05-22
Applicant: 江南大学
IPC: G06V10/764 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/74 , G06V20/40 , G06V40/10 , G06N3/0464
Abstract: 本申请提供的基于解开自适应多维动态图卷积网络的骨架行为识别方法,其能充分有效地提取丰富的时空特征,同时,其能够大型骨架数据集上取得优异的识别准确率,并具备有良好的泛化性能。其在空间维度采用解开自适应图卷积模块自适应调整图拓扑结构并更新人体初始的物理结构,采用多维动态时序卷积模块从多个维度对轨迹特征进行全面表征;然后,采用EMA模块跨时空维度进行时空信息聚合,加强了重要关节处的关键帧特征;最后,结合解开自适应图卷积模块、多维动态时序卷积模块和EMA模块,构建解开自适应多维动态图卷积模型,在公共的大型数据集上基于多流模型实现端到端的训练,有效地提取关节判别依赖关系和多维度的轨迹特征。
-
公开(公告)号:CN118506452A
公开(公告)日:2024-08-16
申请号:CN202410667052.8
申请日:2024-05-28
Applicant: 江南大学
IPC: G06V40/20 , G06V10/44 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本申请提供一种基于时空重聚合图卷积网络的骨架行为识别方法,其能够有效提取关节局部动作特征,同时实现了对跨帧时间特征的增强,提升了时间特征的提取能力,不但有较高的识别准确率,同时具备有良好的泛化性能。其通过对人体骨架结构进行拆分,分别计算其通道注意力进行局部特征增强并聚合还原,提出空间重聚合注意力模块,并结合通道拓扑优化图卷积模块,进而构造空间重聚合图卷积模块,实现对局部动作特征的提取;然后对特征图进行跨帧分割,并结合高效多尺度注意力机制增强各子特征图的跨帧时间特征后重新聚合,提出时序重聚合卷积模块;最后,将时序重聚合卷积模块与空间重聚合图卷积模块相结合,进一步提出时空重聚合图卷积网络模型。
-
-
-
-