-
公开(公告)号:CN113139573B
公开(公告)日:2024-08-09
申请号:CN202110257704.7
申请日:2021-03-09
Applicant: 杭州电子科技大学
IPC: G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于条件双分支注意力机制的鲁棒声纳图像生成方法。本发明采用深度学习技术对复杂水下环境进行声纳图像仿真成像。本发明打破了传统的声纳仿真技术注重底层的物理建模,在多类别、多背景的情况下存在着图像可调性差、逼真度低的局限。该方法能够利用条件信息有效地控制特定条件声纳图像的生成,通过一种双分支注意特征融合机制,依次完成信道级和像素级的注意操作,增强相应元素之间的相关性,从而生成更加清晰、逼真的声纳图像。通过实验发现,该方法在声纳图像仿真上取得很好的表现,且在噪声干扰环境下具有鲁棒的成像效果,说明深度学习方法在声呐图像仿真上的可行性,为复杂水声环境数据中的图像仿真提供了新的研究手段。
-
公开(公告)号:CN118349949A
公开(公告)日:2024-07-16
申请号:CN202410540606.8
申请日:2024-04-30
Applicant: 杭州电子科技大学
IPC: G06F18/25 , G06F18/213 , G06F18/241 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开一种多模态步态识别方法及系统。利用编码器提取肌电信号和姿态信号的深层特征;利用融合模块对肌电信号和姿态信号的深层特征进行融合,得到深层融合特征;利用解码器对深层融合特征进行解码操作,得到步态识别结果。本发明提出二次融合概念,通过分别在特征提取过程中的编码器阶段和得到深层特征之后的多模态融合,在浅层特征提取时利用对方模态信息学习本模态特征,在深层特征融合时采用权重融合策略,有效提高特征提取与融合的效率,进而提高步态识别的准确率。
-
公开(公告)号:CN114863213B
公开(公告)日:2024-04-16
申请号:CN202210512236.8
申请日:2022-05-11
Applicant: 杭州电子科技大学
IPC: G06V10/774 , G06V10/82 , G06V10/764 , G06N3/047 , G06N3/048 , G06N3/09
Abstract: 本发明公开一种基于因果解耦生成模型的域泛化图像识别方法。域泛化的目的是从多个源域数据中学习域不变表示很好的泛化到不可见的目标域,但是学习域不变特征的最大挑战在于从纠缠的特征空间中分解出语义信息和域信息。考虑到因果特征具有跨域不变的特性,本发明提出了因果解耦表征模型。首先,将跨域稳定的因果结构模型作为先验引入。然后,构建基于因果结构的生成模型,分别为任务相关和域相关特征建模。特别的是,两个隐特征之间的双向因果依赖通过一种干预手段解除,从而有效消除域相关特征对预测任务的影响。结果证明,本发明提出的方法能够有效解耦出任务相关和域相关特征,超过了大多数的解决域泛化的方法。
-
公开(公告)号:CN116796221A
公开(公告)日:2023-09-22
申请号:CN202310301807.8
申请日:2023-03-27
Applicant: 杭州电子科技大学
IPC: G06F18/24 , G06N3/096 , G06F18/214
Abstract: 本发明公开了一种面向情绪识别的深度迁移学习域自适应方法,包括S1:对原始脑电信号进行采样、处理和特征提取;S2:对目标域数据和源域数据进行特征降维;S3:对降维后的数据进行深度域自适应;S4:进行标签预测;S5:选取不同的被试者作为目标域,重复S2‑S4;S6:在跨批次实验中,选择其中一个试验批次作为目标域数据,剩下的数据作为源域数据,执行S3‑S4。本发明将联合分布自适应与深度卷积神经网络相结合,联合分布自适应方法同时考虑源域数据和目标域数据的边缘分布与条件分布的差异,提高域适应能力;采用三层网络进行多层深度域自适应,通过多层适应,可以很好的弥合边缘分布与条件分布下的域差异,提高网络的迁移能力。
-
公开(公告)号:CN116597034A
公开(公告)日:2023-08-15
申请号:CN202310556749.3
申请日:2023-05-17
Applicant: 杭州电子科技大学
IPC: G06T11/00 , G06N3/0475 , G06N3/045
Abstract: 本发明公开了一种基于区域结构一致性的汉字书法字体图像生成方法。该方法如下1.获取基础字体图像和目标字体真实图像。基础字体图像包含需要生成目标字体的汉字。2.以编码器‑解码器为基础结构,构建用于输入基础字体图像生成目标字体仿真图像的生成器。3.构建用于判别目标字体仿真图像与目标字体真实图像的判别器。判别器对输入的图像数据的每一个独立的区域进行评价打分。4.构建用于字体骨架结构约束的区域结构一致性网络。5.网络训练。6.生成所需汉字的目标字体。本发明在书法字体图像生成网络中设置区域结构一致性模块,在生成过程中对汉字骨架结构进行有效约束,使生成的目标字体仿真图像字体结构清晰,能有效还原笔划细节。
-
公开(公告)号:CN116595404A
公开(公告)日:2023-08-15
申请号:CN202310235690.8
申请日:2023-03-13
Applicant: 杭州电子科技大学
IPC: G06F18/24 , G06F18/213 , G06F3/01 , G06N3/0464 , G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 本发明公开了基于注意力机制的时空特征提取脑电目标空间定位方法。该方法采用脑机接口中的快速序列视觉呈现范式,采集被试在执行观看任务时的脑电数据。然后依次提取脑电数据的通道空间注意力特征与时空特征,再进一步提取了深度时空特征。最后基于深度时空特征进行目标空间位置定位。该方法在特征提取过程中采用两个轻量级的卷积神经网络和一个紧凑的卷积神经网络,有效降低网络的计算量,适合小数据量的数据训练。在空间时间特征提取上加入了注意力机制,显式地解耦空间和时间信息,运用了整个脑电图的多通道的丰富信息,能够对来自四个方向的目标进行空间定位。
-
公开(公告)号:CN116451059A
公开(公告)日:2023-07-18
申请号:CN202310313394.5
申请日:2023-03-28
Applicant: 杭州电子科技大学
IPC: G06F18/2131 , G06F18/2132 , G06F18/10 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/084 , G06N3/0895 , G06F3/01
Abstract: 本发明公开了一种基于注意力机制的对比表征脑机视频目标检测方法。该方法使用了两个轻量级的卷积神经网络和一个多头注意力机制的卷积神经网络,对大脑的注意力信息进行解码分类,利用脑电通道与时间维度的注意力机制以及通过对比表征的方法解决类不平衡问题,具体在训练特征提取器的阶段,对时间和空间维度的特征提取上加入了注意力机制,可以显式的解耦出空间和时间上的信息,并且通过样本对内对比学习的方式解耦出两个类间的微弱的特征差异,在特征提取的后期阶段引入多头注意力机制以学习样本的多个特征来发现微弱细小特征差异。从而定位目标是否出现以及消失的时间,解决P300特征在长视频检测中衰弱以及正负样本的长尾分布问题。
-
公开(公告)号:CN115998306A
公开(公告)日:2023-04-25
申请号:CN202211524864.4
申请日:2022-11-30
Applicant: 杭州电子科技大学
IPC: A61B5/372 , A61B5/378 , A61B5/00 , G06F18/214 , G06F18/24 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于多尺度神经网络的运动想象分类方法及系统。本发明通过将信号二维化,从而更加充分利用到了各电极EEG信号物理意义上的空间信息,将多频率尺度的卷积神经网络模块和时序循环神经网络模块有效结合到了一起,尽可能地捕捉到了信号中有用的频域信息、空域信息以及时域信息,降低了模型过拟合的可能性,具有良好的分类效果以及可泛化性;本发明考虑用户在实际执行运动想象任务过程中注意力涣散的情况,通过计算用户执行任务时的注意力指标,并在模型训练中地利用该信息,通过注意力指标计算得到的衰减系数k,调整不同频率尺度模块对应的权重来着重提取更关键频率尺度的信息,进一步增加方法的可泛化性和可信度。
-
公开(公告)号:CN115553781A
公开(公告)日:2023-01-03
申请号:CN202211190514.9
申请日:2022-09-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于核心脑网络和张量分解的驾驶疲劳状态检测方法。本发明创新性的结合相关性分析和图论中心性原理为判断节点重要性的依据,考虑功能网络随精神状态的变化,通过保留关键节点和相应边来确定影响精神状态的核心脑网络。针对多层脑网络不同频带的脑网络特征之间的关联无法被有效挖掘的问题,本发明将脑网络数据作为高阶张量,使用连续低秩非负塔克分解算法,使用张量分解的方法保留不同频带脑网络之间的相互联系,快速高效的提取多层核心脑网络的分类特征。
-
公开(公告)号:CN113178195B
公开(公告)日:2022-08-26
申请号:CN202110241424.7
申请日:2021-03-04
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于声音诱发脑电信号的说话人识别方法。本发明通过采集脑电数据,提取听觉刺激部分时频特征和时域统计特征的融合特征。采用alpha频段基线校正部分的脑电信号获得的融合特征作为背景模板。将听觉刺激部分融合特征减去背景模板得到干净任务态数据融合特征,最后利用本发明提出的网络模型区分不同说话人。本发明提供了一种可行的基于声音诱发脑电信号的说话人识别方法,并利用训练好的分类器去区分不同说话人,准确率达到90%。
-
-
-
-
-
-
-
-
-