-
公开(公告)号:CN119672588A
公开(公告)日:2025-03-21
申请号:CN202411493375.6
申请日:2024-10-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于特征相似度的动作分割网络优化方法。本发明首先需要获取数据集的视频,将原始的视频进行分帧处理,得到时序图片,然后获得对应的标签。然后利用通用的特征提取网络获得对数据集进行特征提取,得到相应的特征,然后根据输入的特征计算代表性特征。然后根据代表性特征进行特征相似度计算,然后进行滤波处理,之后将将滤波后的特征相似度输入到损失函数中,反向传播更新参数。本发明通过求得视频中动作的代表性特征,结合特征相似度,对网络的训练加以辅助,达到更好的动作分类结果,减少了过分割错误,适用范围广、模型精确度高、鲁棒性强。
-
公开(公告)号:CN119672589A
公开(公告)日:2025-03-21
申请号:CN202411493382.6
申请日:2024-10-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于卡方过滤的双分支网络视频分割方法。首先利用现有的3D特征提取网络对数据集进行特征提取,然后对提取的特征进行再处理;将再处理的特征输入到双分支神经网络当中,为了结合两分支网络的特性,边界分支注重于识别边界,主干分支注重于识别动作主体,利用投票的形式结合双分支阶段输出的网络参数;最后反向传播更新参数。本发明针对于神经网络使用含有噪声的特征进行训练导致的过拟合问题,提出了一种特征预处理方式,使用卡方过滤与遗传算法来优化未经过处理的特征。本发明通过将预处理部分与双分支神经网络上进行结合,提高了预测的准确率,在50Salads与Gtea数据集上取得了出色的结果。
-
公开(公告)号:CN115375967A
公开(公告)日:2022-11-22
申请号:CN202210975326.0
申请日:2022-08-15
Applicant: 杭州电子科技大学 , 北京中电华大电子设计有限责任公司
IPC: G06V10/774 , G06V20/00 , G06V10/34 , G06F11/36
Abstract: 本发明涉及一种基于MCU‑AI的多场景自适应识别方法。其实现步骤为(1)批量图像输入和预处理(2)自适应图像增强(3)获取预设模型框架,通过AutoML从多个模型框架中选择适合的网络模型进行批量图像训练。(4)量化并转换模型(5)添加随机波动,并不断重复测试,选取最好的量化参数。并以此重新进行训练后量化操作(6)测试执行,重新对感知量化后的模型进行评估测试精度。本发明设计了一种基于MCU‑AI的多场景自适应识别方法,旨在针对多个不同数据集实现自适应图像增强以及网络模型选择,不断改进量化感知参数,以提升部署到MCU中的模型整体性能。
-
公开(公告)号:CN116596037A
公开(公告)日:2023-08-15
申请号:CN202310571199.2
申请日:2023-05-17
Applicant: 杭州电子科技大学
IPC: G06N3/0464 , G06N3/082 , G06V10/764 , G06V10/20 , G06V10/82 , G06V10/778
Abstract: 本发明公开了一种基于结构重参数化的模型优化方法。本发明步骤包括:1、确定当前模型是否包括卷积、残差结构;2、确定当前模型的数据集类型,对不同的数据进行增强图像;3、对当前模型进行结构复杂化,将当前模型中3x3卷积结构改写多分支结构,得到复杂模型;然后用确定的数据集训练该复杂模型,得到训练好的复杂模型的模型权重;4、基于结构重参数化替换复杂模型中的分支结构,将复杂模型中的分支结构等价替换为单个卷积核大小相同的3x3卷积结构,同时删除复杂模型中梯度为0的通道,得到裁剪后的模型;5、测试裁剪过的模型,进行评估测试精度。本发明的优势在于使用结构重参数化实现剪枝和重构,适用范围广、模型精确度高、鲁棒性强。
-
公开(公告)号:CN115376164A
公开(公告)日:2022-11-22
申请号:CN202210975109.1
申请日:2022-08-15
Applicant: 杭州电子科技大学 , 北京中电华大电子设计有限责任公司
IPC: G06V40/12 , G06V10/30 , G06V10/74 , G06V10/774 , G06V10/764 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于知识蒸馏网络的MCU指纹识别方法。包括1)批量图像输入和预处理;2)利用CNN卷积神经网络进行特征提取;3)利用三元组损失函数对提取到的指纹特征图进行无监督训练,并比较高维特征图之间的余弦相似度,从而得出同类指纹及异类指纹之间的相似程度并用于评估;4)使用量化感知策略,在量化的过程中,对网络进行训练,从而减小模型尺寸大小,减少模型内存占用,加快模型推理速度,降低功耗;5)利用知识蒸馏技术将复杂模型中的知识迁移到简单模型中;6)执行测试,对训练好的学生网络进行图像相似度评估。
-
公开(公告)号:CN119723630A
公开(公告)日:2025-03-28
申请号:CN202411512411.9
申请日:2024-10-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于人脸模板和滑动窗口的人脸提取方法,首先将图片转为灰度图,并采用sobel算子进行边缘检测得到边缘强度特征;对灰度图进行预处理,然后对经过处理的图片计算积分图;基于人脸模板,对人脸模板满足规则的阈值进行赋值;基于积分图计算像素密度特征,然后结合边缘强度特征标记人脸候选区域;最后利用滑动窗口检测人脸候选区域并与人脸模板满足规则结合寻找具体人脸位置,绘制人脸方框。本发明引入人脸模板与自适应的滑动窗口检测结合技术,利用检测区域与人脸模板的匹配程度增强检测的准确性。本发明采用基于特征点的局部滑动窗口,避免对无效区域、无效特征的检测,通过对边缘强度特征和像素密集度特征的检测,来预测人脸的大致位置,并结合人脸模板搜索人脸具体位置。
-
公开(公告)号:CN117275048A
公开(公告)日:2023-12-22
申请号:CN202311273312.5
申请日:2023-09-28
Applicant: 杭州电子科技大学
IPC: G06V40/12 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种基于全局特征和局部细节点特征融合的指纹识别方法。本发明步骤包括(1)批量的图像输入和预处理;(2)利用CvT模型网络进行特征提取;(3)使用CNN卷积神经网络来获取指纹图像的细节点信息;(4)通过设定阈值对得到的细节点分数图进行细节点筛选,最后获取得到细节点信息;(5)执行测试,通过得到的全局特征图和细节点信息,对训练好的学生网络进行图像相似度评估。本发明旨在通过指纹全局特征和细节点局部特征融合的方法,实现指纹全局信息和局部信息的互补来达到指纹的高精度识别。
-
公开(公告)号:CN119762632A
公开(公告)日:2025-04-04
申请号:CN202411503462.5
申请日:2024-10-25
Applicant: 杭州电子科技大学
IPC: G06T13/20 , G06V10/80 , G06N3/047 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于光流信息的扩散模型视频生成方法。首先对现有数据集中的视频进行预处理,获取参考图像信息和光流信息;然后使用标准Stable Diffusion模型作为视频生成的主干网络;使用两个与标准SD模型中Unet结构相同的Unet分别提取参考图像特征和光流特征,参考图像特征在自注意力层与SD模型Unet的自注意力层进行融合,光流特征在交叉注意力层和SD模型Unet的时序注意力层进行融合。同时为了更好的利用光流信息,本发明提出了运动损失来进一步提高网络的生成效果。另外,本发明也采用了多样化的提示信息使得网络能够获得更加稳定的生成效果。
-
公开(公告)号:CN119672769A
公开(公告)日:2025-03-21
申请号:CN202411493371.8
申请日:2024-10-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于多任务学习的端侧指纹表征识别方法。首先对指纹图片进行预处理,然后将预处理后的训练数据输入主干神经网络,得到基础特征;之后将基础特征输入细节点提取网络,经过多层卷积和反卷积,生成纹理信息图。将基础特征输入多层感知机,生成拓扑信息,并得到对应的类别信息。最后将基础特征、纹理信息和拓扑信息通过联合损失函数,反向传播于三个网络模块进行更新,以达到将基础特征在纹理信息和拓扑信息的辅佐下转化为指纹表征信息的目的。本发明使用多任务学习方法,多尺度学习指纹特征信息,有效提升指纹识别精度。本发明将指纹多尺度信息融合为一个指纹表征,使得鲁棒性更强。本发明全程采用轻量级网络,节省了硬件资源开销,更加适配端侧设备。
-
-
-
-
-
-
-
-