-
公开(公告)号:CN119785403A
公开(公告)日:2025-04-08
申请号:CN202411879010.7
申请日:2024-12-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V40/16 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种面向威廉斯综合症的面部图像分析系统,包括:面部检测模块,用于识别并裁剪面部图像中的人脸区域,得到训练图像和测试图像;面部特征提取模块,用于根据训练图像,通过MobileFaceNet网络提取局部面部区域并重映射坐标值;其中局部面部区域包括:眼部区域、鼻子区域、嘴巴区域;逐像素加权模块,用于对训练图像的局部面部区域进行加权处理,得到加权图像;网络训练模块,用于通过VMamba网络对加权图像进行分类预测,得到训练好的VMamba网络;图像分析模块,用于将测试图像输入至训练好的VMamba网络,得到面向威廉斯综合症的面部图像分析结果。本发明能够准确分析具有威廉斯综合证的面孔图像。
-
公开(公告)号:CN118072143A
公开(公告)日:2024-05-24
申请号:CN202410282313.4
申请日:2024-03-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于扩散模型的缺失模态生成方法、系统及存储介质,方法包括:基于条件扩散模型构建基于UNet主干网络的缺失模态生成网络模型,多模态各自对应一个缺失模态生成网络模型,模型训练时输入包括对样本缺失模态加噪的带噪数据、加噪程度,以及其它未缺失模态组成的条件模态,输出为该样本缺失模态带噪数据中的噪声预测值;本发明方法还包括从现有数据中构建更高缺失率的样本作为模型训练的补充数据,用于提高模型处理不同类型数据缺失情况的能力;利用模型输出的预测噪声对带噪数据进行去噪,即得到缺失模态信息。本发明方法不仅能够灵活的应对任意模态缺失下的缺失模态生成任务,而且模型训练稳定,具有较好的缺失模态复原结果。
-
公开(公告)号:CN118171128A
公开(公告)日:2024-06-11
申请号:CN202410415796.0
申请日:2024-04-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2321 , G06V10/762 , G06V10/80 , G06V10/40 , G06V10/44 , G06N3/0455 , G06N3/048 , G06F18/213 , G06F18/25 , G06N3/084
Abstract: 本发明提供了一种基于变分自动编码器的不完整多视角聚类系统、方法及存储介质,该不完整多视角聚类系统包括深度多视角概率编码网络模块、多视角特征融合模块、特征一致性保持模块、聚类分配模块和深度多视角概率解码网络模块。本发明的有益效果是:1)本发明首次将概率编码器应用于不完整多视角聚类任务,能够灵活、高效的处理具有任意缺失视角数据的聚类任务而无需额外的数据补全步骤,提出的模型复杂度与视角数量呈线性关系,可以适用于具有多个视角的场景;2)本发明采用了基于分布的聚类预测方法,在提出的模型中可以直接获得聚类预测结果,而无需对提取的特征执行额外的聚类算法来获得最终结果。
-
公开(公告)号:CN119474341A
公开(公告)日:2025-02-18
申请号:CN202411610007.5
申请日:2024-11-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/334 , G06F16/35 , G06F16/31 , G06F16/903 , G06F16/906 , G06N3/0455
Abstract: 本发明公开一种多模态风险内容识别方法和装置、系统、存储介质,包括:获取多种模态数据;将多种模态数据的风险内容通过各模态转换模型对齐到文本模态,形成统一文本摘要形式,同时进行基于相似案例检索增强推理。采用本发明的技术方案,能够全面精准识别潜在风险,并对其进行层次化分类。
-
公开(公告)号:CN117556349A
公开(公告)日:2024-02-13
申请号:CN202311469150.2
申请日:2023-11-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2431 , G06F18/214 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种不完备多视图不完备多标签分类方法和装置,包括:步骤S1、获取多视图多标签数据训练集及其对应的视图与标签缺失位置信息;步骤S2、将多视图数据训练集及其对应的视图与标签缺失位置信息作为不完备多视图多标签分类深度神经网络模型的输入,根据深度神经网络模型训练损失函数,得到输入数据在深度神经网络模型的总损失;步骤S3、将待处理的多视图数据及其对应的缺失视图位置信息输入到具有所述总损失函数的深度神经网络模型中进行不完备多视图数据的多标签分类。采用本发明的技术方案,以双分支深度神经网络模型作为框架,通过对比学习的方法提升嵌入特征的鉴别能力,进而提升模型在不完备多视图多标签分类任务上的分类性能。
-
公开(公告)号:CN118948293A
公开(公告)日:2024-11-15
申请号:CN202411056546.9
申请日:2024-08-02
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 一种基于扩散模型合成可定制心脏周期的心电图生成方法,涉及一种心电图生成方法,为了解决现有的心电图生成方法生成的心电图信号存在数据不平衡、隐私保护性差以及无法生成特定病理信号的问题。本发明对将心电图语义标签作为条件输入,同时输入噪声以及扩散时间步至深度生成模型,生成心电图;所述深度生成模型以扩散模型作为整体架构,并引入了转换器模型以学习心电图信号中的长期依赖关系,同时引入了语义心电图批量归一化模块以精确学习局部ECG语义特征。有益效果为生成的心电图信号可以精确遵循提供的心电图语义信息,定制出具有真实生理意义的心电图,可以改善数据不平衡问题、隐私保护性强。
-
公开(公告)号:CN117556349B
公开(公告)日:2024-08-13
申请号:CN202311469150.2
申请日:2023-11-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2431 , G06F18/214 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种不完备多视图不完备多标签分类方法和装置,包括:步骤S1、获取多视图多标签数据训练集及其对应的视图与标签缺失位置信息;步骤S2、将多视图数据训练集及其对应的视图与标签缺失位置信息作为不完备多视图多标签分类深度神经网络模型的输入,根据深度神经网络模型训练损失函数,得到输入数据在深度神经网络模型的总损失;步骤S3、将待处理的多视图数据及其对应的缺失视图位置信息输入到具有所述总损失函数的深度神经网络模型中进行不完备多视图数据的多标签分类。采用本发明的技术方案,以双分支深度神经网络模型作为框架,通过对比学习的方法提升嵌入特征的鉴别能力,进而提升模型在不完备多视图多标签分类任务上的分类性能。
-
公开(公告)号:CN117373095A
公开(公告)日:2024-01-09
申请号:CN202311448453.6
申请日:2023-11-02
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V40/16 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种局部全局信息交叉融合的面部表情识别方法和系统,包括以下步骤:步骤S1、获取人脸图像数据集;步骤S2、根据人脸图像数据集,得到人脸表情识别模型;步骤S3、将待处理的人脸图像输入到人脸表情识别模型中,进行实时表情识别。本发明的技术方案,可以得到更精确的表情识别性能。
-
-
-
-
-
-
-