-
公开(公告)号:CN119295836A
公开(公告)日:2025-01-10
申请号:CN202411593628.7
申请日:2024-11-08
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V20/10 , G06V10/80 , G06V10/74
Abstract: 一种联合空谱关联与混合阶相似性的光谱图像地物分类方法,属于遥感图像处理和分类领域,该方法首先通过熵率超像素分析将高光谱数据集提取出的第一主成分进行分割,堆叠每个区域提取的d维潜在特征得到潜在特征矩阵。然后,根据波段间相关系数矩阵学习、高光谱波段间相似性矩阵学习以及空谱联合相关性学习得到总目标函数,并求解系数矩阵和波段间相似矩阵直到总目标函数值收敛。最后,根据求解所得波段间相似矩阵进行谱聚类,并选取信息熵最大的波段构成波段子集,对所得波段子集使用k近邻算法进行分类,得到分类结果,并计算分类准确率;与其他方法相比,本发明提高了分类的准确性,性能更加稳健。
-
公开(公告)号:CN118733984A
公开(公告)日:2024-10-01
申请号:CN202410641502.6
申请日:2024-05-22
Applicant: 哈尔滨理工大学
IPC: G06F18/20 , G06F18/2411 , G06F18/2415 , G06F18/23213 , G06Q50/00
Abstract: 本发明公开了一种基于异构图的随机游走属性网络嵌入和社区发现方法。首先,结合异构图中结构节点的结构重要性、属性重要性,以及异构图中属性节点的属性重要性,计算结构节点的影响力;其次,构建异构图的加权图及其转移概率矩阵;然后,构建加权图随机游走序列,游走时属性节点作为中介节点实现无连接节点之间的游走,低影响力节点作为桥接节点实现游走跨越,降低游走序列中的冗余信息;最后,利用skip‑gram模型对游走序列进行训练,学习每个节点的低维向量表示,根据k‑means聚类算法,对节点的低维向量进行聚类,实现社区划分。
-
公开(公告)号:CN118015694A
公开(公告)日:2024-05-10
申请号:CN202410022752.1
申请日:2024-01-06
Applicant: 哈尔滨理工大学
IPC: G06V40/20 , G06V40/10 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于分区感知网络的可见光‑红外跨模态行人图像检索的方法,属于行人图像检索技术领域。该方法可以减轻可见光图像和红外图像之间的模态差异,提高跨模态行人图像检索的性能。该方法首先构造了一个实例级通道注意力模块并将其嵌入双流主干网络中,在保持特征有效性的同时减小两种模态之间的差异。其次,区别于现有的水平划分方式,提出非重叠局部分割的方法对特征图进行划分,并在这些子块中集成局部空间注意力模块,以实现模态一致性表示的学习并增强对身体各部位细粒度特征的识别能力。此外,提出了一种交叉约束的三元组损失函数,旨在通过模态间及模态内的一致性和成对损失构建,进一步优化网络的模态解耦能力。与其他方法相比,精确度更高,性能更加稳健。
-
公开(公告)号:CN115512708B
公开(公告)日:2024-05-07
申请号:CN202211218439.2
申请日:2022-10-05
Applicant: 哈尔滨理工大学
IPC: G10L17/04 , G10L17/06 , G06F18/28 , G06F18/214 , G06F18/24
Abstract: 本发明公开了一种基于区分性字典与分类器联合学习的说话人识别方法,该方法在训练数据中增加分类器参数和正则化参数,提高了传统说话人识别系统的正确率,是在传统字典学习基础上的创新。本发明在训练阶段,首先对语音提取i‑vector,将其和One‑Hot拼接后作为稀疏分解的输入;然后初始化字典和分类器参数,获取i‑vector在字典上的稀疏表示;最后利用K均值‑奇异值分解(KSVD)算法更新字典。在识别阶段,首先利用字典与其二范数的商作为识别阶段的字典,同理得到分类器参数;然后计算测试语音在字典上的稀疏表示,分类器参数和稀疏表示的积是说话人在不同字典上的得分;最后判断得分最高说话人是否是测试说话人。本发明可以应用于说话人识别领域。
-
公开(公告)号:CN116756600A
公开(公告)日:2023-09-15
申请号:CN202310720045.5
申请日:2023-06-17
Applicant: 哈尔滨理工大学
IPC: G06F18/23213 , G06F18/22 , G06F17/16 , G06Q50/00
Abstract: 本发明针对基于随机游走的网络嵌入和社区发现方法存在忽略节点属性信息、游走时没有考虑社区中节点的中心性和边界性等问题,提出了一种基于随机游走的属性网络嵌入和社区发现方法。首先,计算节点拓扑和属性相似度,构建联合相似度矩阵。其次,分别构造偏向社区边界和内部游走的转移概率矩阵,更好地识别社区中心和边界,保持社区结构。接着,根据节点度和属性数设置游走次数和长度,减少低度和低属性节点过采样造成的冗余信息以及手动设置游走参数带来的不便。最后,通过Skip‑Gram模型得到的节点嵌入向量并运用k‑means聚类得到社区划分结果。通过在真实数据集和人工数据集上进行实验,验证了所提算法的有效性。
-
公开(公告)号:CN115910073A
公开(公告)日:2023-04-04
申请号:CN202211186472.1
申请日:2022-09-27
Applicant: 哈尔滨理工大学
IPC: G10L17/18 , G10L17/02 , G10L17/04 , G10L17/22 , G06N3/044 , G06N3/045 , G06N3/048 , G06N3/08 , G06N3/084
Abstract: 本发明提出了一种基于双向注意力残差网络的语音欺诈检测方法,能够有效提升欺诈语音检测系统的识别性能,防止欺诈语音通过自动说话人验证系统(ASV)。在训练过程中,本发明首先对语音进行预处理,并提取常数Q变换(CQT)特征矩阵,将其作为残差网络(ResNet)的输入,利用ResNet提取浅层特征,然后将此特征输入双向注意力网络,以区分特征中不同维度的重要程度,从而得到区分性更强的特征表示。在测试阶段,利用训练好的网络模型作为真实语音与欺诈语音的分类器,对语音进行打分,根据打分结果对真实语音与欺诈语音进行分类。实验结果表明,本发明方法能够明显提升欺诈检测系统的性能,保护ASV系统免受不法用户的侵害。本发明可应用在语音处理和生物识别领域。
-
公开(公告)号:CN119646627A
公开(公告)日:2025-03-18
申请号:CN202411847560.0
申请日:2024-12-13
Applicant: 哈尔滨理工大学
IPC: G06F18/241 , G06F18/2132 , G06F18/25 , G06F18/2431 , G06N3/084
Abstract: 本发明提出了一种基于记忆关联多信息可靠融合的疾病分类方法,旨在解决现有多模态模型在医疗诊断中的不可靠性和缺乏可解释性的问题。该方法利用DNA甲基化、mRNA表达和miRNA表达三种模态信息,通过构建记忆模块和可靠融合模块实现分类网络。记忆模块包含独立特征编码器,提取模态潜在特征并进行存储,基于存储模式评估模态信息的可靠性。可靠融合模块通过生成式对抗网络实现模态间的循环一致性,生成具有多模态特性的联合表示作为疾病分类的依据。在训练过程中,利用简化的霍普菲尔德能量衡量模态置信度,从而优化模态融合,确保深层特征的有效交互。该方法在疾病分类任务中表现出色,具有高可信度和可解释性,推动了多模态学习在医疗领域的应用。
-
公开(公告)号:CN119399818A
公开(公告)日:2025-02-07
申请号:CN202411599547.8
申请日:2024-11-08
Applicant: 哈尔滨理工大学
IPC: G06V40/16 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种流形关系维系的非完备多视角人脸图像深度锚图聚类方法属于多媒体信息处理中的人脸图像数据处理领域,首先通过图神经网络对每个视角构建子空间特征,然后采用流形关系对原始特征和子空间特征进行维系,同时随机选取特定于视角的锚点和公共子空间进行结合,比较其结果和原始数据之间的相似度,通过多次对网络进行梯度下降优化,得到具有鉴别性的公共子空间锚图后进行谱聚类,最终得到聚类结果和准确率。与其他方法相比,本发明的精确度更高,性能更加稳健。
-
公开(公告)号:CN119006908A
公开(公告)日:2024-11-22
申请号:CN202411082610.0
申请日:2024-08-08
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V10/82 , G06V20/10 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种面向跨地域光谱图像地物分类的可反转双路卷积方法,属于光谱图像地物分类技术领域。本发明方法将一种独特的可反转双路卷积架构融入卷积神经网络模型中,实现了对源域与目标域数据的高效且低内存需求的深度特征提取能力。进一步地,为了缩小源域与目标域之间的特征差异,本发明构建了一种基于最大平均差异的损失函数,旨在对齐两域间的特征分布,从而增强模型对目标域数据的泛化能力。同时,针对双路径卷积神经网络,构建了预测损失函数,确保模型对源域样本保持高度的预测准确性和可靠性。通过将上述两种损失函数融合为总损失函数,并以此为指导,不断优化更新网络模型的参数。最终,当模型训练成熟后,将目标域数据送入训练好的网络模型中,以获得目标域数据集的分类标签。在公开跨地域光谱数据集上的实施结果表明,本发明方法相较于现有方法,计算效率更高,内存需求更低,同时分类性能也更有竞争力。
-
公开(公告)号:CN118887247A
公开(公告)日:2024-11-01
申请号:CN202410938245.2
申请日:2024-07-12
Applicant: 哈尔滨理工大学
IPC: G06T7/136 , G06V10/764 , G06V10/80 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06V10/776 , G16H30/00
Abstract: 本发明公开了一种基于多尺度对比学习的涂鸦监督医学图像分割方法,涉及医学图像分割技术领域。该方法采用混合的CNN‑ASPP双分支网络结构,无需完全标注的未配对掩码;基于阈值的硬伪标签机制使两个分支相互学习,融合CNN主分支的局部细粒度特征与ASPP辅助分支的多尺度上下文和全局信息,隐式学习全局形状先验知识;通过结合区域损失和边界损失优化的硬伪标签监督,引导图像块级别的对比学习,充分挖掘医学图像中非目标切片的解剖结构信息,从而增强模型对前景和背景区域的区分能力,减少噪声标签的干扰,提升了分割模型的鲁棒性和泛化能力。
-
-
-
-
-
-
-
-
-