-
公开(公告)号:CN110334243A
公开(公告)日:2019-10-15
申请号:CN201910626365.8
申请日:2019-07-11
Applicant: 哈尔滨工业大学
IPC: G06F16/65 , G06F16/683 , G10L15/02 , G10L15/06 , G10L25/30
Abstract: 本发明提供基于多层时序池化的音频表示学习方法,属于音频分类技术领域。本发明首先提取训练集和待表示音频中每个音频样本的频谱特征,并切分成长度相等的片段,利用训练集的片段级别时频特征集合训练CNN网络,然后用训练好的CNN网络提取待表示音频的片段级别特征表示;再将提取的待表示音频的片段级别特征表示作为多层时序池化网络的输入,所述多层时序池化网络的每个时序池化层依次对输入数据进行非线性特征映射和时序编码操作,最终输出待表示音频的表示向量。本发明解决了现有缺少能够灵活、高效地捕捉任意时长音频样本的时序动态信息的特征表示技术的问题。本发明可用于鲁棒和高级的音频表示。
-
公开(公告)号:CN118887658A
公开(公告)日:2024-11-01
申请号:CN202410970713.4
申请日:2024-07-18
Applicant: 哈尔滨工业大学
Abstract: 本发明提出了一种基于梯度和Shapley Additive Explanation的二阶段激光雷达3D目标检测器的可解释性方法,流程框架如图1,能够高效地生成高质量的归因图,可视化点云中每个点对于模型预测结果的影响大小。通过基于梯度生成的归因图能够有效地定位对于目标检测器输出影响最大的点云区域。此外,结合聚类和Shapley Additive Explanation进行二阶段增强,获取一个更加精细的归因图。本发明已应用于激光雷达3D目标检测可解释性分析系统中,能够高效地可视化展示输入点云中每个点对于模型预测结果的影响。
-
公开(公告)号:CN118884379A
公开(公告)日:2024-11-01
申请号:CN202410903575.8
申请日:2024-07-08
Applicant: 哈尔滨工业大学
IPC: G01S7/41 , G06F18/2415 , G06F18/23213 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种面向毫米波雷达目标识别深度学习模型的概念级解释方法。该方法包括:结合雷达专家视觉经验,从毫米波雷达距离‑角度谱图中提取基本概念;构建自编码器以学习距离‑角度谱图的深层语义特征;根据已提取到的基本概念构建相应的概念数据集;计算每个基本概念数据集的形心以引导概念发现聚类算法训练;利用聚类熵评估聚类结果质量,并保存符合条件的聚类结果为复合概念;利用基本概念和复合概念共同解释毫米波雷达目标识别模型。本发明已成功应用于毫米波雷达目标识别解释系统中,能够对毫米波雷达目标识别深度模型提供有效的概念级解释。
-
-