-
公开(公告)号:CN115457436A
公开(公告)日:2022-12-09
申请号:CN202211051568.7
申请日:2022-08-31
Applicant: 北京邮电大学
IPC: G06V20/40 , G06V10/82 , G06V10/42 , G06V10/774 , G06V10/50 , G06V10/56 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种视频热度预测方法及装置,方法包括:提取视频数据对应的基于深度表示的多模态特征各自对应的特征向量;将各个所述特征向量输入预设的基于变分自编码器VAE的热度预测模型,并将该热度预测模型对应输出的热度序列作为所述视频数据的热度预测结果。本申请能够有效提高视频模态利用率,降低模型训练阶段的信息冗余,并能够提高视频热度预测结果的准确性。
-
公开(公告)号:CN114743013A
公开(公告)日:2022-07-12
申请号:CN202210307718.X
申请日:2022-03-25
Applicant: 中国科学院自动化研究所 , 北京邮电大学
IPC: G06V10/40 , G06V10/44 , G06K9/62 , G06N3/04 , G06N3/08 , G06T3/00 , G06V10/74 , G06V10/774 , G06V10/764 , G06V10/82
Abstract: 本发明提供一种局部描述子生成方法、装置、电子设备和计算机程序产品,所述方法包括:生成跨域数据集,跨域数据集包括多对图像对;根据跨域数据集的尺度特征图,获取特征级域自适应监督信息;根据特征级域自适应监督信息的密集描述子,获取像素级跨域一致性监督信息和描述子损失信息;基于特征级域自适应监督信息、像素级跨域一致性监督信息和描述子损失信息的结合,确定总损失,总损失用于网络的监督训练,获取局部描述子。本发明可增强局部描述子的不变性和鲁棒性,提高描述子在图像匹配任务上的精度。
-
公开(公告)号:CN114743013B
公开(公告)日:2024-12-10
申请号:CN202210307718.X
申请日:2022-03-25
Applicant: 中国科学院自动化研究所 , 北京邮电大学
IPC: G06V10/40 , G06V10/44 , G06T3/04 , G06N3/09 , G06N3/094 , G06N3/0455 , G06V10/74 , G06V10/774 , G06V10/764 , G06V10/82
Abstract: 本发明提供一种局部描述子生成方法、装置、电子设备和计算机程序产品,所述方法包括:生成跨域数据集,跨域数据集包括多对图像对;根据跨域数据集的尺度特征图,获取特征级域自适应监督信息;根据特征级域自适应监督信息的密集描述子,获取像素级跨域一致性监督信息和描述子损失信息;基于特征级域自适应监督信息、像素级跨域一致性监督信息和描述子损失信息的结合,确定总损失,总损失用于网络的监督训练,获取局部描述子。本发明可增强局部描述子的不变性和鲁棒性,提高描述子在图像匹配任务上的精度。
-
公开(公告)号:CN115472181A
公开(公告)日:2022-12-13
申请号:CN202211068244.4
申请日:2022-08-31
Applicant: 北京邮电大学
Abstract: 本发明提供一种基于特征融合和聚类的翻唱识别方法、装置和存储介质,所述方法包括:提取两个输入音频的音频特征;将两个音频特征沿着通道维度进行融合,形成双通道融合特征,利用融合分类特征提取网络提取两个输入音频的分类特征;利用音乐特征聚类网络分别提取两个音频特征的聚类结果;利用二分类决策网络根据两个输入音频的分类特征和各输入音频的聚类结果,输出所述待识别音频的二分类翻唱识别结果。所述方法丰富了音频特征的维度信息,提高了翻唱识别的鲁棒性;丰富了数据标签种类,避免了特征融合的局限性,降低了翻唱识别模型的训练难度,提升了翻唱识别模型的识别性能。
-
-
-