-
公开(公告)号:CN118349922A
公开(公告)日:2024-07-16
申请号:CN202410783596.0
申请日:2024-06-18
Applicant: 厦门理工学院
IPC: G06F18/2431 , G06F18/25 , G06F18/213 , G10L25/03 , G10L25/30 , G10L25/63 , G10H1/00 , G06F40/216 , G06F40/253 , G06F40/284 , G06F40/30 , G06N3/044 , G06N3/045 , G06N3/047 , G06N3/0475
Abstract: 本发明提供的基于上下文特征的音乐情感识别方法、装置、设备及介质,涉及人工智能技术领域,本发明方法通过对音乐样本数据集进行数据处理与特征提取后,采用深度置信网络DBN模型训练学习音乐的局部特征,得到DBN融合特征;构建特征金字塔,以提高模型对不同分辨率下的特征提取的准确性,得到多尺度融合DBN模型;再结合一定时间间隔的前后音乐片段的特征,计算出上下文特征值差,并根据特征值差,进行相邻片段之间的上下文特征融合,以修正模型对情感一致性的理解,最终得到音乐情感识别模型。本发明方法能够捕捉音乐不同层次的细节特征,提高了音乐特征提取与情感分类识别的效率。
-
公开(公告)号:CN118537631A
公开(公告)日:2024-08-23
申请号:CN202410580597.5
申请日:2024-05-11
Applicant: 厦门理工学院
IPC: G06V10/764 , G06V10/82 , G06V10/52 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供了基于特征金字塔和注意力机制的图像情感分析方法、装置,通过对图像进行情感分析,可以更深入地理解图像所传达的信息,进而更好地满足人们在视觉内容理解和交互方面的需求。本方法在ResNet50模型的基础上进行改进,在ResNet50模型中利用特征金字塔模块整合多尺度特征图,以提高图像情感分析的准确率。通过引入CBAM注意力模块来增强对关键特征的关注。模型结合了通道注意力机制和空间注意力机制,以捕捉图像中重要的通道和空间信息。综上所述,本发明提出的基于特征金字塔和注意力机制的图像情感分析模型在特征提取和情感分析方面具有一定的准确性和可靠性。
-