-
公开(公告)号:CN115579021A
公开(公告)日:2023-01-06
申请号:CN202211165910.6
申请日:2022-09-23
Applicant: 重庆邮电大学
IPC: G10L25/51 , G10L25/30 , G10L25/03 , G10L25/18 , G06V40/16 , G06V10/84 , G06V10/82 , G06V10/774 , G06V10/74 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于神经网络和视听融合的声乐表演评分方法及系统,属于声乐测评领域。该方法利用不同的神经网络分别得到三个维度的专家评分数据,包括音频评分、情感评分与着装评分,然后将三个维度的评分输入到专家评分拟合神经网络,最后得到综合评分。本发明使评测结果更加真实有效、贴近专家评分,评分流程更加高效便捷。
-
公开(公告)号:CN114677356A
公开(公告)日:2022-06-28
申请号:CN202210356955.5
申请日:2022-04-01
Applicant: 重庆邮电大学
IPC: G06T7/00 , G06T7/12 , G06T7/13 , G06T7/136 , G06T5/50 , G06T5/40 , G01N21/88 , G01N21/952 , G01N21/956
Abstract: 本发明涉及一种基于多视角图像融合的酒瓶外观缺陷检测方法,属于图像处理技术领域,包括步骤:S1:将酒瓶送达预定拍摄位置,调整光源环境条件;S2:获取酒瓶全方位外观图像信息;S3:对摄像机参数进行矫正,拍摄得到无畸变的酒瓶图像;S4:预处理;S5:进行图像拼接融合,得到具有完整酒瓶外观的酒瓶剖面二维展开图;S6:对拼接好的图像进行顺序处理,根据标准酒瓶展开图的顺序,使用图像分割技术,对拼接后的图像进行重新排列,得到与标准展开图类似的酒瓶外观拼接图;S7:将所述酒瓶外观拼接图的剖面二维展开图与标准展开图进行色差一致性匹配,然后再进行图像相减,判断受检酒瓶是否存在外观缺陷。
-
公开(公告)号:CN119027765A
公开(公告)日:2024-11-26
申请号:CN202410973280.8
申请日:2024-07-19
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于视听融合的声乐演唱情感评价方法,属于声乐情感测评领域,其包括:构建演唱情感打分数据集,并对数据集进行预处理;采用视频特征提取网络的慢路径和快路径同时捕捉视频中的宏表情和微表情的动态信息,并将慢路径和快路径上提取的特征信息进行融合,得到视觉模态特征;提取演唱音频的能够表征演唱者情感的听觉模态特征;采用双模态交叉注意力机制对视觉模态特征和听觉模态特征进行交互得到互补的视觉模态特征和听觉模态特征,并为其设置对应的能够自主学习的权重参数,再根据特征和权重得到打分结果;构建对应的损失函数,根据损失函数计算预测打分的误差。本发明显著提高了在声乐演唱情感智能测评领域的情感评分的准确性。
-
-