一种多媒体播放设置自动调节方法及系统

    公开(公告)号:CN111027675B

    公开(公告)日:2023-03-07

    申请号:CN201911152466.2

    申请日:2019-11-22

    Applicant: 南京大学

    Abstract: 本发明公开了一种多媒体播放设置自动调节方法及系统,方法包括:当按照预设时间间隔或用户操作录制外界环境音频信息,并发送至服务器端;服务器端从接收到的外界环境音频信息中分别提取左声道和右声道的梅尔倒谱系数和恒定Q色度图两种特征,并将两种特征结合后作为各声道的音频特征;服务器端将音频特征输入训练好的深度神经网络中,得到外界环境音频信息对应的环境预测分类标签,并发送至多媒体端;多媒体端判断接收到的环境预测分类标签是否与当前环境分类一致,若不一致,则从预设的设置表中查找与所述环境分类标签对应的推荐播放设置,并按照查找到的推荐播放设置更新多媒体播放设备。本发明可以自动调节多媒体播放设置,更加智能,且调节方法更精确。

    一种多媒体播放设置自动调节方法及系统

    公开(公告)号:CN111027675A

    公开(公告)日:2020-04-17

    申请号:CN201911152466.2

    申请日:2019-11-22

    Applicant: 南京大学

    Abstract: 本发明公开了一种多媒体播放设置自动调节方法及系统,方法包括:当按照预设时间间隔或用户操作录制外界环境音频信息,并发送至服务器端;服务器端从接收到的外界环境音频信息中分别提取左声道和右声道的梅尔倒谱系数和恒定Q色度图两种特征,并将两种特征结合后作为各声道的音频特征;服务器端将音频特征输入训练好的深度神经网络中,得到外界环境音频信息对应的环境预测分类标签,并发送至多媒体端;多媒体端判断接收到的环境预测分类标签是否与当前环境分类一致,若不一致,则从预设的设置表中查找与所述环境分类标签对应的推荐播放设置,并按照查找到的推荐播放设置更新多媒体播放设备。本发明可以自动调节多媒体播放设置,更加智能,且调节方法更精确。

    一种面向大规模图像检索的Top-K召回率优化方法

    公开(公告)号:CN118537687A

    公开(公告)日:2024-08-23

    申请号:CN202410622850.9

    申请日:2024-05-20

    Applicant: 南京大学

    Inventor: 张利军 胡育玮

    Abstract: 本发明公开一种面向大规模图像检索的Top‑K召回率优化方法,适用于类别数量较多的图像检索任务。首先,用一个阈值函数来近似表示与查询输入的相似度排名为K+1的候选图像的相似度得分,并让各候选图像的得分与该函数值作比较以判断其与查询输入的相似度是否排进前K名,以此构建直接优化Top‑K召回率的损失函数。同时,采用该损失函数训练图像检索模型时,使用隐式梯度、函数值估计量以及移动平均量来构建该损失函数的梯度估计值,并使用梯度下降法来更新模型。与现有技术相比,本发明能以更低的误差来近似Top‑K召回率,可在对近似误差敏感的图像检索任务中取得更优表现。

Patent Agency Ranking