基于目标检测的视唱音高检测方法、系统、设备及介质

    公开(公告)号:CN115206339B

    公开(公告)日:2024-09-13

    申请号:CN202210656997.0

    申请日:2022-06-10

    Abstract: 本发明公开了一种基于目标检测的视唱音高检测方法、系统、设备及介质,属于音频数据处理领域,方法包括:获取视唱音频并转换为二维声谱图,检测二维声谱图中各音符的起始时刻、结束时刻和音符下边界代表的频点索引;以第一音符的音符下边界代表的频点索引对应频率为中心,向上、向下分别容纳设定数量的频点为目标,确定第一音符的频点框的顶边频率值和底边频率值;在第一音符的顶边频率值和底边频率值之间的频率范围内,对起始时刻和结束时刻之间的二维声谱图中的每一帧进行峰值搜索,得到每一帧峰值对应的频率值;对第一音符中每一帧峰值对应的频率值求和取平均,得到其音高对应的平均频率以计算其的音高。提高视唱音高检索的精准度和效率。

    基于目标检测的视唱音高检测方法、系统、设备及介质

    公开(公告)号:CN115206339A

    公开(公告)日:2022-10-18

    申请号:CN202210656997.0

    申请日:2022-06-10

    Abstract: 本发明公开了一种基于目标检测的视唱音高检测方法、系统、设备及介质,属于音频数据处理领域,方法包括:获取视唱音频并转换为二维声谱图,检测二维声谱图中各音符的起始时刻、结束时刻和音符下边界代表的频点索引;以第一音符的音符下边界代表的频点索引对应频率为中心,向上、向下分别容纳设定数量的频点为目标,确定第一音符的频点框的顶边频率值和底边频率值;在第一音符的顶边频率值和底边频率值之间的频率范围内,对起始时刻和结束时刻之间的二维声谱图中的每一帧进行峰值搜索,得到每一帧峰值对应的频率值;对第一音符中每一帧峰值对应的频率值求和取平均,得到其音高对应的平均频率以计算其的音高。提高视唱音高检索的精准度和效率。

Patent Agency Ranking