-
公开(公告)号:CN114678039B
公开(公告)日:2025-01-24
申请号:CN202210388559.0
申请日:2022-04-13
Applicant: 厦门大学
Abstract: 本发明提供了歌唱评价技术领域的一种基于深度学习的歌唱评价方法,包括如下步骤:步骤S10、获取大量的歌唱数据,对各所述歌唱数据进行清洗;步骤S20、提取清洗后的各所述歌唱数据的音频特征,构建特征数据集;步骤S30、创建一音频对齐模型,基于所述音频对齐模型对特征数据集中的各音频特征进行对齐;步骤S40、基于深度学习创建一多维度评价模型,利用对齐后的所述特征数据集对多维度评价模型进行训练;步骤S50、获取待评价音频,将所述待评价音频输入多维度评价模型,得到音准评价值、节奏评价值以及发音评价值并进行展示。本发明的优点在于:极大的提升了歌唱评价的准确性以及可解释性。
-
公开(公告)号:CN114495232B
公开(公告)日:2025-01-24
申请号:CN202210101703.8
申请日:2022-01-27
Applicant: 厦门大学
IPC: G06V40/16 , G06V40/20 , G06V20/40 , G06V10/44 , G06V10/62 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了动作识别技术领域的一种基于深度学习的课堂学生动作识别方法及系统,方法包括:步骤S10、对捕获的课堂视频进行剪辑得到若干个课堂子视频;步骤S20、通过人脸检测算法依次检测各课堂子视频中的人脸,进而将课堂子视频剪辑成若干个人脸子视频;步骤S30、分别提取各人脸子视频的静态特征图片以及动态特征图片,基于各静态特征图片以及动态特征图片构建训练数据集;步骤S40、基于深度学习创建一动作识别模型,利用训练数据集对动作识别模型进行训练;步骤S50、利用训练后的动作识别模型对摄像头捕捉的课堂视频进行实时的动作识别。本发明的优点在于:实现实时、准确的识别学生动作,以及时调整教学策略,进而极大的提升了教学质量。
-
公开(公告)号:CN112381036B
公开(公告)日:2024-10-15
申请号:CN202011343361.8
申请日:2020-11-26
Applicant: 厦门大学
IPC: G06V40/16 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/082
Abstract: 一种应用于刑侦的微表情与宏表情片段识别方法,步骤一:采集犯罪嫌疑人视频信息;步骤二:将视频数据转换成图像数据,并进行人脸定位;步骤三:将人脸视频序列数据分别进行微表情片段和宏表情片段的发现;步骤四:然后将发现的微表情和宏表情片段进行相应的微表情和宏表情的识别,得出结果。本发明通过对犯罪嫌疑人视频中发现微表情和宏表情片段并对其进行识别,可以帮助更好的捕捉宏微表情序列,消除了时间,光照,和头部移动的对结果的影响,有较高的鲁棒性和泛化能力,提高预测精度。
-
公开(公告)号:CN118655889A
公开(公告)日:2024-09-17
申请号:CN202410670615.9
申请日:2024-05-28
Applicant: 厦门大学
Abstract: 本发明提供了机器人技术领域的一种多功能智能移动机器人的控制方法,包括:步骤S1、服务器接收移动终端发送的控制指令;步骤S2、将控制指令加密为加密指令发送给机器人;步骤S3、机器人的控制模块解密加密指令得到控制指令,解析控制指令得到目标地址名称、目标地址经纬度、控制内容;步骤S4、控制模块基于目标地址名称、目标地址经纬度自动规划行进路线;步骤S5、控制模块基于行进路线将机器人移动至目标地址;步骤S6、控制模块执行控制内容,将执行数据存储至存储器,并生成执行报告;步骤S7、控制模块通过LED全息屏显示执行报告,将执行报告加密为加密报告反馈给移动终端。本发明的优点在于:极大的提升了机器人控制的便捷性以及安全性。
-
公开(公告)号:CN114724151B
公开(公告)日:2024-09-17
申请号:CN202210430507.5
申请日:2022-04-22
Applicant: 厦门大学
IPC: G06V30/41 , G06N3/0464 , G06V30/304 , G06V10/82 , G06V10/774
Abstract: 本发明提供了乐谱识别技术领域的一种基于卷积神经网络的古筝简谱识别方法及系统,方法包括如下步骤:步骤S10、获取古筝简谱图像,并对所述古筝简谱图像进行预处理;步骤S20、通过投影法对预处理后的所述古筝简谱图像进行分行,得到属性行、音符行以及汉字行;步骤S30、结合卷积神经网络、投影法、模板匹配法以及边缘检测法,提取所述属性行和音符行的简谱特征;步骤S40、将各所述简谱特征填入mus i cXML模板中,完成古筝简谱的识别。本发明的优点在于:极大的提升了古筝简谱的识别精度。
-
公开(公告)号:CN118644863A
公开(公告)日:2024-09-13
申请号:CN202410623789.X
申请日:2024-05-20
Applicant: 厦门大学
IPC: G06V30/304 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明提供了架子鼓谱识别技术领域的一种基于改进CRNN的印刷体架子鼓谱识别方法及系统,方法包括:步骤S1、获取大量的架子鼓谱历史图像以及MusicXML文件,对各架子鼓谱历史图像进行预处理;步骤S2、通过CNN网络从各架子鼓谱历史图像识别音符的第一图像编码为特征序列,通过RNN网络对特征序列进行循环识别编码得到第二图像编码并输出;步骤S3、基于各MusicXML文件获取音乐编码,对各第二图像编码与音乐编码进行匹配生成字典集;步骤S4、获取待识别的架子鼓谱图像,通过CNN网络以及RNN网络从架子鼓谱图像中提取第三图像编码;步骤S5、通过字典集对第三图像编码进行匹配以输出架子鼓谱图像的识别结果。本发明的优点在于:极大的提升了印刷体架子鼓谱识别精度。
-
公开(公告)号:CN118504575A
公开(公告)日:2024-08-16
申请号:CN202410617164.2
申请日:2024-05-17
Applicant: 厦门大学
IPC: G06F40/30 , G06F16/35 , G06F40/284
Abstract: 本发明提供了情感分析技术领域的一种基于ALBERT与分割注意力网络的情感分析方法及系统,方法包括如下步骤:步骤S1、获取待情感分析的文本序列,将所述文本序列中的各语句转换为对应的令牌号,生成各所述语句的注意力掩码;步骤S2、通过ALBERT模型分别对所述令牌号以及注意力掩码进行特征提取,得到字符级语义特征以及句子级语义特征;步骤S3、分别对所述字符级语义特征以及句子级语义特征进行降维,得到降维字符特征以及降维句子特征;步骤S4、通过分割注意力网络对所述降维字符特征添加一个通道维度得到字符级特征;步骤S5、基于所述字符级特征与降维句子特征,输出所述文本序列的情感分析结果。本发明的优点在于:极大的提升了情感分析效率。
-
公开(公告)号:CN114911178B
公开(公告)日:2024-06-25
申请号:CN202210429982.0
申请日:2022-04-22
Applicant: 厦门大学
IPC: G05B19/042
Abstract: 本发明提供了舵机控制技术领域的一种基于关键帧动作的舵机控制方法及系统,方法包括如下步骤:步骤S10、获取各舵机的动作控制数据;步骤S20、基于时间对各舵机的各所述动作控制数据进行排序,进而构建动作节点数据数组;步骤S30、设定一帧间隔ts,基于接收的动作执行指令,对系统时间t进行初始化,以所述帧间隔ts为周期执行中断函数,并更新所述系统时间t;步骤S40、基于所述动作节点数据数组以及系统时间t确定舵机的旋转角度,并基于预设的动作调制函数对角度旋转过程进行控制。本发明的优点在于:极大的提升了舵机控制的精度以及灵活性,并克服了多舵机控制的干扰。
-
公开(公告)号:CN114923486B
公开(公告)日:2024-05-17
申请号:CN202210422662.2
申请日:2022-04-21
Applicant: 厦门大学
IPC: G01C21/20
Abstract: 本发明提供了人工智能技术领域的一种基于全局环境图和注意力侧重的机器人导航方法,包括:步骤S1、构建全局环境图,基于全局环境图、行人状态、机器人状态s2拼接出张量;步骤S2、将张量输入多层感知机得到特征量F1,将F1输入多层感知机得到特征量F2;步骤S3、计算F1的均值得到特征量Fm,将F1和Fm拼接后输入多层感知机得到各行人的注意力得分,计算注意力得分的均值和标准差以对注意力得分进行筛选;步骤S4、对注意力得分进行归一化得到注意力侧权重U,基于F2、U得到环境特征Fw;步骤S5、将Fw和s2拼接后输入多层感知机得到下一时刻的累计奖励和V,基于V进行导航。本发明的优点在于:极大的提高了机器人在多人环境下的导航成功率以及效率。
-
公开(公告)号:CN116665226A
公开(公告)日:2023-08-29
申请号:CN202310681832.3
申请日:2023-06-09
Applicant: 厦门大学
IPC: G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了五线谱识别技术领域的一种基于深度学习的手写体五线谱谱线移除方法及系统,方法包括如下步骤:步骤S10、基于选择性自编码器创建一谱线移除模型;步骤S20、收集大量的手写体五线谱的乐谱图像,基于各所述乐谱图像构建数据集;步骤S30、利用所述数据集对谱线移除模型进行训练,训练过程中不断优化所述谱线移除模型的超参数;步骤S40、利用训练后的所述谱线移除模型进行手写体五线谱谱线的自动移除。本发明的优点在于:极大的提升了手写体五线谱谱线移除的质量以及通用性。
-
-
-
-
-
-
-
-
-