-
-
公开(公告)号:CN114219952B
公开(公告)日:2025-02-07
申请号:CN202111459665.5
申请日:2021-12-02
Applicant: 厦门大学
Abstract: 本发明提供了乐谱识别技术领域的一种基于图像分割和模版匹配的架子鼓谱识别方法及系统,方法包括如下步骤:步骤S10、获取架子鼓谱文件,将所述架子鼓谱文件转换为架子鼓谱图片并进行预处理;步骤S20、识别预处理后的所述架子鼓谱图片中的谱线;步骤S30、基于列切割框选所述谱线上的各音符,得到若干张音符图片;步骤S40、创建若干张音符模板图片,通过OpenCV模板匹配算法匹配所述音符图片和音符模板图片,以对所述音符图片进行识别。本发明的优点在于:在保障架子鼓谱图像信息完整性的前提下,准确识别架子鼓谱。
-
公开(公告)号:CN115146649B
公开(公告)日:2024-09-13
申请号:CN202210730185.6
申请日:2022-06-24
Applicant: 厦门大学
IPC: G06F40/30 , G06F40/279 , G06F40/151 , G06N3/045 , G06N3/0464 , G06N3/044
Abstract: 本发明公开了一种架子鼓乐谱识别方法及装置,涉及乐谱识别技术领域。本发明创造性地通过将架子鼓乐谱图片转化并生成其对应的文本序列,再通过语义字典将语义项转化为数字序列,从而使得可以通过卷积循环神经网络进行架子鼓乐谱图片的识别训练,省略了中间的识别谱线、识别单个乐符等步骤,减轻了费力的组装设计,且更容易对各种属性或者高级特征进行特征的捕获与提取;单个模型相比于每个组件错误累加来说更加健壮,能有效减少错误的积累,在识别效果上具有优势。
-
公开(公告)号:CN114863241B
公开(公告)日:2024-09-13
申请号:CN202210430505.6
申请日:2022-04-22
Applicant: 厦门大学
Abstract: 本发明提供了计算机技术领域的一种基于空间布局与深度学习的影视动画评估方法,包括:步骤S10、获取动画图像并提取空间特征,基于空间特征构建无向全连通图;步骤S20、构建内容相似度网络,通过图卷积对无向全连通图进行推理;步骤S30、将内容相似度网络里的空间节点映射到潜在空间以构建空间关系全连通图;步骤S40、构建空间关系网络,通过图卷积对空间关系全连通图进行推理得到潜在特征并映射回原始空间;步骤S50、基于空间关系网络以及内容相似度网络的输出计算构图评分;步骤S60、提取动画图像的颜色特征并输入颜色评价模型获取颜色评分;步骤S70、基于构图评分以及颜色评分计算综合评分。本发明的优点在于:极大的提升了影视动画评估的可解释性。
-
公开(公告)号:CN118571210A
公开(公告)日:2024-08-30
申请号:CN202410617162.3
申请日:2024-05-17
Applicant: 厦门大学
IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/16 , G10L15/18 , G10L15/22 , G10L21/0224 , G10L25/63 , G06N3/0895
Abstract: 本发明提供了语音情感识别技术领域的一种基于多任务学习的语音情感识别方法及系统,方法包括:步骤S1、对获取的语音数据进行预处理以及情感标注后构建语音数据集;步骤S2、基于语音特征提取模块、语音特征融合模块以及多任务学习模块创建一语音情感识别模型;步骤S3、基于预设比例将语音数据集划分为训练集、测试集以及验证集,通过训练集对语音情感识别模型进行训练,通过测试集对训练后的语音情感识别模型进行测试,通过验证集对测试后的语音情感识别模型进行验证;步骤S4、通过小程序对验证后的语音情感识别模型进行发布,通过小程序访问发布的语音情感识别模型进行语音情感识别。本发明的优点在于:极大的提升了语音情感识别的准确性。
-
公开(公告)号:CN118522022A
公开(公告)日:2024-08-20
申请号:CN202410617155.3
申请日:2024-05-17
Applicant: 厦门大学
IPC: G06V30/304 , G06V30/41 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了古筝乐谱识别技术领域的一种印刷体古筝乐谱识别方法及系统,方法包括如下步骤:步骤S1、获取大量的印刷体的古筝乐谱图像,对各所述古筝乐谱图像进行预处理得到MusicXML文件;步骤S2、基于各所述MusicXML文件生成古筝乐谱的序列标签;步骤S3、对各所述序列标签进行预处理以及编码转换得到对应的标签数据,分别为各所述标签数据中包含的各音乐元素设定一索引值;步骤S4、基于卷积神经网络以及双向循环神经网络创建一古筝乐谱识别模型,通过各所述标签数据对古筝乐谱识别模型进行训练;步骤S5、通过训练后的所述古筝乐谱识别模型对印刷体古筝乐谱进行识别。本发明的优点在于:可对古筝指法符号进行识别,极大的提升了印刷体古筝乐谱识别精度。
-
公开(公告)号:CN114882047B
公开(公告)日:2024-07-12
申请号:CN202210411699.5
申请日:2022-04-19
Applicant: 厦门大学
IPC: G06T7/10 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供了医学图像处理技术领域的一种基于半监督与Transformers的医学图像分割方法及系统,方法包括如下步骤:步骤S10、获取大量的医学图像,对各所述医学图像进行预处理得到图像集;步骤S20、基于FC‑DenseNet和RL‑Transformer创建一U型结构的医学图像分割模型;步骤S30、利用所述图像集对医学图像分割模型进行训练;步骤S40、将待分割医学图像输入训练后的医学图像分割模型进行图像分割。本发明的优点在于:极大的提升了缺少标注数据的医学图像的分割准确性。
-
公开(公告)号:CN111814609B
公开(公告)日:2023-09-29
申请号:CN202010589037.8
申请日:2020-06-24
Applicant: 厦门大学
IPC: G06V40/16 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于深度森林和卷积神经网络的微表情识别方法,所述方法包括:步骤一、采集微表情图像,使用光流法和光流应变法结合的三维特征作为微表情的特征;步骤二、构造基于深度森林和卷积神经网络的异质集成模型,将深度森林的重表示特征经过卷积层和卷积神经网络的深度特征混合形成新的图像特征,帮助分类器实现判别分类;步骤三、结合当前场景内容和微表情分类,与识别对象进行交互。本发明实现了更高的准确率,相比其他微表情识别算法,集成算法表现出更好的鲁棒性。需要更少的参数,训练时消耗更少的时间和资源,是一种轻量高效的微表情识别方法。
-
公开(公告)号:CN116740207A
公开(公告)日:2023-09-12
申请号:CN202310681833.8
申请日:2023-06-09
Applicant: 厦门大学
Abstract: 本发明提供了服装设计技术领域的一种基于对抗网络的服装个性化生成方法,包括如下步骤:步骤S10、获取大量的不同服装类型的服装图像;步骤S20、对各所述服装图像进行预处理,得到服装掩模图、服装轮廓图以及纹理块;步骤S30、基于所述服装图像、服装掩模图、服装轮廓图以及纹理块构建训练集和验证集;步骤S40、基于对抗网络创建一服装生成模型;步骤S50、分别利用所述训练集和验证集对服装生成模型进行训练和验证;步骤S60、利用验证通过后的所述服装生成模型进行服装的自动生成。本发明的优点在于:极大的提升了服装生成质量。
-
公开(公告)号:CN114758560B
公开(公告)日:2023-06-06
申请号:CN202210332565.4
申请日:2022-03-30
Applicant: 厦门大学
Abstract: 本发明提供了音准识别技术领域的一种基于动态时间规整的哼唱音准评价方法,包括如下步骤:步骤S10、获取大量的哼唱数据,并对各所述哼唱数据进行预处理;步骤S20、提取预处理后的所述哼唱数据中的音频特征;步骤S30、对各所述音频特征进行预处理;步骤S40、基于动态时间规整算法创建一音准评价模型,利用预处理后的所述音频特征对音准评价模型进行训练;步骤S50、利用训练后的所述音准评价模型对待评价音频进行评价,生成评价结果。本发明的优点在于:极大的提升了音准评价的准确性。
-
-
-
-
-
-
-
-
-