-
公开(公告)号:CN118761985A
公开(公告)日:2024-10-11
申请号:CN202410895623.3
申请日:2024-07-05
Applicant: 华南理工大学 , 广西中廪智工科技发展集团有限公司
IPC: G06T7/00 , G06V10/774 , G06V40/16 , G06V10/764 , G06V10/82 , G06V10/77 , G06V10/766 , G06N3/045 , G06N3/0499 , G06N3/0464 , G06N3/084 , A61B5/00
Abstract: 本发明公开了一种基于图像分类模型及视觉处理的皮肤状况评测方法,包括下述步骤:获取含多种皮肤状况的人脸面部图像并进行标注,进行图像数据集增强,构建得到训练数据集;基于S0‑CCCT架构构建CoatNet网络,在CoatNet网络的高维特征向量输出处构建MLP网络,输出人脸皮肤不同特征值的评分;基于训练数据集对CoatNet网络和MLP网络的参数进行训练,学习人脸面部图像特征与皮肤状况评分之间的映射关系,训练得到视觉模型;对含多种皮肤状况的人脸面部图像进行图像预处理,图像预处理后的人脸面部图像输入视觉模型得到对应的各种皮肤特征的评分值。本发明能精确输出每个皮肤指标评分,提高了评估的准确性。
-
公开(公告)号:CN111739028A
公开(公告)日:2020-10-02
申请号:CN202010454641.X
申请日:2020-05-26
Applicant: 华南理工大学
Abstract: 本发明公开了一种指甲区域图像获取方法、系统、计算设备及存储介质,所述方法包括:搭建指甲分割网络;构建指甲数据集,并根据指甲数据集,对指甲分割网络进行训练,得到指甲分割模型;获取第一手指图像;调用指甲分割模型,获取第一手指图像中每个手指类别的指甲区域及对应的指甲方向;根据输入的调整指令,调整指甲区域,以调整打印位置及打印图案;将美甲效果展示在手指图像上;根据输入的打印指令,打印图案。本发明解决了现有美甲机识别指甲区域不够精确,鲁棒性不够高的技术问题,还解决了现有美甲消费无法预先查看美甲效果的问题。
-
公开(公告)号:CN111723874B
公开(公告)日:2023-05-26
申请号:CN202010624687.1
申请日:2020-07-02
Applicant: 华南理工大学
IPC: G06F18/214 , G06F18/213 , G06F18/2431 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于宽度和深度神经网络的声场景分类方法,包括下列步骤:首先从声场景音频样本提取对数梅尔谱特征,并划分为训练集和测试集;再设计宽度神经网络和深度联合概率网络;将训练集各音频样本的对数梅尔谱特征作为输入,对上述两个网络进行预训练;根据预训练结果构建联合判别分类树模型,训练并调优该联合判别分类树模型;最后将测试集各音频样本的对数梅尔谱特征输入联合判别分类树模型,辨识各音频样本所对应的声场景。本发明构建的联合判别分类树模型可以补足单一网络泛化能力差、稳定性弱的缺点,并利用宽度神经网络和深度神经网络的优势互补特性提升声场景分类效果。
-
公开(公告)号:CN111723874A
公开(公告)日:2020-09-29
申请号:CN202010624687.1
申请日:2020-07-02
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于宽度和深度神经网络的声场景分类方法,包括下列步骤:首先从声场景音频样本提取对数梅尔谱特征,并划分为训练集和测试集;再设计宽度神经网络和深度联合概率网络;将训练集各音频样本的对数梅尔谱特征作为输入,对上述两个网络进行预训练;根据预训练结果构建联合判别分类树模型,训练并调优该联合判别分类树模型;最后将测试集各音频样本的对数梅尔谱特征输入联合判别分类树模型,辨识各音频样本所对应的声场景。本发明构建的联合判别分类树模型可以补足单一网络泛化能力差、稳定性弱的缺点,并利用宽度神经网络和深度神经网络的优势互补特性提升声场景分类效果。
-
-
-