一种基于MFCC的语音数字识别方法

    公开(公告)号:CN110634473A

    公开(公告)日:2019-12-31

    申请号:CN201910889983.1

    申请日:2019-09-20

    Applicant: 广州大学

    Abstract: 本发明涉及语音识别技术,具体为一种基于MFCC的语音数字识别方法,首先对输入的语音信号进行采样,对采样后的语音信号进行预处理;对采样及预处理后的语音信号进行端点检测,提取出单个数字语音信号;提取每一个数字语音信号的MFCC特征;利用均方误差MSE的方法将每一个数字语音信号的MFCC特征与通过训练获得的MFCC数字语音信号参数模板进行匹配,识别出语音信号中的数字。该方法将MFCC特征与MSE结合实现语音数字的识别,不仅识别率高而且避免了大量的数据计算,识别效率高,且可应用在环境较为复杂的情形下。

    一种复杂图像去模糊方法

    公开(公告)号:CN111583143A

    公开(公告)日:2020-08-25

    申请号:CN202010366179.8

    申请日:2020-04-30

    Applicant: 广州大学

    Abstract: 本发明提供了一种复杂图像去模糊方法,包括步骤:输入模糊图像;对模糊图像进行下采样,得到采样后图片;编码残差块从采样后图片提取特征;将提取的特征输入残差网络训练;解码模块重构输出图片;生成当前尺度的去模糊图片;调整生成的当前尺度的去模糊图片尺寸,然后将调整后的图片与下个尺度输入模糊图片结合,返回进行该尺度的去模糊;尺度循环结束,生成并输出最终的去模糊图片。本发明通过多次验证,它有一个更简单的网络结构,更少的参数,而且更加容易训练,训练收敛快、参数少、去模糊效果好。

    非完整轮式机器人的控制方法、系统、装置及存储介质

    公开(公告)号:CN113791614A

    公开(公告)日:2021-12-14

    申请号:CN202110955872.3

    申请日:2021-08-19

    Applicant: 广州大学

    Abstract: 本发明公开了一种非完整轮式机器人的控制方法、系统、装置及存储介质,控制方法包括:建立非完整轮式机器人的运动模型,并根据所述运动模型确定跟踪误差模型;将所述跟踪误差模型拆分成角速度误差子模型和位置误差子模型;根据所述角速度误差子模型及齐次性理论确定第一控制律;根据所述位置误差子模型及选取的Lyapunov函数确定第二控制律;根据所述第一控制律及所述第二控制律对所述非完整轮式机器人进行控制。本发明实施例能够快速收敛、准确性高且稳定性好,可广泛应用于机器人控制领域。

    一种基于多标签学习的卷积神经网络的表情识别方法

    公开(公告)号:CN110705379A

    公开(公告)日:2020-01-17

    申请号:CN201910861618.X

    申请日:2019-09-12

    Applicant: 广州大学

    Abstract: 本发明为基于多标签学习的卷积神经网络的人脸表情识别方法,首先从视频中获取人脸图像,下载FER人脸数据集,并利用众包资源,对FER数据集进行重新标注,形成概率分布,并将其分类成多种表情,得到FER+人脸数据集;对在视频中获取到的人脸图像进行预处理;建立可用于多种表情识别的多标签学习的卷积神经网络模型;定义损失函数,利用反向传播算法和梯度下降法训练所述模型,迭代多次;保存所述模型,输入测试集的图像对所述模型进行测试;使用所述模型对预处理后的人脸图像进行特征提取,得到人脸图像的特征并利用分类器对人脸图像特征进行分类识别,得到表情识别结果。本发明提高了人脸表情识别的准确率,简化了步骤。

Patent Agency Ranking