-
公开(公告)号:CN115953713A
公开(公告)日:2023-04-11
申请号:CN202211602076.2
申请日:2022-12-13
Applicant: 安徽大学
IPC: G06V20/40 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464 , G06N3/048 , G06V10/80
Abstract: 本发明涉及一种基于改进YOLO模型的粮仓通风特征信息检测方法及系统。所述特征信息为粮食品种、粮面是否平整、粮面是否有压盖物、仓窗密封状态及风机转动状态,这些特征信息会对粮仓的通风效果造成影响。该检测方法首先采集待测粮仓内的多个采集点的图像并预处理得到原始数据集。然后将原始数据集分类并划分为训练集、测试集和验证集。再构建YOLO模型并改进,从而对其训练、评估和调整优化。最后实时监测待测粮仓内的多个采集点图像并分别输入至改进后的YOLO模型中,识别出待测粮仓的多个特征信息。该检测方法及系统可以用来自动化实时监测粮仓通风的特征信息,节约人力成本,同时可以根据特征信息及时调整粮仓通风状态,提升通风效果。
-
公开(公告)号:CN105957537B
公开(公告)日:2019-10-08
申请号:CN201610452012.7
申请日:2016-06-20
Applicant: 安徽大学
IPC: G10L21/0272
Abstract: 本发明公开了一种基于L1/2稀疏约束卷积非负矩阵分解的语音去噪方法和系统。在单通道语音增强中,假设含噪语音信号v(i)为噪声信号n(i)和语音信号s(i)加性不相关,即v(i)=n(i)+s(i),利用CNMF方法对特定噪声进行训练得到噪声基信息;然后以噪声基作为先验信息,使用CNMF_L1/2方法对含噪语言进行分解得到语音基,最后合成去噪后的语音。本发明方法能更好地刻画帧之间语音的相关性;并且使用L1/2正则项对语音基系数矩阵进行强稀疏约束,可实现分离后的语音包含更少的残留噪声。相较与传统方法如谱减法、维纳滤波法以及最小均方差对数域谱估计法等,更能够提高增强后语音的可懂度。
-
公开(公告)号:CN109035196A
公开(公告)日:2018-12-18
申请号:CN201810498275.0
申请日:2018-05-22
Applicant: 安徽大学
CPC classification number: G06T7/0002 , G06N3/0454 , G06N3/084 , G06T7/11 , G06T2207/20028 , G06T2207/20081
Abstract: 针对清晰的纹理平坦区域由于缺乏高频信息,而容易被误检成模糊区域的问题,本发明提出了一基于显著性的图像局部模糊检测方法:将代表图像变换域特征的奇异值向量,反映图像高频信息的局部极值点与熵加权的池化DCT高频系数(HiFST系数)相结合,这两种类型的特征值相互补充,得到更好的特征向量,将得到的混合特征向量输入到BP神经网络进行训练得到模型后,通过预测得到初步结果,再与图像显著性检测相结合,通过图像的显著性约束得到进一步的检测结果,并通过双边滤波优化边缘信息得到最终的结果。在一个公开的大型数据集上进行的定性定量实验结果表明,本方法具有很好的模糊检测效果。
-
公开(公告)号:CN111326170B
公开(公告)日:2022-12-13
申请号:CN202010105525.7
申请日:2020-02-20
Applicant: 安徽大学
IPC: G10L25/24 , G10L25/30 , G10L21/007
Abstract: 本发明公开了一种联合时频域扩张卷积的耳语音向正常音转换方法及其装置。该方法包括:提取耳语音的谱包络,正常音的谱包络、非周期成分以及基频;将谱包络对齐,并转化为第一梅尔倒谱系数特征、第二梅尔倒谱系数特征;训练出谱包络转换模型、非周期转换模型以及基频转换模型;提取耳语的谱包络,并转化为第三梅尔倒谱系数特征;将第三梅尔倒谱系数特征进行转换,获得预测梅尔倒谱系数特征、预测非周期成分以及预测基频;将预测梅尔倒谱系数特征还原成预测谱包络;将预测谱包络、预测非周期成分以及预测基频合成为预测语音。本发明有效捕获语音时频域局部特征,可以显著降低模型参数量,提高语音转换速率,提升语音质量、语音可懂度以及连续性。
-
公开(公告)号:CN115240680A
公开(公告)日:2022-10-25
申请号:CN202210938496.1
申请日:2022-08-05
Applicant: 安徽大学
Abstract: 本发明属于语音信号处理领域,具体涉及一种模糊耳语音的转换方法、系统及其装置。该转换方法包括如下步骤:S1:基于经典的生成对抗网络设计一个用于进行耳语音识别的改进型模型。S2:准备清晰耳语音语料和模糊耳语音语料构成第一训练集、第二训练集和测试集。S3:设计一个音频合成模块。S4:采用训练集和测试集对改进型模型进行训练。S5:利用耳语音转换模型对耳语音进行识别,然后将识别出元音频进行拼接,并转换为所需的正常音的完整音频。转换系统包括:样本采集模块、预处理模块、信号优化模块、骨干网络、音频合成模块、训练组织模块、后处理模块。本发明解决了现有的耳语音转化方法存在的对模糊耳语音识别准确率不足的问题。
-
公开(公告)号:CN115223201A
公开(公告)日:2022-10-21
申请号:CN202210835636.2
申请日:2022-07-15
Applicant: 安徽大学
Abstract: 本发明涉及一种基于单目序列图像的三维人体关节点估算方法、系统及装置,该估算方法先获取每一帧单目序列图像中的二维人体关节序列,然后对二维人体关节点序列进行滤波处理,在二维人体关节点序列中加入位置编码后输入至一个新构建的空间特征提取网络中,提取每一帧单目序列图像中的人体关节点的空间特征,进而得到一个n帧的三维人体关节点姿态特征序列。再然后将n帧的三维人体关节点姿态特征序列输入至一个时序特征提取网络中,得到中间帧的三维人体关节点特征。最终将中间帧的三维人体关节点特征输入到一个全连接层模块二,得到中间帧的三维人体关节点坐标。该估算方法能够有效降低关节点估算过程中的估计误差。
-
公开(公告)号:CN115154828A
公开(公告)日:2022-10-11
申请号:CN202210940177.4
申请日:2022-08-05
Applicant: 安徽大学
Abstract: 本发明涉及一种基于脑机接口技术的大脑功能重塑方法、系统、设备。一种基于脑机接口技术的大脑功能重塑方法包括以下步骤:S1.实时采集运动功能障碍病人的脑电信号,根据脑电信号转换成控制指令。S2.根据运动功能障碍病人的全身视频得到一个动作评价指标。S3.根据运动功能障碍病人的面部视频计算出运动功能障碍病人的生理指标。S4.判断运动功能障碍病人的生理指标和动作评价指标是否在一个预设的合理指标范围内,得到一个判断结果。S5.根据控制指令控制机械臂,当判断运动功能障碍病人的生理指标或动作评价指标不在合理指标范围内时,控制机械臂停止。本发明实现了运动功能障碍病人可以通过脑电信号控制机械臂独立完成康复训练。
-
公开(公告)号:CN115054272A
公开(公告)日:2022-09-16
申请号:CN202210893898.4
申请日:2022-07-27
Applicant: 安徽大学
Abstract: 本发明涉及一种面向运动障碍功能重塑的脑电信号识别方法及系统。识别方法包括以下步骤:S1:设置采样周期,获取多个脑电信号;S2:对脑电信号预处理并提取训练集;S3:将训练集中的脑电信号分为不重叠的时间窗口,计算每个时间窗口的皮尔逊系数,获取时域脑功能连接;S4:根据时域脑功能连接和空间域信息建立脑部生物拓扑模型;S5:提取特定频段范围内的初始特征,校准后训练集上的特征作为输入特征;S6:根据输入特征和脑部生物拓扑模型构造可学习图卷积神经网络模型,输出预测标签。本发明通过充分融合时‑频‑空域的脑电信息,学习更具有鉴别性的运动想象特征,使得模型在训练过程中合理优化电极关系,提高了脑电信号识别的准确率。
-
公开(公告)号:CN111326170A
公开(公告)日:2020-06-23
申请号:CN202010105525.7
申请日:2020-02-20
Applicant: 安徽大学
IPC: G10L25/24 , G10L25/30 , G10L21/007
Abstract: 本发明公开了一种联合时频域扩张卷积的耳语音向正常音转换方法及其装置。该方法包括:提取耳语音的谱包络,正常音的谱包络、非周期成分以及基频;将谱包络对齐,并转化为第一梅尔倒谱系数特征、第二梅尔倒谱系数特征;训练出谱包络转换模型、非周期转换模型以及基频转换模型;提取耳语的谱包络,并转化为第三梅尔倒谱系数特征;将第三梅尔倒谱系数特征进行转换,获得预测梅尔倒谱系数特征、预测非周期成分以及预测基频;将预测梅尔倒谱系数特征还原成预测谱包络;将预测谱包络、预测非周期成分以及预测基频合成为预测语音。本发明有效捕获语音时频域局部特征,可以显著降低模型参数量,提高语音转换速率,提升语音质量、语音可懂度以及连续性。
-
公开(公告)号:CN106529526B
公开(公告)日:2019-12-17
申请号:CN201610529479.7
申请日:2016-07-06
Applicant: 安徽大学
IPC: G06K9/32
Abstract: 本发明针对遮挡、旋转、姿态变化和运动模糊问题,提出了一种基于稀疏表示和先验概率相结合的目标跟踪算法。通过先验概率衡量目标模板的重要性,将模板的重要性引入到正则化模型中,并作为模板更新的主要依据,从而获得一种新的候选目标稀疏系数求解方法。在多个测试视频序列上,与多种流行算法相比,该算法可以达到相同甚至更高的跟踪精度。实验结果表明,在各种含有光照、姿态变化和运动模糊,特别是存在遮挡和平面外旋转的视频中,该算法可以稳定可靠地跟踪目标,表明改进的正则化模型更适应于处理目标遮挡、运动模糊、姿态变化、平面外旋转的视频。
-
-
-
-
-
-
-
-
-