-
公开(公告)号:CN119474550A
公开(公告)日:2025-02-18
申请号:CN202510047316.4
申请日:2025-01-13
Applicant: 江西师范大学
IPC: G06F16/9535 , G06F16/9536 , G06F18/25 , G06F18/2415 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种基于深广模型的图书推荐方法,该方法包括以下步骤,构建数据集,将数据集输入到两个预训练语言模块中,得到两个预训练语言模块最后一层的隐藏状态表示,将两个预训练语言模块最后一层的隐藏状态表示进行平均池化,得到整个输入的综合表示向量,将数据集输入到兴趣提取模块进行处理,得到嵌入层的嵌入表示向量,将嵌入层的嵌入表示向量进行分组拼接,得到兴趣提取模块的输出,将整个输入的综合表示向量和兴趣提取模块的输出进行融合,得到读者对候选借阅图书的概率。本发明通过深广模型中增加注意力机制,注意力机制根据每个行为对用户偏好的影响动态分配权重,从而精准识别用户的关键兴趣,显著增强推荐能力。
-
公开(公告)号:CN115424625B
公开(公告)日:2024-09-20
申请号:CN202211055454.X
申请日:2022-08-31
Applicant: 江西师范大学
Abstract: 本申请提供一种基于多路径网络的说话人确认欺骗检测方法,包括:获取说话人真实语音数据和欺骗语音数据;采用编解码器对所获取的语音进行数据增强,提取所有语音数据的线性频率倒谱系数特征;将编解码方式不同的语音视为来自不同的域,用高斯混合模型提取各域语音的高斯概率特征;构建多路径神经网络,每个域的高斯概率特征分别作为一个神经网络路径的输入;对所述多路径网络进行训练;获取新的说话人语音,对新的语音进行欺骗检测。本发明用高斯混合模型提取各域语音的高斯概率特征,使用多路径网络模型判断语音是真实语音还是欺骗语音,提高了语音欺骗检测系统的泛化性。
-
公开(公告)号:CN118194854B
公开(公告)日:2024-07-23
申请号:CN202410623262.7
申请日:2024-05-20
Applicant: 江西师范大学
IPC: G06F40/232 , G06F40/30 , G06F40/253 , G06F18/214 , G06F18/27 , G06F40/211
Abstract: 本发明公开了一种基于全词掩码和依存掩码的中文文本的纠错方法,包括以下步骤:步骤S1:采集并构建数据集;步骤S2:构建文本纠错模型,文本纠错模型包括拼写纠错模型和语法纠错模型;步骤S3:将错误句子导入到步骤S2中的拼写纠错模型中,获取拼写纠错后的句子,同时对拼写纠错模型进行训练;步骤S4:将拼写纠错后的句子导入到步骤S2中的语法纠错模型的检测网络中,获得拼写纠错后的句子的语法错误类型,对语法纠错模型进行训练;步骤S5:语法错误类型的句子导入到语法纠错模型中的纠错网络,对获得语法错误类型的句子进行语法纠错,获得语法纠错后的句子。本发明通过引入依存句法分析,从而实现对语句更为精准的纠错。
-
公开(公告)号:CN118675533B
公开(公告)日:2024-10-29
申请号:CN202411147042.8
申请日:2024-08-21
Applicant: 江西师范大学
Abstract: 本发明公开了一种融合GMM和ResNext的说话人确认方法,包括如下步骤:采用高斯混合模型以及多尺度ResNext模型组合成多尺度GMM‑ResNext模型,将多尺度GMM‑ResNext模型用于对实时的两条语音数据进行说话人确认;其中,多尺度ResNext模型是通过高斯混合模型提取的原始语音数据的对数高斯概率特征进行训练得到,高斯混合模型通过原始语音数据提取梅尔频率倒谱系数特征进行训练得到;本发明采用基于一维卷积的多尺度残差块,用高斯分量数为512的高斯混合模型对原始语音数据进行建模,提取相应的对数高斯概率特征,结合多尺度GMM‑MSNext模型能够有效提高说话人确认的性能。
-
公开(公告)号:CN119474550B
公开(公告)日:2025-04-29
申请号:CN202510047316.4
申请日:2025-01-13
Applicant: 江西师范大学
IPC: G06F16/9535 , G06F16/9536 , G06F18/25 , G06F18/2415 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种基于深广模型的图书推荐方法,该方法包括以下步骤,构建数据集,将数据集输入到两个预训练语言模块中,得到两个预训练语言模块最后一层的隐藏状态表示,将两个预训练语言模块最后一层的隐藏状态表示进行平均池化,得到整个输入的综合表示向量,将数据集输入到兴趣提取模块进行处理,得到嵌入层的嵌入表示向量,将嵌入层的嵌入表示向量进行分组拼接,得到兴趣提取模块的输出,将整个输入的综合表示向量和兴趣提取模块的输出进行融合,得到读者对候选借阅图书的概率。本发明通过深广模型中增加注意力机制,注意力机制根据每个行为对用户偏好的影响动态分配权重,从而精准识别用户的关键兴趣,显著增强推荐能力。
-
公开(公告)号:CN118675533A
公开(公告)日:2024-09-20
申请号:CN202411147042.8
申请日:2024-08-21
Applicant: 江西师范大学
Abstract: 本发明公开了一种融合GMM和ResNext的说话人确认方法,包括如下步骤:采用高斯混合模型以及多尺度ResNext模型组合成多尺度GMM‑ResNext模型,将多尺度GMM‑ResNext模型用于对实时的两条语音数据进行说话人确认;其中,多尺度ResNext模型是通过高斯混合模型提取的原始语音数据的对数高斯概率特征进行训练得到,高斯混合模型通过原始语音数据提取梅尔频率倒谱系数特征进行训练得到;本发明采用基于一维卷积的多尺度残差块,用高斯分量数为512的高斯混合模型对原始语音数据进行建模,提取相应的对数高斯概率特征,结合多尺度GMM‑MSNext模型能够有效提高说话人确认的性能。
-
公开(公告)号:CN118194854A
公开(公告)日:2024-06-14
申请号:CN202410623262.7
申请日:2024-05-20
Applicant: 江西师范大学
IPC: G06F40/232 , G06F40/30 , G06F40/253 , G06F18/214 , G06F18/27 , G06F40/211
Abstract: 本发明公开了一种基于全词掩码和依存掩码的中文文本的纠错方法,包括以下步骤:步骤S1:采集并构建数据集;步骤S2:构建文本纠错模型,文本纠错模型包括拼写纠错模型和语法纠错模型;步骤S3:将错误句子导入到步骤S2中的拼写纠错模型中,获取拼写纠错后的句子,同时对拼写纠错模型进行训练;步骤S4:将拼写纠错后的句子导入到步骤S2中的语法纠错模型的检测网络中,获得拼写纠错后的句子的语法错误类型,对语法纠错模型进行训练;步骤S5:语法错误类型的句子导入到语法纠错模型中的纠错网络,对获得语法错误类型的句子进行语法纠错,获得语法纠错后的句子。本发明通过引入依存句法分析,从而实现对语句更为精准的纠错。
-
公开(公告)号:CN114373476A
公开(公告)日:2022-04-19
申请号:CN202210028342.9
申请日:2022-01-11
Applicant: 江西师范大学
Abstract: 本发明提供一种基于多尺度残差注意力网络的声音场景分类方法,包括将采集到的音频数据进行特征提取,提取出对数梅尔频谱图及其一阶差分和二阶差分作为输入特征;构建多尺度残差注意力网络,将提取到的对数梅尔频谱图输入到网络中进行训练建立分类模型;采用mixup方法增强数据多样性;采用焦点损失关注分类困难的样本;获取新的声音场景语音,利用分类模型对语音进行声音场景分类,得到声音场景分类结果。本发明采用对数梅尔频谱图及其一阶和二阶差分,使用多尺度残差注意力网络模型来对声音场景进行分类,能够挖掘更多丰富全面的特征信息,从而提高声音场景分类性能。
-
公开(公告)号:CN119170052A
公开(公告)日:2024-12-20
申请号:CN202411254166.6
申请日:2024-09-09
Applicant: 江西师范大学
Abstract: 本发明属于语音伪造检测技术领域,具体为一种基于多尺度GMM‑ResNet模型的语音伪造检测方法,获取说话人真实语音数据及伪造语音数据作为原始语音数据,多尺度GMM‑ResNet模型主要包含两部分:多尺度对数高斯概率特征融合和多尺度特征聚合ResNet模型,多尺度LGP特征融合将基于不同阶数的GMM得到的三种不同尺度LGP特征进行加权融合,从而促进不同尺度LGP特征之间的信息交换,多尺度特征聚合ResNet模型通过对每个ResNet块输出的特征进行聚合,充分融合网络内不同层级的特征信息,从而提高网络的特征提取能力。
-
公开(公告)号:CN115424625A
公开(公告)日:2022-12-02
申请号:CN202211055454.X
申请日:2022-08-31
Applicant: 江西师范大学
Abstract: 本申请提供一种基于多路径网络的说话人确认欺骗检测方法,包括:获取说话人真实语音数据和欺骗语音数据;采用编解码器对所获取的语音进行数据增强,提取所有语音数据的线性频率倒谱系数特征;将编解码方式不同的语音视为来自不同的域,用高斯混合模型提取各域语音的高斯概率特征;构建多路径神经网络,每个域的高斯概率特征分别作为一个神经网络路径的输入;对所述多路径网络进行训练;获取新的说话人语音,对新的语音进行欺骗检测。本发明用高斯混合模型提取各域语音的高斯概率特征,使用多路径网络模型判断语音是真实语音还是欺骗语音,提高了语音欺骗检测系统的泛化性。
-
-
-
-
-
-
-
-
-