-
公开(公告)号:CN115391506A
公开(公告)日:2022-11-25
申请号:CN202210993205.9
申请日:2022-08-18
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F40/194 , G06F40/35
Abstract: 本发明涉及一种针对多段式回复的问答内容标准性检测方法及装置,属于计算机领域。该方法为:1)构建标准问答对语料库,建立标准提问和标准回答的映射关系;2)对语音进行预处理,利用音色识别和语音识别技术,获得问者和答者的待检测提问文本和待检测回答文本;3)计算待检测提问文本和标准问答对语料库中每个标准提问文本的语义相似度,返回待检测提问文本对应的标准回答文本;4)对待检测回答文本和标准回答文本进行局部语义特征提取,利用多头自注意力机制对文本进行全局语义特征提取,再对融合后的语义特征计算语义相似度。本发明提供了一种服务过程中用户提问所得到的回答内容的标准性检测判断方法,以便提升用户服务的体验感和满意度。
-
公开(公告)号:CN114757335A
公开(公告)日:2022-07-15
申请号:CN202210347936.6
申请日:2022-04-01
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于双重条件生成对抗网络的缺失数据填补生成方法,属于计算机中数据感知与重构领域,包括以下步骤:S1:对样本数据进行编码,设计作为数据生成条件的样本类别和样本已存在数据的在生成过程中的表示方式;S2:构建双重条件生成对抗网络的结构,其中包括生成模型、判别模型;S3:对双重条件生成对抗网络结构的目标优化函数进行表示;S4:建立数据生成模型的训练数据集,对双重条件生成对抗网络进行训练;S5:分析不同的数据缺失情况,采用训练好的双重条件生成对抗网络进行缺失数据生成填补。本发明提供了一种针对表格类数据构建高质量训练数据集的方法,用于支撑大数据应用场景中的机器学习模型训练。
-
公开(公告)号:CN116092512A
公开(公告)日:2023-05-09
申请号:CN202211740126.3
申请日:2022-12-30
Applicant: 重庆邮电大学
IPC: G10L21/0272 , G10L17/04 , G10L17/18
Abstract: 本发明涉及一种基于数据生成的小样本语音分离方法,属于语音分离领域,包括以下步骤:S1:采集并构建待分离语音数据集和目标说话人干净语音数据集;S2:对数据集进行预处理;S3:利用基于LSTM的语音匹配模型对预处理后的待分离语音数据集中的每段语音进行帧级别的目标说话人匹配,根据匹配结果,将语音段判断为:不含目标说话人、只包含一个目标说话人、包含多个目标说话人;S4:利用基于GAN的包含多个目标说话人的语音生成模型扩充待分离语音段;S5:构建并训练基于TCN的语音分离模型,将待分离的包含多个目标说话人的语音分离得到单一目标说话人的语音数据,最后拼接出单一说话人的完整语音。
-
-