一种基于社区结构的集体预测方法

    公开(公告)号:CN107545508A

    公开(公告)日:2018-01-05

    申请号:CN201610474035.8

    申请日:2016-06-24

    Abstract: 本发明提供了一种基于社区结构的集体预测方法,所述方法包括:步骤1)遍历网络V中的每个节点,利用社区模块度指标生成若干个社区,每个节点归属于其中一个社区;步骤2)利用网络V中已知标签的节点自身的特征向量和社区结构向量训练预测模型;步骤3)计算所有未知标签节点的自身特征向量和社区结构向量,输入预测模型获取所有未知标签节点的标签和概率;反复进行该步骤,直至所有未知标签节点的标签不再发生改变,输出所有未知标签节点的最终标签和概率。本发明的方法能够提高社区结构中节点标签的预测的正确率。

    一种采用核化听觉模型的单通道声源分离方法

    公开(公告)号:CN114822583B

    公开(公告)日:2024-11-22

    申请号:CN202110120284.8

    申请日:2021-01-28

    Abstract: 本发明公开了一种采用核化听觉模型的单通道声源分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形;其中,所述编码器和解码器均采用核化听觉模型;所述声源分离器采用基于一维时域卷积的源分离模型,所述编码器和解码器的训练过程和所述声源分离器的训练过程是独立的。本发明的方法在编码器和解码器中引入了模型偏置,有效减少了模型参数,极大降低了模型复杂度。

    一种语音识别模型的个性化联邦学习方法和系统

    公开(公告)号:CN114783443B

    公开(公告)日:2024-11-01

    申请号:CN202210325453.6

    申请日:2022-03-30

    Abstract: 本申请提出一种语音识别模型的个性化联邦学习方法和系统,应用于中心端和多个客户端,在中心端,该方法包括:利用本地有标注语音样本进行有监督的训练语音识别模型,获得所述语音识别模型的种子模型,所述种子模型包括特征提取器及分类器;所述特征提取器用于处理多个客户端输入的语音信息,确定多个客户端中每个客户端的语音信息的个性化特征;利用所述多个客户端中每个客户端的语音信息的个性化特征对所述分类器进行半监督训练,获得训练好的分类器;将所述训练好的分类器传递至所述多个客户端中每个客户端。本申请通过将语音识别模型的特征提取器与分类器进行解耦优化的方式实现个性化联邦学习,有效提升语音识别模型性能,降低错误识别率。

    一种基于私有参数的语音识别联邦学习方法和系统

    公开(公告)号:CN114783425B

    公开(公告)日:2024-10-01

    申请号:CN202210326775.2

    申请日:2022-03-30

    Abstract: 本申请涉及一种基于私有参数的语音识别联邦学习方法和系统,应用于中心端和多个客户端,在所述中心端,所述方法包括:利用本地有标注语音样本进行有监督地训练语音识别模型,获得所述语音识别模型的种子模型;根据所述种子模型确定第一私有参数和第一共享参数;根据多个第二共享参数更新所述第一共享参数;所述多个第二共享参数由多个客户端上传得到;将更新后的所述第一共享参数传递至所述多个客户端中每个客户端。本申请实施例利用模型中的私有参数实现对每个客户端的个性化建模,从而可以通过一次训练产生针对多个客户端的个性化语音识别模型,有效提升语音识别模型在每个客户端的性能。

    一种基于变分自编码器的多说话人语音合成方法

    公开(公告)号:CN112289304B

    公开(公告)日:2024-05-31

    申请号:CN201910671050.5

    申请日:2019-07-24

    Abstract: 本发明公开了一种基于变分自编码器的多说话人语音合成方法,包括:提取一条待合成说话人干净语音的音素级别时长参数和帧级别声学参数,将归一化的音素级别时长参数输入第一变分自编码器,输出时长说话人标签;将归一化的帧级别声学参数输入第二变分自编码器,输出声学说话人标签;对待合成的包含多个说话人的语音信号提取帧级别语言学特征和音素级别语言学特征;将时长说话人标签和归一化的音素级别语言学特征输入时长预测网络,输出当前音素预测时长;通过当前音素预测时长获得该音素的帧级别语言学特征,将其与声学说话人标签输入声学参数预测网络,输出归一化的预测语音的声学参数;将归一化的预测语音声学参数输入声码器,输出合成语音信号。

    一种基于听觉感知特性的头相关传输函数客观评价方法及系统

    公开(公告)号:CN117979218A

    公开(公告)日:2024-05-03

    申请号:CN202410092438.0

    申请日:2024-01-23

    Abstract: 本发明公开了一种基于听觉感知特性的头相关传输函数客观评价方法及系统,该方法包括:对输入目标和参考的头相关冲激响应分别进行去除双耳时间差及中耳滤波处理,获得相应的头相关传输函数;对目标和参考的头相关传输函数分别进行内耳感知分析,获得相应的伽玛通特征;利用固定的听觉感知阈值对目标伽玛通特征和参考伽玛通特征之间的误差进行调整,得到调整后的目标伽玛通特征;利用调整后的目标伽玛通特征和参考伽玛通特征计算各频段下的平均误差和对应的包络相似度;对平均误差和包络相似度进行加权求和;利用人耳在不同水平方向下的感知特点对求和值进行调整,并建模得到感知评分,从而实现了基于听觉感知特性的头相关传输函数客观评价。

Patent Agency Ranking