一种基于特征差异最大化的说话人识别方法

    公开(公告)号:CN114613369B

    公开(公告)日:2024-08-09

    申请号:CN202210221405.2

    申请日:2022-03-07

    Abstract: 本发明公开了一种基于特征差异最大化的说话人识别方法,使得说话人特征差异最大化,增加区分性。降低说话人识别系统的错误率。首先将训练集集的全部音频文件进行预处理,生成语谱图特征。将语谱图特征作为VGG‑M的输入,生成嵌入特征(embedding)。然后使用NPLDA打分选取三元组语音对,使用NPLDA的目标函数训练NPLDA模型,使用互信息损失函数计算正负样本对的损失,与NPLDA共同训练VGG‑M网络。在测试阶段,使用训练好的网络提取测试说话人和目标说话人的嵌入特征。使用余弦打分计算两种嵌入特征的相似度,即相似度得分。将计算好的相似度得分与设置好的阈值进行比较,判断是否语音来自同一说话人。该方法通过NPLDA选取三元组对,使得不同说话人特征差异更明显,并利用互信息损失函数和NPLDA共同优化网络,降低识别的错误率。本发明可以应用于说话人识别领域。

    基于时序多尺度特征表示学习的伪造语音检测方法及系统

    公开(公告)号:CN117809694A

    公开(公告)日:2024-04-02

    申请号:CN202410024330.8

    申请日:2024-01-08

    Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。

    基于深度学习的宫颈癌细胞智能检测方法

    公开(公告)号:CN112365471B

    公开(公告)日:2022-06-24

    申请号:CN202011259420.3

    申请日:2020-11-12

    Abstract: 基于深度学习的宫颈癌细胞智能检测方法。本发明涉及深度学习方法对细胞核的分类。本发明的目的是为了解决现有传统诊断方式检测癌细胞准确率低、耗时长等问题。为解决此问题,本发明提出了一种基于深度学习的智能宫颈癌细胞筛查方法。方法的具体过程为:一、数据准备;二、细胞核分割;三、细胞核分类;四、筛选癌细胞。在细胞核分类部分,数据上利用主动学习的方法进行数据的扩充和类别的细分;模型上以ResNeSt为基础模型,引入医生诊断经验,提取诊断指标共同作用训练出更加准确的模型。实验表明,本文细胞核分类方法准确率比原模型准确率更高,另外,本发明还提供了一种更有效的扩充数据和类别细分的数据准备方法。本发明应用于医学图像分类领域。

    基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法

    公开(公告)号:CN114639387A

    公开(公告)日:2022-06-17

    申请号:CN202210221453.1

    申请日:2022-03-07

    Abstract: 本发明公开了一种声纹欺诈检测方法,将能量谱经由Q‑DCT和Q‑IDCT平滑处理的重构群延迟‑常数Q变换(以下称为RGD‑CQT)语谱图特征进行检测语音欺诈攻击的方法,解决了欺诈语音特征区分性不强及欺诈语音检测系统错误率高的问题。在训练时,先对语音序列进行填充或截取操作,进而将语音序列的每一位与索引序号加一的值进行相乘,获得新的语音序列。将两个语音序列分别进行常数Q变换(CQT,constant Q transform),获得两个语谱图X和Y。分别提取两张语谱图的实部和虚部,对语谱图X进行Q‑DCT和Q‑IDCT,之后进行修改的群延迟的计算,最后进行归一化和取对数得到最终的语谱图。将其作为resnet18+cbam网络的输入;然后通过交叉熵损失和Adam优化器训练出一个最优的网络模型作为用于测试的模型。最终根据网络模型的分数,如果分数大于0则认为是真实语音,反之,则判断为欺诈语音。

    一种基于话题影响力渗流的语义社交网络社区发现方法

    公开(公告)号:CN112329473B

    公开(公告)日:2021-07-30

    申请号:CN202011126371.6

    申请日:2020-10-20

    Abstract: 本发明公开了一种基于话题影响力渗流的语义社交网络社区发现方法。步骤1:构造语义社交网络节点的语义空间坐标表示;步骤2:构造步骤1的同时构造基于渗流力学的话题影响力渗流微分方程;步骤3:根据步骤2的话题影响力渗流微分方程,求解话题影响力偏微分方程;步骤4:根据步骤3制定生成社区的博弈规则;步骤5:在步骤4的博弈规则选取话题影响力最大的种子节点作为影响力渗流的初始非均衡节点;步骤6:利用步骤4的博弈规则与步骤5的初始非均衡节点生成社交网络社区结构。现有方法仅以话题的相似性作为社区的生成标准会降低社区内部节点的一致性,社区内聚性略显不足。

    一种二维电容层析成像的图像重建方法

    公开(公告)号:CN113012253A

    公开(公告)日:2021-06-22

    申请号:CN202110356534.8

    申请日:2021-04-01

    Abstract: 本发明属于过程性层析成像领域,尤其是一种二维电容层析成像的图像重建方法,针对现有的ECT技术当前仍然存在很多难点,比如ECT系统的非线性和逆问题求解,体现在图像重建上就是其成像精度不高、与原流型不符的问题,现提出如下方案,其包括以下步骤:S1、通过电容传感器阵列得到测量数据;S2、对测量数据进行预处理;S3、确定截断值;S4、对构造出来的Hankel矩阵进行奇异值分解;S5、对构造出来的矩阵进行反对角线取平均值,S6、得到去噪后的矩阵;S7、引入EIV模型;S8、得到重建图像。本发明的有益效果是:可以最大程度的保留数据的特征,提高算法的重建精度,并且去除多余噪声,使得算法更加接近真实值。

    一种基于互信息估计的说话人识别方法

    公开(公告)号:CN112863521A

    公开(公告)日:2021-05-28

    申请号:CN202011546522.3

    申请日:2020-12-24

    Abstract: 本发明公开了一种基于互信息估计的说话人识别方法,解决了说话人身份特征区分性不强及识别系统错误率高的问题。在训练时,先对语音提取语谱图,将其作为VGG‑M网络的输入;然后对训练数据进行随机的三元组采样,获取正负样本进行互信息估计,并利用基于互信息估计的目标函数训练网络。在识别时,利用训练好的VGG‑M网络提取测试语音与目标说话人语音对应的嵌入特征;然后计算上述两个嵌入特征间的余弦距离,并将其作为说话人的匹配得分;将得分与设定的阈值比较,判断测试语音是否来自目标说话人。该方法能够有效利用正负样本对应的说话人特征间的互信息,以此优化网络训练并降低系统的错误率。本发明可以应用于说话人识别领域。

    一种基于超像素的电容层析成像流型识别方法

    公开(公告)号:CN111444851A

    公开(公告)日:2020-07-24

    申请号:CN202010228670.4

    申请日:2020-03-27

    Abstract: 本发明提出了一种基于超像素的电容层析成像流型识别方法,包括:对该原始流型图像进行下采样处理,得到采样过后的流型图像种子点个数;步骤二、将种子点分配到流型图像的各个部分上;在以种子点为中心的n*n的范围内计算各个像素点的灰度梯度,将灰度梯度最小的像素点作为种子点的最终位置;对步骤三中的种子点周围的像素点进行分类标记;步骤五、多次重复步骤三和步骤四,直至聚类结果不发生变化为止,至此完成流型图像分割;步骤六、增强分割后流型图像的连通性,对其进行后处理;步骤七、标记分类结果,得到各类几何中心位置并进行识别。本发明可以有效解决识别效果差,成像周期长,计算量大,实时性和识别精度还不甚理想的问题。

    一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法

    公开(公告)号:CN111310807A

    公开(公告)日:2020-06-19

    申请号:CN202010077309.6

    申请日:2020-01-27

    Abstract: 一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法,将原始数据及其异质特征整合到一个公共集合中,形成多模态样本集合;然后,在集合上对每一个模态下的样本数据都学习一对垂直和水平投影矩阵,并且可以捕获所有模态下的异质特征之间的互补信息;此外,为了揭示隐藏在多模态视觉数据中的内在子空间结构,设计了一个基于阈值岭回归的自表示模型,进而将学习到的表示矩阵用于构建有效的亲和矩阵;同时,通过联合学习特征子空间和表示矩阵,二者性能可以互相促进;为了确保模型在实际应用中的性能,设计了基于图的表示矩阵约束项来捕获数据的非线性结构信息,这有助于保持复杂样本的邻居关系。

    一种可靠的绝对模拟码检索方法

    公开(公告)号:CN106918307A

    公开(公告)日:2017-07-04

    申请号:CN201710061027.5

    申请日:2017-01-25

    Abstract: 一种可靠的绝对模拟码检索方法属于结构光三维测量技术领域;该方法包括以下步骤:首先,分别计算理想高频绝对模拟码和理想低频绝对模拟码,然后,分别获得实际高频绝对模拟码和实际低频绝对模拟码,第三,计算实际高频绝对模拟码和实际低频绝对模拟码之间的差,第四,根据实际高频绝对模拟码和实际低频绝对模拟码之间的差,以及高频相移条纹周期,计算补偿参数,第五,计算校正的高频绝对模拟码,最后,确定本发明成立的条件;本发明可靠的绝对模拟码检索方法,重建三维结果中不存在粗大误差,重建结果较好地体现了被测表面的细节特征,效果理想。

Patent Agency Ranking