基于概率有监督总变化空间学习的语种识别方法

    公开(公告)号:CN115762473B

    公开(公告)日:2024-08-09

    申请号:CN202211186809.9

    申请日:2022-09-27

    Abstract: 本发明公开了一种基于概率有监督总变化空间学习的语种识别方法,解决了传统i‑vector语种识别系统先验信息利用不充分的问题。在训练阶段,利用开发集移位差分倒谱(SDC)特征训练通用背景模型(UBM),再将数据集中每段语音的SDC特征作为输入,在UBM上进行自适应得到每段语音的GMM均值超矢量;然后将开发集均值超矢量和类别标签作为模型输入,建立基于概率有监督总变化空间学习的语种识别模型。在识别阶段,分别得到开发集、注册集、测试集中全部语音在概率有监督总变化空间上的i‑vector特征,然后利用线性判别分析(LDA)进行降维,最后利用概率线性判别分析(PLDA)分类器进行评分。该方法能够充分利用先验信息,以此提高系统性能。本发明可以应用于语种识别领域。

    一种基于掩码自监督遮挡像素重建的遮挡行人重识别方法

    公开(公告)号:CN117877068A

    公开(公告)日:2024-04-12

    申请号:CN202410016648.1

    申请日:2024-01-04

    Abstract: 本发明提出一种基于掩码自监督遮挡像素重建的遮挡行人重识别方法,属于多媒体信息处理中的行人重识别领域。方法包括一个基于掩膜指导的掩码自编码器微调图像补全模型与基于动态图与图卷积的遮挡行人重识别网络。首先,所述的图像补全模型通过随机对图像块进行删除通过剩余图像块生成完整图片的方式进行自监督训练,使用均方误差损失减小其生成图片与原图差异。然后,训练所述的遮挡行人重识别网络,并使用三元组损失、ID损失与中心损失共同训练以得到鲁棒且有判别力的特征。测试过程中利用图像补全模型和掩膜指导方法对有遮挡的图像进行补全,重建图像被障碍物遮挡的部分行人身体像素。然后,将补全的行人图像输入到遮挡行人重识别网络得到行人特征,并实施行人重识别。与其他方法相比,本发明显著提高了遮挡行人重识别的准确率。

    基于时序多尺度特征表示学习的伪造语音检测方法及系统

    公开(公告)号:CN117809694A

    公开(公告)日:2024-04-02

    申请号:CN202410024330.8

    申请日:2024-01-08

    Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。

    一种面向单类别低信息量数据的图文匹配方法

    公开(公告)号:CN117315687A

    公开(公告)日:2023-12-29

    申请号:CN202311502015.3

    申请日:2023-11-10

    Abstract: 一种面向单类别低信息量数据的图文匹配方法,属于多媒体信息处理中的图文匹配领域。本发明首先将数据集划分为训练集、测试集。然后,用高斯核函数对训练集、测试集的低信息量数据进行核化处理,将其映射到高维度核空间以提取非线性特征。然后,构造针对单类别低信息量数据图文匹配问题的目标函数和投影学习公式,用于后续学习哈希码矩阵和哈希投影矩阵。然后,利用优化算法1优化目标函数,得到哈希码矩阵B。然后,利用优化算法2优化投影学习公式,得到哈希投影矩阵H1、H2。最后,利用上述步骤得到的哈希码矩阵B和哈希投影矩阵H1、H2对测试集进行测试并计算图文匹配的平均准确率。与其他方法相比,本发明的平均准确率更高。

    基于文本特征整合的语义社交网络多视角社区发现方法

    公开(公告)号:CN114461879A

    公开(公告)日:2022-05-10

    申请号:CN202210073662.6

    申请日:2022-01-21

    Abstract: 本发明公开了一种基于文本特征整合的语义社交网络多视角社区发现方法,包括:抓取社交网络中用户发表语义信息;提取语义信息中预设数量的词频特征构建矩阵;对语义信息进行TF‑IDF值计算,提取预设数量的关键字特征构建矩阵;利用LDA主题模型获取语义信息的主题和每位用户的主题分布构建矩阵;利用Pearson相关系数求解上述矩阵之间的相似度矩阵,并与预设阈值进行比较,若大于则建立连接重构原社交网络,得到语义社交网络;利用基于图学习的多视角聚类算法对语义社交网络进行多视角社区发现,得到社区划分结果。该方法从多个视角考虑社交网络的语义信息再进行社区发现,保证社区结构划分结果的高质量、高准确度和高凝聚性。

    一种基于话题影响力渗流的语义社交网络社区发现方法

    公开(公告)号:CN112329473B

    公开(公告)日:2021-07-30

    申请号:CN202011126371.6

    申请日:2020-10-20

    Abstract: 本发明公开了一种基于话题影响力渗流的语义社交网络社区发现方法。步骤1:构造语义社交网络节点的语义空间坐标表示;步骤2:构造步骤1的同时构造基于渗流力学的话题影响力渗流微分方程;步骤3:根据步骤2的话题影响力渗流微分方程,求解话题影响力偏微分方程;步骤4:根据步骤3制定生成社区的博弈规则;步骤5:在步骤4的博弈规则选取话题影响力最大的种子节点作为影响力渗流的初始非均衡节点;步骤6:利用步骤4的博弈规则与步骤5的初始非均衡节点生成社交网络社区结构。现有方法仅以话题的相似性作为社区的生成标准会降低社区内部节点的一致性,社区内聚性略显不足。

Patent Agency Ranking