一种基于RNN和PAD情感模型的情感语音合成方法

    公开(公告)号:CN112185345A

    公开(公告)日:2021-01-05

    申请号:CN202010907929.8

    申请日:2020-09-02

    Abstract: 本发明公开了一种基于RNN和PAD情感模型的情感语音合成方法,包括:步骤1,基于情感语音库获取训练数据,包括PAD量化标注得到的PAD值、上下文相关标注、以及特征参数MGC、BAP和F0;步骤2,将训练数据输入基于LSTM的RNN模型进行训练,得到训练后的特征参数MGC、BAP和F0;步骤3,基于PAD情感模型,利用欧几里得距离计算用于修正训练后的特征参数MGC、BAP和F0的权重,然后利用权重对训练后的特征参数进行修正;步骤4,将待合成的文本经过文本分析得到上下文相关标注,然后将其与修正后的特征参数MGC、BAP和F0合成为情感语音。本发明将基于LSTM的RNN模型和PAD情感模型加入到语音合成中,解决传统语音合成带来的问题以及语音合成中情感不足的问题,提高了语音合成的自然度。

    一种基于双分支网络的面部表情识别模型的构建方法

    公开(公告)号:CN111652171A

    公开(公告)日:2020-09-11

    申请号:CN202010518449.2

    申请日:2020-06-09

    Abstract: 本发明公开了一种基于双分支网络的面部表情识别模型的构建方法,包括:S1,样本集预处理并数值化;S2,样本集划分为训练集和测试集;S3,构建双分支网络;S4,定义目标函数;S5,利用训练集训练所述双分支网络得到面部表情识别模型;S6,利用测试集验证所述面部表情识别模型的准确率。本发明通过构建双分支网络分别对脸部区域图像和眉眼区域图像进行特征提取和分类,以解某些特定因素的影响导致脸部的表情差异较大而降低识别率,以及单一卷积神经网络不能充分利用表情变换蕴含的时间序列信息造成资源浪费的问题。

    基于相对梯度的ISA模型的行为识别方法

    公开(公告)号:CN103065158B

    公开(公告)日:2016-05-18

    申请号:CN201210578578.6

    申请日:2012-12-28

    Abstract: 本发明公开了一种基于相对梯度的ISA模型的行为识别方法,该方法采用改进的独立子空间分析算法来提取视频的局部特征;接着对所提取的局部特征进行聚类,得到聚类中心(即视觉关键词),对每个视频,建立视觉关键词直方图,则每个视频表示为基于视觉关键词直方图的特征向量;最后就是采用多类别支持向量机SVM对其进行分类,完成对行为的识别。本发明可以用于个体行为识别,也可以用于群体行为识别。本发明为一种基于相对梯度的算法,不需要求逆过程,收敛速度更快。

    基于半监督领域自适应的气体检测方法

    公开(公告)号:CN103412003B

    公开(公告)日:2015-06-10

    申请号:CN201310366955.4

    申请日:2013-08-21

    Abstract: 本发明公开了一种基于半监督领域自适应的气体检测方法,包括步骤:对气体传感器采集的气体数据信号进行预处理;利用预处理后的信号构造特征子空间;根据构造特征子空间建立组合核函数;选择目标域中无标记样本;根选择的目标域中无标记样本训练分类器,根据得到的训练分类器进行气体识别。本发明根据气体传感器数据的时间序列特点,通过对领域自适应的核函数进行构造,提出了目标域的无标记样本的选择策略,能有效处理气体传感器数据及传感器漂移,新的核函数既考虑了靠近源域和目标域的子空间应该有更大的权重,又考虑了源域和目标域之间的中间数据,利用格拉斯曼流型几何来描述气体传感器的漂移,有效解决漂移对气体检测和识别的影响。

    一种三维图像重建体的精确测量方法

    公开(公告)号:CN101178815A

    公开(公告)日:2008-05-14

    申请号:CN200710050729.X

    申请日:2007-12-10

    Abstract: 本发明为一种三维图像重建体的精确测量方法,涉及一种三维图像重建体的测量方法。本发明的目的是能够让用户对所需测量的空间结构的各数据指标做出精确的测量,能够有效而准确的指导用户进行实际操作。本发明是通过旋转三维重建体和平移切割平面相结合对三维重建体进行各个部分和方位的切割后,利用切割缓冲器对其切割后的重建体进行数据存放并精确计算得到三维重建体的数据指标,从而达到对三维重建体的精确测量。本发明主要用于各种图像三维体的各数据指标的测量。

    一种基于信息瓶颈约束的目标检测对抗训练方法

    公开(公告)号:CN119785138A

    公开(公告)日:2025-04-08

    申请号:CN202411583269.7

    申请日:2024-11-07

    Abstract: 本发明公开了一种基于信息瓶颈约束的目标检测对抗训练方法,包括步骤:S1,预训练目标检测模型M2;S2,基于MTD方法生成干净样本x的对抗样本#imgabs0#;S3,将x和#imgabs1#送入编码器进行对比训练;S4,在后验分布中进行一次蒙特卡洛采样,生成x和#imgabs2#对应的编码#imgabs3#和#imgabs4#,并将#imgabs5#和#imgabs6#送入解码器继续前向传播,计算M2的检测损失L;S5,重复步骤S4共S次,计算对抗训练损失更新M2的参数;S6,重复步骤S2到步骤S5,直到M2收敛。本发明能显著增强目标检测模型的鲁棒性的同时减轻对抗训练对模型精度造成的损失,在适应性白盒攻击和黑盒攻击下均能实现对目标检测模型的对抗鲁棒性增强,具备优异的泛化性和稳定性。

    一种基于分类回归图对齐的视觉单目标跟踪对抗防御方法

    公开(公告)号:CN118397363A

    公开(公告)日:2024-07-26

    申请号:CN202410579019.X

    申请日:2024-05-11

    Abstract: 本发明公开了一种基于分类回归图对齐的视觉单目标跟踪对抗防御方法,包括获取视频数据集并预处理;构造基于分类回归图对齐的视觉单目标跟踪对抗防御网络AADN;结合搜索分支训练Def1;结合模板分支训练Def2,得到训练好的AADN,将带有未知扰动的视频中的图像帧用训练好的AADN得到防御后搜索区域、防御后模板区域,送入目标跟踪器中处理。本发明通过对抗训练学习过滤干净样本邻域内的潜在对抗扰动,增强其对未知对抗扰动的防御能力,使目标跟踪器有更好的鲁棒性和泛化性、训练好的AADN即插即用,无需对跟踪器的参数进行调整,具有良好的迁移性,并能使目标跟踪器维持着速度与精度的良好平衡。

    一种基于时空约束与可学习特征匹配的快速目标跟踪方法

    公开(公告)号:CN114926498B

    公开(公告)日:2023-05-23

    申请号:CN202210451117.6

    申请日:2022-04-26

    Abstract: 本发明公开了一种基于时空约束与可学习特征匹配的快速目标跟踪方法,公开了一种基于孪生网络结构,采用时空约束机制与可学习特征匹配策略的快速目标跟踪方法。通过设置时序约束分支与空间约束分支分别捕捉并融合随时序变化的目标外观高维特征表示与限制空间搜索尺度,降低跟踪算法计算量并缓解目标因自身运动与环境变化所导致的自身视觉特征的变化。本发明通过设置可学习特征匹配模块完成特征匹配任务,相比于主流的无参互相关方法能够更好地从训练数据中学习正负样本分布并提升跟踪效果。本发明提出的跟踪方法具有良好的跟踪准确度与较高的运算速度,能够部署在运算资源受限的嵌入式平台,能完成准确的视觉目标跟踪任务。

Patent Agency Ranking