基于时序多尺度特征表示学习的伪造语音检测方法及系统

    公开(公告)号:CN117809694A

    公开(公告)日:2024-04-02

    申请号:CN202410024330.8

    申请日:2024-01-08

    Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。

    棘波识别模型构建方法、棘波识别方法、装置及设备

    公开(公告)号:CN117272037A

    公开(公告)日:2023-12-22

    申请号:CN202311304378.6

    申请日:2023-10-09

    Abstract: 本发明涉及医疗技术领域,公开了棘波识别模型构建方法、棘波识别方法、装置及设备,构建方法包括:获取脑电信号;对脑电信号进行分割,得到棘波脑电信号段;对棘波脑电信号段进行脉冲编码,得到脉冲序列;基于脉冲序列以及神经元动力学机制构建初始神经元模型;基于神经元突触内部可塑性调节机制,对初始神经元模型进行更新,构建自适应神经元模型;基于自适应神经元模型,构建脉冲神经网络,脉冲神经网络用于对脉冲序列进行特征映射;基于神经元突触内部可塑性调节机制,对脉冲神经网络进行更新,得到目标棘波识别模型。该目标棘波识别模型,兼顾兴奋性神经元和抑制性神经元,保证脉冲神经网络特征映射的合理性,提高识别非侵入可溯型癫痫样棘波的准确性。

    棘波识别模型构建方法、棘波识别方法、装置及设备

    公开(公告)号:CN117056713A

    公开(公告)日:2023-11-14

    申请号:CN202311008837.6

    申请日:2023-08-10

    Abstract: 本发明涉及医疗技术领域,公开了棘波识别模型构建方法、棘波识别方法、装置及设备,包括:获取脑电信号;对脑电信号进行分割,得到棘波脑电信号段;对棘波脑电信号段进行稀疏脉冲编码,得到稀疏脉冲序列;设置时间步长,基于时间步长,对稀疏脉冲序列进行权重分配,得到脉冲耦合序列;基于神经元模型,对脉冲耦合序列进行特征映射,构建脉冲神经网络;基于神经元突触学习机制,对脉冲神经网络进行更新,得到目标棘波识别模型,本发明通过选用稀疏脉冲编码,将脑电信号编码为稀疏脉冲序列,在稀疏脉冲编码的基础上,耦合运用不同类别编码,更新脉冲神经网络,得到更为理想且通用的目标棘波识别模型,提高了可溯型癫痫样识别精度。

    基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法

    公开(公告)号:CN114639387A

    公开(公告)日:2022-06-17

    申请号:CN202210221453.1

    申请日:2022-03-07

    Abstract: 本发明公开了一种声纹欺诈检测方法,将能量谱经由Q‑DCT和Q‑IDCT平滑处理的重构群延迟‑常数Q变换(以下称为RGD‑CQT)语谱图特征进行检测语音欺诈攻击的方法,解决了欺诈语音特征区分性不强及欺诈语音检测系统错误率高的问题。在训练时,先对语音序列进行填充或截取操作,进而将语音序列的每一位与索引序号加一的值进行相乘,获得新的语音序列。将两个语音序列分别进行常数Q变换(CQT,constant Q transform),获得两个语谱图X和Y。分别提取两张语谱图的实部和虚部,对语谱图X进行Q‑DCT和Q‑IDCT,之后进行修改的群延迟的计算,最后进行归一化和取对数得到最终的语谱图。将其作为resnet18+cbam网络的输入;然后通过交叉熵损失和Adam优化器训练出一个最优的网络模型作为用于测试的模型。最终根据网络模型的分数,如果分数大于0则认为是真实语音,反之,则判断为欺诈语音。

    基于文本特征整合的语义社交网络多视角社区发现方法

    公开(公告)号:CN114461879A

    公开(公告)日:2022-05-10

    申请号:CN202210073662.6

    申请日:2022-01-21

    Abstract: 本发明公开了一种基于文本特征整合的语义社交网络多视角社区发现方法,包括:抓取社交网络中用户发表语义信息;提取语义信息中预设数量的词频特征构建矩阵;对语义信息进行TF‑IDF值计算,提取预设数量的关键字特征构建矩阵;利用LDA主题模型获取语义信息的主题和每位用户的主题分布构建矩阵;利用Pearson相关系数求解上述矩阵之间的相似度矩阵,并与预设阈值进行比较,若大于则建立连接重构原社交网络,得到语义社交网络;利用基于图学习的多视角聚类算法对语义社交网络进行多视角社区发现,得到社区划分结果。该方法从多个视角考虑社交网络的语义信息再进行社区发现,保证社区结构划分结果的高质量、高准确度和高凝聚性。

    一种基于互信息估计的说话人识别方法

    公开(公告)号:CN112863521A

    公开(公告)日:2021-05-28

    申请号:CN202011546522.3

    申请日:2020-12-24

    Abstract: 本发明公开了一种基于互信息估计的说话人识别方法,解决了说话人身份特征区分性不强及识别系统错误率高的问题。在训练时,先对语音提取语谱图,将其作为VGG‑M网络的输入;然后对训练数据进行随机的三元组采样,获取正负样本进行互信息估计,并利用基于互信息估计的目标函数训练网络。在识别时,利用训练好的VGG‑M网络提取测试语音与目标说话人语音对应的嵌入特征;然后计算上述两个嵌入特征间的余弦距离,并将其作为说话人的匹配得分;将得分与设定的阈值比较,判断测试语音是否来自目标说话人。该方法能够有效利用正负样本对应的说话人特征间的互信息,以此优化网络训练并降低系统的错误率。本发明可以应用于说话人识别领域。

    一种双碱法脱硫系统过滤沉淀方法

    公开(公告)号:CN106890505A

    公开(公告)日:2017-06-27

    申请号:CN201710244695.1

    申请日:2017-04-14

    Inventor: 吕薇 陈晨 李贵辉

    Abstract: 本发明设计一种双碱法脱硫系统过滤沉淀方法,包括再生池、沉淀池、循环池、搅拌器、布袋式过滤器、空气压缩机及空气压缩机管路。氧化钙溶解罐中的氢氧化钙浆液与脱硫塔的出塔脱硫液进入再生池中反应,再生池与沉淀池相通,沉淀池中设置搅拌器,沉淀池与循环池通过布袋式过滤器相连,在循环池一侧设置有空气压缩机,空气压缩机与压缩空气管路相连,压缩空气管路另一端插入布袋式过滤器,空气压缩机通过自动控制系统定时向布袋式过滤器中通入空气。循环池的清液通过循环泵打入脱硫塔进行反应。本发明可以很好的防止沉淀物质进入循环池,并有效的防止了长时间使用造成的沉淀堵塞滤布,提供了一种易于更换、造价低廉的过滤方式。同时能达到节能、提高脱硫系统效率的作用。

    基于多尺度交叉注意力Transformer的跨模态行人重识别方法

    公开(公告)号:CN119649399A

    公开(公告)日:2025-03-18

    申请号:CN202411604497.8

    申请日:2024-11-12

    Abstract: 本发明公开了基于多尺度交叉注意力Transformer的跨模态行人重识别方法,包括以下步骤:步骤一、图像获取,步骤二、特征集获取,步骤三、特征融合,步骤四、特征确定,本发明网络的初始阶段,使用两个标准数据集以获取RGB和红外图像,接着,利用MSCAViT从RGB和红外图像中提取关键特征,得到两个特征集,然后,将RGB图像转换为灰度图像,并输入MSCAViT模型以获得第三个特征集,通过这三个特征集的加权融合,使用OSCSO方法确定最优权重,最终得到融合特征,将结果特征输入MSCAViT的解码端,生成最终用于图像匹配的特征,模型通过多种指标进行评估,并与传统方法进行比较,结果表明,所提出的方法在解决VI Re‑ID任务中的模态差异问题上表现出更优越的效果。

Patent Agency Ranking