结合训练集数据分布和W距离的模型窃取检测方法

    公开(公告)号:CN115935179A

    公开(公告)日:2023-04-07

    申请号:CN202211346069.0

    申请日:2022-10-31

    Abstract: 本发明涉及结合训练集数据分布和W距离的模型窃取检测方法,属于计算机与信息科学技术领域。本发明首先利用VAE方法对训练集和查询集降维;其次利用极大似然估计计算查询集概率分布,依概率分布采样得到多组待检测样本;随后,对每组待检测样本,在训练集中随机采样得到相同数量的参考样本,计算每组待检测样本与参考样本间的W距离;最后,使用参考样本中类别数和总类别数的比值为权值,加权计算所有的W距离,当加权计算结果大于检测阈值时判定检测出为模型窃取。本发明提出关联训练集数据分布的模型窃取检测方法,同时考虑查询集和训练集样本分布特点,改进W距离计算方法,有效提升模型窃取检测的准确率。

    强化人体感知特性的分频神经网络汉语语音编码方法

    公开(公告)号:CN115762539A

    公开(公告)日:2023-03-07

    申请号:CN202211327715.9

    申请日:2022-10-27

    Abstract: 本发明涉及强化人体感知特性的分频神经网络汉语语音编码方法,属于计算机与信息科学技术领域。本发明首先根据人体对频率变化感知的非线性特点将汉语语音低频段转化为语谱图、高频段转化为梅尔频谱;然后融合残差网络和VQ‑VAE‑2架构构建语音编解码模型,使用编码器提取语谱图的能量分布特征和梅尔频谱的频率分布特征,并进行矢量量化得到压缩编码向量;最后,使用解码器重建频谱图并采用基于截断牛顿算法的梯度更新方法重建语音信号。本发明在较低编码率条件下,充分考虑人体对汉语语音不同频段的感知差异,有效提升了重建语音信号的质量。

    应用多代价函数的系统异构联邦学习效率提升方法

    公开(公告)号:CN115759282A

    公开(公告)日:2023-03-07

    申请号:CN202211322834.5

    申请日:2022-10-27

    Abstract: 本发明涉及应用多代价函数的系统异构联邦学习效率提升方法,属于计算机与信息科学技术领域。本发明首先根据建模任务设置初始训练参数,确定参与客户端并进行联邦训练;其次,在新一轮训练前根据客户端数据量、计算性能及通信性能、在当前服务器等待时间内训练完成情况动态构建客户端空闲代价函数和终止代价函数;然后,遍历服务器等待时间的可能取值,最小化所有客户端总代价得到最优等待时间,进而更新训练参数并调整参与客户端;最后,通过多轮联邦训练达到全局模型准确率要求。本发明提出参与客户端的空闲代价和终止代价函数计算方法,将服务器固定的等待时间进行动态调整,有效提升了联邦学习训练效率。

    列车自动驾驶系统参数自学习双Q表联合代理建立方法

    公开(公告)号:CN112733448B

    公开(公告)日:2023-03-03

    申请号:CN202110019417.2

    申请日:2021-01-07

    Abstract: 本发明涉及一种可用于实现列车自动驾驶系统参数自学习的双Q表联合代理的建立方法,属于自动驾驶与强化学习领域。主要用于节省现有自动驾驶系统中关键转换参数需要专家逐车调整所消耗的大量人工工作成本,同时实现转换参数随车辆性能变化实时适应。本发明首先建立可正确响应转换参数改变所引发运行效果变化的运行仿真环境;其次,基于Q‑Learning方法,以舒适度和停准率两个条件为训练目标,建立两个参数调整代理分别给出向好的参数调整动作;最后,建立联合策略,协调两个参数调整代理相互配合工作,实现对参数的优化。在某地铁线路实车上实验,结果表明,本发明能达到良好的参数自学习效果,实现了列车参数的自动优化。

    多注意力机制跨度级小样本命名实体识别方法

    公开(公告)号:CN115659978A

    公开(公告)日:2023-01-31

    申请号:CN202211331584.1

    申请日:2022-10-28

    Abstract: 本发明涉及多注意力机制跨度级小样本命名实体识别方法,属于自然语言处理领域。本发明首先对句子进行跨度枚举并通过BERT编码器编码生成跨度连贯性表示;其次,提出跨度内注意力机制关注重要字符信息,引入跨度间注意力机制关注与目标跨度相关度高的其他跨度;然后,利用跨度边界注意力机制关注支持集中实体跨度边界共有特征,利用实例级跨度注意力机制关注与查询集样本跨度相关度高的支持集样本跨度,生成实体类别原型;最后,通过计算支持集和查询集间距离进行实体类别预测。本发明能够改善token级基于度量元学习方法中的语义截断问题,有效提升小样本命名实体识别任务的准确率。

    多语种终身学习的语音识别方法
    196.
    发明公开

    公开(公告)号:CN115148194A

    公开(公告)日:2022-10-04

    申请号:CN202210533041.1

    申请日:2022-05-16

    Abstract: 本发明涉及多语种终身学习的语音识别方法,属于计算机与信息科学技术领域。本发明首先结合连续时序分类和Transformer算法对单一语种的语音训练语音识别模型;其次,当有新语种识别任务加入时,衡量该语种和已识别语种的相似度;然后,使用基于相似度的正交权重修正算法对模型的梯度下降方向进行修正;最后,使用新语种训练多语种语音识别模型,实现多语种的语音识别。本发明能够在保证已学习语种识别能力的同时,在线学习新语种并更新模型,加快了新语种的学习速度,提升了模型对于多个语种的识别性能。

    结合图嵌入知识建模的网络入侵检测方法

    公开(公告)号:CN115118451A

    公开(公告)日:2022-09-27

    申请号:CN202210536021.X

    申请日:2022-05-17

    Abstract: 本发明涉及结合图嵌入知识建模的网络入侵检测方法,属于计算机与信息科学技术领域。本发明首先对网络入侵流量数据包进行特征提取,定义特征节点与数据包节点类别,并根据节点之间的关系构造流量异构网络;然后基于元路径的游走方法生成节点上下文序列,训练图嵌入模型生成节点的特征向量表示;最后,根据模型生成测试集节点的特征向量表示,采用基于节点相似度计算的方法判别节点标签,实现对网络入侵流量的检测。优化了网络流量数据结构复杂情况下,当前深度学习网络入侵检测模型无法充分捕获节点之间拓扑结构关系和特征权重选择不当的问题。针对网络入侵流量本发明能达到较好的分类效果,进一步提升了网络入侵检测的正确率。

    PU强化学习的远程监督命名实体识别方法

    公开(公告)号:CN113221575B

    公开(公告)日:2022-08-02

    申请号:CN202110607269.6

    申请日:2021-05-28

    Abstract: 本发明涉及PU强化学习的远程监督命名实体识别方法,属于自然语言处理与机器学习领域。主要为了解决中文命名实体识别任务的远程监督样本存在噪声标记、模型学习样本特征效率低下问题和训练过程缺乏有效监测机制。本发明首先利用BLSTM模型对文本提取单条样本序列特征和多标签评分信息;然后,基于PU强化学习,训练样本选择器,从标记语料和远程监督语料中筛选出正样本和负样本。再将负样本送入去噪还原器得到还原样本。再引入无偏、一致地估计任务损失的损失函数,使用正样本和还原样本训练中文命名实体识别模型;最后重复上述模型训练,直到筛选标记语料趋于稳定。在ICT语料、EC语料和NEWS进行了实验,结果表明本发明能达到较好的去噪效果。

    利用差分隐私词嵌入扰动的敏感文本脱敏方法

    公开(公告)号:CN114547670A

    公开(公告)日:2022-05-27

    申请号:CN202210039857.9

    申请日:2022-01-14

    Abstract: 本发明涉及利用差分隐私词嵌入扰动的敏感文本脱敏方法,属于差分隐私保护技术领域。本发明首先利用命名实体识别技术识别文本中的敏感单词,并随机抽样语料库中的非敏感单词;其次给敏感单词的词嵌入向量加上差分隐私噪声,生成新的扰动词嵌入向量;然后度量扰动词嵌入向量和非敏感单词的词嵌入向量之间的欧几里得距离,依据最近邻公式取得候选词集合;最后依据多单位拍卖概率公式用候选词集合中的单词替换文本中所有的敏感单词后输出脱敏文本。本发明在多个语料上实验,结果表明其在多种文本上都能达到较好的脱敏效果,具有良好的通用性和可迁移性。

    一种基于深度学习的Android恶意软件检测方法

    公开(公告)号:CN109271788B

    公开(公告)日:2021-10-12

    申请号:CN201810963774.2

    申请日:2018-08-23

    Abstract: 本发明涉及一种基于深度学习的Android恶意软件检测方法,属于计算机与信息科学技术领域。本发明首先对Android应用软件进行特征提取,然后通过对Android应用文件进行解压缩和反编译等操作提取相关的安全特征。提取的特征包括3个方面:文件结构特征、安全经验特征和Dalvik指令集构成的N‑gram统计特征。然后对提取的特征进行数值化处理,构建特征向量。最后基于上述提取的相关特征构建DNN(Deep Neural Network)模型。通过构建的模型对新来的Android软件进行分类和识别。该方法融合了指令集的分析,具有对抗恶意软件混淆的作用,同时基于深度模型的恶意软件检测能够增强特征学习,能够很好地表达大数据的丰富内在信息,更加容易适应不断进化的恶意软件。

Patent Agency Ranking