应用多代价函数的系统异构联邦学习效率提升方法

    公开(公告)号:CN115759282A

    公开(公告)日:2023-03-07

    申请号:CN202211322834.5

    申请日:2022-10-27

    Abstract: 本发明涉及应用多代价函数的系统异构联邦学习效率提升方法,属于计算机与信息科学技术领域。本发明首先根据建模任务设置初始训练参数,确定参与客户端并进行联邦训练;其次,在新一轮训练前根据客户端数据量、计算性能及通信性能、在当前服务器等待时间内训练完成情况动态构建客户端空闲代价函数和终止代价函数;然后,遍历服务器等待时间的可能取值,最小化所有客户端总代价得到最优等待时间,进而更新训练参数并调整参与客户端;最后,通过多轮联邦训练达到全局模型准确率要求。本发明提出参与客户端的空闲代价和终止代价函数计算方法,将服务器固定的等待时间进行动态调整,有效提升了联邦学习训练效率。

    多注意力机制跨度级小样本命名实体识别方法

    公开(公告)号:CN115659978A

    公开(公告)日:2023-01-31

    申请号:CN202211331584.1

    申请日:2022-10-28

    Abstract: 本发明涉及多注意力机制跨度级小样本命名实体识别方法,属于自然语言处理领域。本发明首先对句子进行跨度枚举并通过BERT编码器编码生成跨度连贯性表示;其次,提出跨度内注意力机制关注重要字符信息,引入跨度间注意力机制关注与目标跨度相关度高的其他跨度;然后,利用跨度边界注意力机制关注支持集中实体跨度边界共有特征,利用实例级跨度注意力机制关注与查询集样本跨度相关度高的支持集样本跨度,生成实体类别原型;最后,通过计算支持集和查询集间距离进行实体类别预测。本发明能够改善token级基于度量元学习方法中的语义截断问题,有效提升小样本命名实体识别任务的准确率。

    多语种终身学习的语音识别方法
    53.
    发明公开

    公开(公告)号:CN115148194A

    公开(公告)日:2022-10-04

    申请号:CN202210533041.1

    申请日:2022-05-16

    Abstract: 本发明涉及多语种终身学习的语音识别方法,属于计算机与信息科学技术领域。本发明首先结合连续时序分类和Transformer算法对单一语种的语音训练语音识别模型;其次,当有新语种识别任务加入时,衡量该语种和已识别语种的相似度;然后,使用基于相似度的正交权重修正算法对模型的梯度下降方向进行修正;最后,使用新语种训练多语种语音识别模型,实现多语种的语音识别。本发明能够在保证已学习语种识别能力的同时,在线学习新语种并更新模型,加快了新语种的学习速度,提升了模型对于多个语种的识别性能。

    结合图嵌入知识建模的网络入侵检测方法

    公开(公告)号:CN115118451A

    公开(公告)日:2022-09-27

    申请号:CN202210536021.X

    申请日:2022-05-17

    Abstract: 本发明涉及结合图嵌入知识建模的网络入侵检测方法,属于计算机与信息科学技术领域。本发明首先对网络入侵流量数据包进行特征提取,定义特征节点与数据包节点类别,并根据节点之间的关系构造流量异构网络;然后基于元路径的游走方法生成节点上下文序列,训练图嵌入模型生成节点的特征向量表示;最后,根据模型生成测试集节点的特征向量表示,采用基于节点相似度计算的方法判别节点标签,实现对网络入侵流量的检测。优化了网络流量数据结构复杂情况下,当前深度学习网络入侵检测模型无法充分捕获节点之间拓扑结构关系和特征权重选择不当的问题。针对网络入侵流量本发明能达到较好的分类效果,进一步提升了网络入侵检测的正确率。

    PU强化学习的远程监督命名实体识别方法

    公开(公告)号:CN113221575B

    公开(公告)日:2022-08-02

    申请号:CN202110607269.6

    申请日:2021-05-28

    Abstract: 本发明涉及PU强化学习的远程监督命名实体识别方法,属于自然语言处理与机器学习领域。主要为了解决中文命名实体识别任务的远程监督样本存在噪声标记、模型学习样本特征效率低下问题和训练过程缺乏有效监测机制。本发明首先利用BLSTM模型对文本提取单条样本序列特征和多标签评分信息;然后,基于PU强化学习,训练样本选择器,从标记语料和远程监督语料中筛选出正样本和负样本。再将负样本送入去噪还原器得到还原样本。再引入无偏、一致地估计任务损失的损失函数,使用正样本和还原样本训练中文命名实体识别模型;最后重复上述模型训练,直到筛选标记语料趋于稳定。在ICT语料、EC语料和NEWS进行了实验,结果表明本发明能达到较好的去噪效果。

    利用差分隐私词嵌入扰动的敏感文本脱敏方法

    公开(公告)号:CN114547670A

    公开(公告)日:2022-05-27

    申请号:CN202210039857.9

    申请日:2022-01-14

    Abstract: 本发明涉及利用差分隐私词嵌入扰动的敏感文本脱敏方法,属于差分隐私保护技术领域。本发明首先利用命名实体识别技术识别文本中的敏感单词,并随机抽样语料库中的非敏感单词;其次给敏感单词的词嵌入向量加上差分隐私噪声,生成新的扰动词嵌入向量;然后度量扰动词嵌入向量和非敏感单词的词嵌入向量之间的欧几里得距离,依据最近邻公式取得候选词集合;最后依据多单位拍卖概率公式用候选词集合中的单词替换文本中所有的敏感单词后输出脱敏文本。本发明在多个语料上实验,结果表明其在多种文本上都能达到较好的脱敏效果,具有良好的通用性和可迁移性。

    一种基于深度学习的Android恶意软件检测方法

    公开(公告)号:CN109271788B

    公开(公告)日:2021-10-12

    申请号:CN201810963774.2

    申请日:2018-08-23

    Abstract: 本发明涉及一种基于深度学习的Android恶意软件检测方法,属于计算机与信息科学技术领域。本发明首先对Android应用软件进行特征提取,然后通过对Android应用文件进行解压缩和反编译等操作提取相关的安全特征。提取的特征包括3个方面:文件结构特征、安全经验特征和Dalvik指令集构成的N‑gram统计特征。然后对提取的特征进行数值化处理,构建特征向量。最后基于上述提取的相关特征构建DNN(Deep Neural Network)模型。通过构建的模型对新来的Android软件进行分类和识别。该方法融合了指令集的分析,具有对抗恶意软件混淆的作用,同时基于深度模型的恶意软件检测能够增强特征学习,能够很好地表达大数据的丰富内在信息,更加容易适应不断进化的恶意软件。

    智能化场景下流量监测系统的测试样本生成方法

    公开(公告)号:CN113238957A

    公开(公告)日:2021-08-10

    申请号:CN202110607268.1

    申请日:2021-05-28

    Abstract: 本发明涉及智能化场景下流量监测系统的测试样本生成方法,属于计算机与信息科学技术领域。主要是为了解决现有的智能化场景下流量监测系统的测试样本生成方法存在未考虑神经元组合作用影响和生成条件严苛难以应用于实际测试的问题。本发明首先,构造一组种子测试集和三种变异模型,同时初始化组合覆盖列表;其次,对随机选择的一个种子测试,最大化原模型和变异模型结果置信度的差异性;接着,选择未达成组合覆盖条件的三元组,最小化使下层神经元发生状态转换的两个上层神经元的变动距离;最后,对以上两步进行联合优化,使用梯度上升算法求解,构造测试数据,并通过模型差异检测判断是否保留。重复执行如上步骤,直到种子数据集为空。

    面向图像分类系统攻击的对抗样本检测方法

    公开(公告)号:CN113222056A

    公开(公告)日:2021-08-06

    申请号:CN202110592135.1

    申请日:2021-05-28

    Abstract: 本发明涉及一种基于深度神经网络隐藏层代表性特征最近邻搜索的图像分类系统对抗样本检测方法,属于人工智能对抗领域。主要为了解决对抗样本数量、种类较少难以用于训练和仅使用良性样本训练时深度神经网络隐藏层特征数量较多、相似特征计算量大的问题。本发明首先将只包含良性样本的训练集输入到被攻击图像分类系统中,提取系统隐藏层特征构建隐藏层特征池;并将其按照标签分别进行聚类,将每个簇中心作为该标签代表性特征向量,构建代表性特征池;对于测试样本,先进行图像去噪,再输入到系统中提取隐藏层特征,计算该特征在所有代表性特征中的K近邻,将其中出现频率最高的标签与直接将样本输入系统得到的标签比较,如果不同则为对抗样本。

    生成对抗网络与多模态融合的假新闻检测方法

    公开(公告)号:CN113221872A

    公开(公告)日:2021-08-06

    申请号:CN202110607067.1

    申请日:2021-05-28

    Abstract: 本发明涉及生成对抗网络与多模态融合的假新闻检测方法,属于机器学习领域。主要为了解决单模态假新闻检测特征不足,多模态假新闻检测中不同模态特征之间异质性较大且拼接方式简单,模型训练过程局限于单一数据集,导致假新闻检测准确率和模型泛化性低下的问题。本发明首先需要训练条件生成对抗网络,该网络可以根据输入图片输出描述图片的文本特征;然后提取新闻的文本特征和图片特征,使用条件生成对抗网络将新闻图片特征转化为文本特征,将新闻文本特征、描述新闻图片的文本特征和新闻的图片特征进行张量融合;最后,将融合的特征输入神经网络得到新闻真实性的分类结果。

Patent Agency Ranking