融合知识提示的法律文本小样本命名实体识别方法

    公开(公告)号:CN115062104A

    公开(公告)日:2022-09-16

    申请号:CN202210535070.1

    申请日:2022-05-17

    Abstract: 本发明涉及融合知识提示的法律文本小样本命名实体识别方法,属于自然语言处理与机器学习领域。本发明首先定义裁判文书的提示性模板、标签集和自然词集的映射关系,从中国裁判文书网平台获取了2760篇裁定书和判决书文档;然后采用Bert模型对案件陈述和判决结果句子的嵌入向量进行编码,通过注意力加权得到句子的特征表示,结合构造的模板指导生成式预训练模型GPT生成词的类别向量;最后,利用全连接层将句子向量转化为跨度向量,生成语义标签,最小化其与标签向量的损失函数。本发明有效缓解了在法律领域下,由于其标注样本较少、与通用领域的实体类型分布不同造成的过拟合与分类不准确的问题,提升了法律实体识别的准确率和模型的迁移能力。

    数据流形拓扑感知的人工智能系统对抗样本防御方法

    公开(公告)号:CN115048983A

    公开(公告)日:2022-09-13

    申请号:CN202210535745.2

    申请日:2022-05-17

    Abstract: 本发明涉及一种数据流形拓扑感知的人工智能系统对抗样本防御方法,属于人工智能安全技术领域。针对现有方法依赖已有少量对抗样本进行对抗训练或对目标分类器进行修改与再训练,缺乏对对抗样本生成机理的分析,存在无法及时应对新型对抗性攻击,泛化能力不足等问题,首先生成真实含噪目标数据集的数据流形,获取其拓扑信息;然后对生成模型进行拓扑感知训练,在定义的密度超水平集中调整隐向量分布使之与目标分布连通分量数保持一致,拟合生成模型与目标数据的分布;最后将错误分类的点投影到最近的流形上,反演受扰动的样本,纠正分类结果,实现强泛化能力和高稳健性的人工智能系统对抗样本防御效果。

    一种PE恶意软件检测模型的后门对抗样本生成方法

    公开(公告)号:CN113254930B

    公开(公告)日:2022-08-05

    申请号:CN202110594259.3

    申请日:2021-05-28

    Abstract: 本发明涉及一种基于R‑DBSCAN的PE恶意软件检测模型的后门对抗样本生成方法,属于计算机恶意软件检测领域。主要为了解决恶意软件检测模型在黑盒情形下攻击难度高的问题。本发明首先从公开数据集中获取PE样本并训练代理训练模型,采用SHAP值减维数据集;采用R‑DBSCAN方法对样本聚类,取每一聚类的中心节点作为采样点构建新的数据集;训练神经网络模型;分别输入恶意以及良性样本文件,依据神经网络内部神经元权值变化情况记录对分类结果影响较大的神经元;嵌入任意长度字符串至空PE文件,依据神经元权值变化情况取对其影响较大的字符串并记录该神经元;将触发器以嵌入原始恶意PE文件,修改标签达到对神经网络的对抗训练。

    智能化场景下流量监测系统的测试样本生成方法

    公开(公告)号:CN113238957B

    公开(公告)日:2022-08-05

    申请号:CN202110607268.1

    申请日:2021-05-28

    Abstract: 本发明涉及智能化场景下流量监测系统的测试样本生成方法,属于计算机与信息科学技术领域。主要是为了解决现有的智能化场景下流量监测系统的测试样本生成方法存在未考虑神经元组合作用影响和生成条件严苛难以应用于实际测试的问题。本发明首先,构造一组种子测试集和三种变异模型,同时初始化组合覆盖列表;其次,对随机选择的一个种子测试,最大化原模型和变异模型结果置信度的差异性;接着,选择未达成组合覆盖条件的三元组,最小化使下层神经元发生状态转换的两个上层神经元的变动距离;最后,对以上两步进行联合优化,使用梯度上升算法求解,构造测试数据,并通过模型差异检测判断是否保留。重复执行如上步骤,直到种子数据集为空。

    基于梯度驱动数据生成的模型窃取攻击方法

    公开(公告)号:CN114547102A

    公开(公告)日:2022-05-27

    申请号:CN202210047190.7

    申请日:2022-01-14

    Abstract: 本发明涉及基于梯度驱动数据生成的模型窃取攻击方法,属于计算机与信息科学技术领域。该方法先对数据集进行K‑means聚类;然后将聚类簇质心组成的查询数据集通过API输入到目标模型中得到每条数据对应的标签;接着使用数据‑标签对作为训练集训练替代模型;最后根据目标模型和替代模型间的输出差异构造目标函数,并基于函数梯度生成数据以迭代训练替代模型。本发明基于模型间输出差异梯度来生成数据并以此窃取目标模型,解决了模型窃取过程中目标模型训练集未知造成的替代模型准确率低的问题,减少了目标模型API调用的次数,提高了模型窃取效率。

    基于预测位置注意力的双向LSTM命名实体识别方法

    公开(公告)号:CN109933801B

    公开(公告)日:2022-03-29

    申请号:CN201910225622.7

    申请日:2019-03-25

    Abstract: 本发明涉及基于预测位置注意力的双向LSTM命名实体识别方法,属于自然语言处理与机器学习领域。主要为了解决现有的基于注意力机制的命名实体识别方法输入文本组成要素单一的问题和特征抽取过程中未利用字符序列前后顺序位置信息的问题。本发明首先利用LSTM学习得到字符、词、句三种不同级别的特征向量表示,组合构成混合特征向量;再使用BLSTM模型对混合特征向量进行编码提取全局文本信息,在解码阶段使用基于预测对齐位置的注意力机制的CNN模型来提取文本局部信息,得到的特征向量序列用于判别标签值;最后根据标签值输出文本中的命名实体。在SIGHAN bakeoff‑3 MSRA中文命名实体识别语料上实验,结果表明本发明能达到较好的识别效果。

    Android平台融合多特征的APP反调试方法

    公开(公告)号:CN108388778B

    公开(公告)日:2021-03-30

    申请号:CN201810233288.5

    申请日:2018-03-21

    Abstract: 本发明涉及Android平台融合多特征的APP反调试方法,属于计算机与信息科学技术领域。本发明首先创建子进程,实现对主进程的主动跟踪,同时向主进程写入数据,用于动态加载时生成密钥;然后主进程开启线程分别进行暗桩检测、系统文件监控和子进程监控主进程循环检测主进程和子进程状态,当三个模块任意一个发送异常时退出应用程序;同时子进程与主进程保活交互,保证子进程不被挂起,主进程被监控模块监控,当主进程发送异常信号时结束进程。本发明能够有效地对抗调试攻击和反反调试攻击,提高了APP防护能力。

    结合路径标签数据变异的模糊测试关键数据定位方法

    公开(公告)号:CN108446235B

    公开(公告)日:2021-01-12

    申请号:CN201810235294.4

    申请日:2018-03-21

    Abstract: 针对现有的二进制程序模糊测试中关键数据定位方法资源消耗大、误报率较高等问题,提出结合路径标签数据变异的模糊测试关键数据定位方法。该方法首先通过静态分析定位二进制程序中的危险操作;然后使用动态插桩跟踪程序的执行过程,获取危险操作的路径标签和参数;最后通过分析测试数据变异前后跟踪结果的异同从而定位关键数据。实验结果表明,该方法能够在较低的资源消耗下有效定位测试数据中的关键数据,误报率小于0.4%,同时查全率大于80%,精确率大于60%。该方法可以用于提高二进制程序模糊测试的漏洞挖掘能力,具有一定的实用价值。

    结合词聚合与词组合语义特征的文本相似性度量方法

    公开(公告)号:CN108399163B

    公开(公告)日:2021-01-12

    申请号:CN201810234539.1

    申请日:2018-03-21

    Abstract: 本发明涉及结合文本集词聚合与词组合分布式语义特征的文本相似性度量方法,属于自然语言处理与机器学习领域。本方法首先联合文本集中词聚合、词组合分布式语义特征进行自编码填词预测,通过自编码的训练过程建立词嵌入编码网络;然后通过词嵌入编码网络构建词嵌入表示,再计算词嵌入的最大加权匹配作为文本相似性度量。本发明具有准确度高、分布式语义特征丰富的特点。构建的词嵌入编码网络可以有效利用词语的语义联系,建立分布式语义信息更加丰富的词嵌入表示,更好的描述词语之间的语义相似性,进一步提升文本相似性度量的准确性。

    一种信息安全竞赛题目可用性检测方法

    公开(公告)号:CN107179939B

    公开(公告)日:2021-01-12

    申请号:CN201710332983.2

    申请日:2017-05-12

    Abstract: 本发明涉及一种信息安全竞赛题目可用性检测方法,属于计算机与信息科学技术领域。本发明通过撰写定时监控脚本,对竞赛题目的相关服务,相关服务密码以及题目文件的完整性进行监控,从而对题目可用性状态进行检测,保证竞赛的顺利进行。本发明可以对信息安全竞赛题目的可用性进行检测,其方法适用于各种信息安全竞赛。

Patent Agency Ranking