-
公开(公告)号:CN118631477A
公开(公告)日:2024-09-10
申请号:CN202310221375.X
申请日:2023-03-09
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/241 , G06F18/214 , G06N3/04 , G06N3/0985 , G06F16/901
Abstract: 本发明涉及一种基于元学习的小样本恶意域名检测方法及装置。所述方法包括:将DNS场景建模为异质图;所述异质图的节点包括:客户端、域名和IP地址,所述异质图的边包括:客户端查询域名、域名解析为IP地址和域名的规范名称;基于异质图神经网络HGT来学习域名的节点表示,以得到更新后的域名特征向量;使用基于元学习的小样本分类器对所述更新后的域名特征向量进行分类,以得到恶意域名检测结果。本发明可以获取更好的恶意域名检测效果。
-
公开(公告)号:CN118332375A
公开(公告)日:2024-07-12
申请号:CN202410400399.6
申请日:2024-04-03
Applicant: 中国科学院信息工程研究所
IPC: G06F18/24 , G06F18/22 , G06F18/21 , G06N3/0985 , G06N3/0895 , G06N3/042 , G06N3/048 , G06N3/0464
Abstract: 本发明属于计算机数据挖掘分析技术领域,具体涉及一种基于任务级别关系建模的小样本图节点分类方法和装置。本发明利用对比学习方法来捕获元学习任务间的关系,通过拉近元学习任务图和原始图之间的距离捕获元任务间的相关性,通过拉远不同元学习任务图之间的距离捕获元任务间的差异性,整个方案遵循图元学习范式,对比学习作为子模块加入到图元学习框架中,最终通过联合优化完成小样本图节点分类任务。本发明设计了新的图元学习和图对比学习联合框架,利用对比学习建模了元学习任务间的复杂关系,在不引入额外标注信息的情况下,有效提升了小样本图节点分类任务的性能。
-
公开(公告)号:CN117909468A
公开(公告)日:2024-04-19
申请号:CN202410024770.3
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/35 , G06N20/00
Abstract: 本发明提出一种基于扩散模型的多粒度可控共情对话生成方法,属于文本生成领域。本发明首先通过提取标准回复的话语级别、句子级别和词语级别的控制因素,然后设计掩码矩阵进行细粒度控制,训练扩散模型;最后在共情对话生成阶段,从训练集中进行语义相似性和情绪一致性的匹配检索,将检索到的回复作为原型回复并提取控制因素,然后连同对话上下文输入到训练好的扩散模型中,获得最终的共情对话生成文本。本发明能够实现精细控制,生成的回复可以受到情绪不同程度影响,生成更加自然和适应上下文的共情回复,提高回复的多样性和复杂性。
-
公开(公告)号:CN117909438A
公开(公告)日:2024-04-19
申请号:CN202410024769.0
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F16/33 , G06F40/30 , G06N3/0455
Abstract: 本发明公开了一种文档的篇章级事件论元抽取方法、系统及介质,属于文本信息抽取领域,针对上下文一致性检索、模式一致性检索和自适应混合检索这三种检索方式,通过构建基于T5模型的检索增强生成模型,执行对应的检索增强策略,可以回忆起有助于演示模型应该如何解决任务的样例。其中,本发通过自适应混合检索增强范式来生成参考向量作为深度线索,能够提高模型的类比能力。
-
公开(公告)号:CN111753150B
公开(公告)日:2023-10-13
申请号:CN202010412344.9
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9032
Abstract: 本发明公开一种基于图搜索方法加速epsilon闭包计算的方法及系统,涉及计算机领域,针对传统闭包计算整体消耗时间长的缺陷,为了优化闭包算法,利用图搜索的方法,在NFA构造DFA的过程中对现有的方法进行优化,加速了DFA的构造过程。
-
公开(公告)号:CN116668076A
公开(公告)日:2023-08-29
申请号:CN202310469493.2
申请日:2023-04-27
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种基于异质图鲁棒对抗学习的恶意域名检测方法和装置。所述方法包括:将DNS场景建模为一个原始异质图;其中,所述原始异质图中的节点包括:域名、客户端和IP地址;对原始异质图进行攻击注入,以得到若干个受攻击图;基于DoDe‑CL模型和多层感知机,计算原始异质图和受攻击图中的域名嵌入表示后,对同一域名进行域名嵌入表示组合,并根据组合后的域名嵌入表示,得到所述DNS场景中的恶意域名检测结果。本发明可以提升模型面对基于异质图的攻击时的鲁棒性。
-
公开(公告)号:CN116628303A
公开(公告)日:2023-08-22
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/35 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN116170168A
公开(公告)日:2023-05-26
申请号:CN202210253611.1
申请日:2022-03-15
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开一种基于深度支持向量数据描述的DGA域名检测方法及系统,涉及网络安全领域,为解决解决已有工作检测未知DGA家族方法单一、检测率低的问题,本发明首先从真实DNS流量获取不可解析域名作为待检测域名,然后对不可解析域名提取特征向量,最后将特征向量输入至深度支持向量数据描述算法模型中,判别每个不可解析域名是否是DGA域名。
-
公开(公告)号:CN113472742B
公开(公告)日:2022-09-27
申请号:CN202110588732.7
申请日:2021-05-28
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L41/142 , G06K9/62 , G06N3/04
Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括:解析用户审计日志以获取用户动作信息,将每个用户的动作按照时间先后顺序构建用户动作序列;利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征;将提取的时序特征输入LR分类器进行分类,判别其为正常或异常,从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为,GRU可以更好地捕获用户动作序列的长期依赖,该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。
-
公开(公告)号:CN114050912A
公开(公告)日:2022-02-15
申请号:CN202111158750.8
申请日:2021-09-30
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06K9/62 , G06N3/08
Abstract: 本发明涉及一种基于深度强化学习的恶意域名检测方法和装置。该方法的步骤包括:获取待检测域名的真实DNS流量;查询并记录真实DNS流量中待检测域名的whois信息;根据待检测域名本身以及whois信息,对待检测域名进行特征提取,生成待检测域名的特征向量;将待检测域名的特征向量输入至深度强化学习模型中,判断待检测域名是否具有恶意行为。本发明使用基于深度强化学习的方法来解决真实DNS流量中良性与恶意样本数据不平衡的分类问题,能够快速有效地发现真实DNS流量中存在的低比例恶意样本,在低平衡率时依旧保持较好的效果。
-
-
-
-
-
-
-
-
-