-
公开(公告)号:CN118332375A
公开(公告)日:2024-07-12
申请号:CN202410400399.6
申请日:2024-04-03
Applicant: 中国科学院信息工程研究所
IPC: G06F18/24 , G06F18/22 , G06F18/21 , G06N3/0985 , G06N3/0895 , G06N3/042 , G06N3/048 , G06N3/0464
Abstract: 本发明属于计算机数据挖掘分析技术领域,具体涉及一种基于任务级别关系建模的小样本图节点分类方法和装置。本发明利用对比学习方法来捕获元学习任务间的关系,通过拉近元学习任务图和原始图之间的距离捕获元任务间的相关性,通过拉远不同元学习任务图之间的距离捕获元任务间的差异性,整个方案遵循图元学习范式,对比学习作为子模块加入到图元学习框架中,最终通过联合优化完成小样本图节点分类任务。本发明设计了新的图元学习和图对比学习联合框架,利用对比学习建模了元学习任务间的复杂关系,在不引入额外标注信息的情况下,有效提升了小样本图节点分类任务的性能。
-
公开(公告)号:CN113472742B
公开(公告)日:2022-09-27
申请号:CN202110588732.7
申请日:2021-05-28
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L41/142 , G06K9/62 , G06N3/04
Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括:解析用户审计日志以获取用户动作信息,将每个用户的动作按照时间先后顺序构建用户动作序列;利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征;将提取的时序特征输入LR分类器进行分类,判别其为正常或异常,从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为,GRU可以更好地捕获用户动作序列的长期依赖,该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。
-
公开(公告)号:CN118760772B
公开(公告)日:2025-04-01
申请号:CN202410736212.X
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。
-
公开(公告)号:CN114625978B
公开(公告)日:2024-11-08
申请号:CN202011454130.4
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/22 , G06F18/25 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0985 , G06F16/9536 , G06Q50/00
Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置,包括收集待检测网络和目标网络的网络信息,构建待检测异质网络和目标异质网络;获取每一节点各维度的初始特征向量,得到每个节点的初始特征向量表示;将初始特征向量表示输入基于自注意力图神经网络进行学习,计算各节点的类型感知向量和类型融合向量;通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度,判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响,利用图注意力网络学习类型感知向量和类型融合向量,解决异质网络中对多种类型信息建模的问题,取得较好的锚链接预测效果。
-
公开(公告)号:CN118332101A
公开(公告)日:2024-07-12
申请号:CN202410400400.5
申请日:2024-04-03
Applicant: 中国科学院信息工程研究所
IPC: G06F16/34 , G06F40/30 , G06N3/0442 , G06N3/08 , G06F16/35
Abstract: 本发明属于文本信息抽取领域,涉及一种基于分层迭代的长文本抽取式摘要生成方法和装置。该方法包括:获取文本中字符的词向量、位置向量以及结构子标题向量,将其相加作为语义编码的输入,采用长文本预训练语言模型作为语义编码器,进行语义编码;将语义编码之后的向量送入各个层级编码器中,将语义信息沿着文本结构路线由句子层级至文档层级进行分层传递,然后从文档层级至句子层级再次进行分层传递,实现迭代更新,得到各个层级的隐层表示;通过融合各个层级的隐层表示全面地对每个句子进行评价,选出最优的摘要句。本发明能够克服现有抽取式摘要面向长文本时计算资源消耗大,存在语义损失以及长文本结构建模缺失的问题。
-
公开(公告)号:CN109766432A
公开(公告)日:2019-05-17
申请号:CN201810765723.9
申请日:2018-07-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于生成对抗网络的中文摘要生成方法和装置。该方法包括:1)通过对给定的中文数据集进行预处理操作形成训练集;2)构建基于生成对抗网络的中文摘要生成模型,并使用训练集对中文摘要生成模型进行训练;3)将待生成摘要的中文文本输入到训练完毕的中文摘要生成模型,得到对应的摘要。本发明使用判别器最小化误差来代替最大生成摘要概率的框架;特别设计了由3个LSTMs组成的判别器,能够更好地捕获特征,辅助分类效果;提出使用以字为单位结合上下文,能够有效提升文本摘要的效率。本发明能够对大规模中文文本进行摘要的自动生成,生成的摘要更自然、连贯,具有可读性。
-
公开(公告)号:CN118760745A
公开(公告)日:2024-10-11
申请号:CN202410736214.9
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种面向知识图谱复杂逻辑推理的生成式方法。本发明包括查询转换模块和扩散推理模块,逻辑查询转换模块将一阶逻辑查询转换为输入序列,扩散推理模块展示了前向和后向的双向生成过程,并设计了一个结构增强自注意力机制的变换器。查询转换模块将符号化的一阶逻辑查询转换为自然语言输入序列,扩散推理模块通过前向过程和后向过程的多步生成过程来捕捉复杂逻辑查询的复合分布;同时,在扩散模型的转换器中设计了一个结构增强的自注意力机制,以有效地融合知识图谱中重要的结构特征。本发明通过对扩散中间过程的多粒度控制进一步保证了模型的可控性和可解释性;相较于其他基线方法实现了更好的知识图谱推理结果。
-
公开(公告)号:CN118503775A
公开(公告)日:2024-08-16
申请号:CN202410499002.3
申请日:2024-04-24
Applicant: 中国科学院信息工程研究所
IPC: G06F18/241 , G06N3/042 , G06N3/082
Abstract: 本发明公开了基于属性图表示的用户网络节点或边的分类方法及系统,属于图数据处理领域,针对用户网络的属性信息构建属性图,计算所有邻居节点的属性信息和拓扑信息对目标节点的全局表示产生的影响;再将这两种影响与目标节点的全局表示进行融合,迭代得到目标节点最终的低维表示;输入到多层感知器中进行分类预测。本发明能够解决现有基于图神经网络的属性图表示学习方法中存在的属性扰动、过平滑问题以及属性、拓扑信息影响差异未被充分建模等问题,以及这些问题对最终分类预测造成的不良影响。
-
公开(公告)号:CN110688479B
公开(公告)日:2022-06-17
申请号:CN201910764862.4
申请日:2019-08-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/34 , G06F16/33 , G06F16/35 , G06F40/295
Abstract: 本发明公开了一种用于生成式摘要的评估方法及排序网络。本发明从三个方面来评估摘要质量:第一,运用语言模型来评估语言的流畅度;第二,使用相似度模型评估文本和摘要之间的语义相关性;第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。本发明从摘要的语言流畅性、摘要与原文的相关性以及摘要所包含的信息量等多个方面来综合评估摘要的质量,大大提高了评估的准确性。
-
公开(公告)号:CN110704606A
公开(公告)日:2020-01-17
申请号:CN201910764261.3
申请日:2019-08-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于图文融合的生成式摘要生成方法,其步骤包括:1)将给定的文本数据集划分为训练集、验证集和测试集;其中,文本数据集中的每一样本是一三元组(X,I,Y),X是文本,I是文本X对应的图像,Y是文本X的摘要;2)对文本数据集的图像进行实体特征提取,并将提取的实体特征表示成与文本同维度的图像特征向量;3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练;4)输入一条文本和对应图像并生成该图像的图像特征向量,然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型,得到该文本对应的摘要。本发明生成的摘要可以有效地调整文本中实体的权重,在一定程度缓解未登录词的问题。
-
-
-
-
-
-
-
-
-