-
公开(公告)号:CN114625978B
公开(公告)日:2024-11-08
申请号:CN202011454130.4
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/22 , G06F18/25 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0985 , G06F16/9536 , G06Q50/00
Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置,包括收集待检测网络和目标网络的网络信息,构建待检测异质网络和目标异质网络;获取每一节点各维度的初始特征向量,得到每个节点的初始特征向量表示;将初始特征向量表示输入基于自注意力图神经网络进行学习,计算各节点的类型感知向量和类型融合向量;通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度,判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响,利用图注意力网络学习类型感知向量和类型融合向量,解决异质网络中对多种类型信息建模的问题,取得较好的锚链接预测效果。
-
公开(公告)号:CN118520929B
公开(公告)日:2024-10-29
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN115080871B
公开(公告)日:2024-05-17
申请号:CN202210847062.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/901 , G06N3/0464 , G06N3/042 , G06N3/045 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种跨社交网络社交用户对齐方法,涉及社交网络的用户关系挖掘领域。本发明为了解决现有社交用户对齐方法不能跨社交网络、计算精度低、对齐效率低的缺陷,采用如下步骤实现:采集社交网络的用户属性信息,构建用户关系拓扑图;根据边权重和节点的出入度计算节点权重;构建一阶近邻关系模型和二阶近邻关系模型,确定一阶邻居节点和二阶邻居节点,得到用户节点之间的相互关系;构建社交对齐神经网络,通过社交对齐神经网络对用户关系拓扑图中各节点进行邻居节点的信息聚合、拼接与非线性变换,得到跨社交网络的社交用户身份对齐结果。本发明主要用于通过跨社交网络对其社交用户实现用户关系挖掘。
-
公开(公告)号:CN117251524A
公开(公告)日:2023-12-19
申请号:CN202310446513.4
申请日:2023-04-24
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/2431 , G06F18/2415 , G06F18/214 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种基于多策略融合的短文本分类方法,属于自然语言处理领域,主要涉及深度神经网络、数据增强以及文本分类。该方法包括如下步骤:通过数据预处理剔除噪声数据、基于词性标注关键词进行分类,基于数据增强的文本分类,最终通过多策略融合设置相应的阈值门限获取网络短文本数据标签。本发明通过提出一种基于多策略融合的短文本分类的解决方法,从而提升短文本数据分类的效果,进而提升业务人员发现相关短文本数据精准度和业务效率。
-
公开(公告)号:CN116684127A
公开(公告)日:2023-09-01
申请号:CN202310579956.0
申请日:2023-05-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种面向网络安全可解释网络数据标记方法、系统、计算设备,所述方法包括:模拟器对每一种网络攻击进行模拟,通过抓包操作获得对应的网络数据包,并在此基础上对数据进行聚类操作获得最终数据集;异常检测器对所述最终数据集的网络流量特征信息和解释器提供的部分解释结果进行统一建模,在每次与网络分析人员的交互中,确定一个可疑流量;解释器基于最大线性分离对当前所检测出可疑流量进行解释,并且向网络分析人员查询判断其是否为异常流量。本发明的优点是:充分利用解释器的计算资源,并使异常检测器可以与网络分析人员进行交互,其中通过解释器确保交互质量,最终使异常检测器模型具有适应动态网络环境的能力。
-
公开(公告)号:CN116595316A
公开(公告)日:2023-08-15
申请号:CN202310430301.7
申请日:2023-04-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/10 , G06F18/22 , G06F18/214 , G06F16/9035 , G06F16/951 , G06F16/9537 , G06F16/9538 , G06F16/9535 , G06F16/9038
Abstract: 本发明提出了一种基于评分卡模型的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;利用当前数据信息,构建评分卡模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。本发明应用评分卡模型,可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。
-
公开(公告)号:CN116561599A
公开(公告)日:2023-08-08
申请号:CN202310538213.9
申请日:2023-05-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F17/16 , G06F18/25 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及社交网络技术领域,尤其为基于少样本几何深度学习的用户重识别系统及方法,包括:生成排序模块:用于生成候选实体,并对候选实体进行相应排序;向量转化模块:用于通过图卷积的方式将待链接实体和候选实体转换成含有语义信息的向量表示;深度训练模块:用于使用几何深度学习对所有的用户属性、内容、关系进行训练;身份重识别模块:用于计算两个实体之间的相似度,进行用户身份的重识别。本发明通过使用少样本几何深度学习实现用户身份重识别,通过图卷积的方式将待链接实体和候选实体转换成含有语义信息的向量表示,生成了有用的实体嵌入,并通过深度学习网络对所有的用户属性、内容、关系进行学习输出,获得更为准确的用户身份重识别信息。
-
公开(公告)号:CN115712738A
公开(公告)日:2023-02-24
申请号:CN202211429752.0
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/383 , G06F40/289 , G06F18/25
Abstract: 本发明公开了一种融合多源数据的Telegram中文群组检索方法、装置及设备,所述方法包括:对获取检索词,并对所述检索词进行Telegram中文群组检索,生成多源融合群组;分析多源融合群组对应的群聊记录集合,得到特征词集合;基于特征词集合筛选所述多源融合群组,得到符合特征群组;对符合特征群组进行关联联想,生成关联联想群组;基于所述多源融合群组与符合特征群组集合,得到Telegram中文群组检索结果。本发明着重于解决Telegram中文群组检索困难。
-
公开(公告)号:CN115034286A
公开(公告)日:2022-09-09
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
公开(公告)号:CN110879856B
公开(公告)日:2022-08-05
申请号:CN201911180128.X
申请日:2019-11-27
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为:1)对一目标社交群体的数据集,对该数据集中各用户的轨迹数据进行预处理,去除噪声并对缺失位置信息进行插值;2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式,再将用户的轨迹模式看作时序序列,采用LSTM对该时间序列进行编码,得到用户的轨迹编码;3)根据所述社交关系生成一图网络,将所述社交关系投影到低维空间,学习得到各用户的嵌入表示;4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层,确定各用户的类别,实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。
-
-
-
-
-
-
-
-
-