-
公开(公告)号:CN117609804A
公开(公告)日:2024-02-27
申请号:CN202311255685.X
申请日:2023-09-26
摘要: 本发明公开了一种基于先验聚类及多语图谱推理的用户分析方法及系统,所述方法包括:将平台重点用户标记为目标用户和非目标用户;提取平台中每个用户的特征,构建重点用户样本分布矩阵B及除重点用户外的其他用户的待聚类用户样本分布矩阵A;将所述目标用户分为K1个类别,确定矩阵A中的样本点初始重心数K2,将其他用户分为K1+K2个聚类簇;将每个样本对应的其他用户标记为目标用户或非目标用户;构建一个包含目标内容、非目标内容的多语知识图谱;对目标用户、非目标用户在平台中的聚焦点进行推理。本方法仅依据平台积累的用户行为先验知识及平台积累的用户相关内容信息即可构造一套用户分析方法与系统。
-
公开(公告)号:CN118051623A
公开(公告)日:2024-05-17
申请号:CN202410028993.7
申请日:2024-01-08
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/36 , G06F16/35 , G06N5/025 , G06N5/04 , G06F40/295 , G06F40/30 , G06F40/289 , G06F16/951 , G06F16/9535 , G06F16/9538 , H04L67/55
摘要: 本发明涉及人工智能和知识工程技术领域,本发明提供了一种移动应用知识库构建系统和方法,能够实现面向移动应用知识库的构建,完成移动应用知识库的智能应用。本发明移动应用知识库构建系统,基于APP(应用)基础信息和内容数据的多源异构数据,通过应用实体抽取、属性抽取、关系抽取等结构化处理,结合移动APP推理规则和移动APP标签图谱实现,为移动APP相似性、关联性分析以及移动应用内容分析、风险研判等建立基于检索式的知识服务方式,提供了一种面向移动应用的知识库,是一套面向业务应用的知识属性体系,提高相关的工作和生产效率。
-
公开(公告)号:CN117278253A
公开(公告)日:2023-12-22
申请号:CN202311043720.1
申请日:2023-08-18
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04L9/40 , H04L61/4511 , G06F21/56 , G06N3/04
摘要: 一种基于DNS流量特征与进程特征的恶意软件检测装置与方法,该装置主要包括:DNS进程特征采集模块,部署于要保护的终端主机上,用于确定发起DNS请求的进程,获取其特征信息;DNS流量特征采集模块,部署于网关,用于获取终端主机发起的DNS请求,获取其流量特征信息;数据整合模块,用于对上述模块收集到的特征信息进行关联后发送给分析模块;分析模块,将收到的DNS特征数据输入预先训练好的神经网络,判断对应的进程是否有害。监控DNS请求中的流量特征和进程特征,有效地发现设备中存在的恶意软件。
-
公开(公告)号:CN116935117A
公开(公告)日:2023-10-24
申请号:CN202310887423.9
申请日:2023-07-19
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06V10/764 , G06V10/56
摘要: 本发明涉及标志物检测系统领域,尤其为一种复杂场景下特定标志物检测系统,包括:收集模块:用于通过网络爬虫技术对特定标志物图片进行收集,获得特定标志物图片;处理模块:用于对收集模块收集的特定标志物图片进行图片预处理,获得预处理数据;分类器训练模块:用于根据处理模块处理得到的预处理数据进行模型训练,得到自动分类模型;分类模块:用于连接自动分类模型,对特定标志物图片进行分类。本发明通过颜色和形状的标志物检测算法,从色彩增强、颜色分割和形状分类三个方面提高特定标志物检测系统算法的鲁棒性,通过比较RGB和HSV颜色分割效果,选取效果更好的HSV颜色分割,在形状分类中不仅仅使用简单的SVM模型训练而且同时使用Contourlet变化提高算法的鲁棒性使的算法预测效果更好,保证出现差错在系统允许的范围内。
-
公开(公告)号:CN115858798A
公开(公告)日:2023-03-28
申请号:CN202210651618.9
申请日:2022-06-09
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC分类号: G06F16/36 , G06F40/295 , G06F40/30
摘要: 本发明涉及一种面向维基百科文本数据的事理图谱构建方法和系统,属于文本数据挖掘领域。该方法包括以下步骤:获取维基百科的数据并将其解析为纯文本的形式;使用语义角色标注技术抽取维基百科数据中的事件简介;使用命名实体识别技术对维基百科数据的事件中的人物、地点、机构进行抽取;使用正则表达式匹配技术对维基百科数据的事件中的时间进行抽取;将抽取的事件简介、人物、地点、机构和时间构造为事理图谱。本发明实现了从数据获取、事件抽取、事件论元抽取到图谱构建的相关技术流程,能够帮助研究和分析事件的基本信息和演化过程。
-
公开(公告)号:CN115114427A
公开(公告)日:2022-09-27
申请号:CN202210279929.7
申请日:2022-03-21
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
摘要: 本发明公开一种基于预训练和多任务学习的文本摘要和关键词抽取方法,属于文本信息抽取领域,基于预训练语言模型在抽取任务上进行针对性的进一步微调,并在关键词抽取任务与摘要抽取任务的协作下用于抽取关键词和摘要。本发明能够解决现有文本关键词抽取和摘要抽取技术存在的准确率和召回率低的问题。
-
公开(公告)号:CN111163065A
公开(公告)日:2020-05-15
申请号:CN201911279299.8
申请日:2019-12-13
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04L29/06 , G06F16/2458 , G06F16/23
摘要: 本发明提出了一种异常用户检测方法及装置,检测方法包括:获取用户的行为数据信息;对行为数据信息进行预处理,获得行为序列;将行为序列与预先训练的异常行为库中的异常行为特征进行匹配,以判定用户是否为异常用户;其中,行为序列包括:操作事件和时间间隔信息。根据本发明的异常用户检测方法,依据移动端用户行为的特点,充分利用异常用户特征,在行为序列挖掘过程中,加入时间间隔属性,进行带有时间间隔的行为序列挖掘,可以有效提升异常用户检测的准确率。
-
公开(公告)号:CN115858798B
公开(公告)日:2024-11-19
申请号:CN202210651618.9
申请日:2022-06-09
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC分类号: G06F16/36 , G06F40/295 , G06F40/30
-
公开(公告)号:CN118821782A
公开(公告)日:2024-10-22
申请号:CN202410768553.5
申请日:2024-06-14
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种多粒度相似性增强的篇章级事件论元抽取方法及系统,属于文本信息抽取领域。本发明首先将文档输入预训练语言模型编码,得到高维度嵌入表示;然后构建包含句子和段落节点的异构图,通过图神经网络融合全局语义信息;最后,通过对比学习和排序损失增强段落和句子粒度的相似性。本发明解决了远距离事件论元抽取的难题,并有效缓解了噪音实体对抽取结果的干扰,提高了抽取的准确性和鲁棒性。
-
公开(公告)号:CN115269833B
公开(公告)日:2024-08-16
申请号:CN202210760202.0
申请日:2022-06-29
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC分类号: G06F16/35 , G06F40/194 , G06F18/23213 , G06F18/24 , G06F18/25
摘要: 本发明公开一种基于深度语义和多任务学习的事件信息抽取方法及系统,属于文本信息抽取领域。为克服现有事件信息抽取技术准确率、召回率低等不足,本发明主要利用预训练语言模型通过对文章在篇章级、语段级、语句级、词语级等粒度上分别进行向量表示,通过依次进行事件分类、事件论元抽取、关键词抽取获得事件的主要信息。本发明在事件分类、事件论元抽取、关键词抽取三方面达到了非常高的准确率。
-
-
-
-
-
-
-
-
-