-
公开(公告)号:CN110674290B
公开(公告)日:2023-03-10
申请号:CN201910733074.9
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06Q50/00
Abstract: 本发明提出了一种用于重叠社区发现的关系预测方法、装置和存储介质,用以解决由于获取的用户关系图不够完整,降低了社区发现结果准确性的问题。用于重叠社区发现的关系预测方法,包括:获取用户通信信息中包含的信息内容并分类;确定每一类信息内容中包含的两两信息内容之间的相似度;对于相似度大于预设阈值的两条信息内容,构建该两条信息内容的发送信息用户之间的短时转发关系;构建所述用户通信信息中发送信息用户和接收信息用户之间的收发关系;根据所述短时转发关系和所述收发关系,构建用户关系图;基于所述用户关系图,利用社区发现算法进行社区发现。
-
公开(公告)号:CN114817661A
公开(公告)日:2022-07-29
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06K9/62
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN114817516A
公开(公告)日:2022-07-29
申请号:CN202210448769.4
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F16/35 , G06F16/951 , G06F40/242 , G06F40/279 , G06F40/30 , G06N3/08
Abstract: 本发明涉及一种零样本条件下基于逆向匹配的画像映射方法,包括在数据特征标签和画像标签两个不同体系间建构双相关文本语料库,使用逆向匹配对语料库进行筛选修正;通过人工标注构建分类语料库,并训练模型建立画像体系间的映射关系;采用基于持续响应衰减的更新机制,并结合标签历史状态对时序变化的画像相关更新数据进行修正。本方法从扩展数据的角度出发,采用基于逆向匹配的文本库构建方法,引入与原始标签相关的外部文本数据扩展并增强标签的语义表达,再引入与用户画像相关的外部数据进行标注建立扩展标签和标注数据之间的联系,从而挖掘出原始特征标签隐含的丰富含义,达到从少量标签序列中计算目标画像的目的。
-
公开(公告)号:CN110633366B
公开(公告)日:2022-12-16
申请号:CN201910697992.0
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06V10/774 , G06V10/764
Abstract: 本发明提出了一种短文本分类方法、装置和存储介质,用以从有限的训练数据中获取泛化能力强并且较为准确的分类特征,提高短文本分类的准确性。所述短文本分类方法,包括:获取待分类短文本;将所述待分类短文本输入到多层分类器中,其中,所述多层分类器为利用训练样本和所述待分类短文本所属目标领域的领域知识图谱进行训练得到的,每一层分类器提取不同的文本特征进行训练;根据所述多层分类器的输出结果,确定所述待分类短文本对应的文本类别。
-
公开(公告)号:CN110633366A
公开(公告)日:2019-12-31
申请号:CN201910697992.0
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种短文本分类方法、装置和存储介质,用以从有限的训练数据中获取泛化能力强并且较为准确的分类特征,提高短文本分类的准确性。所述短文本分类方法,包括:获取待分类短文本;将所述待分类短文本输入到多层分类器中,其中,所述多层分类器为利用训练样本和所述待分类短文本所属目标领域的领域知识图谱进行训练得到的,每一层分类器提取不同的文本特征进行训练;根据所述多层分类器的输出结果,确定所述待分类短文本对应的文本类别。
-
公开(公告)号:CN114817661B
公开(公告)日:2024-08-13
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06F18/22 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN110704611B
公开(公告)日:2022-08-19
申请号:CN201910730306.5
申请日:2019-08-08
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F40/279
Abstract: 本发明公开了一种基于特征解交织的非法文本识别方法及装置,所述方法包括:步骤1,对待识别文本进行去变体操作,去除所述待识别文本中的特殊字符;步骤2,根据预先设置的文本特征词库和乱序特征字库,判断所述待识别文本是否为乱序文本,如果判断为是,则对所述待识别文本进行解交织处理,消除变体,否则,直接执行步骤3;步骤3,利用预先训练的分类器组对解变体后的待识别文本进行分类,输出是否为非法文本预测结果。
-
公开(公告)号:CN114817516B
公开(公告)日:2024-08-09
申请号:CN202210448769.4
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F16/35 , G06F16/951 , G06F40/242 , G06F40/279 , G06F40/30 , G06N3/088
Abstract: 本发明涉及一种零样本条件下基于逆向匹配的画像映射方法,包括在数据特征标签和画像标签两个不同体系间建构双相关文本语料库,使用逆向匹配对语料库进行筛选修正;通过人工标注构建分类语料库,并训练模型建立画像体系间的映射关系;采用基于持续响应衰减的更新机制,并结合标签历史状态对时序变化的画像相关更新数据进行修正。本方法从扩展数据的角度出发,采用基于逆向匹配的文本库构建方法,引入与原始标签相关的外部文本数据扩展并增强标签的语义表达,再引入与用户画像相关的外部数据进行标注建立扩展标签和标注数据之间的联系,从而挖掘出原始特征标签隐含的丰富含义,达到从少量标签序列中计算目标画像的目的。
-
公开(公告)号:CN110704611A
公开(公告)日:2020-01-17
申请号:CN201910730306.5
申请日:2019-08-08
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F40/279
Abstract: 本发明公开了一种基于特征解交织的非法文本识别方法及装置,所述方法包括:步骤1,对待识别文本进行去变体操作,去除所述待识别文本中的特殊字符;步骤2,根据预先设置的文本特征词库和乱序特征字库,判断所述待识别文本是否为乱序文本,如果判断为是,则对所述待识别文本进行解交织处理,消除变体,否则,直接执行步骤3;步骤3,利用预先训练的分类器组对解变体后的待识别文本进行分类,输出是否为非法文本预测结果。
-
公开(公告)号:CN110674290A
公开(公告)日:2020-01-10
申请号:CN201910733074.9
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06Q50/00
Abstract: 本发明提出了一种用于重叠社区发现的关系预测方法、装置和存储介质,用以解决由于获取的用户关系图不够完整,降低了社区发现结果准确性的问题。用于重叠社区发现的关系预测方法,包括:获取用户通信信息中包含的信息内容并分类;确定每一类信息内容中包含的两两信息内容之间的相似度;对于相似度大于预设阈值的两条信息内容,构建该两条信息内容的发送信息用户之间的短时转发关系;构建所述用户通信信息中发送信息用户和接收信息用户之间的收发关系;根据所述短时转发关系和所述收发关系,构建用户关系图;基于所述用户关系图,利用社区发现算法进行社区发现。
-
-
-
-
-
-
-
-
-