-
公开(公告)号:CN111143553B
公开(公告)日:2023-04-07
申请号:CN201911244895.2
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F18/2415 , G06N3/045 , G06N3/09 , G06N3/047
Abstract: 本发明提出一种实时文本数据流的特定信息识别方法及系统。本发明主要解决的问题是针对海量实时文本数据流实现领域关注的特定信息识别。本发明提出一种针对海量实时文本数据流的特定信息识别框架及系统,侧重于具有海量性、实时性、多样化和复杂性特点的社交文本特定信息识别,并且实现能够适用于生产环境的社交大数据在线实时分析系统。本发明的目的在于根据互联网环境及手机短信网络环境下海量文本数据流,识别出文本中隐含的特定信息。
-
公开(公告)号:CN110704612B
公开(公告)日:2022-09-16
申请号:CN201910732451.7
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F40/216 , G06F40/30 , G06Q50/00
Abstract: 本发明提出了一种社交群体发现方法、装置和存储介质,用以提高社交群体发现精度和准确度。所述社交群体发现方法,包括:利用预先设定的种子用户和约束条件,从通信数据源中查找候选用户,所述候选用户包括与所述种子用户通信的第一用户和/或满足所述约束条件的第二用户;从所述候选用户的通信数据中提取与所述种子用户关联的关联特征信息;根据提取的关联特征信息,确定每一候选用户对应的置信度;确定对应的置信度大于预设阈值的候选用户为目标用户;根据目标用户之间的通信联系建立初始群体网络;利用群体发现算法从所述初始群体网络中发现社交群体子网络。
-
公开(公告)号:CN111143508A
公开(公告)日:2020-05-12
申请号:CN201911244928.3
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/289 , G06K9/62
Abstract: 本发明提出了一种基于通信类短文本的事件检测与跟踪方法,包括:提取与某事件对应的样本集合中各通信类短文本的语义特征、关键要素,及该样本集合的传播网络;根据该语义特征、该关键要素和该传播网络,分别获得任意两个该通信类短文本之间的语义距离、要素距离和用户距离;以该语义距离、该要素距离和该用户距离,获得任意两个该通信类短文本之间的度量距离;对所有该度量距离进行聚类,获得该事件的事件检测结果;提取该事件检测结果的特征属性以跟踪该事件。还提出一种基于通信类短文本的事件检测与跟踪系统,以及一种进行基于通信类短文本的事件检测与跟踪的数据处理装置。
-
公开(公告)号:CN111143508B
公开(公告)日:2023-04-28
申请号:CN201911244928.3
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/289 , G06F18/23
Abstract: 本发明提出了一种基于通信类短文本的事件检测与跟踪方法,包括:提取与某事件对应的样本集合中各通信类短文本的语义特征、关键要素,及该样本集合的传播网络;根据该语义特征、该关键要素和该传播网络,分别获得任意两个该通信类短文本之间的语义距离、要素距离和用户距离;以该语义距离、该要素距离和该用户距离,获得任意两个该通信类短文本之间的度量距离;对所有该度量距离进行聚类,获得该事件的事件检测结果;提取该事件检测结果的特征属性以跟踪该事件。还提出一种基于通信类短文本的事件检测与跟踪系统,以及一种进行基于通信类短文本的事件检测与跟踪的数据处理装置。
-
公开(公告)号:CN111143553A
公开(公告)日:2020-05-12
申请号:CN201911244895.2
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种实时文本数据流的特定信息识别方法及系统。本发明主要解决的问题是针对海量实时文本数据流实现领域关注的特定信息识别。本发明提出一种针对海量实时文本数据流的特定信息识别框架及系统,侧重于具有海量性、实时性、多样化和复杂性特点的社交文本特定信息识别,并且实现能够适用于生产环境的社交大数据在线实时分析系统。本发明的目的在于根据互联网环境及手机短信网络环境下海量文本数据流,识别出文本中隐含的特定信息。
-
公开(公告)号:CN110704612A
公开(公告)日:2020-01-17
申请号:CN201910732451.7
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F40/216 , G06F40/30 , G06Q50/00
Abstract: 本发明提出了一种社交群体发现方法、装置和存储介质,用以提高社交群体发现精度和准确度。所述社交群体发现方法,包括:利用预先设定的种子用户和约束条件,从通信数据源中查找候选用户,所述候选用户包括与所述种子用户通信的第一用户和/或满足所述约束条件的第二用户;从所述候选用户的通信数据中提取与所述种子用户关联的关联特征信息;根据提取的关联特征信息,确定每一候选用户对应的置信度;确定对应的置信度大于预设阈值的候选用户为目标用户;根据目标用户之间的通信联系建立初始群体网络;利用群体发现算法从所述初始群体网络中发现社交群体子网络。
-
公开(公告)号:CN111988231B
公开(公告)日:2022-07-22
申请号:CN202010845709.7
申请日:2020-08-20
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
Inventor: 张良 , 党向磊 , 胡燕林 , 李佳 , 陈训逊 , 云晓春 , 黄亮 , 刘伟 , 郭三川 , 杨云龙 , 王鼎华 , 戴光耀 , 吴昊 , 李瑞轩 , 郑展伟 , 房超 , 冀晓凯
IPC: H04L45/745 , G06F16/901 , G06F16/903
Abstract: 一种掩码五元组规则匹配的方法,应用于三态内容寻址存储器TCAM芯片,包括:对Database部分中的掩码五元组规则中的后缀掩码进行合并位特征识别,将包含识别到的合并位的多条掩码五元组规则合并为一条规则;将已合并的多条规则相应的匹配结果共同存储于该合并后的规则所对应的UserData部分中,并将上述合并位作为索引分别分配给相应的匹配结果;在数据报文五元组信息与该合并的规则匹配后,再基于该合并位索引最终的匹配结果。此外本发明实施例还提供了一种规则匹配装置。通过本发明实施例提供的方法及装置,可以有效提升了TCAM表项资源所能存储的掩码五元组规则容量,在提高利用率的同时节约了成本。
-
公开(公告)号:CN111984835B
公开(公告)日:2022-07-05
申请号:CN202010845708.2
申请日:2020-08-20
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
Inventor: 党向磊 , 张良 , 胡燕林 , 李佳 , 陈训逊 , 云晓春 , 黄亮 , 刘伟 , 郭三川 , 杨云龙 , 王鼎华 , 戴光耀 , 吴昊 , 李瑞轩 , 郑展伟 , 房超 , 冀晓凯
IPC: G06F16/903 , G06F16/901 , H04L45/745 , H04L101/695
Abstract: 一种IPv4掩码五元组规则匹配的方法,应用于三态内容寻址存储器TCAM芯片,包括:压缩该TCAM芯片所存储的掩码五元组规则中的源端口SP字段及目的端口DP字段,删除协议号P字段,压缩后占10字节,并将原始掩码五元组规则中的协议号字P字段与该规则的匹配结果合并存储;接收报文并提取报文中的五元组信息,在TCAM芯片所存储的掩码五元组规则中查询;若查询命中匹配结果,则判断报文中的五元组信息与匹配结果相应的协议号P字段是否一致,若一致则输出匹配结果。此外本发明实施例还提供了一种规则匹配装置。通过本发明实施例提供的方法、装置,能够有效解决TCAM资源浪费的问题,使TCAM得到充分的使用。
-
公开(公告)号:CN113422755A
公开(公告)日:2021-09-21
申请号:CN202110480987.1
申请日:2021-04-30
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
Abstract: 本发明公开了一种基于聚类和关联情报的DGA域名检测分析方法和系统,方法包括:获取DNS的统计数据,并在统计数据范围内获取疑似DGA域名,抽取疑似DGA域名的行为和文本特征,并生成疑似DGA域名的聚类标签,并基于所述聚类标签划分疑似DGA域名的DGA家族,并使用解析IP数量过滤删减所述DGA家族,以获得所述DGA家族中保留下来的DGA域名;从而在DGA家族中保留下来的DGA域名范围内,使用域名创建时间和威胁情报信息过滤疑似DGA域名。这样,该方法和系统能够准确对DGA域名进行检测和研判,通过聚类分析和情报检测,可以检测出活跃且价值较高的DGA域名,实现对DGA域名的有效检测和研判,具有较高的检测准确性。
-
公开(公告)号:CN112367262A
公开(公告)日:2021-02-12
申请号:CN202010844839.9
申请日:2020-08-20
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
Inventor: 党向磊 , 张良 , 胡燕林 , 李佳 , 陈训逊 , 云晓春 , 黄亮 , 刘伟 , 郭三川 , 杨云龙 , 王鼎华 , 戴光耀 , 吴昊 , 李瑞轩 , 郑展伟 , 房超 , 冀晓凯
IPC: H04L12/743
Abstract: 一种五元组规则匹配的方法,该五元组规则模板预先进行了分类,并为分类后的规则模板设置关联规则有效标志,该方法具体包括:接收数据报文并提取五元组信息;根据提取的五元组信息依次对分类后的规则模板类型进行判断,并进一步确定该五元组信息所匹配的规则模板,记录其命中的规则模板相对应的关联规则有效标志;根据所命中的关联规则有效标志,在所确定的规则模板类型对应的规则Hash表中顺次查找相匹配的规则表项,并输出匹配结果。此外本发明实施例还提供了一种规则匹配装置。通过本发明实施例提供的方法、装置及芯片,可以显著提升五元组规则查表效率,解决了规则表资源竞争的问题。
-
-
-
-
-
-
-
-
-