-
公开(公告)号:CN113382039B
公开(公告)日:2023-01-13
申请号:CN202110494589.5
申请日:2021-05-07
Applicant: 中国科学院信息工程研究所(CN)
IPC: H04L67/51
Abstract: 本发明公开了一种基于5G移动网络流量分析的应用识别方法和系统。本方法为:1)数据采集模块采集5G移动网络流量并将其发送给DPI识别模块;2)DPI识别模块对数据链路层和网络层进行拆包,获取五元组以及时间戳信息,然后根据五元组以及时间戳信息对数据包进行分类合并成流;然后根据每一流中数据包的明文特征判断该流对应的应用层协议;3)DFI识别模块从网络流量数据包中提取流量的多粒度级别特征,包括流特征、数据包特征、主机行为特征、TCP头部特征、IP头部特征;然后对得到的多粒度级别特征进行过滤;4)DFI识别模块根据过滤后的流的特征利用基于结构数据依赖的DBSCAN方法识别该流所属应用。
-
公开(公告)号:CN115439564A
公开(公告)日:2022-12-06
申请号:CN202210926540.7
申请日:2022-08-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于稠密子图的图压缩方法和系统,属于计算机软件技术领域。本发明利用稠密子图进行结点重排序并重编码,使得排序不用在大图上进行从而减少结点排序的时间,并降低稠密子图中各结点在内存中的冗余消耗;对抽取出的K边联通子图内各结点进行重编码,构建新的边的存储表示,使得图中出现频次较高的结点占用的空间得以减少;对于图的稀疏空间上,采用压缩邻接表降低存储消耗并采用二级索引提高结点邻居的查找效率。本发明简单且易于使用,降低了结点间的间隙距离,有效减少了将图存储在内存中所需的空间。
-
公开(公告)号:CN110688479B
公开(公告)日:2022-06-17
申请号:CN201910764862.4
申请日:2019-08-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/34 , G06F16/33 , G06F16/35 , G06F40/295
Abstract: 本发明公开了一种用于生成式摘要的评估方法及排序网络。本发明从三个方面来评估摘要质量:第一,运用语言模型来评估语言的流畅度;第二,使用相似度模型评估文本和摘要之间的语义相关性;第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。本发明从摘要的语言流畅性、摘要与原文的相关性以及摘要所包含的信息量等多个方面来综合评估摘要的质量,大大提高了评估的准确性。
-
公开(公告)号:CN114547165A
公开(公告)日:2022-05-27
申请号:CN202210060268.9
申请日:2022-01-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种数据标准化智能处理方法及装置。该方法包括:创建初始消息队列;创建结果消息队列;根据初始数据处理策略,从数据仓库中获取、组织待处理的数据,推送到消息总线;对消息总线中的消息进行解析、执行标准化处理,根据结果数据处理策略把结果写回消息总线;对消息总线中的结果消息进行解析并更新到数据仓库。本发明由用户通过配置数据标准化知识库实现实例化和个性化定制,采用消息总线解耦数据源和数据标准化处理功能,具备很好的适应性和可扩展性。本发明实现对多来源、内容格式不一致的数据的统一规范化处理,形成标准化数据,提升数据标准化处理的智能化和自动化程度,降低人工操作错误率,从而提高了数据处理效率和数据质量。
-
公开(公告)号:CN109783696B
公开(公告)日:2021-06-04
申请号:CN201811466997.4
申请日:2018-12-03
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/2458
Abstract: 本发明公开了一种面向弱结构相关性的多模式图索引构建方法及系统。本方法为:1)读取目标领域的模式图集合中的模式图并为每一模式图生成一模式图标志ID;2)构建模式图同构树:对各模式图进行两两判断,如果两个模式图之间存在子图同构关系,则添加一条从规模较小模式图指向规模较大模式图的有向边,得到模式图集合的模式图同构树;3)对模式图同构树进行频繁子图挖掘,找到公共模式图并将其加入到模式图同构树中;4)当模式图同构树中存在一子模式图具有多个父模式图时,则为该子模式图保留唯一的父模式图;5)计算模式图同构树的最小生成树,并对其进行深度优先遍历,得到模式图集的最优匹配顺序。本发明能够大大提高匹配效率。
-
公开(公告)号:CN108200576B
公开(公告)日:2020-11-06
申请号:CN201711259304.X
申请日:2017-12-04
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种卫星互联网中不良用户的检测方法及系统,该方法的步骤包括:检测卫星接收终端与用户终端之间的WiFi工作频段是否有WiFi信号;如果有WiFi信号,则检测卫星互联网上行频段是否有上行信号;如果有上行信号,则检测发出该上行信号的用户的身份信息;根据该用户的身份信息接入该用户接入的卫星接收终端,获取该用户的通信内容;根据该用户的身份信息和通信内容,判断该用户是否为不良用户。本发明用于识别出卫星互联网中的不良用户,为卫星互联网的安全管控提供重要基础,提高网络的安全性,具有简单易行的技术优势。
-
公开(公告)号:CN111753150A
公开(公告)日:2020-10-09
申请号:CN202010412344.9
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9032
Abstract: 本发明公开一种基于图搜索方法加速epsilon闭包计算的方法及系统,涉及计算机领域,针对传统闭包计算整体消耗时间长的缺陷,为了优化闭包算法,利用图搜索的方法,在NFA构造DFA的过程中对现有的方法进行优化,加速了DFA的构造过程。
-
公开(公告)号:CN111597330A
公开(公告)日:2020-08-28
申请号:CN201910129637.3
申请日:2019-02-21
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种基于支持向量机的面向智能专家推荐的用户画像方法,其步骤包括:1)利用设定专家的个人信息,获取一专家信息数据集;2)对该专家信息数据集中的每一条专家信息处理为一个由词语序列构建而成的句子;3)计算每篇文档中的每个词语的TF-IDF值,构成TF-IDF权重矩阵tdm;4)利用该TF-IDF权重矩阵tdm生成TF-IDF特征空间;然后在该TF-IDF特征空间中构建并训练支持向量机模型;5)根据待构建画像专家的文本信息生成对应TF-IDF值,然后在该TF-IDF特征空间中利用训练后的支持向量机模型对该TF-IDF值进行分类,生成该待构建画像专家的用户画像。本方法用户画像准确性高。
-
公开(公告)号:CN110929029A
公开(公告)日:2020-03-27
申请号:CN201911064089.7
申请日:2019-11-04
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于图卷积神经网络的文本分类方法及系统。本方法为:1)对于目标领域的文本训练集中的每一已类别标注文本,根据该文本中词的词频、逆文档率生成该文本的文本特征向量;将各文本特征向量组合生成一文本特征矩阵,即TF-IDF矩阵,并根据词的词向量相似度构建一该文本训练集的图结构;2)利用所述图结构及文本特征矩阵训练图卷积神经网络;3)对于该目标领域的一待分类文本a,将该文本a的文本特征向量输入训练后的图卷积神经网络,得到该文本a的类别。本发明不仅考虑到文本的语义结构信息,而且从另一个角度捕捉文本的隐藏特征,分类准确性高。
-
公开(公告)号:CN110704606A
公开(公告)日:2020-01-17
申请号:CN201910764261.3
申请日:2019-08-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于图文融合的生成式摘要生成方法,其步骤包括:1)将给定的文本数据集划分为训练集、验证集和测试集;其中,文本数据集中的每一样本是一三元组(X,I,Y),X是文本,I是文本X对应的图像,Y是文本X的摘要;2)对文本数据集的图像进行实体特征提取,并将提取的实体特征表示成与文本同维度的图像特征向量;3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练;4)输入一条文本和对应图像并生成该图像的图像特征向量,然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型,得到该文本对应的摘要。本发明生成的摘要可以有效地调整文本中实体的权重,在一定程度缓解未登录词的问题。
-
-
-
-
-
-
-
-
-