-
公开(公告)号:CN112069312A
公开(公告)日:2020-12-11
申请号:CN202010806716.6
申请日:2020-08-12
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/295 , G06F40/30 , G06F16/9535
Abstract: 本发明提供一种基于实体识别的文本分类方法,包括:对待检测文本进行切词,得到情感词与实体词,并通过一实体及情感类别已标注数据集判断实体词的情感类别;对待检测文本进行断句,通过情感词与标注情感类别的实体词在每一句子中的词性、否定词及标点符号内容,获取各句子的情感类别;依据各句子的情感类别,得到待检测文本的情感类别。本发明利用半监督学习的方式,通过协同训练加主动学习的方式,结合学习加情感规则的方式,确定指向性实体集;通过识别指定方向实体,结合情感词进行倾向性判断;生成指定类别实体集,结合情感规则,实现对文本更深层次的分析。
-
公开(公告)号:CN111694952A
公开(公告)日:2020-09-22
申请号:CN202010299741.X
申请日:2020-04-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种基于微博的大数据分析模型系统及其实现方法,该实现方法包括以下步骤:步骤1、首先对收集的数据进行清洗和预处理工作,然后对数据进行人工标注;步骤2、模型训练阶段,采用SVM、cnnrnn结合Bert预训练模的方式进行模型训练;步骤3、在次人工标注的训练集上进行模型训练;步骤4、通过对比真实数据标签和预测结果,不断迭代优化通过不断的迭代优化参数调优的方式得到最佳模型;步骤5、在海量的文章中聚类,通过simHash算法,对文章内容进行局部HASH;步骤6、把选择出来的HASH对应的文章查询出来,再通过机器学习的算法进行聚类。本发明能够在保证模型准确率的基础上可以有效地减少机器需求,提高模型的准确率以及鲁棒性。
-
公开(公告)号:CN109189743A
公开(公告)日:2019-01-11
申请号:CN201810671449.9
申请日:2018-06-26
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/178 , G06F16/182 , H04L12/26 , H04L29/06
Abstract: 本发明公开一种面向大流量实时图数据的低资源消耗的超级节点识别过滤方法和系统,属于大数据预处理领域。该方法包括:1)接收图数据并对其进行格式转化;2)根据过滤规则对格式转化之后的数据进行过滤;3)识别过滤之后的数据中的超级节点,并根据识别出的超级节点对所述过滤规则进行动态修改。该系统包括数据接收模块、数据过滤模块、过滤规则管理模块以及超级节点识别模块。本发明可在海量实时图数据流中识别出超级节点,是一种低资源消耗的超级节点识别方案,只需极少资源就可以在海量数据中识别出超级节点。
-
公开(公告)号:CN109508471B
公开(公告)日:2024-04-12
申请号:CN201811110142.8
申请日:2018-09-21
Applicant: 长安通信科技有限责任公司 , 国家计算机网络与信息安全管理中心
IPC: G06F30/18
Abstract: 本发明公开了一种运动轨迹补全方法,该方法包括:获取两个相邻轨迹点记录之间的至少两条路径;基于两个相邻轨迹点记录的运动时长利用假设检验从至少两条路径中筛选出补全运动轨迹,补全运动轨迹能够通过假设检验,假设检验的至少部分参数是利用路径对应的相关运动记录得到的。本发明还公开了一种运动轨迹补全装置、可读存储介质。通过上述方式,本发明能够补全运动轨迹缺失的部分。
-
公开(公告)号:CN117520570A
公开(公告)日:2024-02-06
申请号:CN202310693072.8
申请日:2023-06-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/38 , G06F16/25 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06F18/241
Abstract: 本发明公开了一种面向政策文件的智能文本辅助处理系统,属于信息管理领域,具体包括:采集层,数据层,处理层和应用层;所述采集层基于雷达采集软件、python技术以及大数据中心数据推送的方式对政策文件的相关信息进行获取;数据层通过ETL技术将数据载入至数据库;处理层对数据进行清洗加工和智能分析,供应用层使用;应用层实现信息可视化展示、快速检索、自动分类、多语言翻译、引用规范化和语音转写等。本发明具有高效性和易用性,在信息系统管理等领域有重要应用价值。
-
公开(公告)号:CN111930957A
公开(公告)日:2020-11-13
申请号:CN202010598739.2
申请日:2020-06-28
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例公开了实体间亲密度的分析方法、装置、电子设备以及存储介质。所述方法包括:获取知识图谱中的多个实体以及所述多个实体之间的关系;根据所述多个实体中两个实体与所述多个实体中的其他实体之间的关系,确定所述两个实体之间的关系关联度;根据所述两个实体之间的关系关联度,确定所述两个实体之间的亲密度。基于该方法和装置,可以从实体间关系维度对实体间亲密度的分析,提高了实体间亲密度分析的全面性。
-
公开(公告)号:CN111861144A
公开(公告)日:2020-10-30
申请号:CN202010605353.X
申请日:2020-06-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了面向多维指标分析的评估方法,包括:获取预定地区的产业发展相关指标的数据,所述产业发展相关指标至少包括产业指标、科研机构指标及政策法规指标;对所述产业发展相关指标的数据执行无量纲化处理;根据无量纲化处理得到的数据,计算所述产业发展相关指标的熵值,根据所述熵值计算所述产业发展相关指标的权值;根据无量纲化处理得到的数据和权值,评估预定地区的产业发展。本发明还提供了面向多维指标分析的评估装置。本发明通过对多个角度的指标数据信息进行获取和计算,实现了全方面、多维度、快速评估。
-
公开(公告)号:CN111461348A
公开(公告)日:2020-07-28
申请号:CN202010264622.0
申请日:2020-04-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于图核的深度网络嵌入学习模型,包括构造节点的子结构集合、生成子结构的特征向量、在多个重构核希尔伯特空间上近似特征向量、设计基于图核的深度卷积模型、提出一种挖掘潜在社区信息的优化方法5个部分;本发明综合利用了社交网络分析、图算法分析、机器学习等技术,为网络的节点生成高质量表征向量,进而基于该向量可进行其他应用的研究,对进一步研究社交网络的特性和挖掘相关信息提供了关键基础。
-
公开(公告)号:CN109992514A
公开(公告)日:2019-07-09
申请号:CN201910257181.9
申请日:2019-04-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种基于可视化内容的移动应用动态分析方法,包括:点击移动应用中各类可视化内容元素,触发移动应用的动态行为,对动态行为进行分类,记录可视化内容元素和对应的动态行为;在记录中提取可视化内容元素的特征向量,根据动态行为分类的结果,构造动态行为关于可视化内容元素特征向量的关系模型;根据关系模型,预测点击待执行动态分析的移动应用的任意可视化内容元素后产生每类动态行为的概率,即动态行为触发概率;根据动态行为触发概率,采用点击策略点击待分析移动应用页面中的可视化内容元素,触发移动应用动态行为,完成对移动应用的动态分析。本发明的方法可以提高移动应用功能性测试效率和安全性测试效率。
-
公开(公告)号:CN109905873A
公开(公告)日:2019-06-18
申请号:CN201910137453.1
申请日:2019-02-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W8/18 , H04W8/22 , G06F16/2455
Abstract: 本发明涉及一种基于特征标识信息的网络应用账号关联方法,属于信息处理技术领域。本发明方法面向移动互联网用户的固网和移动网上网行为,对客户端和服务器端产生的网络通信日志进行综合分析,重点从明文请求日志中提取出客户端特征标识信息和登录网站账号信息,设计基于特征标识信息和网络账号信息的关联规则,建立基于特征标识信息的网络账号关联方法,提高网络账号之间的关联率和准确率。因此,本发明方法不具体针对跨特定社交平台的网络账号关联范畴,只考虑通过利用运营商提供的网络通信特征信息,建立基于特征标识信息的网络应用账号关联方法,用以解决目前主流移动APP和主流网站网络账号缺少关联条件和关联准确率不高等难题。
-
-
-
-
-
-
-
-
-