-
公开(公告)号:CN113220964B
公开(公告)日:2024-03-22
申请号:CN202110357064.7
申请日:2021-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/045 , G06N3/0464 , G06N3/09 , G06Q50/00
Abstract: 本发明属于网络信息以及自然语言处理技术领域,特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型,建立了面向社交网络短文本的文本特征提取模型,设计了基于网信领域的社交网络短文本的属性推断模型,综合考虑了文本关键词抽取和摘要生成,提出对应的观点挖掘输出模型,最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本,能够有效的为网信领域相关专业人士提供观点挖掘结果。
-
公开(公告)号:CN111353300B
公开(公告)日:2023-09-01
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06F18/214 , G06F18/241
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
公开(公告)号:CN111932109B
公开(公告)日:2023-04-07
申请号:CN202010784889.2
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0637 , G06F16/735 , G06F16/951 , G06Q50/00
Abstract: 本发明涉及一种面向移动短视频应用的用户影响力评价系统,属于数据挖掘技术领域。本方法充分考虑了移动短视频应用域内数据和多元化的域外新媒体平台数据,分别采集移动短视频应用域内的用户基本信息、短视频信息以及域外平台关联账号的粉丝数信息等,设计评估算法分别计算基于短视频质量的域内影响力值和基于传播潜力的域外影响力值,通过一定的权重合成最终的用户影响力值。所述方法对已有的单一平台数据来源的评价方法作出改进,考虑用户的跨平台传播潜力,以适应新媒体平台“矩阵式”传播的新形势,提高对移动短视频用户影响力评价的全面性和有效性,实现评价系统的自动化运行和实时更新。
-
公开(公告)号:CN115129884A
公开(公告)日:2022-09-30
申请号:CN202210605631.0
申请日:2022-05-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了基于语义交互匹配网络的知识图谱补全方法,其包括以下步骤:S1、将数据集划分为训练子集、验证子集和测试子集;S2、设定初始参数K、θ1、θ2;S3、构建支持集、查询集和负样本集;S4、获取第一子图表示、第二子图表示和第三子图表示;S5、计算得相似度得分一和相似度得分二;S6、计算损失函数值L;S7、获取知识谱图补全模型;S8、将补全信息补入至待补全的知识图谱中。本发明通过捕获实体邻居之间的语义交互来增强实体表示,实现了对小样本数据的知识图谱的补全工作,并取得了较好的成果,大大提升了知识图谱补全技术的泛用性、可拓展性,促进了知识图谱在当前尚不完善的特定领域的普及。
-
公开(公告)号:CN111949848B
公开(公告)日:2022-05-31
申请号:CN202010785632.9
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9536 , G06F16/958 , G06F16/35 , G06F40/295 , G06F40/216
Abstract: 本发明涉及一种基于特定事件的跨平台传播态势评估及分级方法,属于网络信息领域。本发明的基于特定事件的跨平台传播态势评估及分级方法,具体包括四个功能模块,分别为:原始网络元素检测模块、特定事件的话题传播计算模块、话题传播模型参数的等级评定和威胁分析模块、任务调度和优化模块。本发明解决了现有技术中没有考虑到事件的传播态势评估及分级方法,提出了针对特定事件传播情况的量化评估方法和有区分度的分级手段,建立了信息系统框架,实现了对特定事件的跨平台传播态势评估及分级,同时根据特定事件的跨平台传播态势评估对后续监测工作进行指导,从而有效提高对于事件传播的紧急或影响程度的判断能力,用以指导实际工作。
-
公开(公告)号:CN110096575B
公开(公告)日:2022-02-01
申请号:CN201910375599.X
申请日:2019-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/33 , G06F16/958 , G16H10/20 , G16H20/70
Abstract: 本发明公开了一种面向微博用户的心理画像方法,包括:步骤一、在微博平台上选取样本用户,根据设定的心理学量表,利用调查问卷法获取样本用户的人格特征得分;步骤二、根据所述样本用户在微博平台上的文本信息,获取样本用户的文本表征,根据所述样本用户的行为信息,获取样本用户的行为表征;步骤三、根据样本用户的人格特征得分与文本表征和行为表征的对应关系,构建人格特征预测模型;步骤四、获取待测用户的文本表征和行为表征,根据人格特征预测模型,获得待测用户的人格特征。本发明能够实现对微博用户的人格特质的分析,为微博用户的心理画像提供技术支持。
-
公开(公告)号:CN113255918A
公开(公告)日:2021-08-13
申请号:CN202110393843.2
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N5/04 , G06F16/36 , G06N5/02 , G06K9/62 , G06F40/126
Abstract: 本发明公开了一种强化聚合知识指导的生成常识推理方法,包括:基于知识图谱构建概念推理图和分层概念扩展图;搭建强化聚合指导下基于概念推理图的知识图谱增强型编码器;搭建强化聚合指导下基于分层概念扩展图的知识图谱增强型解码器;训练包含知识图谱增强型编码器和知识图谱增强型解码器的生成常识推理模型;应用训练后的生成常识推理模型生成常识推理语句。本发明提供的方法可以有效避免因未考虑概念之间关系而导致生成语句不符合日常情景、逻辑不合理等一系列问题,通过引入强化聚合过程从知识图谱中筛选能提供丰富关系信息的附加概念描述,有效提升了模型对不可见概念集的概括。
-
公开(公告)号:CN113220964A
公开(公告)日:2021-08-06
申请号:CN202110357064.7
申请日:2021-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明属于网络信息以及自然语言处理技术领域,特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型,建立了面向社交网络短文本的文本特征提取模型,设计了基于网信领域的社交网络短文本的属性推断模型,综合考虑了文本关键词抽取和摘要生成,提出对应的观点挖掘输出模型,最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本,能够有效的为网信领域相关专业人士提供观点挖掘结果。
-
公开(公告)号:CN109992645B
公开(公告)日:2021-05-14
申请号:CN201910250572.8
申请日:2019-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 拓尔思信息技术股份有限公司
Abstract: 本发明公开了一种基于文本数据的资料管理系统及方法,属于信息管理系统领域。资料管理系统包括数据上传模块,数据存储模块,数据解析模块,数据检索模块,数据可视化模块,工具箱和管理台。所述方法首先将本地文件利用数据上传模块上传至数据存储模块,然后数据解析模块对上传文件进行解析处理,得到上传文件的属性并进行存储。将解析后的资料内容及附件分别存储在数据存储模块中的全文索引搜索引擎数据库和关系型数据库中。最后采用相似性判断技术,利用数据检索模块对存储到数据库中的资料进行检索;利用数据可视化模块对所有资料内容按分类进行展示、文档操作功能和各种可视化展示。本发明提高了工作效率,提升了对战略研究素材的管理能力。
-
公开(公告)号:CN112214558A
公开(公告)日:2021-01-12
申请号:CN202011296138.2
申请日:2020-11-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
-
-
-
-
-
-
-
-