-
公开(公告)号:CN119106199A
公开(公告)日:2024-12-10
申请号:CN202310657378.8
申请日:2023-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/906 , G06F16/904 , G06Q50/00
Abstract: 本发明提出一种面向社交媒体的迭代式线索发现方法和系统。包括融合文本、结构和互动信息的线索主体重要度评分方法。通过对候选账号的文本内容、社交网络结构和互动信息分别进行建模,分别得到内容、结构和互动三个维度的重要度评分,再对多个维度的评分进行加权,得到最终的线索主体重要度评分。选取分数最高的作为线索发现结果。该方法及系统可以综合利用社交媒体平台中的内容、结构以及互动信息对线索主体进行评分,提升线索主体识别的准确率。
-
公开(公告)号:CN113220964B
公开(公告)日:2024-03-22
申请号:CN202110357064.7
申请日:2021-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/045 , G06N3/0464 , G06N3/09 , G06Q50/00
Abstract: 本发明属于网络信息以及自然语言处理技术领域,特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型,建立了面向社交网络短文本的文本特征提取模型,设计了基于网信领域的社交网络短文本的属性推断模型,综合考虑了文本关键词抽取和摘要生成,提出对应的观点挖掘输出模型,最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本,能够有效的为网信领域相关专业人士提供观点挖掘结果。
-
公开(公告)号:CN111353300B
公开(公告)日:2023-09-01
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06F18/214 , G06F18/241
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
公开(公告)号:CN111932109B
公开(公告)日:2023-04-07
申请号:CN202010784889.2
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/0637 , G06F16/735 , G06F16/951 , G06Q50/00
Abstract: 本发明涉及一种面向移动短视频应用的用户影响力评价系统,属于数据挖掘技术领域。本方法充分考虑了移动短视频应用域内数据和多元化的域外新媒体平台数据,分别采集移动短视频应用域内的用户基本信息、短视频信息以及域外平台关联账号的粉丝数信息等,设计评估算法分别计算基于短视频质量的域内影响力值和基于传播潜力的域外影响力值,通过一定的权重合成最终的用户影响力值。所述方法对已有的单一平台数据来源的评价方法作出改进,考虑用户的跨平台传播潜力,以适应新媒体平台“矩阵式”传播的新形势,提高对移动短视频用户影响力评价的全面性和有效性,实现评价系统的自动化运行和实时更新。
-
公开(公告)号:CN115129884A
公开(公告)日:2022-09-30
申请号:CN202210605631.0
申请日:2022-05-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了基于语义交互匹配网络的知识图谱补全方法,其包括以下步骤:S1、将数据集划分为训练子集、验证子集和测试子集;S2、设定初始参数K、θ1、θ2;S3、构建支持集、查询集和负样本集;S4、获取第一子图表示、第二子图表示和第三子图表示;S5、计算得相似度得分一和相似度得分二;S6、计算损失函数值L;S7、获取知识谱图补全模型;S8、将补全信息补入至待补全的知识图谱中。本发明通过捕获实体邻居之间的语义交互来增强实体表示,实现了对小样本数据的知识图谱的补全工作,并取得了较好的成果,大大提升了知识图谱补全技术的泛用性、可拓展性,促进了知识图谱在当前尚不完善的特定领域的普及。
-
公开(公告)号:CN111949848B
公开(公告)日:2022-05-31
申请号:CN202010785632.9
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9536 , G06F16/958 , G06F16/35 , G06F40/295 , G06F40/216
Abstract: 本发明涉及一种基于特定事件的跨平台传播态势评估及分级方法,属于网络信息领域。本发明的基于特定事件的跨平台传播态势评估及分级方法,具体包括四个功能模块,分别为:原始网络元素检测模块、特定事件的话题传播计算模块、话题传播模型参数的等级评定和威胁分析模块、任务调度和优化模块。本发明解决了现有技术中没有考虑到事件的传播态势评估及分级方法,提出了针对特定事件传播情况的量化评估方法和有区分度的分级手段,建立了信息系统框架,实现了对特定事件的跨平台传播态势评估及分级,同时根据特定事件的跨平台传播态势评估对后续监测工作进行指导,从而有效提高对于事件传播的紧急或影响程度的判断能力,用以指导实际工作。
-
公开(公告)号:CN114077838A
公开(公告)日:2022-02-22
申请号:CN202010825717.5
申请日:2020-08-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/295 , G06F40/284
Abstract: 本发明提供一种基于词表示特征的命名实体识别方法及电子装置,包括:对待检测文本进行分词,获取各词语的基础特征;将各词语组成一词语序列,并对每一词语进行编码,提取编码结果的词嵌入特征;根据词语序列的设定权重与设定主题,生成一词向量序列,提取词向量序列的词表示特征;将基础特征、词嵌入特征及词表示特征输入一实体识别模型,获取待检测文本中的命名实体。本发明采用了word2vec训练的词嵌入及LSTM训练的词表示,捕获了语句的长期依赖性,充分的利用了长距离上下文信息对命名实体进行识别,相对于传统模型有较好的改进,提高了微博命名实体的识别的准确率。
-
公开(公告)号:CN110096575B
公开(公告)日:2022-02-01
申请号:CN201910375599.X
申请日:2019-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/33 , G06F16/958 , G16H10/20 , G16H20/70
Abstract: 本发明公开了一种面向微博用户的心理画像方法,包括:步骤一、在微博平台上选取样本用户,根据设定的心理学量表,利用调查问卷法获取样本用户的人格特征得分;步骤二、根据所述样本用户在微博平台上的文本信息,获取样本用户的文本表征,根据所述样本用户的行为信息,获取样本用户的行为表征;步骤三、根据样本用户的人格特征得分与文本表征和行为表征的对应关系,构建人格特征预测模型;步骤四、获取待测用户的文本表征和行为表征,根据人格特征预测模型,获得待测用户的人格特征。本发明能够实现对微博用户的人格特质的分析,为微博用户的心理画像提供技术支持。
-
公开(公告)号:CN113255918A
公开(公告)日:2021-08-13
申请号:CN202110393843.2
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N5/04 , G06F16/36 , G06N5/02 , G06K9/62 , G06F40/126
Abstract: 本发明公开了一种强化聚合知识指导的生成常识推理方法,包括:基于知识图谱构建概念推理图和分层概念扩展图;搭建强化聚合指导下基于概念推理图的知识图谱增强型编码器;搭建强化聚合指导下基于分层概念扩展图的知识图谱增强型解码器;训练包含知识图谱增强型编码器和知识图谱增强型解码器的生成常识推理模型;应用训练后的生成常识推理模型生成常识推理语句。本发明提供的方法可以有效避免因未考虑概念之间关系而导致生成语句不符合日常情景、逻辑不合理等一系列问题,通过引入强化聚合过程从知识图谱中筛选能提供丰富关系信息的附加概念描述,有效提升了模型对不可见概念集的概括。
-
公开(公告)号:CN113220964A
公开(公告)日:2021-08-06
申请号:CN202110357064.7
申请日:2021-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明属于网络信息以及自然语言处理技术领域,特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型,建立了面向社交网络短文本的文本特征提取模型,设计了基于网信领域的社交网络短文本的属性推断模型,综合考虑了文本关键词抽取和摘要生成,提出对应的观点挖掘输出模型,最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本,能够有效的为网信领域相关专业人士提供观点挖掘结果。
-
-
-
-
-
-
-
-
-