-
公开(公告)号:CN106503859A
公开(公告)日:2017-03-15
申请号:CN201610963409.2
申请日:2016-10-28
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于在线社会关系网络的消息传播预测方法及装置,涉及社交媒体及大数据技术领域,该方法包括步骤1,对于一条消息d,获取其发出后在[0,T]时间段内,用户对其关注行为到达的时间序列;步骤2,对所述时间序列进行建模,对建模生成的模型进行学习,训练出所述模型的模型参数,根据所述模型参数,获取消息流行度预测函数。本发明能够应对数据涌发现象;通过MAPE对比,该方法准确率更高;形式灵活,可以应用到其他应用场景。
-
公开(公告)号:CN106168969A
公开(公告)日:2016-11-30
申请号:CN201610524367.2
申请日:2016-07-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明提供一种信源重要度的评级方法及评级系统,评级方法包括:步骤1,计算信源所属网站的网站重要度值W1;步骤2,计算信源在所属行业的行业重要度值W2;步骤3,预设定网站重要度权重值C1和行业重要度权重值C2;根据下式计算得到信源重要度值M:信源重要度值M=网站重要度值W1*网站重要度权重值C1+行业重要度值W2*行业重要度权重值C2;步骤4,根据信源重要度值M对信源进行重要度评级,并输出信源重要度评级结果。优点为:本发明能够对信源进行客观、科学合理、有效实用的信源重要度评级。
-
公开(公告)号:CN106126605A
公开(公告)日:2016-11-16
申请号:CN201610453205.4
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种基于用户画像的短文本分类方法。本方法为:1)基于用户发出的短文本数据生成对应用户的用户画像;其中,用户ui的用户画像为用户ui属于类别ci的值;2)采用分类器对该用户ui的短文本TS进行分类,得到该短文本TS所属类别的可能性F={f1,...,fi,...,fm};3)根据用户ui的用户画像与F={f1,...,fi,...,fm}计算该短文本TS属于各类别的值,选出最大的类别结果作为该短文本TS的类别标签。本发明大大增加了分类的准确率。
-
公开(公告)号:CN105843854A
公开(公告)日:2016-08-10
申请号:CN201610150817.6
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种面向网络数据的专题文档快速识别系统,通过与不同规则的高效匹配达到快速识别专题的目的。本发明主要由文档获取模块、文档结果存储模块、轮询监测模块、实时服务接口、历史服务接口、规则树构建模块、实时过滤处理模块和回溯过滤处理模块组成。本发明实现了对实时数据和历史有效数据同时进行处理的功能,能够对大量文档数据进行批量处理,能够在保证系统正常运行的前提下对处理算法进行动态热切换,能够在输入输出接口内容变动后依然可以保证系统的正常运行,弥补了目前一些文档识别系统无法随意更改、灵活性和复用性差等的缺陷,对需求变更有很强的适应性。
-
公开(公告)号:CN105608106A
公开(公告)日:2016-05-25
申请号:CN201510744624.9
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了一种面向智能终端的舆情分析方法。包括:获取用户预先设定的关键词,然后根据该关键词获取包括该关键词的新闻,再根据获取的新闻通过自然语言分析方法分析出新闻预警级别,然后再计算出用户当前的舆情健康指数,并向用户显示与舆情健康指数对应的应对策略。本发明方法能够对舆情信息进行自动分析、统计、聚类等操作,具有成本低、效率高、准确性高、安全性较高等优点。
-
公开(公告)号:CN105095070A
公开(公告)日:2015-11-25
申请号:CN201510363954.3
申请日:2015-06-26
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种基于浏览器测试组件的QQ群数据获取方法与系统,通过给予浏览器测试组件,实现用户行为模拟,由此方式实现Web端QQ等登陆操作,结合并行化设计,面向QQ群实现即时聊天信息和非即时信息的数据获取。本发明能够避免人工登陆操作,在快速获取数据的同时,兼顾了获取数据的完整性,同时在后期维护上成本投入更小,能够根据版本变化快速修改并投入使用。
-
公开(公告)号:CN107168986B
公开(公告)日:2020-05-26
申请号:CN201710178505.0
申请日:2017-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明公开了一种新闻APP应用活跃度的分析方法,包括以下步骤:步骤1、采集不少于2个新闻APP的相关数据;步骤2、将步骤1采集的数据代入活跃度计算模型进行分析计算;步骤3、将步骤2中得到的计算结果进行排列,即得所采集新闻APP的活跃度排行。其能够综合客观的判断一个新闻APP的实际活跃度,并对多个新闻APP的活跃度进行分析和排行,使用户方便的选择适合自身的新闻APP。
-
公开(公告)号:CN108920479A
公开(公告)日:2018-11-30
申请号:CN201810337919.8
申请日:2018-04-16
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。本发明所述推荐方法可跨信源进行账号推荐,且推荐结果精确合理。
-
公开(公告)号:CN108804594A
公开(公告)日:2018-11-13
申请号:CN201810523561.8
申请日:2018-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京天润基业科技发展股份有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种新闻内容全文检索引擎的构建方法及装置,该方法步骤如下:获取带有实时访问信息的实时网站日志;获取带有新闻热度评论信息的新闻网站的数据;对所述实时网站日志和所述新闻网站数据分类;对分类后的所述新闻网站数据进行处理、索引并存储;获取新闻网站数据中国的新闻元信息并存储;获取新闻网站数据中的热度信息进行存储,并对新闻网站数据中的热度信息统计。本发明在查询性能、索引空间和构建性能方面实现了合理的平衡;考虑到统计数据随时间变化的特性,动态更新索引结果;提高了系统的健壮性;提高统计数据与文本数据的复合查询性能。
-
公开(公告)号:CN108628828A
公开(公告)日:2018-10-09
申请号:CN201810347840.3
申请日:2018-04-18
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明一种基于自注意力的观点及其持有者的联合抽取方法:S1.构建提取观点及其持有者的语料集;S2.识别包含观点的语句;S3.联合抽取观点及其持有者。本发明优点:1、文本分类模型避免了抽取出的句子不包含观点的情况;2、观点及其持有者联合抽取模型摆脱了词性标注、命名实体识别和句法依存分析等自然语言处理环节,避免这些环节出现误差对模型提取效果的影响,且该模型有很高灵活度和覆盖面;3、本发明包含构建提取观点及其持有者的语料集,识别包含观点的语句,联合抽取观点及其持有者。4、本发明在双向LSTM的基础上使用self-attention有效结合两者优点,使词语序列的表示语义更丰富,训练的模型准确率更高。
-
-
-
-
-
-
-
-
-