-
公开(公告)号:CN107168986A
公开(公告)日:2017-09-15
申请号:CN201710178505.0
申请日:2017-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种新闻APP应用活跃度的分析方法,包括以下步骤:步骤1、采集不少于2个新闻APP的相关数据;步骤2、将步骤1采集的数据代入活跃度计算模型进行分析计算;步骤3、将步骤2中得到的计算结果进行排列,即得所采集新闻APP的活跃度排行。其能够综合客观的判断一个新闻APP的实际活跃度,并对多个新闻APP的活跃度进行分析和排行,使用户方便的选择适合自身的新闻APP。
-
公开(公告)号:CN107153908A
公开(公告)日:2017-09-12
申请号:CN201710186473.9
申请日:2017-03-24
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06Q10/06393 , G06F17/3089 , G06Q50/01
Abstract: 本发明公开了一种移动新闻App影响力评级方法,步骤包括:1)采集新闻APP上的数据,并将数据聚类入库,所述数据包括:所属网站、评论次数、转载次数、日均访问量(PV)和访问量(UV);2)计算新闻影响力因子;3)利用PageRank算法计算新闻App转载率;4)通过查询回复率参考表得出新闻App回复率;5)利用计算模型计算新闻APP得分,根据分数将新闻App排序。本发明以分数的形式展现给用户,更加直白的显示出不同的新闻App的影响力。这个数值就是新闻App的评价分,分数越高的新闻App,越能满足用户的需求,可以及时的为大众提供实时新闻。
-
公开(公告)号:CN106126606A
公开(公告)日:2016-11-16
申请号:CN201610453319.9
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种短文本新词发现方法。本方法为:1)从当前短文本中提取一字符串s,计算该字符串s的对称条件概率SCP(s)以及该字符串s的左邻熵HL(s)和右邻熵HL(s);2)取左邻熵HL(s)和右邻熵HL(s)的较小值,记为BE(s);3)计算该字符串s的成词概率Prword(s),根据Prword(s)的值确定词s是否为新词。本发明大大提高了新词发现的准确率。
-
公开(公告)号:CN105912644A
公开(公告)日:2016-08-31
申请号:CN201610217911.9
申请日:2016-04-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
CPC classification number: G06F16/345 , G06F17/2775
Abstract: 本发明公开了一种网络评论产生式摘要方法。首先,基于标点符号对评论进行短语分割、分词并标记每个词语的词性,进而基于评论对象参数字典和句法模板过滤掉与评论对象无关的短语;然后,计算短语情感极性强度值,根据评论对象参数的所有短语的情感极性强度值对评论对象参数的重要性进行排序,选取最重要的一部分参数进行摘要生成;最后,针对选取的每个参数,选取一个对该参数最重要的一个评论短语,把选取的所有短语置入到设计好的摘要模板中以生成评论摘要。本发明综合利用了情感分析、词性分析等技术提取有效的用户评论信息,并根据设计好的模板生成摘要,对提高摘要的可读性和准确性有很大帮助。
-
公开(公告)号:CN105843957A
公开(公告)日:2016-08-10
申请号:CN201610236172.8
申请日:2016-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例提供一种微博深度分类方法及系统,该方法包括:将分词处理后的第一微博训练样本数据分别与各第一筛选词库进行词汇匹配,确定所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率;将所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率进行归一化处理,并将归一化处理后的数据输入学习模型;根据所述学习模型的输出确定微博事件分类模型;根据所述微博事件分类模型对微博文本进行分类。本发明实施例提供的微博深度分类方法及系统,能够对微博文本进行深入的细化分类,提高微博文本的分类正确率。
-
公开(公告)号:CN105824801A
公开(公告)日:2016-08-03
申请号:CN201610150794.9
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/2785 , G06F16/288
Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。
-
公开(公告)号:CN105608107A
公开(公告)日:2016-05-25
申请号:CN201510744625.3
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30905
Abstract: 本发明公开了一种基于舆情大数据的视觉展示方法。获取舆情大数据的数据变化值;确定用于显示所述数据的变化值的时间长度;根据所述数据的变化值和时间长度,确定所述立体模型的变化速度。本发明能够形象地展示数据的变化值和变化速度,从而将数据的变化以视觉变化来展现,增强了使用者和浏览的用户的视觉体验。
-
公开(公告)号:CN108628828B
公开(公告)日:2022-04-01
申请号:CN201810347840.3
申请日:2018-04-18
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本发明一种基于自注意力的观点及其持有者的联合抽取方法:S1.构建提取观点及其持有者的语料集;S2.识别包含观点的语句;S3.联合抽取观点及其持有者。本发明优点:1、文本分类模型避免了抽取出的句子不包含观点的情况;2、观点及其持有者联合抽取模型摆脱了词性标注、命名实体识别和句法依存分析等自然语言处理环节,避免这些环节出现误差对模型提取效果的影响,且该模型有很高灵活度和覆盖面;3、本发明包含构建提取观点及其持有者的语料集,识别包含观点的语句,联合抽取观点及其持有者。4、本发明在双向LSTM的基础上使用self‑attention有效结合两者优点,使词语序列的表示语义更丰富,训练的模型准确率更高。
-
公开(公告)号:CN107577782B
公开(公告)日:2021-04-30
申请号:CN201710827978.9
申请日:2017-09-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F16/33 , G06F16/9535
Abstract: 本发明公开了一种基于异质数据的人物相似度刻画方法,属于数据挖掘领域。本发明首先搜集用户的微博文本,获取用户之间的关注关系以及各用户的基本信息,针对不同类型数据的特点个性化选择处理方式,并对于微博文本采用Doc2vec模型,结合上下文信息将文本表示成向量,再根据定义的相似度函数衡量相似度,最后将不同维度得到的矩阵进行融合,刻画用户最终的相似度。本发明引入了多种社交网络信息,包括社交关系数据、用户属性数据和用户文本数据等,通过对不同类型的信息加以综合考虑,以得到更全面的人物相似度刻画方法;同时本发明提供了对于多种数据的处理和计算方案,利用完整的数据和加权融合方法,个性化计算不同偏好的人物相似度。
-
公开(公告)号:CN108470046B
公开(公告)日:2020-12-01
申请号:CN201810184478.2
申请日:2018-03-07
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/34
Abstract: 本发明涉及计算机技术领域,具体提供了一种基于新闻事件搜索语句的新闻事件排序方法及系统,旨在解决在考虑用户主观信息的情况下,如何实现新闻事件排序的技术问题。为此目的,本发明中的新闻事件排序方法,能够通过预设的新闻事件排序模型对预先获取的新闻事件搜索语句进行识别,得到按照相关度大小排序的新闻事件排序结果。其中,新闻事件搜索语句包含能够表征用户情感倾向的用户主观信息。基于此,本发明能够结合用户对新闻事件的情感倾向,按照新闻事件与用户偏好相关程度进行排序,从而提高新闻事件排序结果的准确性。同时,本发明中的系统能够执行并实现上述方法。
-
-
-
-
-
-
-
-
-