-
公开(公告)号:CN106126606A
公开(公告)日:2016-11-16
申请号:CN201610453319.9
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种短文本新词发现方法。本方法为:1)从当前短文本中提取一字符串s,计算该字符串s的对称条件概率SCP(s)以及该字符串s的左邻熵HL(s)和右邻熵HL(s);2)取左邻熵HL(s)和右邻熵HL(s)的较小值,记为BE(s);3)计算该字符串s的成词概率Prword(s),根据Prword(s)的值确定词s是否为新词。本发明大大提高了新词发现的准确率。
-
公开(公告)号:CN105912644A
公开(公告)日:2016-08-31
申请号:CN201610217911.9
申请日:2016-04-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
CPC classification number: G06F16/345 , G06F17/2775
Abstract: 本发明公开了一种网络评论产生式摘要方法。首先,基于标点符号对评论进行短语分割、分词并标记每个词语的词性,进而基于评论对象参数字典和句法模板过滤掉与评论对象无关的短语;然后,计算短语情感极性强度值,根据评论对象参数的所有短语的情感极性强度值对评论对象参数的重要性进行排序,选取最重要的一部分参数进行摘要生成;最后,针对选取的每个参数,选取一个对该参数最重要的一个评论短语,把选取的所有短语置入到设计好的摘要模板中以生成评论摘要。本发明综合利用了情感分析、词性分析等技术提取有效的用户评论信息,并根据设计好的模板生成摘要,对提高摘要的可读性和准确性有很大帮助。
-
公开(公告)号:CN105843957A
公开(公告)日:2016-08-10
申请号:CN201610236172.8
申请日:2016-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例提供一种微博深度分类方法及系统,该方法包括:将分词处理后的第一微博训练样本数据分别与各第一筛选词库进行词汇匹配,确定所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率;将所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率进行归一化处理,并将归一化处理后的数据输入学习模型;根据所述学习模型的输出确定微博事件分类模型;根据所述微博事件分类模型对微博文本进行分类。本发明实施例提供的微博深度分类方法及系统,能够对微博文本进行深入的细化分类,提高微博文本的分类正确率。
-
公开(公告)号:CN105824801A
公开(公告)日:2016-08-03
申请号:CN201610150794.9
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/2785 , G06F16/288
Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。
-
公开(公告)号:CN105608107A
公开(公告)日:2016-05-25
申请号:CN201510744625.3
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30905
Abstract: 本发明公开了一种基于舆情大数据的视觉展示方法。获取舆情大数据的数据变化值;确定用于显示所述数据的变化值的时间长度;根据所述数据的变化值和时间长度,确定所述立体模型的变化速度。本发明能够形象地展示数据的变化值和变化速度,从而将数据的变化以视觉变化来展现,增强了使用者和浏览的用户的视觉体验。
-
公开(公告)号:CN105488092A
公开(公告)日:2016-04-13
申请号:CN201510408490.3
申请日:2015-07-13
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30864 , G06F17/277 , G06K9/6221 , G06Q50/01
Abstract: 本发明涉及一种时间敏感和自适应的子话题在线检测方法及系统。该方法包括:1)对文档流中的每篇文档进行向量化表示;2)对文档进行增量式聚类,并根据随时间衰减的文档权重调整子话题的中心权重;3)当聚类产生的子话题数量或者某个子话题权重占比满足阈值条件,或者子话题满足长尾检测条件时,进行子话题间的合并或者删除无意义的子话题;4)根据每个新子话题的权重已及其内在的文档分布,对新子话题生成摘要并输出展示。该系统包括文档表示模块、增量式聚类模块、新子话题发现模块、摘要生成模块。本发明中历史文档权重随时间衰减,并且基于阈值判断和长尾检测进行子话题数量和内容的动态更新,能够有效提高子话题检测的效率。
-
公开(公告)号:CN114357290B
公开(公告)日:2024-10-15
申请号:CN202111635132.8
申请日:2021-12-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9536 , G06Q50/00
Abstract: 本发明通过网络技术处理领域的方法,公开了一种多视角社交媒体用户立场检测方法与装置,分为两个模块执行:多视角话题表征模块:根据原始语料构建包含多种节点的异构图,并从三个视角抽取出三种不同的以话题为中心的关系网络,构建用户表征,话题表征,文本表征;多视角用户立场检测模块:根据输入话题检索多视角话题表征模块输出的话题表征,取出该话题对应的话题表征,得到融合话题的文本表征并分别与多视角话题表征模块输出的用户表征,话题表征,文本表征进行拼接预测用户这段评论文本对该话题的立场,并利用与多视角话题表征模块共享的权重进行加权求和得到最终立场。实现了准确分析用户对某话题所持立场的效果。
-
公开(公告)号:CN117131190A
公开(公告)日:2023-11-28
申请号:CN202310856800.2
申请日:2023-07-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9535 , G06Q50/00 , G06N3/047 , G06F40/289
Abstract: 本发明涉及文本分类的技术领域,特别是涉及一种基于序贯神经网络模型的社交媒体用户文本分类方法,通过用户分类关键词、训练集数据和序贯模板模型构建社交媒体用户分类序贯神经网络模型,对采集的用户社交媒体发文文本进行相关特征提取,根据社交媒体中文用户分类序贯神经网络模型返回的权重值对用户进行分类;包括以下步骤:首先搜寻典型用户的post文本,收集相关关键词和停用词分别创建关键词词库和停用词词库,通过关键词词库和停用词词库结合典型用户文本构建神经网络训练矩阵,根据训练集和序贯模型创建神经网络模型,然后对采集到的中文用户post文本进行处理,最后通过序贯神经网络模型判定出用户的类型。
-
公开(公告)号:CN113688310B
公开(公告)日:2023-08-29
申请号:CN202110839324.4
申请日:2021-07-23
Applicant: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN110990711B
公开(公告)日:2023-05-12
申请号:CN201910392858.X
申请日:2019-05-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/9536 , G06F16/958 , G06Q50/00 , G06N20/00
Abstract: 本发明公开了基于机器学习的微信公众号推荐算法,包括:为训练文本标注标签,获取训练文本的关键词及关键词向量,对关键词向量进行聚类计算,获得簇,并确定簇的中心向量;采集公众号文本,获取公众号文本的关键词及关键词向量,根据关键词向量与中心向量的相似度确定公众号文本对应的标签,获得标签分析结果;根据目标用户的历史行为确定目标用户的喜好标签;从标签分析结果中选取与喜好标签相关的标签,将相关的标签对应的公众号文本推荐给目标用户。本发明还提供了基于机器学习的微信公众号推荐系统。本发明能够根据分析用户喜好,进而自动推荐合适的公众号,避免用户受各种良莠不齐的公众号干扰,避免花费过多时间用于挑选公众号文章。
-
-
-
-
-
-
-
-
-