关键词扩展方法和关键词扩展系统

    公开(公告)号:CN106294396A

    公开(公告)日:2017-01-04

    申请号:CN201510260688.1

    申请日:2015-05-20

    IPC分类号: G06F17/30

    CPC分类号: G06F16/951

    摘要: 本发明提出了一种关键词扩展方法和一种关键词扩展系统,其中,方法包括:通过关键词获取模块在当前数据中获取关键词;通过初始扩展模块对关键词进行初始扩展,以确定关键词的初始扩展词;通过候选词提取模块使用词权重计算公式计算样本数据库中的多个目标样本词的词权重,并根据词权重在多个目标样本词中提取候选词;通过匹配模块将每个候选词与关键词及初始扩展词进行匹配,以获取关键词的目标扩展词。通过本发明的技术方案,通过对关键词进行扩展,可以全面地检测出具有敏感信息但经过变异的词,并对具有敏感信息的词进行过滤,从而提高了对具有敏感信息的数据的监测效果。

    信息处理方法和信息处理系统

    公开(公告)号:CN106294312A

    公开(公告)日:2017-01-04

    申请号:CN201510369322.8

    申请日:2015-06-29

    IPC分类号: G06F17/27

    摘要: 本发明提出了一种信息处理方法和一种信息处理系统,所述方法包括:获取当前文档中的文档语句和所述文档语句中的单词,并根据预设词典确定所述单词的单词极性值;根据所述文档语句中的每个所述单词、所述单词的所述单词极性值以及语句极性值计算模型计算所述文档语句的语句极性值;根据所述当前文档中的每个所述文档语句的所述语句极性值和特征词集合确定所述当前文档的情感倾向性。通过本发明的技术方案,可以准确地分析出当前文档针对当前话题的情感倾向性。

    基于社交网络的关键词提取方法及装置

    公开(公告)号:CN104572736A

    公开(公告)日:2015-04-29

    申请号:CN201310503897.5

    申请日:2013-10-23

    IPC分类号: G06F17/30 G06F17/27

    CPC分类号: G06F17/30705

    摘要: 本发明提供一种基于社交网络的关键词提取方法及装置,方法包括:对待提取文本进行分词,并统计词的词频和该词对应的文本数;根据所述词频和该词对应的文本数,计算词权重,选取第一预设值个词权重较大的词作为候选关键词,从候选关键词中提取第二预设值个在待提取文本中出现频率较大的候选关键词作为关键词。本发明通过对待提取文本进行噪声过滤、文本去重、分词以及计算词权重,进而根据词权重提取关键词,由于不需要大量的历史搜索信息,从而提高了提取速度。

    一种微博用户身份识别方法及系统

    公开(公告)号:CN103914494B

    公开(公告)日:2017-05-17

    申请号:CN201310008156.X

    申请日:2013-01-09

    IPC分类号: G06F17/30 G06F21/31

    摘要: 本发明提供一种微博用户身份识别方法及系统,所述方法包括:获取待识别用户行为数据以及用户行为的特征库信息;预处理所述获取的待识别用户行为数据;将所述预处理后的用户行为数据,进行语义单元重构;获取所述语义单元的属性信息以及其对应的权重;根据所述语义单元的属性信息以及其对应的权重,获取所述待识别用户行为特征;将所述待识别用户行为特征与用户行为的特征库信息中的每个特征类型进行比较;当所述待识别用户行为特征与所述用户行为的特征库信息中的一个特征类型的相似度超过预设阈值,则所述待识别用户身份确定。采用本发明提供的微博用户身份识别方法及系统可以有效提高微薄用户身份识别的准确性及实时性。

    一种微博用户身份识别方法及系统

    公开(公告)号:CN103914494A

    公开(公告)日:2014-07-09

    申请号:CN201310008156.X

    申请日:2013-01-09

    IPC分类号: G06F17/30 G06F21/31

    摘要: 本发明提供一种微博用户身份识别方法及系统,所述方法包括:获取待识别用户行为数据以及用户行为的特征库信息;预处理所述获取的待识别用户行为数据;将所述预处理后的用户行为数据,进行语义单元重构;获取所述语义单元的属性信息以及其对应的权重;根据所述语义单元的属性信息以及其对应的权重,获取所述待识别用户行为特征;将所述待识别用户行为特征与用户行为的特征库信息中的每个特征类型进行比较;当所述待识别用户行为特征与所述用户行为的特征库信息中的一个特征类型的相似度超过预设阈值,则所述待识别用户身份确定。采用本发明提供的微博用户身份识别方法及系统可以有效提高微薄用户身份识别的准确性及实时性。

    信息处理方法和信息处理系统

    公开(公告)号:CN106294312B

    公开(公告)日:2019-02-26

    申请号:CN201510369322.8

    申请日:2015-06-29

    IPC分类号: G06F17/27

    摘要: 本发明提出了一种信息处理方法和一种信息处理系统,所述方法包括:获取当前文档中的文档语句和所述文档语句中的单词,并根据预设词典确定所述单词的单词极性值;根据所述文档语句中的每个所述单词、所述单词的所述单词极性值以及语句极性值计算模型计算所述文档语句的语句极性值;根据所述当前文档中的每个所述文档语句的所述语句极性值和特征词集合确定所述当前文档的情感倾向性。通过本发明的技术方案,可以准确地分析出当前文档针对当前话题的情感倾向性。