用于识别文本类型的方法、装置和设备

    公开(公告)号:CN107797982A

    公开(公告)日:2018-03-13

    申请号:CN201610798213.2

    申请日:2016-08-31

    CPC classification number: G06F17/27 G06F17/2715

    Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。

    用于识别文本类型的方法、装置和设备

    公开(公告)号:CN107797982B

    公开(公告)日:2021-05-07

    申请号:CN201610798213.2

    申请日:2016-08-31

    Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。

    一种获取舆情数据的方法和装置

    公开(公告)号:CN107544988B

    公开(公告)日:2021-03-19

    申请号:CN201610482038.6

    申请日:2016-06-27

    Abstract: 本发明提供了一种获取舆情数据的方法和装置,预先挖掘实体词库,所述实体词库包括描述所对应实体的关键词;在获取舆情数据时,从所获取的网页数据中提取关键词;将提取的关键词与各实体词库进行相似度匹配,确定相似度满足预设要求的实体词库所对应的实体;将所述网页数据作为所确定出实体的舆情数据。本发明能够自动实现舆情数据的获取,相比较人工收集舆情数据的方式,大大降低了人力成本,且提高了舆情数据的覆盖率。

    新闻的展示方法和装置
    4.
    发明公开

    公开(公告)号:CN108021596A

    公开(公告)日:2018-05-11

    申请号:CN201610973969.6

    申请日:2016-11-04

    Abstract: 本发明提出一种新闻的展示方法和装置,其中,该新闻的展示方法包括:获取与同一商家有关的多篇新闻及对应的发布时间;分别为多篇新闻添加各自的标签信息,其中,标签信息包括事件标签和事件状态标签;根据多篇新闻的事件标签和发布时间,对多篇新闻按照事件进行分类;针对每类事件,根据事件状态标签,确定属于同一类事件的新闻的展示顺序。本发明的新闻的展示方法将与同一个商家有关的多篇新闻,从事件维度,将描述同一事件不同阶段的新闻进行顺序展示,方便了用户了解商家所经历的事件。

    新闻的展示方法和装置
    5.
    发明授权

    公开(公告)号:CN108021596B

    公开(公告)日:2021-12-28

    申请号:CN201610973969.6

    申请日:2016-11-04

    Abstract: 本发明提出一种新闻的展示方法和装置,其中,该新闻的展示方法包括:获取与同一商家有关的多篇新闻及对应的发布时间;分别为多篇新闻添加各自的标签信息,其中,标签信息包括事件标签和事件状态标签;根据多篇新闻的事件标签和发布时间,对多篇新闻按照事件进行分类;针对每类事件,根据事件状态标签,确定属于同一类事件的新闻的展示顺序。本发明的新闻的展示方法将与同一个商家有关的多篇新闻,从事件维度,将描述同一事件不同阶段的新闻进行顺序展示,方便了用户了解商家所经历的事件。

    一种获取舆情数据的方法和装置

    公开(公告)号:CN107544988A

    公开(公告)日:2018-01-05

    申请号:CN201610482038.6

    申请日:2016-06-27

    Abstract: 本发明提供了一种获取舆情数据的方法和装置,预先挖掘实体词库,所述实体词库包括描述所对应实体的关键词;在获取舆情数据时,从所获取的网页数据中提取关键词;将提取的关键词与各实体词库进行相似度匹配,确定相似度满足预设要求的实体词库所对应的实体;将所述网页数据作为所确定出实体的舆情数据。本发明能够自动实现舆情数据的获取,相比较人工收集舆情数据的方式,大大降低了人力成本,且提高了舆情数据的覆盖率。

Patent Agency Ranking