-
公开(公告)号:CN107797982A
公开(公告)日:2018-03-13
申请号:CN201610798213.2
申请日:2016-08-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
CPC classification number: G06F17/27 , G06F17/2715
Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。
-
公开(公告)号:CN107797982B
公开(公告)日:2021-05-07
申请号:CN201610798213.2
申请日:2016-08-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/216 , G06F40/284 , G06F16/35
Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。
-
公开(公告)号:CN107544988B
公开(公告)日:2021-03-19
申请号:CN201610482038.6
申请日:2016-06-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/955 , G06K9/62
Abstract: 本发明提供了一种获取舆情数据的方法和装置,预先挖掘实体词库,所述实体词库包括描述所对应实体的关键词;在获取舆情数据时,从所获取的网页数据中提取关键词;将提取的关键词与各实体词库进行相似度匹配,确定相似度满足预设要求的实体词库所对应的实体;将所述网页数据作为所确定出实体的舆情数据。本发明能够自动实现舆情数据的获取,相比较人工收集舆情数据的方式,大大降低了人力成本,且提高了舆情数据的覆盖率。
-
公开(公告)号:CN108021596A
公开(公告)日:2018-05-11
申请号:CN201610973969.6
申请日:2016-11-04
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种新闻的展示方法和装置,其中,该新闻的展示方法包括:获取与同一商家有关的多篇新闻及对应的发布时间;分别为多篇新闻添加各自的标签信息,其中,标签信息包括事件标签和事件状态标签;根据多篇新闻的事件标签和发布时间,对多篇新闻按照事件进行分类;针对每类事件,根据事件状态标签,确定属于同一类事件的新闻的展示顺序。本发明的新闻的展示方法将与同一个商家有关的多篇新闻,从事件维度,将描述同一事件不同阶段的新闻进行顺序展示,方便了用户了解商家所经历的事件。
-
公开(公告)号:CN108021596B
公开(公告)日:2021-12-28
申请号:CN201610973969.6
申请日:2016-11-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/35 , G06F16/955 , G06F16/954 , G06F16/957 , G06Q30/02
Abstract: 本发明提出一种新闻的展示方法和装置,其中,该新闻的展示方法包括:获取与同一商家有关的多篇新闻及对应的发布时间;分别为多篇新闻添加各自的标签信息,其中,标签信息包括事件标签和事件状态标签;根据多篇新闻的事件标签和发布时间,对多篇新闻按照事件进行分类;针对每类事件,根据事件状态标签,确定属于同一类事件的新闻的展示顺序。本发明的新闻的展示方法将与同一个商家有关的多篇新闻,从事件维度,将描述同一事件不同阶段的新闻进行顺序展示,方便了用户了解商家所经历的事件。
-
公开(公告)号:CN107544988A
公开(公告)日:2018-01-05
申请号:CN201610482038.6
申请日:2016-06-27
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供了一种获取舆情数据的方法和装置,预先挖掘实体词库,所述实体词库包括描述所对应实体的关键词;在获取舆情数据时,从所获取的网页数据中提取关键词;将提取的关键词与各实体词库进行相似度匹配,确定相似度满足预设要求的实体词库所对应的实体;将所述网页数据作为所确定出实体的舆情数据。本发明能够自动实现舆情数据的获取,相比较人工收集舆情数据的方式,大大降低了人力成本,且提高了舆情数据的覆盖率。
-
公开(公告)号:CN105718533A
公开(公告)日:2016-06-29
申请号:CN201610029313.9
申请日:2016-01-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/00 , G06F16/951
Abstract: 本申请公开了信息推送方法和装置。所述方法的一具体实施方式包括:获取候选推送信息;基于预先训练的信息标识模型确定与所述候选推送信息对应的标识信息;基于所述候选推送信息以及与所述候选推送信息对应的标识信息,生成待推送信息;推送所述待推送信息。该实施方式实现了推送的信息之间在标识上的差异,使用户获取信息的效率更高。
-
-
-
-
-
-