-
公开(公告)号:CN105573980A
公开(公告)日:2016-05-11
申请号:CN201510918463.0
申请日:2015-12-10
申请人: 百度在线网络技术(北京)有限公司
发明人: 张新展
IPC分类号: G06F17/27
CPC分类号: G06F17/271 , G06F17/272 , G06F17/2735 , G06F17/277
摘要: 本申请公开了信息片段生成方法和装置。所述方法的一具体实施方式包括:对获取的信息进行句子切分得到至少一个分句;根据预先设定的论元集合标注所述至少一个分句中的论元;将已标注论元的各个分句进行分词,并将分词后得到的词汇进行词性标注;基于预先设定的词汇搭配对集合、标注的论元、以及词性标注结果,对已标注论元的各个分句进行分析,生成主谓宾结构的信息片段。该实施方式通过快速、有效的生成信息片段,实现了信息精确、简洁的表达。
-
公开(公告)号:CN105574092B
公开(公告)日:2019-08-23
申请号:CN201510918337.5
申请日:2015-12-10
申请人: 百度在线网络技术(北京)有限公司
发明人: 张新展
IPC分类号: G06F16/332 , G06F17/27
摘要: 本申请公开了信息挖掘方法和装置。所述方法的一具体实施方式包括:对获取的文本信息进行句子切分得到分句集合;根据预先设定的舆情词汇集合从所述分句集合中选取至少一个候选分句;基于领域词典对所述至少一个候选分句进行分词处理,并对分词处理后得到的各个词汇进行依存分析,得到至少一个候选词汇搭配对;根据所述舆情词汇集合从所述至少一个候选词汇搭配对中选取至少一个词汇搭配对,作为从所述文本信息中挖掘出的第一词汇搭配对集合。该实施方式实现了快速、精确的信息挖掘。
-
公开(公告)号:CN105574092A
公开(公告)日:2016-05-11
申请号:CN201510918337.5
申请日:2015-12-10
申请人: 百度在线网络技术(北京)有限公司
发明人: 张新展
摘要: 本申请公开了信息挖掘方法和装置。所述方法的一具体实施方式包括:对获取的文本信息进行句子切分得到分句集合;根据预先设定的舆情词汇集合从所述分句集合中选取至少一个候选分句;基于领域词典对所述至少一个候选分句进行分词处理,并对分词处理后得到的各个词汇进行依存分析,得到至少一个候选词汇搭配对;根据所述舆情词汇集合从所述至少一个候选词汇搭配对中选取至少一个词汇搭配对,作为从所述文本信息中挖掘出的第一词汇搭配对集合。该实施方式实现了快速、精确的信息挖掘。
-
-