基于搜索的实时热点新闻提供方法及装置

    公开(公告)号:CN108399265A

    公开(公告)日:2018-08-14

    申请号:CN201810246407.0

    申请日:2018-03-23

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明提供了一种基于搜索的实时热点新闻提供方法及装置。该方法包括:获取具有实时热点属性的新闻的原始标题,对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,提取新闻的原始标题中的句子主干内容,并将提取的句子主干内容作为新闻候选标题;利用新闻标题的摘要质量评估策略,对所述新闻候选标题的质量进行评估,进而根据评估结果确定新闻摘要标题;在搜索页面提供所述新闻摘要标题。本发明实施例在搜索页面提供新闻摘要标题,提升用户使用搜索引擎的体验,提高用户的点击率。

    新闻标题的质量评估方法及装置

    公开(公告)号:CN108363700A

    公开(公告)日:2018-08-03

    申请号:CN201810247762.X

    申请日:2018-03-23

    IPC分类号: G06F17/27

    摘要: 本发明提供了一种新闻标题的质量评估方法及装置。该方法包括:对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,提取新闻的原始标题中的句子主干内容,并将提取的句子主干内容作为新闻候选标题;利用新闻标题的摘要质量评估策略,对所述新闻候选标题的质量进行评估。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题,与此同时引入摘要质量评估策略,对新闻候选标题的质量进行评估,对于摘要质量较好的结果进行自动审核,以降低人工运营审核的成本,并大幅降低了人工审核造成的摘要推送延迟。

    基于实体库进行实体搜索的方法及装置

    公开(公告)号:CN107679186A

    公开(公告)日:2018-02-09

    申请号:CN201710916084.7

    申请日:2017-09-30

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种基于实体库进行实体搜索的方法及装置,上述方法包括:接收来自用户的query,并确定所述query的实体词频度;基于所述query的实体词频度确定出与所述query相似度最高的高频query;以该高频query为实体词,到实体库中进行相关信息搜索。基于本发明提供的实体搜索的方法,可以识别出用户发起的query查询意图,并且可以基于query的实体词并识别出频度,进而为该query确定出与其相似度最高的高频query,基于该高频query为实体词到快速实体库中进行相关信息的搜索。

    基于实体库进行实体搜索的方法及装置

    公开(公告)号:CN107679186B

    公开(公告)日:2021-12-21

    申请号:CN201710916084.7

    申请日:2017-09-30

    摘要: 本发明提供了一种基于实体库进行实体搜索的方法及装置,上述方法包括:接收来自用户的query,并确定所述query的实体词频度;基于所述query的实体词频度确定出与所述query相似度最高的高频query;以该高频query为实体词,到实体库中进行相关信息搜索。基于本发明提供的实体搜索的方法,可以识别出用户发起的query查询意图,并且可以基于query的实体词并识别出频度,进而为该query确定出与其相似度最高的高频query,基于该高频query为实体词到快速实体库中进行相关信息的搜索。

    新闻标题的摘要方法及装置

    公开(公告)号:CN108491512A

    公开(公告)日:2018-09-04

    申请号:CN201810247766.8

    申请日:2018-03-23

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明提供了一种新闻标题的摘要方法及装置。该方法包括:获取新闻的原始标题,对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,提取新闻的原始标题中的句子主干内容,并将提取的句子主干内容作为新闻候选标题;利用新闻标题的摘要质量评估策略,对所述新闻候选标题的质量进行评估,进而根据评估结果确定新闻摘要标题。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题。

    新闻标题的句子主干内容提取方法及装置

    公开(公告)号:CN108470026A

    公开(公告)日:2018-08-31

    申请号:CN201810247767.2

    申请日:2018-03-23

    IPC分类号: G06F17/27

    摘要: 本发明提供了一种新闻标题的句子主干内容提取方法及装置。该方法包括:获取新闻的原始标题,并对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,生成新闻的原始标题的句法树;通过对所述句法树的筛选与剪枝,提取新闻的原始标题的句子主干内容。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题。

    新闻标题的处理方法及装置

    公开(公告)号:CN108460150A

    公开(公告)日:2018-08-28

    申请号:CN201810247228.9

    申请日:2018-03-23

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明提供了一种新闻标题的处理方法及装置。该方法包括:获取新闻资源,并从新闻资源中提取新闻的原始标题;对新闻的原始标题进行词法分析,得到词法分析结果;根据所述词法分析结果,采用句法分析算法对新闻的原始标题进行句法分析,得到句法分析结果;基于所述词法分析结果和所述句法分析结果,提取新闻的原始标题中的句子主干内容,作为新闻候选标题。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题。

    实体库生成方法及装置
    8.
    发明公开

    公开(公告)号:CN107807957A

    公开(公告)日:2018-03-16

    申请号:CN201710916101.7

    申请日:2017-09-30

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30604 G06F17/30867

    摘要: 本发明提供了一种实体库生成方法及装置,上述方法包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。根据本发明提供的实体库生成方法,可获取各种类型的信息内容,而通过对用户历史搜索行为的分析可以准确确定出用户的需求实体的相关信息,以用户实际的需求实体为基础结合实体知识图谱构建符合用户个性化实体需求的实体库,在用户进行实体搜索时,可以快速并准确为用户提供符合用户搜索需求的相关信息。