信息提取方法和装置
    1.
    发明授权

    公开(公告)号:CN105677764B

    公开(公告)日:2020-05-08

    申请号:CN201511022937.X

    申请日:2015-12-30

    Abstract: 本申请公开了信息提取方法和装置。所述方法的一具体实施方式包括:将预先获取的网页文件解析为标签树结构,并从所述标签树的节点中识别出所述网页文件中的网页正文所在的至少一个正文节点;将所述至少一个正文节点包含的内容进行段落划分,生成各个段落块,并根据各个段落块关联的标签的属性为各个段落块设定标签属性;基于各个段落块的标签属性将各个段落块包含的文本内容进行分类;基于分类结果从段落块包含的文本内容中提取包含问题和答案的信息。该实施方式实现了信息自动、精确的提取。

    用于提供搜索结果的方法和装置

    公开(公告)号:CN105677927B

    公开(公告)日:2019-04-12

    申请号:CN201610200781.8

    申请日:2016-03-31

    Abstract: 本申请公开了用于提供搜索结果的方法和装置。所述方法的一具体实施方式包括:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及根据所述至少一个待展示网页生成交互式对话。该实施方式能够为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。

    图片搜索方法和装置
    8.
    发明公开

    公开(公告)号:CN104504109A

    公开(公告)日:2015-04-08

    申请号:CN201410843496.9

    申请日:2014-12-30

    CPC classification number: G06F17/30 G06F17/3025

    Abstract: 本发明提出一种图片搜索方法和装置,该图片搜索方法包括:接收用户输入的搜索关键词;根据所述搜索关键词在预先建立的图片文本信息的索引中进行搜索,获得与所述搜索关键词匹配的索引;所述图片文本信息包括对搜索引擎抓取的图片进行内容分析获得的文本信息;获得与所述搜索关键词匹配的索引对应的图片,并将所述图片显示给所述用户。本发明可以通过对图片进行内容分析,增加图片文本信息的描述,从而可以在用户搜索时返回更多更相关的图片,进而可以更好地满足用户的需求,提高用户体验度。

    文本相似度确定方法、装置、设备和介质

    公开(公告)号:CN111737954B

    公开(公告)日:2023-07-28

    申请号:CN202010537008.7

    申请日:2020-06-12

    Abstract: 本申请公开了一种文本相似度确定方法、装置、设备和介质,涉及自然语言处理技术。具体实现方案为:利用孪生网络结构中的两个特征提取网络,分别对第一输入文本和第二输入文本进行编码,得到第一输入文本和第二输入文本的句嵌入,其中,特征提取网络是利用词在网络中各层表征并通过区分词在文本中的重要性对文本进行编码;通过计算第一输入文本和第二输入文本的句嵌入之间的相似度,确定第一输入文本和第二输入文本的相似度。本申请实施例利用孪生网络架构确定文本相似度,并且利用词在网络中各层表征并通过区分词在文本中的重要性对文本进行编码,使得编码后得到的句嵌入更加符合文本的语义信息,准确性更高,从而提高文本相似度判断的准确性。

    一种用于挖掘与检索词相关的关键词的方法和装置

    公开(公告)号:CN108572971B

    公开(公告)日:2022-11-01

    申请号:CN201710138638.5

    申请日:2017-03-09

    Abstract: 本发明提供了一种用于挖掘与检索词相关的关键词的方法和装置,该方法包括:根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果,其中,所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果和/或与query相关的辅助展现结果;根据所述历史展现结果,生成与query相对应的至少一个聚合结果;从所述至少一个聚合结果中提取与query相关的关键词。根据本发明的方案,引入了用户历史搜索行为指导,且借鉴了海量历史搜索结果,较大程度地弥补了检索词本身的信息量不足的问题,从而利于挖掘出能够反映用户搜索意图的真正关键词。

Patent Agency Ranking