通过计算机实现的计算文本相似度和搜索处理方法及装置

    公开(公告)号:CN104462060B

    公开(公告)日:2017-08-01

    申请号:CN201410728432.4

    申请日:2014-12-03

    Abstract: 本发明提供的一种通过计算机实现的计算文本相似度和搜索处理方法及装置。所述方法包括:获取第一文本串和第二文本串;根据预先设置的短语翻译模型和依存结构模型,对所述第一文本串进行解码,获取K个翻译文本串;分别计算所述K个翻译文本串与所述第二文本串之间的第一语义相似度值,并且根据计算的K个第一语义相似度值计算所述第一文本串和第二文本串之间的第二语义相似度值。其解决了句子中长距离的依存关系问题,能够更好地表示搜索语句的语义,从而更好地将搜索语句与网页标题进行匹配,使用户得到语义匹配的搜索结果条目,增强用户搜索体验。

    搜索排序模型的训练方法、搜索处理方法及装置

    公开(公告)号:CN104615767A

    公开(公告)日:2015-05-13

    申请号:CN201510082145.5

    申请日:2015-02-15

    Inventor: 张军

    CPC classification number: G06F17/30864 G06F17/30988 G06F17/30991

    Abstract: 本发明实施例提供了一种搜索排序模型的训练方法、搜索处理方法及装置。所述搜索排序模型的训练方法包括:获取多组标注的样本数据,每组所述样本数据包括搜索词及其相应的被标注为正例或负例的多个搜索结果条目;根据所述多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的输入层、词向量层、隐藏层和输出层,对所述搜索排序模型进行训练,以学习所述搜索排序模型的参数。本发明实施例的搜索排序模型的训练、搜索处理方法及装置,能够提高计算得到的搜索结果条目排序分数的准确度,且为用户提供更准确的搜索排序结果。

    查询词权重值的确定方法和装置

    公开(公告)号:CN104615723B

    公开(公告)日:2018-08-07

    申请号:CN201510064123.6

    申请日:2015-02-06

    Inventor: 张军

    Abstract: 本发明实施例公开了种查询词权重值的确定方法和装置。所述方法包括:按照设定规则对查询日志信息进行分类处理;根据查询词在至少两类查询日志信息中出现的差异性,确定查询词的权重值。所述装置包括:日志信息处理模块,用于按照设定规则对查询日志信息进行分类处理;权重值计算模块,根据查询词在至少两类查询日志信息中出现的差异性,确定查询词的权重值。本发明解决了现有的查询词权重值由网络中包含该查询词的文档数目所决定,与查询词在该查询式中的重要程度有较大偏差技术问题,优化现有的查询词权重值确定技术,使得计算得到的查询词权重值与用户实际的查询操作密切相关,提高了查询词权重值的准确性以及搜索引擎的搜索效果。

    训练命名实体识别模型的方法、命名实体识别方法及装置

    公开(公告)号:CN104615589A

    公开(公告)日:2015-05-13

    申请号:CN201510082318.3

    申请日:2015-02-15

    Inventor: 张军

    Abstract: 本发明实施例提供了一种训练命名实体识别模型的方法、命名实体识别方法及装置。其中,用于训练循环神经网络命名实体识别模型的方法包括:获取多个标注的样本数据,每个所述样本数据包括文本串及其多个分词标注数据,所述分词标注数据包括从所述文本串中分出的分词及其在所述文本串中的命名实体属性标志;将所述多个标注的样本数据中的分词映射为词向量,以所述样本数据作为训练样本,对RNN命名实体识别模型进行训练,以学习所述RNN命名实体识别模型的参数。本发明实施例的训练命名实体识别模型的方法、命名实体识别方法和装置,经训练的模型具有更好的泛化能力,能够快速识别出自然语言文本中的命名实体,且提高了命名实体的识别精度。

    信息的推荐方法和装置
    6.
    发明公开

    公开(公告)号:CN104572825A

    公开(公告)日:2015-04-29

    申请号:CN201410738395.5

    申请日:2014-12-04

    CPC classification number: G06F17/30867

    Abstract: 本发明公开了一种信息的推荐方法和装置,其中,信息的推荐方法包括:获得查询信息及其对应的待推荐候选内容;获得查询信息和待推荐候选内容对应的学习网络的参数信息;以及根据参数信息计算出查询信息与待推荐候选内容在预设空间中的相似度,并根据相似度从待推荐候选内容中筛选出待推荐内容,以用于向用户展现待推荐内容。本发明实施例通过获得查询信息及其对应的待推荐候选内容,获得查询信息和待推荐候选内容对应的学习网络的参数信息,以及根据参数信息计算出查询信息与待推荐候选内容在预设空间中的相似度,并根据相似度从待推荐候选内容中筛选出待推荐内容,可以实现向用户推荐出能够激发用户需求的推荐内容,解决了同质化的问题。

    通过计算机实现的计算文本相似度和搜索处理方法及装置

    公开(公告)号:CN104462060A

    公开(公告)日:2015-03-25

    申请号:CN201410728432.4

    申请日:2014-12-03

    Abstract: 本发明提供的一种通过计算机实现的计算文本相似度和搜索处理方法及装置。所述方法包括:获取第一文本串和第二文本串;根据预先设置的短语翻译模型和依存结构模型,对所述第一文本串进行解码,获取K个翻译文本串;分别计算所述K个翻译文本串与所述第二文本串之间的第一语义相似度值,并且根据计算的K个第一语义相似度值计算所述第一文本串和第二文本串之间的第二语义相似度值。其解决了句子中长距离的依存关系问题,能够更好地表示搜索语句的语义,从而更好地将搜索语句与网页标题进行匹配,使用户得到语义匹配的搜索结果条目,增强用户搜索体验。

    搜索排序模型的训练方法、搜索处理方法及装置

    公开(公告)号:CN104615767B

    公开(公告)日:2017-12-29

    申请号:CN201510082145.5

    申请日:2015-02-15

    Inventor: 张军

    Abstract: 本发明实施例提供了一种搜索排序模型的训练方法、搜索处理方法及装置。所述搜索排序模型的训练方法包括:获取多组标注的样本数据,每组所述样本数据包括搜索词及其相应的被标注为正例或负例的多个搜索结果条目;根据所述多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的输入层、词向量层、隐藏层和输出层,对所述搜索排序模型进行训练,以学习所述搜索排序模型的参数。本发明实施例的搜索排序模型的训练、搜索处理方法及装置,能够提高计算得到的搜索结果条目排序分数的准确度,且为用户提供更准确的搜索排序结果。

    实现个性化搜索的方法和装置

    公开(公告)号:CN104462357A

    公开(公告)日:2015-03-25

    申请号:CN201410742373.6

    申请日:2014-12-08

    Inventor: 张军 牛罡

    CPC classification number: G06F17/30867

    Abstract: 本发明提出一种实现个性化搜索的方法和装置,该实现个性化搜索的方法包括接收用户输入的查询词;根据预先建立的对应所述用户建立的词向量集合中,获取所述查询词对应的词向量;将所述查询词和所述词向量发送给服务端,以使所述服务端根据所述查询词和所述词向量获取搜索结果;接收所述服务端发送的搜索结果,并展现所述搜索结果。该方法可以实现用户的个性化搜索,并且保护用户隐私。

    信息的推荐方法和装置
    10.
    发明授权

    公开(公告)号:CN104572825B

    公开(公告)日:2019-03-12

    申请号:CN201410738395.5

    申请日:2014-12-04

    Abstract: 本发明公开了一种信息的推荐方法和装置,其中,信息的推荐方法包括:获得查询信息及其对应的待推荐候选内容;获得查询信息和待推荐候选内容对应的学习网络的参数信息;以及根据参数信息计算出查询信息与待推荐候选内容在预设空间中的相似度,并根据相似度从待推荐候选内容中筛选出待推荐内容,以用于向用户展现待推荐内容。本发明实施例通过获得查询信息及其对应的待推荐候选内容,获得查询信息和待推荐候选内容对应的学习网络的参数信息,以及根据参数信息计算出查询信息与待推荐候选内容在预设空间中的相似度,并根据相似度从待推荐候选内容中筛选出待推荐内容,可以实现向用户推荐出能够激发用户需求的推荐内容,解决了同质化的问题。

Patent Agency Ranking