获取业务对象标签、建立训练模型的方法及装置

    公开(公告)号:CN104111933B

    公开(公告)日:2017-08-04

    申请号:CN201310134293.8

    申请日:2013-04-17

    IPC分类号: G06F17/30

    摘要: 本申请公开了获取业务对象标签、建立训练模型的方法及装置,其中,所述获取业务对象标签的方法包括:获取目标业务对象的文字描述信息,对所述文字描述信息进行分词,得到多个描述词语;提取各个描述词语的特征;将各个描述词语的特征以及描述词语在所述目标文字描述信息中的上下文信息输入到预置的训练模型中,根据所述训练模型的输出结果确定各个描述词语是否可作为对应业务对象的标签;其中,所述训练模型用于预测目标文字描述信息中的各个描述词语能够作为对应业务对象的标签的概率,该概率与当前描述词语的特征以及该当前描述词语在所述目标文字描述信息中的上下文信息相关。通过本申请,可以使得预测出的结果具有较高的准确度。

    查询条件相似度确定方法、对象查询方法及相关装置

    公开(公告)号:CN103793390A

    公开(公告)日:2014-05-14

    申请号:CN201210421325.8

    申请日:2012-10-29

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30864

    摘要: 本申请公开了一种查询条件相似度确定方法、对象查询方法及相关装置,包括:获取查询点击日志,查询点击日志中包括各查询条件及对应点击的对象;并针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;以及针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定第一查询条件与第二查询条件之间的相似度。采用本申请实施例提供的方案,提高了确定不同查询条件之间的相似度的准确性。

    一种数据分类的方法及装置

    公开(公告)号:CN102193936B

    公开(公告)日:2013-09-18

    申请号:CN201010122141.2

    申请日:2010-03-09

    发明人: 钟灵 刘华雷

    IPC分类号: G06F17/30 G06F17/27 G06Q30/00

    CPC分类号: G06F17/3071

    摘要: 本申请涉及数字处理领域,公开了一种商品分类的方法及装置,用于提高商品分类流程的执行效率。该方法为:获取需要进行分类的各商品的相关数据,并提取出其中的商品标题;对各商品标题分别进行分词划分,并确定各分词的权重,其中,各分词的权重用于表示该分词的历史出现频率;针对不同的商品分别选取权重取值符合预设条件的分词组成分词序列;将针对各商品选取的分词序列进行比较,并将分词序列相同的商品的相关数据进行合并。这样,大大减少了需要处理的商品相关数据的数量,可以在较短时间内迅速、准确地实现商品分类,从而有效提高了商品分类流程的执行效率,降低了商品相关数据的管理复杂度,也减轻了系统的运算负荷。

    信息提供方法及其装置
    4.
    发明授权

    公开(公告)号:CN103136257B

    公开(公告)日:2016-09-28

    申请号:CN201110390649.5

    申请日:2011-11-30

    发明人: 钟灵

    IPC分类号: G06F17/30

    摘要: 本申请公开了一种信息提供方法及其装置,该方法包括:根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。该方法使得搜索匹配出来的展示信息与用户输入的搜索词的匹配度更高,能够获取更准确、可用的展示信息。

    查询条件相似度确定方法、对象查询方法及相关装置

    公开(公告)号:CN103793390B

    公开(公告)日:2018-05-29

    申请号:CN201210421325.8

    申请日:2012-10-29

    IPC分类号: G06F17/30

    摘要: 本申请公开了一种查询条件相似度确定方法、对象查询方法及相关装置,包括:获取查询点击日志,查询点击日志中包括各查询条件及对应点击的对象;并针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;以及针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定第一查询条件与第二查询条件之间的相似度。采用本申请实施例提供的方案,提高了确定不同查询条件之间的相似度的准确性。

    获取业务对象标签、建立训练模型的方法及装置

    公开(公告)号:CN104111933A

    公开(公告)日:2014-10-22

    申请号:CN201310134293.8

    申请日:2013-04-17

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30684

    摘要: 本发明公开了获取业务对象标签、建立训练模型的方法及装置,其中,所述获取业务对象标签的方法包括:获取目标业务对象的文字描述信息,对所述文字描述信息进行分词,得到多个描述词语;提取各个描述词语的特征;将各个描述词语的特征以及描述词语在所述目标文字描述信息中的上下文信息输入到预置的训练模型中,根据所述训练模型的输出结果确定各个描述词语是否可作为对应业务对象的标签;其中,所述训练模型用于预测目标文字描述信息中的各个描述词语能够作为对应业务对象的标签的概率,该概率与当前描述词语的特征以及该当前描述词语在所述目标文字描述信息中的上下文信息相关。通过本发明,可以使得预测出的结果具有较高的准确度。

    一种提供相关词的方法及装置

    公开(公告)号:CN103136213A

    公开(公告)日:2013-06-05

    申请号:CN201110376840.4

    申请日:2011-11-23

    IPC分类号: G06F17/30

    摘要: 本申请公开了一种提供相关词的方法及装置,用以解决现有技术中提供的相关词不够准确的问题。该方法针对用户输入的关键词的各备选相关词,将该关键词与该备选相关词在设定的每个特征上的特征分数输入相关性分数计算模型,得到该关键词与该备选相关词的相关性分数,并据此提供相关词,其中,该相关性分数计算模型为根据设定数量的已计算出相关性分数的关键词与相关词确定的。通过上述方法,即使用户输入的关键词未记录在搜索日志中,也可以通过将该关键词与各备选相关词的特征分数输入相关性分数计算模型,来获得该关键词与各备选相关词的相关性分数,从而为用户提供准确的相关词,使用户无需再次进行搜索,节省了服务器资源。

    一种数据分类的方法及装置

    公开(公告)号:CN102193936A

    公开(公告)日:2011-09-21

    申请号:CN201010122141.2

    申请日:2010-03-09

    发明人: 钟灵 刘华雷

    IPC分类号: G06F17/30 G06F17/27 G06Q30/00

    CPC分类号: G06F17/3071

    摘要: 本申请涉及数字处理领域,公开了一种商品分类的方法及装置,用于提高商品分类流程的执行效率。该方法为:获取需要进行分类的各商品的相关数据,并提取出其中的商品标题;对各商品标题分别进行分词划分,并确定各分词的权重,其中,各分词的权重用于表示该分词的历史出现频率;针对不同的商品分别选取权重取值符合预设条件的分词组成分词序列;将针对各商品选取的分词序列进行比较,并将分词序列相同的商品的相关数据进行合并。这样,大大减少了需要处理的商品相关数据的数量,可以在较短时间内迅速、准确地实现商品分类,从而有效提高了商品分类流程的执行效率,降低了商品相关数据的管理复杂度,也减轻了系统的运算负荷。

    一种提供相关词的方法及装置

    公开(公告)号:CN103136213B

    公开(公告)日:2017-04-12

    申请号:CN201110376840.4

    申请日:2011-11-23

    IPC分类号: G06F17/30

    摘要: 本申请公开了一种提供相关词的方法及装置,用以解决现有技术中提供的相关词不够准确的问题。该方法针对用户输入的关键词的各备选相关词,将该关键词与该备选相关词在设定的每个特征上的特征分数输入相关性分数计算模型,得到该关键词与该备选相关词的相关性分数,并据此提供相关词,其中,该相关性分数计算模型为根据设定数量的已计算出相关性分数的关键词与相关词确定的。通过上述方法,即使用户输入的关键词未记录在搜索日志中,也可以通过将该关键词与各备选相关词的特征分数输入相关性分数计算模型,来获得该关键词与各备选相关词的相关性分数,从而为用户提供准确的相关词,使用户无需再次进行搜索,节省了服务器资源。

    一种查询咨询账户的方法及装置

    公开(公告)号:CN105989501A

    公开(公告)日:2016-10-05

    申请号:CN201510054404.3

    申请日:2015-02-03

    IPC分类号: G06Q30/00 G06Q30/02

    摘要: 本申请实施例公开了一种查询咨询账户的方法及装置,该方法包括获取用户的咨询媒介;获取与所述咨询媒介相关的第一账户;获取第一账户中第二账户的最近行为信息;根据所述咨询媒介以及所述最近行为信息计算第二账户的第一权重值;将所述第二账户的第一权重值进行排序。本申请公开的查询咨询账户的方法的实施例,不仅丰富了咨询媒介和用户账户之间的关系,挖掘更多的潜在用户账户,还分析了用户账户和咨询账户间的关系强弱,提高了查询咨询账户的准确率。