训练语料扩充系统和方法
    21.
    发明授权

    公开(公告)号:CN1940915B

    公开(公告)日:2010-05-05

    申请号:CN200510108065.9

    申请日:2005-09-29

    CPC classification number: G06F17/2715 G06F17/30731

    Abstract: 本发明提供一种通过扩充新的样本种子来自动扩充训练语料的系统和方法。其中使用样本种子收集训练语料;基于已有的样本种子和被收集的训练语料,产生新的样本种子;基于收集训练语料时所使用过的所有样本种子和新的样本种子确定训练语料扩充策略;按照训练语料扩充策略调整新的样本种子,使用调整后的新的样本种子再次收集训练语料,重复上述步骤直到达到预定的条件。本发明能够以较低的成本方便地从网络或者其它资源中自动扩充训练语料,提高训练语料的覆盖面。

    一种用于确定银行卡交易的地点的方法和装置

    公开(公告)号:CN104680380B

    公开(公告)日:2018-04-10

    申请号:CN201310629599.0

    申请日:2013-11-29

    Abstract: 公开一种用于确定银行卡交易的地点的方法和装置,该方法包含:根据银行卡交易信息,获取用户在连锁店的银行卡交易的交易时间,其中,所述连锁店有多个分店,所述银行卡交易发生在所述多个分店的哪一个分店是未知的;根据所述在连锁店的银行卡交易的交易时间,从银行卡交易信息中获取该用户在其它商户的银行卡交易的交易时间和地点;根据所述在其它商户的银行卡交易与在所述连锁店的分店的银行卡交易的时间关系,和所述在其它商户的银行卡交易的地点与所述连锁店的多个分店的地点之间的位置关系,确定所述在连锁店的银行卡交易的地点。

    对产品的使用场景进行分类的方法及装置

    公开(公告)号:CN104679769B

    公开(公告)日:2018-04-06

    申请号:CN201310628364.X

    申请日:2013-11-29

    CPC classification number: G06Q10/087 G06Q30/0282

    Abstract: 本发明公开了一种对产品的使用场景进行分类的方法,其包括:从描述所述产品的使用场景的文本中析取能够特征化所述使用场景的至少一个特征元组,其中所述至少一个特征元组包括多个特征词语;对所述至少一个特征元组进行隐含语义关联分析,以获得用于所述使用场景的隐含主题序列;以及根据用于所述使用场景的所述隐含主题序列,确定所述使用场景所属的产品场景类别。此外,本发明还公开了相应的装置。

    对用户进行分组的方法和装置

    公开(公告)号:CN103377262B

    公开(公告)日:2017-09-12

    申请号:CN201210134904.4

    申请日:2012-04-28

    CPC classification number: H04L67/22 H04L67/306

    Abstract: 本发明提供对网络上的用户进行分组的方法和装置。所述方法包括:获取用户在网络上发布的评论;从所述评论中提取三元组集合,包括至少一个由用户关注的方面、用户对上述方面给出的评价,以及给出所述评价的原因所构成的三元组;基于所述三元组集合,构建评论的特征表示;以及基于所述特征表示,将所述用户归入特定的用户群组。所述装置与上述方法相对应。本发明的实施例还可以对如此获得的分组信息进行处理,获取并显示与用户群组相关联的相关信息。通过本发明实施例的方法和装置,可以更好地实现对用户的分组。

    训练主题模型的方法,对比文档内容的方法和相应的装置

    公开(公告)号:CN105095229A

    公开(公告)日:2015-11-25

    申请号:CN201410177307.9

    申请日:2014-04-29

    CPC classification number: G06F17/30734

    Abstract: 本发明公开了一种训练主题模型的方法和比对文档内容的方法以及相应的装置,上述训练主题模型的方法包括:提取文本片段的中心概念;为该中心概念构建特征向量,使得该特征向量包含中心概念在本体论中的关联信息;以及基于所构建的至少一个特征向量,训练主题模型。比对文档内容的方法包括:利用以上训练的主题模型,分别获取两个文档对应的两个主题集合;比对两个主题集合中的主题,将相同主题对齐;以及对相同主题下两个文档中的文本片段进行语义分析,以将语义相同的文本片段对齐。通过以上的方法和装置,可以基于中心概念的特征向量训练得到主题模型。利用这样的主题模型,可以实现文档语义内容的有效比对。

    一种用于确定银行卡交易的地点的方法和装置

    公开(公告)号:CN104680380A

    公开(公告)日:2015-06-03

    申请号:CN201310629599.0

    申请日:2013-11-29

    Abstract: 本发明公开一种用于确定银行卡交易的地点的方法和装置,该方法包含:根据银行卡交易信息,获取用户在连锁店的银行卡交易的交易时间,其中,所述连锁店有多个分店,所述银行卡交易发生在所述多个分店的哪一个分店是未知的;根据所述在连锁店的银行卡交易的交易时间,从银行卡交易信息中获取该用户在其它商户的银行卡交易的交易时间和地点;根据所述在其它商户的银行卡交易与在所述连锁店的分店的银行卡交易的时间关系,和所述在其它商户的银行卡交易的地点与所述连锁店的多个分店的地点之间的位置关系,确定所述在连锁店的银行卡交易的地点。

    文档标记方法和装置
    27.
    发明授权

    公开(公告)号:CN102163187B

    公开(公告)日:2014-11-26

    申请号:CN201010112221.X

    申请日:2010-02-21

    CPC classification number: G06F17/27

    Abstract: 本申请涉及一种文档标记方法和装置。根据所提供的实施例,获取与基础文档相关的焦点实体,并获取对焦点实体的评论的情感极性,然后基于所述焦点实体及相应的情感极性生成对所述基础文档的标记。所提供的实施例能够用对相关焦点实体的评价来对基础文档进行标记,进而能够方便人们了解对有关实体的评价。

    用于收集实体别名的方法和设备

    公开(公告)号:CN101499062A

    公开(公告)日:2009-08-05

    申请号:CN200810004920.5

    申请日:2008-01-29

    CPC classification number: G06Q30/02 Y10S707/99936

    Abstract: 本发明提出一种用于收集实体别名的方法,包括:利用Web搜索引擎获得与用户输入的实体相关联的Web对象;从社会化标签网站获得所述Web对象的社会化标签,作为所述实体的候选别名;和对候选别名进行求精,从而获得所述实体的别名的集合。本发明还提出一种用于收集实体别名的设备,包括:用于利用Web搜索引擎获得与用户输入的实体相关联的Web对象的装置;用于从社会化标签网站获得所述Web对象的社会化标签作为所述实体的候选别名的装置;和用于对候选别名进行求精、从而获得所述实体的别名的集合的装置。根据本发明,可以针对任何给定的实体,通过获得大量相关Web对象及其社会化标签来自动和迅速地收集该实体的别名。

    数据概况分析方法和系统
    30.
    发明公开

    公开(公告)号:CN101226523A

    公开(公告)日:2008-07-23

    申请号:CN200710001953.X

    申请日:2007-01-17

    CPC classification number: G06F17/30616 G06F17/277

    Abstract: 本发明公开了一种数据概况分析方法和系统。其中所述系统包括:数据处理装置,用于读取输入的数据条目,并根据所述数据条目的片段及片段的语义特征,对所述片段进行语义标注;以及数据分析装置,与数据处理装置连接,用于基于已进行语义标注的片段,对输入的数据条目集合进行语义级数据分析,从而得到分析结果。根据本发明的方法和系统,能够更好地对自由文本进行数据分析,并根据语义对自由文本的数据条目集合进行相应的统计和分析。

Patent Agency Ranking