-
公开(公告)号:CN1940915B
公开(公告)日:2010-05-05
申请号:CN200510108065.9
申请日:2005-09-29
Applicant: 国际商业机器公司
CPC classification number: G06F17/2715 , G06F17/30731
Abstract: 本发明提供一种通过扩充新的样本种子来自动扩充训练语料的系统和方法。其中使用样本种子收集训练语料;基于已有的样本种子和被收集的训练语料,产生新的样本种子;基于收集训练语料时所使用过的所有样本种子和新的样本种子确定训练语料扩充策略;按照训练语料扩充策略调整新的样本种子,使用调整后的新的样本种子再次收集训练语料,重复上述步骤直到达到预定的条件。本发明能够以较低的成本方便地从网络或者其它资源中自动扩充训练语料,提高训练语料的覆盖面。
-
公开(公告)号:CN104680380B
公开(公告)日:2018-04-10
申请号:CN201310629599.0
申请日:2013-11-29
Applicant: 国际商业机器公司
Abstract: 公开一种用于确定银行卡交易的地点的方法和装置,该方法包含:根据银行卡交易信息,获取用户在连锁店的银行卡交易的交易时间,其中,所述连锁店有多个分店,所述银行卡交易发生在所述多个分店的哪一个分店是未知的;根据所述在连锁店的银行卡交易的交易时间,从银行卡交易信息中获取该用户在其它商户的银行卡交易的交易时间和地点;根据所述在其它商户的银行卡交易与在所述连锁店的分店的银行卡交易的时间关系,和所述在其它商户的银行卡交易的地点与所述连锁店的多个分店的地点之间的位置关系,确定所述在连锁店的银行卡交易的地点。
-
公开(公告)号:CN104679769B
公开(公告)日:2018-04-06
申请号:CN201310628364.X
申请日:2013-11-29
Applicant: 国际商业机器公司
CPC classification number: G06Q10/087 , G06Q30/0282
Abstract: 本发明公开了一种对产品的使用场景进行分类的方法,其包括:从描述所述产品的使用场景的文本中析取能够特征化所述使用场景的至少一个特征元组,其中所述至少一个特征元组包括多个特征词语;对所述至少一个特征元组进行隐含语义关联分析,以获得用于所述使用场景的隐含主题序列;以及根据用于所述使用场景的所述隐含主题序列,确定所述使用场景所属的产品场景类别。此外,本发明还公开了相应的装置。
-
公开(公告)号:CN103377262B
公开(公告)日:2017-09-12
申请号:CN201210134904.4
申请日:2012-04-28
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: H04L67/22 , H04L67/306
Abstract: 本发明提供对网络上的用户进行分组的方法和装置。所述方法包括:获取用户在网络上发布的评论;从所述评论中提取三元组集合,包括至少一个由用户关注的方面、用户对上述方面给出的评价,以及给出所述评价的原因所构成的三元组;基于所述三元组集合,构建评论的特征表示;以及基于所述特征表示,将所述用户归入特定的用户群组。所述装置与上述方法相对应。本发明的实施例还可以对如此获得的分组信息进行处理,获取并显示与用户群组相关联的相关信息。通过本发明实施例的方法和装置,可以更好地实现对用户的分组。
-
公开(公告)号:CN105095229A
公开(公告)日:2015-11-25
申请号:CN201410177307.9
申请日:2014-04-29
Applicant: 国际商业机器公司
CPC classification number: G06F17/30734
Abstract: 本发明公开了一种训练主题模型的方法和比对文档内容的方法以及相应的装置,上述训练主题模型的方法包括:提取文本片段的中心概念;为该中心概念构建特征向量,使得该特征向量包含中心概念在本体论中的关联信息;以及基于所构建的至少一个特征向量,训练主题模型。比对文档内容的方法包括:利用以上训练的主题模型,分别获取两个文档对应的两个主题集合;比对两个主题集合中的主题,将相同主题对齐;以及对相同主题下两个文档中的文本片段进行语义分析,以将语义相同的文本片段对齐。通过以上的方法和装置,可以基于中心概念的特征向量训练得到主题模型。利用这样的主题模型,可以实现文档语义内容的有效比对。
-
公开(公告)号:CN104680380A
公开(公告)日:2015-06-03
申请号:CN201310629599.0
申请日:2013-11-29
Applicant: 国际商业机器公司
Abstract: 本发明公开一种用于确定银行卡交易的地点的方法和装置,该方法包含:根据银行卡交易信息,获取用户在连锁店的银行卡交易的交易时间,其中,所述连锁店有多个分店,所述银行卡交易发生在所述多个分店的哪一个分店是未知的;根据所述在连锁店的银行卡交易的交易时间,从银行卡交易信息中获取该用户在其它商户的银行卡交易的交易时间和地点;根据所述在其它商户的银行卡交易与在所述连锁店的分店的银行卡交易的时间关系,和所述在其它商户的银行卡交易的地点与所述连锁店的多个分店的地点之间的位置关系,确定所述在连锁店的银行卡交易的地点。
-
-
公开(公告)号:CN101425063B
公开(公告)日:2012-08-08
申请号:CN200710167211.4
申请日:2007-11-01
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30017 , G06F17/30873
Abstract: 本发明旨在提供一种多维度数据集的显示和浏览方法及设备。在所述方案中,多个主题标签可被分布在3维空间中。通过3D视图,可以额外地显示诸如主题标签之间的关系,主题标签的权重等复杂信息,同时也缩小了屏幕尺寸,改进了用户体验。
-
公开(公告)号:CN101499062A
公开(公告)日:2009-08-05
申请号:CN200810004920.5
申请日:2008-01-29
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06Q30/02 , Y10S707/99936
Abstract: 本发明提出一种用于收集实体别名的方法,包括:利用Web搜索引擎获得与用户输入的实体相关联的Web对象;从社会化标签网站获得所述Web对象的社会化标签,作为所述实体的候选别名;和对候选别名进行求精,从而获得所述实体的别名的集合。本发明还提出一种用于收集实体别名的设备,包括:用于利用Web搜索引擎获得与用户输入的实体相关联的Web对象的装置;用于从社会化标签网站获得所述Web对象的社会化标签作为所述实体的候选别名的装置;和用于对候选别名进行求精、从而获得所述实体的别名的集合的装置。根据本发明,可以针对任何给定的实体,通过获得大量相关Web对象及其社会化标签来自动和迅速地收集该实体的别名。
-
公开(公告)号:CN101226523A
公开(公告)日:2008-07-23
申请号:CN200710001953.X
申请日:2007-01-17
Applicant: 国际商业机器公司
CPC classification number: G06F17/30616 , G06F17/277
Abstract: 本发明公开了一种数据概况分析方法和系统。其中所述系统包括:数据处理装置,用于读取输入的数据条目,并根据所述数据条目的片段及片段的语义特征,对所述片段进行语义标注;以及数据分析装置,与数据处理装置连接,用于基于已进行语义标注的片段,对输入的数据条目集合进行语义级数据分析,从而得到分析结果。根据本发明的方法和系统,能够更好地对自由文本进行数据分析,并根据语义对自由文本的数据条目集合进行相应的统计和分析。
-
-
-
-
-
-
-
-
-