-
公开(公告)号:CN1940915A
公开(公告)日:2007-04-04
申请号:CN200510108065.9
申请日:2005-09-29
Applicant: 国际商业机器公司
CPC classification number: G06F17/2715 , G06F17/30731
Abstract: 本发明提供一种通过扩充新的样本种子来自动扩充训练语料的系统和方法。其中使用样本种子收集训练语料;基于已有的样本种子和被收集的训练语料,产生新的样本种子;基于收集训练语料时所使用过的所有样本种子和新的样本种子确定训练语料扩充策略;按照训练语料扩充策略调整新的样本种子,使用调整后的新的样本种子再次收集训练语料,重复上述步骤直到达到预定的条件。本发明能够以较低的成本方便地从网络或者其它资源中自动扩充训练语料,提高训练语料的覆盖面。
-
公开(公告)号:CN103927321B
公开(公告)日:2018-07-03
申请号:CN201410002073.4
申请日:2014-01-03
Applicant: 国际商业机器公司
Abstract: 本发明涉及一种使用众包改进情感分析的方法和系统。公开了一种用于管理情感分析的方法和计算机。计算机取回用于执行所述情感分析的数据。所述计算机分析所述数据和所述情感分析以便确定是否存在需要进一步处理以改进所述情感分析的差距。响应于确定存在需要进一步处理以改进所述情感分析的差距,所述计算机生成任务以解决所述差距。所述计算机然后使用众包提交所生成的任务以便处理。
-
公开(公告)号:CN103793420B
公开(公告)日:2017-04-12
申请号:CN201210427841.1
申请日:2012-10-31
Applicant: 国际商业机器公司
CPC classification number: H04L67/22
Abstract: 本发明公开了一种用于配电管理的方法和系统。例如,提供一种跨站点数据分析方法,该方法包括:基于初始用户集中的至少一个用户在第一站点和第二站点中的动作标识所述第一站点与所述第二站点的至少一个动作关联特征,该初始用户集中的用户是第一站点和第二站点的成员;以及基于至少一个动作关联特征确定在第一站点中注册的第一用户名与在第二站点中注册的第二用户名是否属于同一用户。根据本发明的实施例,可以有效地判别不同站点中的相同的用户,即使他们的用户名不同。由此,可以通过在站点之间共享信息而向用户提供定制的信息服务。
-
公开(公告)号:CN102651719B
公开(公告)日:2016-08-31
申请号:CN201110047636.8
申请日:2011-02-28
Applicant: 国际商业机器公司
CPC classification number: H04L12/586 , H04L12/588 , H04L51/16 , H04L51/32
Abstract: 本发明提供了一种用于在包括多条消息的消息交互环境下通过结合与一消息相关联的关联消息而对该消息所涉及的话题进行跟踪的方法和设备。该方法包含:从所述消息交互环境所包括的多条消息中选取消息;从所述消息交互环境所包括的多条消息中,识别与所选取的消息相关联的关联消息;以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。本发明的话题跟踪方法和设备能够在诸如微博客的消息交互环境中准确地确定消息之间的相似度,由此进行话题跟踪。
-
-
公开(公告)号:CN103377262A
公开(公告)日:2013-10-30
申请号:CN201210134904.4
申请日:2012-04-28
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: H04L67/22 , H04L67/306
Abstract: 本发明提供对网络上的用户进行分组的方法和装置。所述方法包括:获取用户在网络上发布的评论;从所述评论中提取三元组集合,包括至少一个由用户关注的方面、用户对上述方面给出的评价,以及给出所述评价的原因所构成的三元组;基于所述三元组集合,构建评论的特征表示;以及基于所述特征表示,将所述用户归入特定的用户群组。所述装置与上述方法相对应。本发明的实施例还可以对如此获得的分组信息进行处理,获取并显示与用户群组相关联的相关信息。通过本发明实施例的方法和装置,可以更好地实现对用户的分组。
-
公开(公告)号:CN102789473A
公开(公告)日:2012-11-21
申请号:CN201110145948.2
申请日:2011-05-18
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30286 , G06F17/30734
Abstract: 公开了一种标识符检索方法,该方法可以包括步骤:根据源标识符从数据源中提取候选标识符;从数据源中获取源标识符的简档和候选标识符的简档;以及根据源标识符的简档和候选标识符的简档,从候选标识符中选择与源标识符相关联的目标标识符。该方法可以高效、准确、迅速地查找与源标识符相关联的目标标识符。
-
公开(公告)号:CN102651719A
公开(公告)日:2012-08-29
申请号:CN201110047636.8
申请日:2011-02-28
Applicant: 国际商业机器公司
CPC classification number: H04L12/586 , H04L12/588 , H04L51/16 , H04L51/32
Abstract: 本发明提供了一种用于在包括多条消息的消息交互环境下通过结合与一消息相关联的关联消息而对该消息所涉及的话题进行跟踪的方法和设备。该方法包含:从所述消息交互环境所包括的多条消息中选取消息;从所述消息交互环境所包括的多条消息中,识别与所选取的消息相关联的关联消息;以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。本发明的话题跟踪方法和设备能够在诸如微博客的消息交互环境中准确地确定消息之间的相似度,由此进行话题跟踪。
-
公开(公告)号:CN101661487B
公开(公告)日:2012-08-08
申请号:CN200810213334.1
申请日:2008-08-27
Applicant: 国际商业机器公司
IPC: G06F17/30
Abstract: 本发明提供了一种对信息项进行搜索的方法和系统。方法包括以下步骤:接收对对象的查询;基于该查询,搜索与所述对象相关的信息项以获取对象的信息项集合,其中每个信息项与一个用户相关联;提取该信息项集合中每个关联的用户的历史信息项记录;基于所有用户的历史信息项记录,计算每个用户针对所述对象的有效性权重;基于该有效性权重,对所述对象的信息项集合中的所有信息项进行排序;以及将排序的信息项作为搜索结果进行输出。
-
公开(公告)号:CN102436447A
公开(公告)日:2012-05-02
申请号:CN201010299057.8
申请日:2010-09-29
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F19/705 , G06F19/707
Abstract: 本公开提供了化学物质的信息的处理和匹配方法、系统及存储系统。根据本发明的一个实施例,化学物质的信息的处理方法包括:获得所述化学物质的化学结构式的子结构;从所获得的子结构中确定所述化学物质的特征子结构;以及存储所述化学物质的所述特征子结构。本公开的一个方面所要解决的技术问题在于提供一种能够独立于现有的各种命名方法而处理和/或匹配化学物质的信息的方法和系统。本公开的一个方面提供了一种利用特征子结构高效全面地索引和/或查询化学物质的信息的方法和系统及其存储系统。
-
-
-
-
-
-
-
-
-