-
公开(公告)号:CN103268348B
公开(公告)日:2016-08-10
申请号:CN201310204529.0
申请日:2013-05-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种用户查询意图识别方法,包括:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。本发明识别的准确率和召回率高;时间复杂度低,给搜索引擎造成的负荷较小,能够提升用户体验;特别适合于移动端的搜素或者移动终端本地的应用搜索。
-
公开(公告)号:CN102867040B
公开(公告)日:2015-03-18
申请号:CN201210320575.2
申请日:2012-08-31
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
Abstract: 本发明涉及一种面向中文搜索引擎混杂语言的查询纠错方法及系统。本发明针对中文搜索引擎混杂语言查询的特点,采用面向混杂语言的异构字符树词典和基于高频或高点击次数用户查询日志构建的语言模型,对用户的查询进行同步切分和纠错尝试,利用状态之间的转移达到对查询进行切分的目的;采用双队列记录每一步编辑后最优的N个完成状态和M个未完成状态,在保障纠错速度的同时获取最佳的切分方式和对应的替代词条组合;利用最终纠错结果侯选集的特征进行判定,输出符合限定条件的纠错结果,有效地提高了准确率。
-
公开(公告)号:CN103823868A
公开(公告)日:2014-05-28
申请号:CN201410066711.9
申请日:2014-02-26
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30616 , G06F17/30707
Abstract: 本发明提供一种面向在线百科的事件识别方法和事件关系抽取方法。所述事件识别方法包括:从在线百科的分类体系中得到事件类分类标签;所述事件类分类标签表示该分类标签下的词条与一个或多个事件有关。以及对于所述在线百科中的词条,根据其所有分类标签中属于所述事件类分类标签的分类标签所占比率,判断所述词条是否是事件类词条。本发明能够快速且准确地识别出事件类词条,并且能够在事件识别的基础上进行事件关系的抽取,适用于对事件进行预测和溯源。
-
公开(公告)号:CN103268348A
公开(公告)日:2013-08-28
申请号:CN201310204529.0
申请日:2013-05-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种用户查询意图识别方法,包括:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。本发明识别的准确率和召回率高;时间复杂度低,给搜索引擎造成的负荷较小,能够提升用户体验;特别适合于移动端的搜素或者移动终端本地的应用搜索。
-
公开(公告)号:CN101894022A
公开(公告)日:2010-11-24
申请号:CN201010224004.X
申请日:2010-07-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明有关于一种业务流程间交互冲突的半自动修正方法及其系统,其中该方法包括:步骤一,识别存在交互冲突的业务流程模型的独立编辑区域;步骤二,针对每个独立编辑区域计算修正计划及其相应的修改代价;步骤三,计算存在交互冲突的业务流程模型的修正计划及其相应的修改代价。与现有的方法相比,本发明一方面能够提多样的修正计划供业务人员选择,另外一方面避免了修正过程中引入新的交互冲突,同时能够实现即时的交互冲突的修正。
-
公开(公告)号:CN101005490B
公开(公告)日:2010-06-02
申请号:CN200610001678.7
申请日:2006-01-20
Applicant: 中国科学院计算技术研究所
IPC: H04L29/06
Abstract: 根据本发明,提出了一种面向最终用户的个性化服务呈现方法,所述方法包括步骤:捕获当前的执行状态;在服务网格环境下,以服务属性及用户已有的对服务的调用历史为依据,计算服务相关性和用户的使用偏爱;以及根据当前的执行状态、以及计算出的服务相关性和用户的使用偏爱,动态地选取服务资源,向最终用户推荐满足其个性化需求的服务。
-
公开(公告)号:CN1163825C
公开(公告)日:2004-08-25
申请号:CN00136750.1
申请日:2000-12-28
Applicant: 中国科学院计算技术研究所
IPC: G06F9/445
Abstract: 本发明设计了一种内外网(Intranet/Internet)安全物理隔离方案,并实现了软件自动智能控制。物理上保证了在任何情况下只能选通内网或外网,选择由软件自动透明实现,从而既保证了绝对安全,又做到了对用户方便、完全透明。与转播系统实现无缝结合,提高了转播系统安全性,而且广泛应用于其它类似要求的系统,可与浏览器集成等。
-
公开(公告)号:CN1361476A
公开(公告)日:2002-07-31
申请号:CN00136750.1
申请日:2000-12-28
Applicant: 中国科学院计算技术研究所
IPC: G06F9/445
Abstract: 本发明设计了一种内外网(Intranet/Internet)安全物理隔离方案,并实现了软件自动智能控制。物理上保证了在任何情况下只能选通内网或外网,选择由软件自动透明实现,从而既保证了绝对安全,又做到了对用户方便、完全透明。与转播系统实现无缝结合,提高了转播系统安全性,而且广泛应用于其它类似要求的系统,可与浏览器集成等。
-
公开(公告)号:CN104636466B
公开(公告)日:2020-07-31
申请号:CN201510071993.6
申请日:2015-02-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向开放网页的实体属性抽取方法和系统。其中,所述方法包括:提取开放网页的文本,从中获得目标实体的候选文本集合;以及,根据目标实体属性在训练文本集合中出现的频率,选择基于规则的方式或者基于统计的方式从所述候选文本集合中抽取目标实体属性的值。本发明能够提高开放网页实体属性抽取的准确率和召回率,并且不依赖于网页结构,能够适应开放网页类型的变化。
-
公开(公告)号:CN104615687B
公开(公告)日:2018-05-22
申请号:CN201510033050.4
申请日:2015-01-22
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种面向知识库更新的实体细粒度分类方法与系统。所述方法包括:从文本中识别出实体;将识别出的实体、知识库中与其相关的实体以及相关实体在知识库中的分类作为结点构建依赖图,其中依赖图中的边的权值表示该边连接的两个结点之间的相关程度;以及,通过在所述依赖图上执行重启动随机游走,得到识别出的实体所属的分类。本发明能够克服现有技术在实体上下文缺乏的情况下难以实现对该实体进行细粒度分类的缺陷,并且提高了实体细粒度分类的准确率。
-
-
-
-
-
-
-
-
-