-
公开(公告)号:CN103246714B
公开(公告)日:2015-05-27
申请号:CN201310149482.2
申请日:2013-04-26
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
IPC: G06F17/30
Abstract: 本发明提供一种基于错误模式挖掘的中文搜索引擎查询纠错方法。该方法通过挖掘搜索引擎查询日志中的错误模式并建模,有效的改善了查询纠错系统中查询及其正确形式之间转换概率的预估精度;利用隐马尔科夫模型进行查询纠错,通过隐含状态的转移实现对查询的切分和纠错,提高了查询纠错的准确率和速度。
-
公开(公告)号:CN104408093A
公开(公告)日:2015-03-11
申请号:CN201410645944.4
申请日:2014-11-14
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/30905 , G06F17/2765
Abstract: 本发明提供一种新闻事件要素抽取方法,包括:识别新闻文本中包含的人名并抽取人名特征;根据所抽取的人名特征计算人名成为新闻事件的主角的概率;以及基于该概率识别出新闻事件的主角。在一些实施例中,所述方法还包括:抽取关于新闻事件的主角的观点和发言的语句,以及新闻事件发生的地点和时间。本发明在保证抽取准确率的前提下,能够克服人工分析整理新闻信息成本高、效率低的问题,同时,也为新闻事件检索、新闻报道跟踪等上层应用提供支持。
-
公开(公告)号:CN102662428B
公开(公告)日:2015-02-04
申请号:CN201210051468.4
申请日:2012-03-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种离散事件网络模拟环境的时钟同步方法,包括:1)某一离散事件发生时,确定离散事件发生时间所对应的虚拟时钟滴答计数值,并将其作为目标计数值发送给内核态程序;所述虚拟时钟滴答计数值用于控制所有接入离散事件网络模拟器的真实软件的定时器的运行;2)内核态程序以1为步长逐步累加虚拟时钟滴答计数值直至达到所述目标计数值;每次虚拟时钟滴答计数值加1时,对于接入离散事件网络模拟器的真实软件,判断所述真实软件的定时器是否超时。本发明能够避免模拟环境因与真实环境时间不一致而造成失真。本发明中,真实软件不需经过修改便可直接应用于离散事件网络模拟环境中。
-
公开(公告)号:CN102413003B
公开(公告)日:2014-09-10
申请号:CN201010287612.5
申请日:2010-09-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明一种检测网络安全性的方法和系统,方法包括:步骤1,依据网络中设备的初始状态、设备间连接关系和设备的脆弱性信息,生成包含攻击节点和状态节点的攻击图;步骤2,针对设定的目标节点,将攻击图转换为随机Petri网模型;步骤3,在随机Petri网模型上引入攻击行为的策略和效用信息,生成攻击视角的随机博弈网模型;在随机Petri网模型上引入防御行为的策略和效用信息,生成防御视角的随机博弈网模型;步骤4,合并攻击视角的随机博弈网模型和防御视角的随机博弈网模型,生成攻防博弈策略模型;步骤5,利用攻防博弈策略模型进行网络安全性的检测。本发明能够提高网络安全性检测的准确性。
-
公开(公告)号:CN103853823A
公开(公告)日:2014-06-11
申请号:CN201410065743.7
申请日:2014-02-26
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30705
Abstract: 本发明提供一种面向在线百科的实体属性抽取方法及系统,该方法包括:在待抽取的在线百科网页文本集合T中选择一个页面,抽取该页面的实体属性表达规则,得到当前规则集合。该方法还包括使用当前规则集合对所述待抽取的在线百科网页文本集合T进行实体属性抽取,并且根据抽取得到的实体属性抽取T的实体属性表达规则,用抽取得到的规则集合作为当前规则集合并重复这一过程k次,得到最终规则集合。使用所述最终规则集合对T进行实体属性抽取。本发明提供的实体属性抽取方法能够适应文本结构的变化,适用于各种在线百科,具有召回率高并且准确率高的效果。
-
公开(公告)号:CN103824115A
公开(公告)日:2014-05-28
申请号:CN201410072412.6
申请日:2014-02-28
Applicant: 中国科学院计算技术研究所
IPC: G06N5/04
Abstract: 本发明提供一种面向开放网络知识库的实体间关系推断方法。该方法包括根据目标实体从知识库中找出所有与该目标实体之间有关系路径相连的所有实体作为候选实体集;根据待推断的目标关系从所述知识库中找出的所有存在所述目标关系的实体对;以及综合考虑所找出的各实体对间的关系路径信息以及各实体的属性信息来从所述候选实体集中选出可能与该目标实体存在所述目标关系的候选实体。该方法利用知识库中已有的实体关系和实体的属性自动对实体间的关系进行推理,有效改善了推断效果,实现了对知识库中关系的丰富与完善。
-
公开(公告)号:CN103533048A
公开(公告)日:2014-01-22
申请号:CN201310475961.3
申请日:2013-10-12
Applicant: 中国科学院计算技术研究所
IPC: H04L29/08
Abstract: 本发明提供一种BT网络中热门种子文件获取方法,包括下列步骤:1)构造多个虚拟BT客户端,所述多个虚拟BT客户端的ID均匀分布在BT网络ID逻辑空间;2)各虚拟BT客户端监听BT网络中的get_peers消息,统计所收到的对应于每个infohash的get_peer消息的数目;3)定期统计所有虚拟BT客户端所接收到的对应于每个infohash的get_peer消息的数目,并根据get_peer消息的数目确定相应的infohash是否为热门infohash。本发明能够全面准确地获取整个BT网络范围内的热门种子文件。
-
公开(公告)号:CN103475704A
公开(公告)日:2013-12-25
申请号:CN201310403402.1
申请日:2013-09-06
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向虚拟机群应用的虚拟节点配置方法,包括下列步骤:1)定制虚拟MAC地址的编码方案,虚拟MAC地址包括虚拟机群标识符、虚拟网卡标识符和用于承载虚拟机群应用的应用层配置信息的字段;所述虚拟机群应用的应用层配置信息的项目包括a)、b)、c)中的任意一项或多项,其中a)为虚拟节点的角色,b)为网络访问控制策略,c)为单个节点中的多网卡、多IP协同策略;2)建立MAC地址与IP地址的映射关系;3)对于待配置的虚拟机群应用,根据所定制的编码方案为每个虚拟节点分配虚拟MAC地址。本发明能够支持虚拟机群应用即启即用;能够广泛地适用于各类虚拟机群应用。
-
公开(公告)号:CN103336793A
公开(公告)日:2013-10-02
申请号:CN201310230933.5
申请日:2013-06-09
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种个性化论文推荐方法及其系统,其中该方法包括:步骤1,利用科研领域中研究人员撰写学术论文的行为特性,挖掘异质学术网络数据,根据所述异质学术网络数据构建训练数据集,并根据所述训练数据集进行训练得到排序学习模型;步骤2,在线构建用户配置,生成用户感兴趣的候选论文集,根据所述候选论文集并基于所述排序学习模型生成论文推荐结果,基于所述论文推荐结果,按照一定方式生成论文推荐返回给用户;步骤3,在线接收用户反馈,并根据不同的用户反馈行为相应地更新所述论文推荐结果。本发明有效地避免了推荐系统初期的“冷启动”问题,保证了推荐结果的准确率和召回率。
-
公开(公告)号:CN103235812A
公开(公告)日:2013-08-07
申请号:CN201310146037.0
申请日:2013-04-24
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种查询多意图识别方法和系统,所述方法包括:根据G-PLSI模型计算查询意图概率特征向量,其中,G-PLSI模型用于模拟摘要文本的产生过程、相同查询意图下搜索不同查询时的点击链接行为,以及相同查询意图下在同一session中搜索不同查询的行为,查询意图概率特征向量体现摘要文本信息以及不同查询在相同链接上的点击概率和在同一session中的共现概率。所述方法还包括:计算不同查询的查询意图概率特征向量之间的相似度并且根据该相似度进行查询聚类。本发明使用的查询意图概率特征向量对查询内容和用户点击行为进行结合利用,能够更准确地反映用户搜索意图。
-
-
-
-
-
-
-
-
-