-
公开(公告)号:CN103488623A
公开(公告)日:2014-01-01
申请号:CN201310397617.7
申请日:2013-09-04
Applicant: 中国科学院计算技术研究所
IPC: G06F17/27
Abstract: 本发明公开了一种自学习的涉及多语言数据处理分类方法,包括通过第一种子词中文或者外文“很”抽取候选情感词,然后进行停用词过滤,停用词表从语料库中自动获取;步骤2,通过第二种子词“好”和第三种子词“差”或者外文“好”“差”对情感词和情感文本同时进行支持或反对聚类;通过半监督学习构建情感分类器,先从聚类的结果中挑选确信的样本训练初始分类器,然后融合文本的情感得分和分类器的后验概率来挑选新样本加入训练集。本发明提出的面向多语言倾向性分析的方法是语言无关的,无需借助机器翻译系统和大规模双语词典,直接在目标语言上学习情感分类器,具有最小资源依赖性,对于每种目标语言,仅仅需要三个种子词而不需要其他先验知识。
-
公开(公告)号:CN103354554A
公开(公告)日:2013-10-16
申请号:CN201310204527.1
申请日:2013-05-28
Applicant: 中国科学院计算技术研究所
IPC: H04L29/08
Abstract: 本发明提供一种用于eMule网络的文件资源信息采集方法,包括下列步骤:1)初始化文件集合;2)遍历所述文件集合,对于每个文件,搜索共享过该文件的活跃客户端的地址信息,得到活跃客户端集合;3)对于活跃客户端集合中的每个活跃客户端,探测该活跃客户端所共享的文件列表;4)根据所探测的活跃客户端所共享的文件列表,更新所述文件集合,返回执行步骤2);重复执行所述步骤2)~4),得到文件索引表,该文件索引表中记录出现在所述文件集合中的每个文件及其对应的活跃客户端地址信息。本发明能够全面获取eMule网络上所有文件的索引;能够获得eMule网络中各个文件资源的活跃度信息,从而为进一步的监控提供依据。
-
公开(公告)号:CN103324662A
公开(公告)日:2013-09-25
申请号:CN201310134433.1
申请日:2013-04-18
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种社会媒体事件的动态观点演变的可视化方法,该方法首先确定所采集的社会媒体事件信息集合中信息的情感隶属度和情感分类,然后基于所述信息的情感分类,建立情感可视化图形的几何布局并基于所述信息的情感隶属度对所建立的几何布局进行着色。该方法可以直观的显示信息流中事件的情感变化,在事件的变化和发展方面可以显示更多的情感信息,能够帮助用户更好的识别事件的转折点和爆发点,预测事件的发展趋势。
-
公开(公告)号:CN103246714A
公开(公告)日:2013-08-14
申请号:CN201310149482.2
申请日:2013-04-26
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
IPC: G06F17/30
Abstract: 本发明提供一种基于错误模式挖掘的中文搜索引擎查询纠错方法。该方法通过挖掘搜索引擎查询日志中的错误模式并建模,有效的改善了查询纠错系统中查询及其正确形式之间转换概率的预估精度;利用隐马尔科夫模型进行查询纠错,通过隐含状态的转移实现对查询的切分和纠错,提高了查询纠错的准确率和速度。
-
公开(公告)号:CN103198149A
公开(公告)日:2013-07-10
申请号:CN201310142075.9
申请日:2013-04-23
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种查询纠错方法和系统。所述方法包括:将查询语句转换为字符序列,判断字符序列的长度是否大于预定阈值δ;对长度大于δ的字符序列同时进行正向和反向查询纠错处理,直到重合处理的字符个数达到阈值M,得到正向和反向的候选语句项集合。所述方法还包括将正向的候选语句项集合中后M个字符与反向候选语句项集合中前M个字符相同的候选语句项进行拼接,拼接后的候选语句项构成纠错候选项集合。所述方法支持中、英文混杂的查询语句,并且可对长查询采用正反向并行的查询纠错处理,这种并行的处理方式在保证正确率的同时节省了查询纠错的处理时间。
-
公开(公告)号:CN103116635A
公开(公告)日:2013-05-22
申请号:CN201310049317.X
申请日:2013-02-07
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种面向领域的暗网资源采集方法。该方法从抓取的页面中识别与指定领域相关的页面,获取有效表单集合;对于有效表单集合中的每个表单,判断其表单类型并按照不同的表单类型构造有效查询,所述表单类型为单输入项的表单或多输入项的表单;以及输出有效的查询所返回的结果,作为采集的暗网资源。该方法能够实现暗网资源查询接口的自动识别和分类,同时实现简单查询接口和复杂查询接口的查询的有效构造,从而实现暗网资源的采集。该方法不仅能够无缝的集成到现有的搜索引擎当中,而且能够同时进行简单查询接口和复杂查询接口所指向的暗网资源的采集。
-
公开(公告)号:CN102662986A
公开(公告)日:2012-09-12
申请号:CN201210065804.0
申请日:2012-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种微博检索方法,该系统定期获取最新发布的微博消息,计算每条消息的摘要,并且提取该摘要中的词语间的关联关系,将其保存到词关系数据库中。在收到检索用户的查询词后,将与该查询词存在关联关系的多个词作为推荐词列表返回给检索用户,检索用户通过在推荐词和查询词之间建立逻辑关系来构建话题,以及将所构建的话题作为检索条件,将符合该检索条件的微博消息返回给检索用户。该系统基于由多个词构成的话题来进行检索,能够改善检索效果,提高用户体验。而且,通过利用微博用户的爱好与属性,提供一种基于人的信息查询手段,能够在最大程度上向检索用户提供其所关心的话题消息数据。
-
公开(公告)号:CN102662428A
公开(公告)日:2012-09-12
申请号:CN201210051468.4
申请日:2012-03-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种离散事件网络模拟环境的时钟同步方法,包括:1)某一离散事件发生时,确定离散事件发生时间所对应的虚拟时钟滴答计数值,并将其作为目标计数值发送给内核态程序;所述虚拟时钟滴答计数值用于控制所有接入离散事件网络模拟器的真实软件的定时器的运行;2)内核态程序以1为步长逐步累加虚拟时钟滴答计数值直至达到所述目标计数值;每次虚拟时钟滴答计数值加1时,对于接入离散事件网络模拟器的真实软件,判断所述真实软件的定时器是否超时。本发明能够避免模拟环境因与真实环境时间不一致而造成失真。本发明中,真实软件不需经过修改便可直接应用于离散事件网络模拟环境中。
-
公开(公告)号:CN102497434A
公开(公告)日:2012-06-13
申请号:CN201110424401.6
申请日:2011-12-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种内核态虚拟网络设备的建立方法,包括:步骤1、虚拟机监控机扫描虚拟机用户态调用参数,对于参数中给出的每个虚拟网络设备,保存该虚拟网络设备的基本配置;步骤2、位于用户态的虚拟机监控机在初始化虚拟机上下文时,初始化虚拟机上下文内核态锁;和步骤3、来宾机的虚拟网络设备初始化过程中,在映射该设备的I/O端口或I/O内存映射地址时,根据所述虚拟网络设备基本配置,向内核注册虚拟网络设备结构。还提供一种基于内核态虚拟网络设备的网络包接收方法和发送方法。应用上述方法建立的虚拟设备,既避免了不必要的内核态/用户态切换开销和内核态/用户态数据拷贝开销,又具有较高的可扩展性和可操作性。
-
公开(公告)号:CN101741750B
公开(公告)日:2012-04-18
申请号:CN201010034234.X
申请日:2010-01-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种P2P中资源下载方法及其系统,方法包括:步骤1,节点根据物理网络信息和预设的节点组划分标准选择加入的节点组;步骤2,发生数据请求的节点为用户节点,用户节点获得拥有请求数据的备选节点,备选节点组成备选节点集合;步骤3,用户节点依据用户节点所属的节点组,以及备选节点同所述用户节点间的连接质量,从备选节点集合中选择备选节点,被选择的备选节点作为资源节点;步骤4,用户节点从所述资源节点下载请求的数据。本发明能够在选择节点进行下载时应用物理层网络拓扑结构。
-
-
-
-
-
-
-
-
-