一种基于流式数据的局部性非聚簇索引方法及系统

    公开(公告)号:CN105335475A

    公开(公告)日:2016-02-17

    申请号:CN201510641703.7

    申请日:2015-09-30

    CPC classification number: G06F17/3033 G06F17/30516

    Abstract: 本发明公开了一种基于流式数据的局部性非聚簇索引方法及系统,该方法包括:实时更新步骤,实时更新哈希索引表中针对所接收到的每条流式数据而产生的索引记录,该索引记录记载了该流式数据中出现的索引键、该索引键首次出现时所对应的主键以及从首次出现到当前最末次出现所覆盖的数据个数;写入步骤,当达到触发条件时,将该哈希索引表中的该索引记录写入索引表中,继续执行该实时更新步骤。本发明极大地缩小了索引表的空间及构建索引表所产生的带宽开销,该索引方法将随机访问与顺序扫描结合起来,有效地利用了流式数据的时间局部特性,更符合存储介质的访问模型,提高了索引数据查询的效率。

    一种社交网络谣言识别方法及系统

    公开(公告)号:CN105045857A

    公开(公告)日:2015-11-11

    申请号:CN201510401458.2

    申请日:2015-07-09

    CPC classification number: G06F16/951 G06F16/35

    Abstract: 本发明公开了一种社交网络谣言识别方法及系统,该方法包括获取微博信息例,并获取所述微博信息例的微博信息与用户信息,根据所述微博信息与所述用户信息,提取所述微博信息例的微博内容特征,所述微博内容特征包括浅层文本特征与微博深层隐含特征;根据所述用户信息,提取所述用户的基本属性特征与用户深层隐含特征,根据所述微博信息提取所述微博的微博流行度特征,所述微博流行度特征包括基于流行度及流行度趋势的波动性特征与差异性特征以及转发特征;根据所述浅层文本特征、所述微博深层隐含特征、所述基本属性特征、所述用户深层隐含特征、所述微博流行度特征,构建特征向量,训练分类器,将所述特征向量输入所述分类器并输出结果。

    一种基于用户和微博主题的微博流行度预测方法及系统

    公开(公告)号:CN104933622A

    公开(公告)日:2015-09-23

    申请号:CN201510109475.9

    申请日:2015-03-12

    Abstract: 本发明涉及社交网络分析领域,特别涉及一种基于用户和微博主题的微博流行度预测方法及系统,该方法包括:获取预设时间段内的微博数据和用户数据,根据所述微博数据和所述用户数据,获取用户属性特征和微博主题特征,将所述用户属性特征进行归一化处理,以处理后的所述用户特征进行用户聚类,并根据聚类结果,获取用户的类别信息;根据所述微博主题特征和所述用户的类别信息,获取用户聚类在所述微博主题下的转发特征,并计算所述用户聚类在所述微博主题下的权重系数;根据所述微博主题特征、所述用户属性特征、所述权重系数,构建微博流行度预测模型,通过所述微博流行度预测模型对微博流行度进行预测。

    用于搜索引擎的色情用户查询识别方法及设备

    公开(公告)号:CN103177126B

    公开(公告)日:2015-07-29

    申请号:CN201310134933.5

    申请日:2013-04-18

    Abstract: 本发明提供一种用于搜索引擎的色情用户查询识别方法,该方法包括基于已标注的用户查询集合,训练用于识别色情用户查询的分类模型,以及利用该训练好的分类模型判断待识别的用户查询是否为色请用户查询。其中,用于训练所述分类模型的用户查询特征包括用户查询的命名实体和实体上下文主题特征以及用户属于色情查询和非色情查询的概率。该方法不需要基于搜索引擎的查询结果来识别色情查询,而是通过利用用户查询中包含的命名实体特征和语言模型特征实现了快速、有效的色情查询识别。

    一种新闻事件要素抽取方法与装置

    公开(公告)号:CN104408093A

    公开(公告)日:2015-03-11

    申请号:CN201410645944.4

    申请日:2014-11-14

    CPC classification number: G06F17/30905 G06F17/2765

    Abstract: 本发明提供一种新闻事件要素抽取方法,包括:识别新闻文本中包含的人名并抽取人名特征;根据所抽取的人名特征计算人名成为新闻事件的主角的概率;以及基于该概率识别出新闻事件的主角。在一些实施例中,所述方法还包括:抽取关于新闻事件的主角的观点和发言的语句,以及新闻事件发生的地点和时间。本发明在保证抽取准确率的前提下,能够克服人工分析整理新闻信息成本高、效率低的问题,同时,也为新闻事件检索、新闻报道跟踪等上层应用提供支持。

    一种离散事件网络模拟环境的时钟同步方法

    公开(公告)号:CN102662428B

    公开(公告)日:2015-02-04

    申请号:CN201210051468.4

    申请日:2012-03-01

    Abstract: 本发明提供一种离散事件网络模拟环境的时钟同步方法,包括:1)某一离散事件发生时,确定离散事件发生时间所对应的虚拟时钟滴答计数值,并将其作为目标计数值发送给内核态程序;所述虚拟时钟滴答计数值用于控制所有接入离散事件网络模拟器的真实软件的定时器的运行;2)内核态程序以1为步长逐步累加虚拟时钟滴答计数值直至达到所述目标计数值;每次虚拟时钟滴答计数值加1时,对于接入离散事件网络模拟器的真实软件,判断所述真实软件的定时器是否超时。本发明能够避免模拟环境因与真实环境时间不一致而造成失真。本发明中,真实软件不需经过修改便可直接应用于离散事件网络模拟环境中。

    检测网络安全性的方法及系统

    公开(公告)号:CN102413003B

    公开(公告)日:2014-09-10

    申请号:CN201010287612.5

    申请日:2010-09-20

    Abstract: 本发明一种检测网络安全性的方法和系统,方法包括:步骤1,依据网络中设备的初始状态、设备间连接关系和设备的脆弱性信息,生成包含攻击节点和状态节点的攻击图;步骤2,针对设定的目标节点,将攻击图转换为随机Petri网模型;步骤3,在随机Petri网模型上引入攻击行为的策略和效用信息,生成攻击视角的随机博弈网模型;在随机Petri网模型上引入防御行为的策略和效用信息,生成防御视角的随机博弈网模型;步骤4,合并攻击视角的随机博弈网模型和防御视角的随机博弈网模型,生成攻防博弈策略模型;步骤5,利用攻防博弈策略模型进行网络安全性的检测。本发明能够提高网络安全性检测的准确性。

    一种面向在线百科的实体属性抽取方法及系统

    公开(公告)号:CN103853823A

    公开(公告)日:2014-06-11

    申请号:CN201410065743.7

    申请日:2014-02-26

    CPC classification number: G06F17/30705

    Abstract: 本发明提供一种面向在线百科的实体属性抽取方法及系统,该方法包括:在待抽取的在线百科网页文本集合T中选择一个页面,抽取该页面的实体属性表达规则,得到当前规则集合。该方法还包括使用当前规则集合对所述待抽取的在线百科网页文本集合T进行实体属性抽取,并且根据抽取得到的实体属性抽取T的实体属性表达规则,用抽取得到的规则集合作为当前规则集合并重复这一过程k次,得到最终规则集合。使用所述最终规则集合对T进行实体属性抽取。本发明提供的实体属性抽取方法能够适应文本结构的变化,适用于各种在线百科,具有召回率高并且准确率高的效果。

    面向开放网络知识库的实体间关系推断方法及系统

    公开(公告)号:CN103824115A

    公开(公告)日:2014-05-28

    申请号:CN201410072412.6

    申请日:2014-02-28

    Abstract: 本发明提供一种面向开放网络知识库的实体间关系推断方法。该方法包括根据目标实体从知识库中找出所有与该目标实体之间有关系路径相连的所有实体作为候选实体集;根据待推断的目标关系从所述知识库中找出的所有存在所述目标关系的实体对;以及综合考虑所找出的各实体对间的关系路径信息以及各实体的属性信息来从所述候选实体集中选出可能与该目标实体存在所述目标关系的候选实体。该方法利用知识库中已有的实体关系和实体的属性自动对实体间的关系进行推理,有效改善了推断效果,实现了对知识库中关系的丰富与完善。

Patent Agency Ranking