一种短文本数据的事件演化分析方法

    公开(公告)号:CN103150383B

    公开(公告)日:2015-07-29

    申请号:CN201310082990.3

    申请日:2013-03-15

    Abstract: 本发明提供一种短文本数据的事件演化分析方法,包括:根据词库和当前时段输入的短文本数据构造当前时段的文档—词项矩阵并对其进行非负矩阵分解,得到文档—事件矩阵和事件—词项矩阵;根据事件—词项矩阵计算当前时段的事件和前一时段的事件之间的相似度,根据该相似度、当前时段的事件和前一时段的剩余图构造当前时段的事件关系图;当前时段的事件关系图分割为一个或多个子图;对子图进行归类得到新生成事件集和演化事件集;根据文档—事件矩阵计算每个事件关联的文档数,并根据该文档数做演化事件集的趋势分析和预测,作为下一时段非负矩阵分解的约束条件。该方法适于动态地跟踪短文本数据的事件演化过程。

    一种面向网络话题的热度评价方法

    公开(公告)号:CN104615685A

    公开(公告)日:2015-05-13

    申请号:CN201510032875.4

    申请日:2015-01-22

    Abstract: 本发明提供一种面向网络话题的热度评价方法,包括:将网络话题的属性与规则中的属性进行对比;其中,所述规则是经过训练得到的,且用于指示网络话题的属性与热度值的对应关系;以及根据对比的结果得到该网络话题的热度值。本发明定义了数值评价体系,方便了用户理解话题的热度程度,有利于话题之间的热度比较;以及,采用粗糙集相关理论最优化训练集中的不一致性,学习出热度值与属性之间的关系,提供了高热度评价的效果,其中,将无限制的属性值离散化到有限的数值范围内,减小了计算的复杂度;此外,综合多种背景知识的用户的评价得到训练集,使得样本数据更为全面,尽可能地减轻了个体的偏见。

    一种面向微博客平台的社交朋友圈的挖掘方法及系统

    公开(公告)号:CN103279482B

    公开(公告)日:2015-05-13

    申请号:CN201310143346.2

    申请日:2013-04-23

    Abstract: 本发明提供一种面向微博客平台的社交朋友圈的挖掘方法及系统,其方法包括:步骤1,通过微博客平台所提供的数据接口得到待查看用户的朋友列表;步骤2,针对所述朋友列表中的每个朋友用户,通过微博客平台所提供的数据接口得到所述每个朋友用户的朋友列表;步骤3,计算所述待查看用户的朋友列表与所述每个朋友用户的朋友列表的邻里相似度;步骤4,取出邻里相似度大于指定阈值的朋友用户,作为所述待查看用户的现实朋友用户;步骤5,计算所述待查看用户与所述现实朋友用户所构成的有向连通图中的最强连通子图,所获得的每个最强连通子图构成所述待查看用户的社交朋友圈。本发明能够在海量用户中挖掘社交朋友圈。

    内核态虚拟网络设备的建立方法、及其包发送和接收方法

    公开(公告)号:CN102497434B

    公开(公告)日:2014-11-05

    申请号:CN201110424401.6

    申请日:2011-12-16

    Abstract: 本发明提供一种内核态虚拟网络设备的建立方法,包括:步骤1、虚拟机监控机扫描虚拟机用户态调用参数,对于参数中给出的每个虚拟网络设备,保存该虚拟网络设备的基本配置;步骤2、位于用户态的虚拟机监控机在初始化虚拟机上下文时,初始化虚拟机上下文内核态锁;和步骤3、来宾机的虚拟网络设备初始化过程中,在映射该设备的I/O端口或I/O内存映射地址时,根据所述虚拟网络设备基本配置,向内核注册虚拟网络设备结构。还提供一种基于内核态虚拟网络设备的网络包接收方法和发送方法。应用上述方法建立的虚拟设备,既避免了不必要的内核态/用户态切换开销和内核态/用户态数据拷贝开销,又具有较高的可扩展性和可操作性。

    一种跨领域的文本情感分类器的训练方法和分类方法

    公开(公告)号:CN101770580B

    公开(公告)日:2014-03-12

    申请号:CN200910076428.3

    申请日:2009-01-04

    Inventor: 谭松波 程学旗

    Abstract: 本发明提供一种跨领域的文本情感分类器的训练方法,包括下列步骤:1)在源领域和新领域样本的关键词中挑选通用情感特征;2)根据源领域的样本,计算特征wt属于类别ck的样本的概率P(t|ck),以及类别ck的概率P(ck),进而计算新领域的样本di属于类别ck的概率P(ck|di);3)基于EM迭代方法训练所述分类器,其中在M步根据源领域和新领域样本以及所述通用情感特征重新计算所述P(t|ck)和所述P(ck),在E步根据重新计算的所述P(t|ck)和所述P(ck)重新计算所述P(ck|di)。根据本发明的文本情感分类方法对新领域的文本进行分类的精度较高。

    一种获取KAD网络上热门检索资源的方法和系统

    公开(公告)号:CN103605789A

    公开(公告)日:2014-02-26

    申请号:CN201310645868.2

    申请日:2013-12-04

    CPC classification number: G06F17/3089

    Abstract: 本发明提供一种获取KAD网络上热门检索资源的方法及系统。所述方法包括:构造模拟节点并加入KAD网络,使得所述模拟节点在KAD网络空间中均匀分布;由所述模拟节点监听所述KAD网路中其他节点的请求消息。所述方法还包括由所述模拟节点将从资源检索请求消息中获取的资源ID发送至热门资源统计服务器进行统计。本发明能够比较全面、准确地获得KAD网络中的热门检索资源,能够为网络信息挖掘及网络信息安全等工作提供帮助。

    一种跨领域文本情感倾向性分析方法

    公开(公告)号:CN101714135B

    公开(公告)日:2013-10-16

    申请号:CN200910242427.1

    申请日:2009-12-11

    Abstract: 本发明提供一种跨领域文本情感倾向性分析方法,包括下列步骤:1)确定源领域和目标领域中文本与词的初始情感分;2)根据测试文本集和测试词集分别与所有词集和所有文本集的关系建立测试文本集DU与测试词集WU和训练词集WL间的相似矩阵M、测试词集WU与测试文本集DU和训练文本集DL间的相似矩阵N和测试词集WU与所有词集之间的相似矩阵V中的一个或多个,计算一个或多个相似矩阵的归一化矩阵和邻域矩阵;3)利用所述源领域和目标领域中文本与词的初始情感分和所述一个或多个相似矩阵的邻域矩阵迭代计算测试文本和测试词的情感分并进行归一化。该方法能够大幅提高对新领域的文本进行分类的精度。

Patent Agency Ranking