一种面向流式数据的在线处理方法及系统

    公开(公告)号:CN103853766B

    公开(公告)日:2017-04-05

    申请号:CN201210510056.2

    申请日:2012-12-03

    Abstract: 本发明公开了一种面向流式数据的在线处理方法,包括:步骤1,建立在线内存缓存层,对所述流式数据按照键值结构进行属性抽取后存储在所述在线内存缓存层中;步骤2,在所述内存缓存层中对所述流式数据建立混合索引结构;步骤3,对建立好索引结构的每条流式数据增加一个访问标志位,此标志位用于标志不同分析程序对于该流式数据的注册情况,同时对每一个分析程序访问流式数据的状态进行记录。步骤4,数据清理,若某流式数据被所述内存缓存层中的所有指定的分析程序访问过,则将该流式数据进行清理操作。本发明大幅度减小了流式处理过程中的数据读写压力,能够有效缓解大规模流式数据处理系统中数据库的压力,且能够提升流式数据的实时处理速度。

    一种面向网络用户的个性化文本排序及推荐方法

    公开(公告)号:CN104298732A

    公开(公告)日:2015-01-21

    申请号:CN201410514028.7

    申请日:2014-09-29

    CPC classification number: G06F17/30867

    Abstract: 本发明提供一种面向网络用户的个性化文本排序及推荐方法,所述个性化文本排序方法包括对于用户的每条包括具有关键词和运算符的表达式的兴趣规则,执行以下步骤:1)、对于多个文本中的每个文本提取关键词和该关键词在该文本中的权重。2)、对于所述多个文本中的每个文本,计算该文本与该兴趣规则对应的表达式树的相似度;其中,表达式树是根据兴趣规则中包括的表达式建立的,表达式树中的节点分为运算符节点和文本节点,文本节点包括关键词和该关键词在该兴趣规则中的权重。3)、根据与所述表达式树的相似度大小,对所述多个文本中的每个文本进行排序。本发明能够在稀疏用户行为的场景下有效地将符合个性化需求的文本信息推荐给用户。

    基于关键句的多语言情感数据处理分类方法及系统

    公开(公告)号:CN103995853A

    公开(公告)日:2014-08-20

    申请号:CN201410198519.5

    申请日:2014-05-12

    CPC classification number: G06F17/30705

    Abstract: 本发明公开了一种基于关键句的多语言情感数据处理分类方法及系统,方法包括:步骤1,从未标注的情感数据集中自动抽取一部情感词典数据包,通过K近邻算法和投票规则来最终判定情感词的极性;步骤2,用抽取出的情感词典数据包计算情感属性的得分,然后再综合考虑位置属性和关键词属性,自动为每一篇文本抽取若干句情感关键句;步骤3,把抽取出的情感关键句直接应用于有监督情感数据分类和无监督情感数据分类中。由此解决多语言翻译时语言迁移和情感数据分析的双重难点问题,以提高情感数据分析的准确性。

    一种网页信息的抽取方法和系统

    公开(公告)号:CN103870506A

    公开(公告)日:2014-06-18

    申请号:CN201210548678.4

    申请日:2012-12-17

    CPC classification number: G06F17/30864 G06F17/30929

    Abstract: 本发明公开了一种网页信息的抽取方法和系统。包括:获得已标注网页,生成语义结构树,构建信息模式图,生成信息模式图中每个语义属性节点的语义属性节点信息,生成包装器,将包装器导出为包装器文件;构建用于抽取已标注网页的同类网页的抽取器;获得待抽取网页,抽取器在待抽取网页的DOM树中,从信息模式图的根语义属性节点开始逐层递归抽取信息模式图的每个语义属性节点对应的抽取数据区或者抽取迭代数据区;导出每个语义属性节点对应的抽取数据区或者抽取迭代数据区中的数据作为抽取结果。本发明具有较高的通用性、泛化能力、容错性、可扩展性以及较低的人工参与度,同时本发明也保证了在线抽取的效率,从而具有较高的实用性。

    多种语言文本数据分类处理方法

    公开(公告)号:CN103488623A

    公开(公告)日:2014-01-01

    申请号:CN201310397617.7

    申请日:2013-09-04

    Abstract: 本发明公开了一种自学习的涉及多语言数据处理分类方法,包括通过第一种子词中文或者外文“很”抽取候选情感词,然后进行停用词过滤,停用词表从语料库中自动获取;步骤2,通过第二种子词“好”和第三种子词“差”或者外文“好”“差”对情感词和情感文本同时进行支持或反对聚类;通过半监督学习构建情感分类器,先从聚类的结果中挑选确信的样本训练初始分类器,然后融合文本的情感得分和分类器的后验概率来挑选新样本加入训练集。本发明提出的面向多语言倾向性分析的方法是语言无关的,无需借助机器翻译系统和大规模双语词典,直接在目标语言上学习情感分类器,具有最小资源依赖性,对于每种目标语言,仅仅需要三个种子词而不需要其他先验知识。

    网络存储系统中的数据管理系统

    公开(公告)号:CN1464468A

    公开(公告)日:2003-12-31

    申请号:CN02122473.0

    申请日:2002-06-05

    Abstract: 一种网络存储系统中的数据管理系统,包括:存储设备,在所述存储设备上进行系统中文件数据的读写、元数据的读写、日志数据的读写、包括文件数据和元数据的数据的复制与回收、包括文件数据、元数据和日志数据的数据的备份和恢复以及资源的分配和回收;服务器,通过在基于IP网络的标准网络块设备接口协议之上添加控制协议来控制存储设备进行相应的操作。本发明在基于IP网络的标准网络块设备协议之上添加控制协议,以此来控制存储设备进行相应的操作,使得文件数据的读写、元数据的读写、日志数据的读写、数据的复制与回收、数据的备份和恢复以及资源的分配与回收都在存储设备上完成,从而实现一体化的数据管理。

    一种面向网络用户的个性化文本排序及推荐方法

    公开(公告)号:CN104298732B

    公开(公告)日:2018-01-09

    申请号:CN201410514028.7

    申请日:2014-09-29

    Abstract: 本发明提供一种面向网络用户的个性化文本排序及推荐方法,所述个性化文本排序方法包括对于用户的每条包括具有关键词和运算符的表达式的兴趣规则,执行以下步骤:1)、对于多个文本中的每个文本提取关键词和该关键词在该文本中的权重。2)、对于所述多个文本中的每个文本,计算该文本与该兴趣规则对应的表达式树的相似度;其中,表达式树是根据兴趣规则中包括的表达式建立的,表达式树中的节点分为运算符节点和文本节点,文本节点包括关键词和该关键词在该兴趣规则中的权重。3)、根据与所述表达式树的相似度大小,对所述多个文本中的每个文本进行排序。本发明能够在稀疏用户行为的场景下有效地将符合个性化需求的文本信息推荐给用户。

    一种多文档自动文摘方法

    公开(公告)号:CN101231634B

    公开(公告)日:2011-05-04

    申请号:CN200710308516.2

    申请日:2007-12-29

    Abstract: 本发明公开了一种利用图划分方法来自动提取多文档文摘的方法,包括以下步骤:进行句子边界切分,把文档用切分出来的句子表示;将句子表示成向量,计算句子两两间的相似度构成句子关联矩阵,并按指定的阈值对关联矩阵进行约简,同时进行规范化处理;在多文档文摘中引入主题的隐性逻辑结构的挖掘,将文档集按主题划分成不同的隐性子主题,从而把文摘任务转化为对子主题的选取和抽取过程;利用图划分的方法,既从全局特性上保证句子所在子主题的重要度,又从局部特性上保证不同子主题之间内容的低冗余性,从而有效提高了文摘质量。

    一种用于测试MIPS处理器的设备

    公开(公告)号:CN1818883A

    公开(公告)日:2006-08-16

    申请号:CN200510007633.6

    申请日:2005-02-07

    Abstract: 本发明提供一种用于测试MIPS处理器的设备。本发明采用测试主板与处理器分离的方式,该设备包括处理器子卡和测试主板两部分,该测试主板和处理器子卡之间通过SLOT1插槽连接。处理器子卡封装有待测的MIPS处理器、处理器倍频跳线电路和上电逻辑时序电路。处理器子卡根据不同封装、不同管脚排布的MIPS处理器进行封装,封装的处理器子卡的输出信号的排布应与测试主板的SLOT1插槽的信号输入排布方式相一致;从而每一次MIPS处理器设计升级后,只需要重新封装相应的处理器子卡就可以测试,而不需要更新整个设备。本发明的设备可以针对不同封装类型的MIPS处理器进行测试。

    集群系统
    10.
    发明授权

    公开(公告)号:CN1242338C

    公开(公告)日:2006-02-15

    申请号:CN02122474.9

    申请日:2002-06-05

    Abstract: 一种集群系统,包括:多个节点系统,每个节点系统中包括为网络用户提供网络服务的应用系统和为集群系统提供系统服务的网络系统;互连交换网络,集群系统中的所有节点系统分布式的通过上述互连交换网络连接,其中,所述网络系统负责提供集群系统服务、集群系统的资源抽象和网络协议处理;所述应用系统构建在所述网络系统之上,使用网络系统提供的集群系统服务。本发明高效地支持传统集群服务,降低集群服务给主机系统所带来的负载;提高集群系统软件的可移植性;强有力地支持异构的集群系统;支持新型集群服务的增删、升级,以及动态查询和服务绑定功能,使得集群系统具有很强的延展性。

Patent Agency Ranking