面向全文检索的分级存储方法及装置

    公开(公告)号:CN109885642B

    公开(公告)日:2021-11-02

    申请号:CN201910119254.8

    申请日:2019-02-18

    Abstract: 本发明公开了一种面向全文检索的分级存储方法及装置,所述方法包括:获取SQL语句,创建全文检索表,并将所述全文检索表持久化到Zookeeper中;配置ElasticSearch集群中一部分节点使用SSD盘,另一部分节点使用SATA盘,并在每个节点上安装自定义的ElasticSearch插件;数据加载工具通过ElasticSearch集群的调用接口API将文档数据加载到ElasticSearch集群中,通过所述ElasticSearch插件对请求进行过滤,并使用预先存储的全文检索表中的元数据进行索引创建;通过所述ElasticSearch插件运行监听策略,监听Zookeeper中表的元数据信息的变化,并应用分级存储策略,执行定时回滚策略,将回滚任务下发给ElasticSearch集群。

    一种基于MPP引擎的跨数据中心快速查询方法和系统

    公开(公告)号:CN107066546B

    公开(公告)日:2021-03-09

    申请号:CN201710165501.9

    申请日:2017-03-20

    Abstract: 本发明涉及一种基于MPP引擎的跨数据中心快速查询方法和系统,属于大数据检索分析领域,可应用于实时系统或离线备份系统。该方法将不同MPP引擎中的数据进行统一标记并存储到元数据中;全局中心节点接收查询请求并对其进行语法解析,然后分发送到对应的数据分中心节点;各数据分中心节点通过元数据的相应MPP引擎进行查询,并将数据传输给全局中心节点;全局中心节点利用MPP引擎对数据分中心节点返回的数据进行快速查询,并输出查询结果。本发明能够实现不同数据中心数据的联合查询,兼容多种MPP引擎,充分利用不同存储模式的特点优化查询,支持多种方式导出查询结果,便于实现上层不同应用对结果数据再分析的不同要求。

    一种数据共享方法和装置
    25.
    发明公开

    公开(公告)号:CN108512902A

    公开(公告)日:2018-09-07

    申请号:CN201810159206.7

    申请日:2018-02-24

    Abstract: 本发明公开了一种数据共享方法和装置。该方法包括:获取数据源对应的第一元数据和数据目的对应的第二元数据;根据所述第一元数据和所述第二元数据,配置整形流程文件;根据所述第一元数据、所述第二元数据、所述整形流程文件以及预先配置的数据传输路径,生成共享场景配置文件;根据所述共享场景配置文件传输数据,实现所述数据源和所述数据目之间的数据共享。本发明通过简单配置便可构建数据共享的快速传输通道,在传输通道中,可根据元数据定义及整形流程进行自动整形,数据规范化,可以对多源数据灵活整形,使数据共享过程规范化,并且有效提高了数据共享方案的通用性和传输效率。

    基于多尺度滑动窗口与动态聚合的对话级情感分析方法

    公开(公告)号:CN118132710B

    公开(公告)日:2025-01-24

    申请号:CN202410273102.4

    申请日:2024-03-11

    Abstract: 本发明提出了一种基于多尺度滑动窗口与动态聚合的对话级情感分析方法,涉及自然语言处理领域。本方法首先对评论对话构造对话树,通过滑动窗口构造多尺度话语窗口;然后利用预训练语言模型编码多尺度话语窗口;再基于对话情感预测模型根据编码的多尺度话语窗口特征表示进行预测,生成多尺度话语窗口预测结果并进行动态聚合;利用多任务学习,构造窗口级、线程级和对话级损失函数,训练优化对话情感预测模型。本方法在无需设计复杂网络的情况下提高在由多轮对话情感分析的预测效果。

    一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质

    公开(公告)号:CN107491487B

    公开(公告)日:2020-12-04

    申请号:CN201710582509.5

    申请日:2017-07-17

    Abstract: 本发明公开了一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质。本发明的全文数据库架构包括:数据模块,用于记录全文数据库的数据库表名及其索引字段信息;存储模块,包括若干独立的数据块,用于存储数据库表的数据和索引信息;加载模块,用于根据元数据模块中的索引信息将各所述数据库表的数据加载到所述数据块,当一数据块写满时,则将该数据块标记为稳态;索引创建模块,用于对于标记为稳态数据块,生成该数据块的索引;查询模块,用于根据查询语句在所述元数据模块中进行查找,如果找到匹配的索引字段,则查找各数据块的索引,然后根据数据块的索引判断该数据块是否满足查询条件。本发明大大提高了查询速度和数据库吞吐率。

    一种数据布局优化方法及系统

    公开(公告)号:CN103678158A

    公开(公告)日:2014-03-26

    申请号:CN201310732673.1

    申请日:2013-12-26

    Abstract: 本发明涉及一种数据布局优化方法,具体包括以下步骤:步骤1:接收业务系统输入的连续数据流;步骤2:将数据流划分为连续无交叉的多个数据块;步骤3:判断待处理的数据块是否达到缓存上限,如果是,进行下一步;否则,跳转至步骤1;步骤4:计算得到缓存中的所有数据块的指纹;步骤5:将缓存中数据块的指纹与指纹列表中的指纹进行匹配,将匹配的数据块标记为重复数据块;将不指纹匹配的指纹存入指纹列表中;步骤6:更新数据块信息表中的数据块的物理位置信息;步骤7:根据数据块信息表中的各个数据块的物理位置信息存储对应的数据块。本发明提高了数据的顺序性,降低了数据布局的离散化,提高了重复数据删除系统的顺序读写性能。

Patent Agency Ranking