一种基于机器学习的分布式查询系统及其优化方法

    公开(公告)号:CN116244610A

    公开(公告)日:2023-06-09

    申请号:CN202310332553.6

    申请日:2023-03-31

    Abstract: 本发明涉及一种基于机器学习的分布式查询系统及其优化方法。所述聚类模块,用于将系统中新产生的数据进行分析,得到聚类结果;所述数据分片存储模块,用于将收到的分片键范围将数据存储到对应的数据分片中,保证相似的数据被分配在同一个或者几个数据分片中;所述回归模块,用于配合数据缓存模块进行主动的数据缓存,预测数据未来的使用率,将使用率高的数据主动缓存到高速读取设备上;所述数据缓存模块,用于将预测的数据的未来访问率做一个排序,得到高使用率的数据所对应的分片键,之后向数据分片存储模块读取所对应的数据,将这个数据传递给数据缓存模块,数据缓存模块将接收到的数据存储到高速读取设备上。用以解决数据以分布式方式存储在磁盘上,它们之间的连接松散,使得查询更加困难的问题。

    基于元学习和图注意力时空神经网络的空气质量预测方法

    公开(公告)号:CN112288156B

    公开(公告)日:2023-03-31

    申请号:CN202011155619.1

    申请日:2020-10-26

    Abstract: 本发明公开了基于元学习和图注意力时空神经网络的空气质量预测方法,属于空气质量预测技术领域。获取数据;将多个城市划分为源城市和目标城市;根据城市监测站点地理空间数据构建图结构,将监测站点位置作为图的顶点,通过设置距离阀值来确定任意两顶点是否存在边;根据城市监测站点图结构构造输入特征向量,输入图注意力时空神经网络模型进行计算,图注意力时空神经网络模型是由图注意力网络(GAT)和双层长短期记忆网络(LSTM)组成,获取监测站之间的空间相关性和时间相关性;从多个源城市中迁移知识,对注意力时空神经网络模型进行有效的初始化。本发明可以在数据缺失的情况下保持空气质量的时空预测的准确性。

    一种面向多敏感属性数据发布的匿名隐私保护方法

    公开(公告)号:CN110659513B

    公开(公告)日:2022-12-06

    申请号:CN201910933708.5

    申请日:2019-09-29

    Abstract: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。

    基于子载波动态选择的速度自适应室内人体检测方法

    公开(公告)号:CN109409216B

    公开(公告)日:2022-04-05

    申请号:CN201811086897.9

    申请日:2018-09-18

    Abstract: 本发明涉及一种基于子载波动态选择的速度自适应室内人体检测方法,训练阶段包括信道状态信息的获取及预处理;信道状态信息去噪;信道状态信息特征值提取;信道状态信息分类训练,检测阶段包括信道状态信息预处理;提取窗口内的特征值:按照窗口分割进行特征值提取,所述特征值作为人体检测的验证数据;人体检测。该方法可以防止由于慢速移动对信道状态信息影响不明显,而造成检测结果不准确的情况发生,有效的解决检测环境中存在慢速移动的人体时,检测漏报率较高的问题。

Patent Agency Ranking