一种自组织网络上的组合服务执行路径的选择方法

    公开(公告)号:CN101170499A

    公开(公告)日:2008-04-30

    申请号:CN200710170785.7

    申请日:2007-11-22

    Applicant: 复旦大学

    CPC classification number: Y02D70/34

    Abstract: 本发明属于自组织网络技术领域,具体为一种自组织网络上的组合服务执行路径的选择方法。主要包括:执行路径的选择策略、自组织网络上QoS模型建立和服务执行有向无环图的构造。整个流程是:通过服务发现得到组合服务所需要的基本服务的信息,并对这些信息进行建模,得到具有较高QoS且离请求节点较近的节点上的基本服务,根据服务有向无环图构造出执行有向无环图。用户在自组织网络上提出一个组合服务的请求时,利用该选择方法,自组织网络会自动选择一个较优的执行路径,在执行整个组合服务中能够达到较小的网络代价。

    一种时空数据查询处理中的抽样系统

    公开(公告)号:CN114756772B

    公开(公告)日:2025-02-14

    申请号:CN202210370416.7

    申请日:2022-04-09

    Applicant: 复旦大学

    Abstract: 本发明属于数据分析技术领域,具体为一种时空数据查询处理中的抽样系统。本发明系统包括时空网格划分器、样本生成器:时空网格划分器按照一定粒度在时空坐标系上划分网格,并给每个网格分配样本容量;具体的划分粒度可以根据实际需求定义;样本生成器按照划分器分配的样本容量在每个网格内均匀采样,并汇总成最终样本。本发明可帮助分析人员从时空大数据中获取更为全面的样本,发掘容易被简单均匀采样遗漏的信息,增加样本分析结论的可靠性。

    一种基于大型语言模型的自然语言到SQL转换方法

    公开(公告)号:CN118643050A

    公开(公告)日:2024-09-13

    申请号:CN202410665916.2

    申请日:2024-05-27

    Applicant: 复旦大学

    Abstract: 本发明公开了一种基于大型语言模型的自然语言到SQL转换方法,涉及信息技术领域,步骤1:数据库模式剪枝;利用预先训练好的大语言模型分析输入的自然语言查询,自动剪枝数据库模式,排除与查询无关的表格和字段;步骤2:SQL骨架预测,基于剪裁后的数据库模式和输入的自然语言查询,基于大语言模型预测SQL骨架构建可预测的SQL骨架;步骤3:样例选择;根据预测出的SQL骨架从预先定义的SQL样例库中选出与之匹配的SQL样例;步骤4:数据库适配;将大语言模型生成的SQL根据特定数据库进行调整,修正具体的数据库的SQL查询,使得生成的SQL语句能够在特定的数据库环境中执行。

    基于和积网络模型的基数估计及近似查询处理方法及装置

    公开(公告)号:CN116756291A

    公开(公告)日:2023-09-15

    申请号:CN202310818649.3

    申请日:2023-07-04

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于和积网络模型的基数估计及近似查询处理方法及装置,在模型构建步骤中基于准确性需求对叶子节点的行号位图进行合并,从而构建出准确性高并且最小化推理开销的融合位图的和积网络模型;在查询处理步骤中,基于给定的与准确性需求相关的规则以及分解到最底层乘积节点中的查询请求决定其下叶子节点的计算方式,因此能够获取最优的推理准确性以及开销。通过本发明的方法及装置能够提高查询优化中基数估计的准确性,从而帮助提高查询优化结果,减少查询执行所需开销,帮助数据分析人员对大规模数据集进行实时分析,通过融合额外的数据分布特征,提高近似查询处理在SPJA查询上的准确性,以提升用户体验,提高决策的有效性。

    一种基于代价估计的查询优化系统

    公开(公告)号:CN116521719A

    公开(公告)日:2023-08-01

    申请号:CN202310401083.4

    申请日:2023-04-15

    Abstract: 本发明属于数据库查询技术领域,具体为一种基于代价估计的查询优化系统。本发明包括系统信息提取器、基于深度学习的代价估计模型;系统信息器将数据库管理系统的存储、执行模型等信息处理成为结构化数据以供模型使用;基于深度学习的代价估计模型能够根据不同的系统信息,通过历史执行记录建立从查询到代价的映射关系,从而对未知查询的代价进行估计;代价估计模型的训练采用分层训练策略,可以帮助模型从成批的训练数据中进行学习,提高模型训练的内存利用率,减小训练震荡,加速模型收敛。本发明可以帮助数据库优化器选择正确执行计划,最终提高数据库整体的查询执行效率。

    用于时序数据修复的多版本存储、查询方法及电子设备和程序产品

    公开(公告)号:CN116467112A

    公开(公告)日:2023-07-21

    申请号:CN202310541821.5

    申请日:2023-05-15

    Applicant: 复旦大学

    Abstract: 本发明公开了一种用于时序数据修复的多版本存储方法,对获得的时序数据,采用多个修复策略或者算法进行修复,获得多个对应的修复时序数据版本,以差量存储方式存储所述修复数据,将所述多个版本的修复数据的冗余部分进行合并。所述差量存储方式是指,将修复后的时序数据,以修复前的原始时序数据,以及由对应的修复操作指令组成的差量文件进行表示,则所述多版本修复时序数据则由一条原始时序数据及多份差量文件组成。

    数据分析中的数据过滤规则建模方法

    公开(公告)号:CN110175191A

    公开(公告)日:2019-08-27

    申请号:CN201910401717.X

    申请日:2019-05-14

    Applicant: 复旦大学

    Abstract: 本发明属于数据分析技术领域,具体为一种数据分析中的数据过滤规则建模方法。本发明的数据过滤规则建模方法主要包含三个部分:(1)数据列分析过滤(2)数据范围分析过滤(3)结果集自动可视化。本发明通过合理的设定相关的规则解决如何在数据分析中应用数据过滤规则建立分析过滤模型,利用模型分析过滤数据并直观的展示数据。本发明可方便用户快速筛选数据并找到感兴趣的数据子集,分析与挖掘数据项之间联系。

    一种MapReduce平台上的海量高维数据聚类方法

    公开(公告)号:CN102222092B

    公开(公告)日:2013-02-27

    申请号:CN201110148982.5

    申请日:2011-06-03

    Applicant: 复旦大学

    Abstract: 本发明属于云计算与数据挖掘技术领域,具体为一种MapReduce平台上的海量高维数据聚类方法。该方法首先对原始数据的每一维进行分割,用切分好的非空小格代替原数据中的点集进行聚类,减小数据规模。利用MapReduce的开源实现,使得聚类过程可以在分布式集群上并行完成,克服了单机算法在存储和计算上的限制。聚类过程采用K-mediods算法的思想,并提出高效的欧式距离计算方法。本发明适用于处理海量高维数据,用户可以根据集群的计算能力、算法的时间期望以及对聚类精确性的要求对算法进行手动调整,满足了不同用户的需要。

    一种MapReduce平台上的海量高维数据聚类方法

    公开(公告)号:CN102222092A

    公开(公告)日:2011-10-19

    申请号:CN201110148982.5

    申请日:2011-06-03

    Applicant: 复旦大学

    Abstract: 本发明属于云计算与数据挖掘技术领域,具体为一种MapReduce平台上的海量高维数据聚类方法。该方法首先对原始数据的每一维进行分割,用切分好的非空小格代替原数据中的点集进行聚类,减小数据规模。利用MapReduce的开源实现,使得聚类过程可以在分布式集群上并行完成,克服了单机算法在存储和计算上的限制。聚类过程采用K-mediods算法的思想,并提出高效的欧式距离计算方法。本发明适用于处理海量高维数据,用户可以根据集群的计算能力、算法的时间期望以及对聚类精确性的要求对算法进行手动调整,满足了不同用户的需要。

    一种层次关系数据上关键字检索结果的聚合摘要方法

    公开(公告)号:CN102214216A

    公开(公告)日:2011-10-12

    申请号:CN201110150869.0

    申请日:2011-06-07

    Applicant: 复旦大学

    Inventor: 何震瀛 胡昊 汪卫

    Abstract: 本发明属于关系数据库技术领域,具体为一种层次关系数据上关键字检索结果的聚合摘要方法。该方法的步骤为:给定具有层次关系H的关系数据库D和其上的一个检索Q以及n个检索结果S,S中为每一条结果元组t1、t2、…、tn,根据H上的层次关系,按照最低上层最小覆盖聚集的原则采用按序连接方法将n条检索结果t1、t2、…、tn聚合成为最大最低上层最小覆盖聚集,并对这些聚合结果根据最大覆盖的原则,以迭代查找最大覆盖,在查找的过程中进行剪枝,从而找出贪心结果I。本发明在聚合过程中根据层次关系减少了连接操作,在摘要过程中引入剪枝方法减少时间代价,从而使聚合摘要效率更高。

Patent Agency Ranking