基于区块链和智能合约的增强型数据权益保护方法

    公开(公告)号:CN107507091A

    公开(公告)日:2017-12-22

    申请号:CN201710798216.0

    申请日:2017-09-07

    Applicant: 复旦大学

    CPC classification number: G06Q40/04 G06F21/31 G06Q20/405 H04L67/10

    Abstract: 本发明属于数据安全技术领域,具体为一种基于区块链和智能合约的增强型数据权益保护方法。本发明步骤包括:数据拥有者将数据属性和策略属性提交给部署在区块链的智能合约来发布数据;其他使用者作为数据受让方将其流通属性作为参数调用该智能合约进行流通申请,智能合约根据数据的策略属性自动判定申请是否合法后,返回申请结果;若数据受让方的流通属性合法,则获得智能合约授权生成的流通许可证;反之,智能合约将判定申请失败。本发明应用区块链技术,保护数据拥有者的权益,并公正地受理每个数据受让方的申请;同时提升了系统稳定性,去除了数据权益保护过程中对第三方权威机构的依赖,为数据流通过程提供了公正、透明、可信的执行环境。

    一种基于特定划分的主题模型下的文档生成方法

    公开(公告)号:CN107491417A

    公开(公告)日:2017-12-19

    申请号:CN201710548431.5

    申请日:2017-07-06

    Applicant: 复旦大学

    CPC classification number: G06F17/30616 G06F17/16 G06F17/30657 G06F17/30705

    Abstract: 本发明属于数据挖掘技术领域,具体为一种基于特定划分的主题模型下的文档生成方法。本发明根据某种给定的文本数据库划分方式,加入子集的概念,例如对于一些文本数据库,像新闻数据库,某个时间片段中的文本的主题分布具有一定的相似性,特别是那些报告相同事件的不同新闻频道的文本,利用时间片段的属性就可以对数据库进行划分,分成一个个的子集。由此,本发明提出新的文本数据库上的主题模型(DbLDA);在DbLDA中,每个文档的生成的具体步骤为:生成主题矩阵;对一个子集生成主题分布:对子集中的文章,生成主题分布;对每个词,选择一个主题,选择一个单词。可应用于带有结构化属性的文本数据库。

    一种在无线自组织网络中的基于位置信息的组合服务执行路径选择方法

    公开(公告)号:CN101742606A

    公开(公告)日:2010-06-16

    申请号:CN200810202721.5

    申请日:2008-11-14

    Applicant: 复旦大学

    Abstract: 本发明属于自组织网络技术领域,具体是一种在无线自组织网络中的基于位置信息的组合服务执行路径选择方法。整个最短执行路径选择的过程包括相邻节间的跳数估计算法、线性类型组合服务最短执行路径选择、并发类型组合服务最短执行路径选择三个部分。本方法在保证服务执行成功率的基础上,大大降低了平均执行路径长度,减少了数据传输的时间和缩短了服务应答的时间,从而更好地适应无线自组织网络环境。

    数据集的处理和SQL-自然语言翻译模型的测试的方法和装置

    公开(公告)号:CN117331835A

    公开(公告)日:2024-01-02

    申请号:CN202311322798.7

    申请日:2023-10-12

    Applicant: 复旦大学

    Abstract: 本发明涉及数据集的处理方法,包括:接收多个第一SQL语句‑自然语言对;对于每个所述第一SQL语句‑自然语言对,将其中的第一SQL语句切分为SQL语句单元,将其中的第一自然语言切分为自然语言单元,并将所述SQL语句单元和所述自然语言单元对齐;将多个所述SQL语句单元和对齐的所述自然语言单元组合为多个第二SQL语句‑自然语言对;将多个所述第二SQL语句‑自然语言对分为训练集和测试集。本发明还涉及SQL‑自然语言翻译模型的测试的方法、数据集的处理和SQL‑自然语言翻译模型的测试装置,以及计算设备集群、计算机程序产品和介质。

    生成数据库的查询语句集合的方法、训练排序模型的方法

    公开(公告)号:CN116756167A

    公开(公告)日:2023-09-15

    申请号:CN202310545980.2

    申请日:2023-05-15

    Applicant: 复旦大学

    Abstract: 本申请涉及信息技术领域,公开了一种用于生成数据库的查询语句集合的方法、训练排序模型的方法,生成数据库的查询语句集合的方法包括:标注步骤,从数据库的多个样本结构化查询语言SQL语句中提取出多个关键词,并获取每个关键词的语义标注;重组步骤,将每个样本SQL语句拆分成多个查询单元,并基于预设重组规则,将多个查询单元进行多次重组,得到多个候选SQL语句;转换步骤,基于多个语义标注,将每个候选SQL语句转换为模板语言语句,得到多个模板语言语句,其中,多个候选SQL语句和多个模板语言语句形成查询语句集合。本发明可以提高数据查询结果的准确率。

    数据分析中的数据过滤规则建模方法

    公开(公告)号:CN110175191B

    公开(公告)日:2023-06-27

    申请号:CN201910401717.X

    申请日:2019-05-14

    Applicant: 复旦大学

    Abstract: 本发明属于数据分析技术领域,具体为一种数据分析中的数据过滤规则建模方法。本发明的数据过滤规则建模方法主要包含三个部分:(1)数据列分析过滤(2)数据范围分析过滤(3)结果集自动可视化。本发明通过合理的设定相关的规则解决如何在数据分析中应用数据过滤规则建立分析过滤模型,利用模型分析过滤数据并直观的展示数据。本发明可方便用户快速筛选数据并找到感兴趣的数据子集,分析与挖掘数据项之间联系。

    基于机器学习的近似查询优化系统

    公开(公告)号:CN114911844A

    公开(公告)日:2022-08-16

    申请号:CN202210515794.X

    申请日:2022-05-11

    Applicant: 复旦大学

    Abstract: 本发明属于数据分析技术领域,具体为一种基于机器学习的近似查询优化系统。本发明系统包括数据诱导谓词和抽样器参数优化两部分;前者将一张表上的谓词转换为连接表上的诱导谓词,将谓词信息横向传递到其它表上来实现数据跳过,即让各表的输入数据变为各自的分区子集,从而引导查询优化器在削减后的数据上找出更好的查询计划;后者在数据诱导谓词部分找出的含诱导谓词的查询计划上插入抽样器来获取一系列候选查询计划,并通过训练深度学习模型来预测候选查询计划中抽样器的抽样率取值,从而在查询优化过程中降低局部数据与全局数据分布不一致时的负面影响。本发明在为用户提供查询误差保障性的同时降低查询执行时延。

    大型语料库上的快速文本聚类方法

    公开(公告)号:CN108228721B

    公开(公告)日:2021-06-04

    申请号:CN201711290927.3

    申请日:2017-12-08

    Applicant: 复旦大学

    Abstract: 本发明属于关系数据库技术领域,具体为一种大型语料库上的快速文本聚类方法。由于文本数据通常具有高维和稀疏的特征,单纯基于数据相似度的聚类方法难以获得较好的效果,而基于生成模型的方法如狄利克雷多项混合模型在表现上更加突出。本发明通过使用狄利克雷分布的对称先验和构造索引来进行优化,使总时间仅依赖于文档中不同单词的个数,从而在篇幅较长的文档中也能高效运行。

    一种高效的文本区间热词查询方法

    公开(公告)号:CN106874430B

    公开(公告)日:2021-06-04

    申请号:CN201710059191.2

    申请日:2017-01-23

    Applicant: 复旦大学

    Abstract: 本发明属于电子信息技术领域,具体为高效的文本区间热词查询方法。现有的热词提取算法一般面向挖掘任务,时间复杂度较高,难以直接应用于热词的在线查询处理。本发明方法包括两个阶段:利用时间序列划分和范围查询的思想,对原始文本数据D进行预处理;数据预处理的基础上,采用优化算法EHWE,对给定查询q的时间范围以及需要提取的热词个数k,计算确定所需热词。与现有的面向挖掘的算法相比,EHWE算法能够在保证计算结果准确率的前提下,有效提高热词在线查询的效率。实验结果表明,与现有的面向挖掘的算法相比,EHWE算法在CNN,BBC和NYT三个数据集涉及的整个时间范围上的运行时间分别减少59.7%,65.1%和75.5%。

    近似查询处理中的样本调节系统

    公开(公告)号:CN112380250A

    公开(公告)日:2021-02-19

    申请号:CN202011106056.7

    申请日:2020-10-15

    Applicant: 复旦大学

    Abstract: 本发明属于数据分析技术领域,具体为一种近似查询处理中的样本调节系统。本发明系统包括查询分析器、查询执行器、样本生成器、样本调节器;查询分析器利用物化样本在线回答查询,根据物化样本的统计信息确定查询在物化样本上执行或者在原始数据集上执行;样本生成器和样本调节器负责离线构造、删除和调整更新物化样本,包括:根据用户查询,生成抽象样本;根据样本物化策略对一些抽象样本进行物化,并根据存储资源限制删除已有的物化样本;定期评估物化样本的效用,通过强化学习模型学习更新样本物化策略,并与系统中已经存在的物化样本集进行对比,以便生成更好的物化样本。本发明可帮助分析人员及时从大数据中获取查询结果,减少查询等待时间。

Patent Agency Ranking