-
公开(公告)号:CN115098408B
公开(公告)日:2024-12-17
申请号:CN202210658236.9
申请日:2022-06-10
Applicant: 清华大学
IPC: G06F12/0862 , G06F12/0882 , G06F18/214 , G06N3/0464 , G06N3/0442
Abstract: 本发明提供一种数据预存取方法及装置。其中,所述方法包括以下步骤:获取待预测数据页,提取所述待预测数据页的数据特征;将所述待预测数据页的数据特征输入预先训练的预测模型中,得到数据相关值和目标数据页;确认所述数据相关值大于预设阈值,则将所述目标数据页进行预存取;其中,所述预先训练的预测模型是根据历史调用数据页样本训练得到的。本发明使用机器学习模型来获取数据页访问的模式,从而大大提高了数据页预存取的准确性,对数据库系统和大数据系统等领域的发展具有重要意义。
-
公开(公告)号:CN118260708A
公开(公告)日:2024-06-28
申请号:CN202410201558.X
申请日:2024-02-23
Applicant: 清华大学
IPC: G06F18/25 , G06F18/2132 , G06N3/094 , G06N3/0475 , G06F18/214
Abstract: 本申请提供一种时序数据处理方法、装置及设备,涉及时序数据处理技术,该方法包括:获取真实数据和真实数据的负载信息。根据预设的模式信息提取算法对真实数据进行提取,得到模式信息和去模式数据。基于负载信息、模式信息和去模式数据,采用预设的鲁棒性训练方法对初始的时序数据生成对抗网络进行训练,得到训练后的时序数据生成对抗网络。通过训练后的时序数据生成对抗网络,生成合成的时序数据。本申请的方法,通过分别设置模式信息与时序数据生成对抗网络更好地捕捉序列相关性,利用负载信息,通过鲁棒性训练方法生成更加逼真且多样化的时序数据,解决了时序数据的生成结果不逼真且单一的技术问题。
-
公开(公告)号:CN113114744A
公开(公告)日:2021-07-13
申请号:CN202110342134.1
申请日:2021-03-30
Applicant: 清华大学
Abstract: 本发明提供一种数据湖架构下支持跨链交易的区块链系统,该系统包括:区块链公链、区块链数据湖应用平台及区块链私链/联盟链;其中:区块链数据湖应用平台包括基于数据湖的区块链预言机,基于数据湖的区块链预言机是区块链公链和区块链私链/联盟链的交互接口;基于数据湖的区块链预言机用于对区块链私链/联盟链部署到区块链数据湖应用平台的至少一个区块链应用进行格式化处理,以使得区块链公链访问区块链应用。本发明提供的数据湖架构下支持跨链交易的区块链系统,实现了公链上的区块链应用使用者或来自于私有链和联盟链的参与者可以无缝地在区块链数据湖应用平台上使用来自私有链和联盟链的区块链应用系统,从而更好地服务于区块链应用需求。
-
公开(公告)号:CN113094352A
公开(公告)日:2021-07-09
申请号:CN202110342171.2
申请日:2021-03-30
Applicant: 清华大学
Abstract: 本发明提供一种数据湖区块链数据库系统构建方法及装置,该方法包括:获取至少一个目标对象的第一类型数据及第二类型数据;根据第一类型数据获取交易账本数据,将交易账本数据存储到与目标对象对应的第一区块;对第二类型数据进行语义分析得到语义信息数据,将语义信息数据存储到与目标对象对应的第二区块;获取与第一区块相关的第二区块,将第一区块和与第一区块相关的第二区块中的数据进行融合并进行区块存储得到与目标对象对应的融合区块;为融合区块建立索引标签,从而构建得到数据湖区块链数据库系统。本发明提供的数据湖区块链数据库系统构建方法及装置,实现了基于区块链和数据湖的超融合分布式数据库系统的构建,可以满足各种处理需求。
-
公开(公告)号:CN112967775A
公开(公告)日:2021-06-15
申请号:CN202110332729.9
申请日:2021-03-26
Applicant: 清华大学
IPC: G16H10/60 , G06F21/62 , G06F16/901 , G06F16/27
Abstract: 本发明提供一种基于区块链的医疗健康数据可信共享方法及系统,该方法包括:获取医疗健康授权数据,并将所述医疗健康授权数据保存到本地服务器中;根据所述医疗健康授权数据,生成查询字符串和对应的哈希值,并将所述查询字符串和所述哈希值上传到区块链系统;根据目标查询字符串,将所述本地服务器中对应的目标医疗健康授权数据发送到查询终端,以供所述查询终端根据目标哈希值,对所述目标医疗健康授权数据进行验证,得到验证通过后的目标医疗健康授权数据。本发明通过使用区块链作为共识管理的基础,解决了医疗健康行业面临的医疗健康数据碎片化、医疗健康数据共享不充分以及医疗健康数据所有者隐私保护的问题。
-
公开(公告)号:CN110990579A
公开(公告)日:2020-04-10
申请号:CN201911044916.6
申请日:2019-10-30
Applicant: 清华大学
Abstract: 本发明实施例提供一种跨语言的医学知识图谱构建方法、装置与电子设备,其中所述方法包括:基于不同语言的医疗标准,通过将生成的跨语言且异构的数据集中的概念与关系进行融合,获取跨语言的概念知识图谱;通过对来自医院、开放数据集和社交数据集中所述不同语言的电子病历进行实体、事件和关系的抽取与融合,获取跨语言的实例知识图谱;将所述跨语言的概念知识图谱与所述跨语言的实例知识图谱相结合,形成跨语言的事实知识图谱。本发明实施例通过对多种不同语言的医疗标准和实例电子病历分别进行分析与信息提取,能够更加准确地对知识库中不同语言形成的知识图谱进行融合,从而得到更加准确、可靠的医学知识图谱。
-
公开(公告)号:CN106506542B
公开(公告)日:2019-11-22
申请号:CN201611173748.7
申请日:2016-12-16
Applicant: 清华大学
Abstract: 本发明提供一种基于云目录的统一云存储资源共享方法及装置。所述方法包括S1,基于资源共享协议,为资源提供者和资源管理者分配相应的权限;S2,获取待共享的非结构化资源,由具有权限的资源提供者和/或资源管理者进行审计;审计通过后对所述非结构化资源进行统一存储管理,以进行资源共享;S3,接收外部应用系统对特定资源的调用请求,基于所述统一存储管理获取所述特定资源并发送给所述外部应用系统。本发明基于资源共享协议对来自不同资源提供者的非结构化资源进行管理审计,提供一种灵活的资源共享撤销方式;通过统一的云目录编制,实现全局共享的资源定位,基于同步策略实现全局和局部共享资源的同步更新,有效的实现网络资源的共享服务。
-
公开(公告)号:CN105654402A
公开(公告)日:2016-06-08
申请号:CN201510999753.2
申请日:2015-12-25
Applicant: 清华大学
IPC: G06Q50/20
CPC classification number: G06Q50/205
Abstract: 本发明公开了一种基于时间维度和同类比较维度的学习能力判定方法和系统,该方法包括:S1:获取第N次考试中,具有第一知识点的每一试题的得分、总分和难度系数;S2:计算所述每一试题的得分与总分的第一比值,以及所述第一比值与所述难度系数的第二比值;S3:计算第N-1次考试第一知识点得分率与所有第二比值之和作为第N次考试的第一知识点得分率;S4:计算第N-1次考试的第一知识点理想得分率和所述每一试题的难度系数的倒数之和作为第N次考试的第一知识点理想得分率;S5:计算所述第N次考试的第一知识点得分率和所述第N次考试的第一知识点理想得分率之间的比值,以作为第N次考试的第一知识点的判定结果;其中,N为大于等于1的自然数。
-
公开(公告)号:CN103198150B
公开(公告)日:2016-04-20
申请号:CN201310146076.0
申请日:2013-04-24
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明公开了一种大数据索引方法及系统,涉及数据库索引技术领域。所述方法包括:将与数据中心服务器单元相连的所有终端设备产生的数据送入NoSQL数据库单元;建立pLSM索引引擎单元;用户执行索引操作。所述系统包括:数据中心服务器单元,用于接收与其连接的所有终端设备产生的数据并将接收到的数据送入NoSQL数据库单元;NoSQL数据库单元,用于存储数据中心服务器单元传来的数据;pLSM索引引擎单元,以COLA为外存组件,以Skip List为内存组件,并在内存中添加Delete Filter模块以支持外存组件上的删除操作。
-
公开(公告)号:CN105469145A
公开(公告)日:2016-04-06
申请号:CN201610028547.1
申请日:2016-01-15
Applicant: 清华大学
Abstract: 本发明涉及一种基于遗传粒子群算法的智能组卷方法,包括根据对应于试卷属性信息的约束条件生成每个约束条件对应的目标函数,根据每个约束条件的目标函数计算试卷的适应度函数;从题库中获取试题组成多份试卷,对每份试卷进行染色体编码,每份试卷对应一个染色体,染色体包含多段,每段染色体对应一类试题,每段染色体包含多个基因,每个基因个对应一道试题;通过粒子群算法得到初始种群;通过遗传算法对初始种群处理得到新的种群以输出其中的试卷。根据上述技术方案,可以以试卷的属性信息作为约束条件生成适应度函数,并根据适应度函数对试卷进行粒子群算法和遗传算法处理,从而得到满足用户需要的试卷。
-
-
-
-
-
-
-
-
-