-
公开(公告)号:CN120066802A
公开(公告)日:2025-05-30
申请号:CN202510541168.1
申请日:2025-04-28
Applicant: 山东大学
IPC: G06F9/50 , G06N3/045 , G06F18/214
Abstract: 本申请提供了一种基于序列依赖层级传播机制的大模型优化方法及系统,涉及大语言模型技术领域,大模型包括表示学习模块和下游任务模块,表示学习模块的具体步骤为:对输入的文本进行自然语言处理,得到词向量序列;基于序列依赖层级传播机制,将词向量序列进行均匀分块,分别使用片段间与片段内的注意力机制,生成Key矩阵和Value矩阵;利用Key矩阵和Value矩阵,进行Transformer的注意力机制计算,得到最终的序列表示,作为下游任务模块的输入。本发明引入序列依赖层级传播机制,将序列划分为多个块,并在这些块内和块间有效学习序列依赖关系,从而显著降低了传统自注意力机制的计算复杂度,并有效减少了内存占用。
-
公开(公告)号:CN119884626A
公开(公告)日:2025-04-25
申请号:CN202510368683.4
申请日:2025-03-27
Applicant: 山东大学
IPC: G06F18/15 , G06F18/214 , G06N3/0475 , G06N3/045 , G06N3/048 , G06N3/094 , G06N3/084
Abstract: 本发明公开了一种基于时间感知扩散的电力数据缺失值补全方法及系统,属于电力数据治理技术领域,该方法包括:获取电力数据并进行预处理,随机掩码一部分电力数据代表缺失值;采样噪音数据,将噪音数据加入到掩码部分的电力数据上,并与未掩码的原始电力数据一同输入预先构建好的基于时间感知扩散的生成对抗模型中进行训练,得到预测噪音数据;在加入噪音数据的掩码部分的电力数据中去除预测噪音数据,得到电力数据缺失值的补全结果。本发明基于分数的扩散模型强大的生成效果,保证电力数据的生成质量;提出的基于时间感知扩散的生成对抗模型针对电力数据的连续缺失特性,将时间间隔作为额外输入,提高补全的准确性。
-
公开(公告)号:CN105184452B
公开(公告)日:2018-11-13
申请号:CN201510501437.8
申请日:2015-08-14
Applicant: 山东大学 , 山大地纬软件股份有限公司
Abstract: 本发明公开了一种适用于用电信息大数据计算的MapReduce作业依赖控制方法,包括:获取计算服务所需的业务数据,形成数据文件;主节点动态分发计算服务,从节点负责MapReduce计算服务的执行;从节点读取计算服务所需要的用电信息数据;对作业间的数据依赖关系进行管理;作业依赖控制引擎按照指定的作业依赖关系,对作业进行执行和提交;数据处理单元完成用电信息大数据计算,得到业务数据,并将数据回写至应用系统的业务数据库。解决复杂用电大数据计算服务的作业依赖关系,满足在较短时间内完成用电信息大数据复杂计算的业务需求。能够及时高效地处理海量用电信息数据的复杂计算,为营销业务的开展提供可靠的数据支撑。
-
公开(公告)号:CN105184452A
公开(公告)日:2015-12-23
申请号:CN201510501437.8
申请日:2015-08-14
Applicant: 山东大学 , 山大地纬软件股份有限公司
Abstract: 本发明公开了一种适用于用电信息大数据计算的MapReduce作业依赖控制方法,包括:获取计算服务所需的业务数据,形成数据文件;主节点动态分发计算服务,从节点负责MapReduce计算服务的执行;从节点读取计算服务所需要的用电信息数据;对作业间的数据依赖关系进行管理;作业依赖控制引擎按照指定的作业依赖关系,对作业进行执行和提交;数据处理单元完成用电信息大数据计算,得到业务数据,并将数据回写至应用系统的业务数据库。解决复杂用电大数据计算服务的作业依赖关系,满足在较短时间内完成用电信息大数据复杂计算的业务需求。能够及时高效地处理海量用电信息数据的复杂计算,为营销业务的开展提供可靠的数据支撑。
-
公开(公告)号:CN105183371A
公开(公告)日:2015-12-23
申请号:CN201510502666.1
申请日:2015-08-14
Applicant: 山东大学 , 山大地纬软件股份有限公司
CPC classification number: Y02D10/45
Abstract: 本发明公开了基于迁移均衡策略的用电信息分布式文件存储方法与装置,数据采集模块将原始数据帧进行解析得到原始数据,以文件形式存入本地磁盘模块,将原始数据帧上传至关系数据库和MongoDB数据库;检测本地磁盘模块中文件的信息,选择是否将文件上传至数据存储模块;MongoDB数据库采用迁移均衡策略通过路由在mongos获取分片所在的节点负载,从数据量和负载两方面实现均衡;大数据管理引擎定时监测未进行数据转存计算的文件信息,将文件从MongoDB数据库提取,以时间为标签;将从MongoDB数据库提取到的文件数据转化为数据字符流,计算得到业务数据;最后进行数据持久化。实现用电信息大数据的高效存储,满足用电信息采集系统用电大数据存储容量、存储速率需求。
-
公开(公告)号:CN120068009A
公开(公告)日:2025-05-30
申请号:CN202510553653.0
申请日:2025-04-29
Applicant: 山东大学
Abstract: 本发明公开一种多模态特征融合方法、系统、设备、介质及程序产品,涉及特征融合技术领域,包括:对多模态数据进行编码和语义增强得到多模态原始特征和多模态语义特征;计算原始特征相似度矩阵和语义特征相似度矩阵,且进行稀疏化处理和归一化处理;根据归一化后的原始特征相似度矩阵和语义特征相似度矩阵,聚合原始特征和语义特征,根据用户与商品的交互得到商品集合ID嵌入特征;从商品集合ID嵌入特征中提取模态偏好,结合商品集合原始特征和商品集合语义特征,得到整体的多模态原始特征、多模态语义特征和ID特征,将三者拼接得到多模态融合特征。解决多模态数据的信息冗余和冲突问题,捕捉不同模态特征间的关系,提高融合效果。
-
公开(公告)号:CN105303123A
公开(公告)日:2016-02-03
申请号:CN201510734401.4
申请日:2015-11-02
Applicant: 山东大学 , 山大地纬软件股份有限公司
IPC: G06F21/62
CPC classification number: G06F21/6245
Abstract: 本发明公开了一种基于分块混淆的动态数据隐私保护系统及方法;通过可信第三方对新插入和修改的数据进行缓存并在满足条件时将数据进行分组和存储;通过保留关键分片来保证删除操作中被删数据和剩余数据的隐私安全;通过伪造数据回收机制实现存储资源消耗的降低和应用性能的优化。实验证明,提出的动态数据隐私保护机制具有较好的可行性和实用性。
-
-
-
-
-
-