-
公开(公告)号:CN118194171A
公开(公告)日:2024-06-14
申请号:CN202410155790.4
申请日:2024-02-04
申请人: 国网智能电网研究院有限公司 , 国家电网有限公司大数据中心 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
IPC分类号: G06F18/2431 , G06F18/25 , G06Q50/06
摘要: 本发明提供了基于元学习的多模态电力样本分类方法,涉及新一代信息技术领域,包括:获取待分类的多模态数据;基于预先训练好的电力样本分类学习器对所述待分类的多模态数据进行分类;其中,所述电力样本分类学习器是遍历拟合任务类别标签对多组多模态数据进行关联分析得到关联电力节点和关联模态数据,基于所述关联电力节点和关联模态数据对电力样本分类学习器进行训练,结合元学习器更新电力样本分类学习器的参数得到。解决现有技术中由于大模型的训练收敛速度较慢,训练数据的需求量较多,导致存在电力样本分类模型训练效率较差的技术问题。
-
公开(公告)号:CN117609278A
公开(公告)日:2024-02-27
申请号:CN202311774783.4
申请日:2023-12-21
申请人: 国网智能电网研究院有限公司 , 国家电网有限公司大数据中心 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
IPC分类号: G06F16/242 , G06F16/23 , G06F16/215 , G06F18/22 , G06N3/0499 , G06N3/09 , G06Q50/06
摘要: 本发明涉及数据识别技术领域,公开了基于深度度量学习的多模态电力数据管理方法与系统,本发明提供的方法包括:获取多模态电力数据库;获取预定电力数据模态属性集;基于预设电力数据模态属性对多模态电力数据库进行特征识别,获得多个数据模态特征;基于多个数据模态特征进行深度度量学习,获得多个深度模态特征;基于预设电力数据模态属性,根据多个深度模态特征进行深度学习,构建电力数据多模态搜索模型;根据电力数据多模态搜索模型对多模态电力数据库进行数据管理。通过本发明提供的方法实现多模态数据的统一管理,提高电力数据的多模态搜索能力和多模态相似匹配准确性,提高电力数据的多模态搜索能力,以及多模态相似匹配准确性。
-
公开(公告)号:CN111651577B
公开(公告)日:2023-04-21
申请号:CN202010485925.5
申请日:2020-06-01
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司
IPC分类号: G06F16/332 , G06F16/532 , G06F16/632 , G06F16/732 , G06F18/2415
摘要: 本发明公开了一种跨媒体数据关联分析模型训练、数据关联分析方法及系统。在判别模型层的无监督哈希学习中将潜在的多模态数据流形元组考虑在内,充分挖掘了跨模态数据间的关联性,在生成模型中去拟合这种流形分布,生成拟合后的流形元组供判别器判断。同时,利用判别模型层、生成模型层组成的对抗网络,结合强化学习层对解决对抗网络面对的离散数据梯度传播问题;通过对抗网络提高了判别器判断多模态数据元组与用户查询请求相关性的能力,显著提高了预测与用户查询请求的关联数据的能力,对于在线用户查询请求的检索系统可以显著提高其检索速度。
-
公开(公告)号:CN111611792B
公开(公告)日:2023-05-23
申请号:CN202010439068.5
申请日:2020-05-21
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司
IPC分类号: G06F40/232 , G06F40/295 , G10L15/26
摘要: 本发明提供了一种语音转录文本的实体纠错方法及系统,该方法包括:对从目标语音转录文本中提取的实体词汇进行拼音标注;利用标注的拼音及基于拼音相似度的编辑距离对实体词汇进行聚类,生成聚类结果;将聚类结果中在同一类别出现频率最高的实体词汇确定为标准实体词汇,并将该类别中其他实体词汇替换为标准实体词汇。通过利用基于拼音相似度的编辑距离对实体词汇进行聚类,从而将拼音相似度作为参考因素加入编辑距离算法中,加强了对同义词及音词的辨别能力,使得聚类结果更加符合语音转录文本的实际情况,根据该聚类结果用同一类别中出现频率最高的实体词汇替换其他实体词汇,实现了对语音转录文本的纠错,进而提高了最终语音转录文本的准确性。
-
公开(公告)号:CN111651641A
公开(公告)日:2020-09-11
申请号:CN202010481878.7
申请日:2020-05-29
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司
IPC分类号: G06F16/901 , G06F16/9032 , G16H50/20
摘要: 本发明提供一种图查询方法、装置及存储介质,其中,方法包括:获取待查询子图;根据所述待查询子图在原始图对应的摘要图中进行查询,得到目标查询子图,所述原始图表征包含待查询子图对应的图信息的图,所述原始图由边对具有属性关系的节点进行连接得到,所述原始图中的边标注有连接的两个节点间的属性关系,所述摘要图表征对所述原始图进行节点合并后的图;根据所述待查询子图和所述目标查询子图在得到所述目标查询子图的原始图中进行查询,得到图查询结果。通过实施本发明,可以更好地适应当前随着时代发展所带来的越来越大的图规模,并且查询效率高效,返回结果准确性高,能够满足在海量图数据中快速高效查询子图的要求。
-
公开(公告)号:CN111651577A
公开(公告)日:2020-09-11
申请号:CN202010485925.5
申请日:2020-06-01
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司
IPC分类号: G06F16/332 , G06F16/532 , G06F16/632 , G06F16/732 , G06K9/62
摘要: 本发明公开了一种跨媒体数据关联分析模型训练、数据关联分析方法及系统。在判别模型层的无监督哈希学习中将潜在的多模态数据流形元组考虑在内,充分挖掘了跨模态数据间的关联性,在生成模型中去拟合这种流形分布,生成拟合后的流形元组供判别器判断。同时,利用判别模型层、生成模型层组成的对抗网络,结合强化学习层对解决对抗网络面对的离散数据梯度传播问题;通过对抗网络提高了判别器判断多模态数据元组与用户查询请求相关性的能力,显著提高了预测与用户查询请求的关联数据的能力,对于在线用户查询请求的检索系统可以显著提高其检索速度。
-
公开(公告)号:CN111651641B
公开(公告)日:2023-08-29
申请号:CN202010481878.7
申请日:2020-05-29
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司
IPC分类号: G06F16/901 , G06F16/9032 , G16H50/20
摘要: 本发明提供一种图查询方法、装置及存储介质,其中,方法包括:获取待查询子图;根据所述待查询子图在原始图对应的摘要图中进行查询,得到目标查询子图,所述原始图表征包含待查询子图对应的图信息的图,所述原始图由边对具有属性关系的节点进行连接得到,所述原始图中的边标注有连接的两个节点间的属性关系,所述摘要图表征对所述原始图进行节点合并后的图;根据所述待查询子图和所述目标查询子图在得到所述目标查询子图的原始图中进行查询,得到图查询结果。通过实施本发明,可以更好地适应当前随着时代发展所带来的越来越大的图规模,并且查询效率高效,返回结果准确性高,能够满足在海量图数据中快速高效查询子图的要求。
-
公开(公告)号:CN111553442B
公开(公告)日:2024-03-12
申请号:CN202010397834.6
申请日:2020-05-12
申请人: 国网智能电网研究院有限公司 , 国家电网有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司
IPC分类号: G06F18/241 , G06F18/214
摘要: 本发明公开了一种分类器链标签序列的优化方法及系统,方法包括:获取待分类的输入样本;利用分类器链模型识别输入样本,生成样本标签集合,组成分类器链;利用共现分析获取样本标签集合对应的共现矩阵;利用共现矩阵的多个共现分支组成共现向量;根据共现向量获取分类器链的起始分支,基于贪心策略生成分类器链标签的顺序。本发明提出了分类器链对应的标签顺序生成策略,通过加快算法生成标签序列,耗时少,得到的分类器链的标签序列准确率高,实现了对原有分类器链模型的性能优化。
-
公开(公告)号:CN112000611B
公开(公告)日:2023-08-01
申请号:CN202010859145.2
申请日:2020-08-24
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司 , 国家电网有限公司
摘要: 本发明涉及图数据技术领域,具体涉及图数据划分方法、处理方法及电子设备。划分方法包括获取目标图数据、目标图数据的大小以及图数据处理器的内存大小;利用目标图数据的大小以及图数据处理器的内存大小,确定目标图数据对应的目标子图的数量;基于目标子图的数量,对目标图数据进行划分;根据各个目标子图的大小以及图数据处理器的内存大小,调整目标子图的数量;基于调整后的目标子图的数量对目标图数据进行划分。利用划分后得到的目标子图的大小与图数据处理器的内存大小,调整实际划分的目标子图的数量;通过平衡每个目标子图的大小,确定目标子图的数量,使得划分得到的目标子图均能够被图数据处理器处理,提高了后续图数据处理的效率。
-
公开(公告)号:CN112000611A
公开(公告)日:2020-11-27
申请号:CN202010859145.2
申请日:2020-08-24
申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司 , 国家电网有限公司
摘要: 本发明涉及图数据技术领域,具体涉及图数据划分方法、处理方法及电子设备。划分方法包括获取目标图数据、目标图数据的大小以及图数据处理器的内存大小;利用目标图数据的大小以及图数据处理器的内存大小,确定目标图数据对应的目标子图的数量;基于目标子图的数量,对目标图数据进行划分;根据各个目标子图的大小以及图数据处理器的内存大小,调整目标子图的数量;基于调整后的目标子图的数量对目标图数据进行划分。利用划分后得到的目标子图的大小与图数据处理器的内存大小,调整实际划分的目标子图的数量;通过平衡每个目标子图的大小,确定目标子图的数量,使得划分得到的目标子图均能够被图数据处理器处理,提高了后续图数据处理的效率。
-
-
-
-
-
-
-
-
-