-
公开(公告)号:CN119597920A
公开(公告)日:2025-03-11
申请号:CN202411680942.9
申请日:2024-11-22
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/35 , G06F40/284 , G06F40/242 , G06N3/0442 , G06N3/08
Abstract: 本发明实施例公开了一种基于ERNIE模型的敏感信息识别方法,所述方法包括:获取电网敏感文本数据集并对其进行分词处理,确定词表;利用ERNIE模型对所述电网敏感文本数据集进行处理,获取每个句子对应的动态向量和与所述动态向量相匹配的标签;获取所述每个句子的上下文语义信息,根据所述词表中各分词对句子敏感分类的重要性,确定其对应的权重;根据标签之间的依赖关系和各分词权重,确定电网敏感文本数据集对应的标签序列;当所述标签序列对应的ERNIE模型目标函数满足阈值条件时,则ERNIE模型训练完成;根据训练完成后的ERNIE模型确定敏感信息的识别结果。本发明通过ERNIE模型能够显著提高电网领域专业数据中敏感信息识别的准确性和效率。
-
公开(公告)号:CN119493855A
公开(公告)日:2025-02-21
申请号:CN202411626134.4
申请日:2024-11-14
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/334 , G06F16/36 , G06N5/04 , G06F18/24 , G06F18/22
Abstract: 本发明公开了一种电力领域热点话题发现方法、装置、介质和设备,首先通过标签标记文本来区分电力领域的子领域,然后通过自指导生成提问指令,构建指令数据库。接着,基于电力领域的语料库对初始大语言模型进行增量训练,并使用指令数据库进行微调,从而获得适应电力领域的目标大语言模型。最后,利用知识图谱检索最新的标签文本,将其输入模型以生成热点话题。可以理解的是,本方法通过增量训练和微调,使大语言模型在电力领域内具备更强的理解和生成能力,解决了“幻觉”问题。同时通过实时更新的数据、标签和知识图谱,系统能够提供更加精准、时效性高的热点话题,确保生成内容的专业性和准确性。
-
公开(公告)号:CN119478602A
公开(公告)日:2025-02-18
申请号:CN202411512207.7
申请日:2024-10-28
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06V10/80 , G06V10/77 , G06V10/44 , G06V10/52 , G06V10/42 , G06V10/764 , G06V10/75 , G06V10/82 , G06V10/25 , G06V10/26 , G06V20/70 , G06V20/13 , G06V10/774 , G06V10/776 , G06N3/0464 , G06N3/0455 , G06N3/0985 , G06N3/048
Abstract: 本发明公开了一种输电线路隐患自动提取方法和装置,其方法包括:获取遥感影像;对遥感影像进行预处理,基于预处理后的遥感影像,构建样本数据集;利用样本数据集对遥感解译模型训练和验证,得到训练好的遥感解译模型;采用Swin Transformer编码器模块对遥感影像进行特征提取,生成编码特征图;采用CBAM注意力机制模块和PPM模块对第四编码特征图进行特征加权和融合,生成第五编码特征图;采用FPN模块对第一编码特征图、第二编码特征图、第三编码特征图和第五编码特征图进行特征提取和特征融合,输出目标提取图像。通过本方法对输电线路隐患进行提取,识别精度高且效率高。
-
公开(公告)号:CN119089896A
公开(公告)日:2024-12-06
申请号:CN202411127633.9
申请日:2024-08-16
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F40/242 , G06Q50/06 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/084 , G06F18/25 , G06F18/24
Abstract: 本发明公开了一种电网领域关键词抽取方法、训练方法、介质和设备,在训练阶段先获取电网领域词典并构建电网领域伪数据集,再将伪数据集输入预训练语言模型,进行初步调整,获得调整后的电网领域预训练模型。接着获取电网领域的第一文本数据集,对其进行预处理,得到目标文本数据集,最后将目标文本数据集输入调整后的预训练模型,进行二次调整,获得最终的电网领域关键词抽取模型。在应用阶段,将待抽取数据集输入训练好的电网领域关键词抽取模型,获取目标标签序列,并基于目标标签序列从待抽取数据集中抽取电网领域关键词,得到关键词列表。本发明提供了一种高效、精准的电网领域关键词抽取解决方案。
-
公开(公告)号:CN117252722A
公开(公告)日:2023-12-19
申请号:CN202311074925.6
申请日:2023-08-24
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06Q50/00 , G06F16/901
Abstract: 本发明实施例公开了一种用于网络社区的检测方法,该方法包括下列步骤:先获取预设网络中所有节点的极限派系,并构建第一极限派系集合;再将所述第一极限派系集合中的派系按照节点数量从大到小进行排序;选择前K个派系作为K个网络社区,其中K为预设的社区数量;最后在剩余N‑K个派系中,获取前K个派系中不存在的节点,判断所述节点所在派系与前K个派系的公共点数量,确定网络社区,其中N为第一极限派系集合中派系的数量,这种方法能够基于网络的派系,在复杂网络中快速准确的确定社区。
-
公开(公告)号:CN117171291A
公开(公告)日:2023-12-05
申请号:CN202311099681.7
申请日:2023-08-29
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/31 , G06F16/332 , G06F16/35 , G06F40/279 , G06F40/186 , G06F40/126 , G06F18/2415 , G06N3/0499
Abstract: 本发明公开了一种基于提示学习的实体关系抽取方法、装置、介质和设备,首先构建包含待抽取文本和实体问题的实体抽取模板,及构建包含待抽取文本和关系类别的关系抽取模板关系问题抽取模板;然后将实体抽取模板与文本进行组合,通过对句子特征进行编码,并基于提示学习进行调优,抽取实体集合。最后,将前一步抽取的实体集合加入关系问题抽取模板并与文本进行组合,通过关系问题抽取模板抽取待抽取文本中的预设关系及包含预设关系的实体作为三元组。本发明通过转换任务的形式,充分利用问答领域预训练模型,通过构建问题模板来对模型进行信息提示,可以有效减少对标注数据的依赖,实现少样本下的实体和关系抽取具有良好的实用性。
-
公开(公告)号:CN117251580A
公开(公告)日:2023-12-19
申请号:CN202311203409.9
申请日:2023-09-18
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/36 , G06F16/33 , G06F16/9535 , G06N3/08
Abstract: 本申请实施例公开了电力项目的话题推荐模型的训练方法及相关设备,利用协作知识图谱损失函数和预设的深度学习算法训练预设的话题推荐模型,使话题推荐系统所推荐的知识文档与用户具备较高的关联性。同时协作知识图谱是一个包含丰富内容的知识文档的结构化数据图,能够完整的记录与预设电力项目相关的知识文档,使训练后的话题推荐模型所推荐的知识文档更为全面。
-
-
-
-
-
-