-
公开(公告)号:CN113537372A
公开(公告)日:2021-10-22
申请号:CN202110837807.0
申请日:2021-07-23
申请人: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司营销服务中心 , 国家电网有限公司
IPC分类号: G06K9/62 , G06F40/295
摘要: 本申请是关于一种地址识别方法、装置、设备及存储介质,具体涉及人工智能领域。所述方法包括:获取目标文本中各个分段文本对应的特征向量;分段文本包含至少一个单字;根据各个分段文本分别对应的特征向量,获取各个分段文本分别对应的地址类别;将至少两种地址类别分别对应的分段文本,按照地址类别进行排序并连接,获得目标文本中的地址文本。上述方案将目标文本拆分为多个部分的信息,并对各个部分都进行类别识别,当识别完成后,再根据地址类别,将与地址文本有关的分段文本组合起来,从而实现在语序规则较为自由的自然语言中,也可以准确地判断出地址文本,提高了地址文本的获取准确性。
-
公开(公告)号:CN113537372B
公开(公告)日:2024-01-23
申请号:CN202110837807.0
申请日:2021-07-23
申请人: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司营销服务中心 , 国家电网有限公司
IPC分类号: G06F18/2431 , G06F18/214 , G06F40/295 , G06F16/332 , G06F16/35 , G06F16/387 , G06N3/0442 , G06N3/049 , G06N3/084
摘要: 本申请是关于一种地址识别方法、装置、设备及存储介质,具体涉及人工智能领域。所述方法包括:获取目标文本中各个分段文本对应的特征向量;分段文本包含至少一个单字;根据各个分段文本分别对应的特征向量,获取各个分段文本分别对应的地址类别;将至少两种地址类别分别对应的分段文本,按照地址类别进行排序并连接,获得目标文本中的地址文本。上述方案将目标文本拆分为多个部分的信息,并对各个部分都进行类别识别,当识别完成后,再根据地址类别,将与地址文本有关的分段文本组合起来,从而实现在语序规则较为自由的自然语言中,也可以准确地判断出地址文本,提高了地址文本的获取准确性。
-
公开(公告)号:CN114757191B
公开(公告)日:2024-09-17
申请号:CN202210319638.6
申请日:2022-03-29
申请人: 国网江苏省电力有限公司营销服务中心 , 国网江苏省电力有限公司
IPC分类号: G06F40/295 , G06F18/10 , G06F18/213 , G06F18/25 , G06N3/0455 , G06N3/0442 , G06N3/08
摘要: 本发明提出一种基于深度学习的电力舆情领域命名实体识别方法与系统,整理电力舆情的文本数据,标记出所述文本数据中的实体词;将数据预处理标注为位置索引标注序列;对预处理后的数据进行特征提取;根据数据标注结果抽取新的电力舆情文本数据中的实体词。本发明的位置索引标注方式很好地解决了实体之间交叉包含的问题;结合文本中每个字的五笔顺序与偏旁部首的特征,通过BiLSTM模型进行特征的提取,与BERT预训练模型得到的BERT特征相融合,增强了特征向量中语义的表征,可以更好、更准确的抽取文本包含的实体;通过使用CRF层对得到的位置索引序列标签进行约束,大大减少不规则标签出现的概率,从而可以获得较好的实体标签序列。
-
公开(公告)号:CN114757191A9
公开(公告)日:2022-11-01
申请号:CN202210319638.6
申请日:2022-03-29
申请人: 国网江苏省电力有限公司营销服务中心 , 国网江苏省电力有限公司
IPC分类号: G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提出一种基于深度学习的电力舆情领域命名实体识别方法与系统,整理电力舆情的文本数据,标记出所述文本数据中的实体词;将数据预处理标注为位置索引标注序列;对预处理后的数据进行特征提取;根据数据标注结果抽取新的电力舆情文本数据中的实体词。本发明的位置索引标注方式很好地解决了实体之间交叉包含的问题;结合文本中每个字的五笔顺序与偏旁部首的特征,通过BiLSTM模型进行特征的提取,与BERT预训练模型得到的BERT特征相融合,增强了特征向量中语义的表征,可以更好、更准确的抽取文本包含的实体;通过使用CRF层对得到的位置索引序列标签进行约束,大大减少不规则标签出现的概率,从而可以获得较好的实体标签序列。
-
公开(公告)号:CN114757191A
公开(公告)日:2022-07-15
申请号:CN202210319638.6
申请日:2022-03-29
申请人: 国网江苏省电力有限公司营销服务中心 , 国网江苏省电力有限公司
IPC分类号: G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提出一种基于深度学习的电力舆情领域命名实体识别方法与系统,整理电力舆情的文本数据,标记出所述文本数据中的实体词;将数据预处理标注为位置索引标注序列;对预处理后的数据进行特征提取;根据数据标注结果抽取新的电力舆情文本数据中的实体词。本发明的位置索引标注方式很好地解决了实体之间交叉包含的问题;结合文本中每个字的五笔顺序与偏旁部首的特征,通过BiLSTM模型进行特征的提取,与BERT预训练模型得到的BERT特征相融合,增强了特征向量中语义的表征,可以更好、更准确的抽取文本包含的实体;通过使用CRF层对得到的位置索引序列标签进行约束,大大减少不规则标签出现的概率,从而可以获得较好的实体标签序列。
-
公开(公告)号:CN117609278A
公开(公告)日:2024-02-27
申请号:CN202311774783.4
申请日:2023-12-21
申请人: 国网智能电网研究院有限公司 , 国家电网有限公司大数据中心 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
IPC分类号: G06F16/242 , G06F16/23 , G06F16/215 , G06F18/22 , G06N3/0499 , G06N3/09 , G06Q50/06
摘要: 本发明涉及数据识别技术领域,公开了基于深度度量学习的多模态电力数据管理方法与系统,本发明提供的方法包括:获取多模态电力数据库;获取预定电力数据模态属性集;基于预设电力数据模态属性对多模态电力数据库进行特征识别,获得多个数据模态特征;基于多个数据模态特征进行深度度量学习,获得多个深度模态特征;基于预设电力数据模态属性,根据多个深度模态特征进行深度学习,构建电力数据多模态搜索模型;根据电力数据多模态搜索模型对多模态电力数据库进行数据管理。通过本发明提供的方法实现多模态数据的统一管理,提高电力数据的多模态搜索能力和多模态相似匹配准确性,提高电力数据的多模态搜索能力,以及多模态相似匹配准确性。
-
公开(公告)号:CN118428365A
公开(公告)日:2024-08-02
申请号:CN202410475675.5
申请日:2024-04-19
申请人: 国网智能电网研究院有限公司 , 国网山东省电力公司电力科学研究院 , 国家电网有限公司
IPC分类号: G06F40/295 , G06V10/40 , G06V10/44 , G06F18/213 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明涉及多模态信息抽取技术领域,具体提供了一种基于深度神经网络的电力设备命名实体识别方法及装置,包括:获取电力设备新闻报道的文本数据和图像数据;将所述文本数据作为预先构建的多模态命名实体识别模型中的BERT模型的输入,将所述图像数据作为预先构建的多模态命名实体识别模型中的分层视觉特征提取模型的输入,得到预先构建的多模态命名实体识别模型输出的电力设备新闻报道的命名实体识别结果。本发明提供的技术方案,能够提高电力设备新闻报道信息抽取的准确性,实现将非结构化文本数据准确转化为知识,进而帮助完善智慧电网建设,支撑电力设备态势感知与舆情风险预警等监管工作。
-
公开(公告)号:CN118709761A
公开(公告)日:2024-09-27
申请号:CN202410829537.2
申请日:2024-06-25
申请人: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC分类号: G06N5/022 , G06N5/04 , G06N5/045 , G06N5/01 , G06F18/241 , G06F18/243
摘要: 本发明公开了一种基于大模型的电力标签知识分类方法及系统,涉及数据处理领域。所述方法包括:收集电力源端数据,确定有效源端数据;确定层次标签图谱,监督训练开源大模型;引入无标签标准语义库确定初始化分类模型;读取下游任务特征,进行有监督调整,确定分类大模型;接收预分类任务,进行分类决策,确定分类结果;若所述预分类任务的分类结果为空置,接收新增缺陷类型,执行类增量学习。采用本方法解决了现有技术中电力知识标签由于具有高度专业性,导致标签类别数据稀少,可解释性差的技术问题,实现了引入领域知识来增强模型的可解释性,达到对标准知识的标签分类,并用于预测和推断新的样本数据的技术效果。
-
公开(公告)号:CN118626594A
公开(公告)日:2024-09-10
申请号:CN202410829538.7
申请日:2024-06-25
申请人: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F18/214 , G06N5/022 , G06N3/0455 , G06N3/0499 , G06N3/084 , G06Q50/06
摘要: 本发明公开了电力标准知识的标签自动化标注方法、系统及存储介质,涉及自动化标注技术领域,包括:采集源电力标准知识数据集,进行预处理,获得标准电力知识数据集,进行文本扩充,生成电力标准知识文本描述数据集;获取文本关联筛选规则,对电力标准知识文本描述数据集进行筛选,得到电力标准知识文本扩充数据集;对前述数据集进行数据标注,获得电力标准知识文本标注数据集;对电力标准知识文本标注数据集进行修正,获得电力标准知识文本标注样本集,进行训练优化,获得电力标准知识标注模型进行电力标准知识标签自动化标注。本发明解决现有技术存在手动标注很难保证标注一致性和准确性的技术问题,达到提高自动化标注效率和质量的技术效果。
-
公开(公告)号:CN118607623A
公开(公告)日:2024-09-06
申请号:CN202410698148.0
申请日:2024-05-31
申请人: 国网智能电网研究院有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司
摘要: 本发明提出了一种基于自然语言处理技术的知识图谱自动更新方法,该基于自然语言处理技术的知识图谱自动更新方法通过四个关键步骤实现:建立语义解析模型,利用知识图谱表示技术映射更新请求,智能化更新策略调整更新方式,以及通过自动化测试和验证系统进行全面验证。此外,方法还应用机器学习算法优化更新策略,以应对图谱规模扩大所带来的挑战。该方案的创新在于智能化的更新流程,利用人工智能和自然语言处理技术实现自动化更新和修正,从而降低人工干预和错误风险,提高效率和准确性,简化图谱维护过程。
-
-
-
-
-
-
-
-
-