-
公开(公告)号:CN113157860B
公开(公告)日:2022-03-11
申请号:CN202110370413.9
申请日:2021-04-07
Applicant: 国网山东省电力公司信息通信公司 , 北京大学 , 南瑞集团有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/289 , G06F40/242 , G06F40/216
Abstract: 本发明公布了一种基于小规模数据的电力设备检修知识图谱构建方法,包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修手册中的基础词汇爬取的百科知识;根据所述电力基础语料数据集和通用词典,统计词频构建电力领域主题词典;根据所述电力基础语料文档数据集,生成电力语义词向量转换模型,并根据所述转换模型计算所述检修手册中的基础词汇和所述百科知识的语义相似度;判断所述语义相似度是否大于阈值,如果是,则建立所述检修手册和所述百科知识之间的语义关联关系,构建知识图谱。本发明的方法可以满足故障原因查询、处理措施检索和相关知识参考的场景。
-
公开(公告)号:CN113157860A
公开(公告)日:2021-07-23
申请号:CN202110370413.9
申请日:2021-04-07
Applicant: 国网山东省电力公司信息通信公司 , 北京大学 , 南瑞集团有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/289 , G06F40/242 , G06F40/216
Abstract: 本发明公布了一种基于小规模数据的电力设备检修知识图谱构建方法,包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修手册中的基础词汇爬取的百科知识;根据所述电力基础语料数据集和通用词典,统计词频构建电力领域主题词典;根据所述电力基础语料文档数据集,生成电力语义词向量转换模型,并根据所述转换模型计算所述检修手册中的基础词汇和所述百科知识的语义相似度;判断所述语义相似度是否大于阈值,如果是,则建立所述检修手册和所述百科知识之间的语义关联关系,构建知识图谱。本发明的方法可以满足故障原因查询、处理措施检索和相关知识参考的场景。
-
公开(公告)号:CN117610537A
公开(公告)日:2024-02-27
申请号:CN202311413683.9
申请日:2023-10-27
Applicant: 国网山东省电力公司信息通信公司 , 北京大学
Abstract: 本发明涉及自然语言处理技术领域,提供了基于核范数和图神经网络的情感因果关系抽取方法及系统,包括:获取文本;基于所述文本,通过情感因果关系抽取模型,得到文本中的情感和原因句子对;所述情感因果关系抽取模型在提取到所述文本中每个子句的初始隐状态表示后,使用图注意力网络进行子句之间的交互,得到每个子句的隐状态表示,并基于所述隐状态表示,预测出情感子句和原因子句,将所有的情感子句和原因子句两两组合为情感和原因句子对,并预测每个情感和原因句子对的概率,抽取出概率满足条件的情感和原因句子对;其中,情感因果关系抽取模型通过二元交叉熵和核范数组成的损失函数进行训练。提高了因果关系抽取的效果。
-
公开(公告)号:CN117634466A
公开(公告)日:2024-03-01
申请号:CN202311220009.9
申请日:2023-09-20
Applicant: 国网山东省电力公司信息通信公司 , 国网山东省电力公司 , 北京大学
IPC: G06F40/211 , G06F40/289 , G06N3/048 , G06F18/241
Abstract: 本发明属于信息抽取领域,提供基于连接词增强的双流情感因果关系抽取方法及系统。其中,基于连接词增强的双流情感因果关系抽取方法包括对文本进行编码,得到文本中各个子句的隐状态表示;抽取出所有情感句和原因句;构建第一句对集合以及第二句对集合;得到各个集合对应的每个连接词及其隐状态表示;将第一句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第一隐状态表示;将第二子句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第二隐状态表示;根据句子对第一隐状态表示和句子对第二隐状态表示分别与句子对的映射关系,对应抽取出情感‑原因句子对以及原因‑情感句子对,确定出双流情感因果关系。
-
公开(公告)号:CN117332783A
公开(公告)日:2024-01-02
申请号:CN202311219833.2
申请日:2023-09-20
Applicant: 国网山东省电力公司信息通信公司 , 国网山东省电力公司 , 北京大学
IPC: G06F40/295 , G06F18/214 , G06F40/211
Abstract: 本发明公开一种基于重排序的命名实体识别方法、系统、设备及存储介质,涉及命名实体数据识别技术领域,包括:对文本训练集采用预构建的命名实体识别模型得到候选识别结果;对候选识别结果根据预设的标准答案计算F1分值,并按照F1分值对候选识别结果排序;对排序后的候选识别结果定义对比学习损失函数,以此对预构建的命名实体识别模型进行训练;对待处理文本采用训练后的命名实体识别模型,得到目标实体词的分类识别结果。提高命名实体识别效果。
-
公开(公告)号:CN113723074A
公开(公告)日:2021-11-30
申请号:CN202110993094.7
申请日:2021-08-27
Applicant: 国网山东省电力公司信息通信公司
IPC: G06F40/211 , G06F40/295 , G06N3/04
Abstract: 本发明提供了一种基于证据检验增强的文档级关系抽取方法,该方法构建基于证据检验增强的文档级关系抽取模型,模型包括关系抽取模块和证据验证模块;通过联合训练的方式,使证据验证模块引导关系抽取模块关注对于关系判断更为重要的信息;由于采用了证据验证的方式利用证据信息,避免了直接使用证据进行关系抽取可能产生的错误传播问题,从而提高了文档级关系抽取的准确率。
-
公开(公告)号:CN113723074B
公开(公告)日:2023-04-18
申请号:CN202110993094.7
申请日:2021-08-27
Applicant: 国网山东省电力公司信息通信公司
IPC: G06F40/211 , G06F40/295 , G06N3/045
Abstract: 本发明提供了一种基于证据检验增强的文档级关系抽取方法,该方法构建基于证据检验增强的文档级关系抽取模型,模型包括关系抽取模块和证据验证模块;通过联合训练的方式,使证据验证模块引导关系抽取模块关注对于关系判断更为重要的信息;由于采用了证据验证的方式利用证据信息,避免了直接使用证据进行关系抽取可能产生的错误传播问题,从而提高了文档级关系抽取的准确率。
-
公开(公告)号:CN118378696A
公开(公告)日:2024-07-23
申请号:CN202410526142.5
申请日:2024-04-29
Applicant: 北京大学
Abstract: 本发明提供了一种基于PAMS编码的运动行为知识表示方法,属于计算机视觉领域。本发明通过三维人体姿态提取模型从视频中提取出人体各个关节点的绝对三维坐标和局部旋转信息,对视频的每帧,根据关节点三维绝对坐标,建立可变人体坐标系,建立人体运动学树,根据PAMS编码对人体各关节进行分级,计算子关节相对于父关节的旋转角,将每帧运动表示为包括人体坐标系原点在全局坐标系中的三维绝对坐标、人体坐标系各轴在全局坐标系中的方向和各关节旋转角表示的各关节相对旋转运动。本发明运动行为表示能完备地反应人体刚体运动的信息,易于理解和分析,有效反应运动之间的相关性与差异,为基于运动表示进行信息抽取、构建健身知识图谱奠定基础。
-
公开(公告)号:CN112989796B
公开(公告)日:2023-09-22
申请号:CN202110259151.9
申请日:2021-03-10
Applicant: 北京大学
IPC: G06F40/211 , G06F40/295 , G06F40/284
Abstract: 本发明公布了一种基于句法指导的文本命名实体信息识别方法,构建基于句法指导的文本命名实体信息识别模型,模型包括基于Transformer模型的编码层、句法指导自注意力层、表示融合层、条件随机场CRF解码层;仅需建模依存句法树结构而无需引入依存关系类型,通过采用注意力机制,采用抽取准确率高、易于获取词级别的词性信息弥补不引入依存关系类型带来的信息缺失。采用本发明方法能够避免自然语言处理中信息抽取中抽取出的依存关系类型的错误传递问题。
-
公开(公告)号:CN116911372A
公开(公告)日:2023-10-20
申请号:CN202310991138.1
申请日:2023-08-07
Abstract: 本发明提供了一种基于通用子网络剪枝的预训练语言模型持续学习方法,该方法通过通用子网络剪枝,将网络中的冗余神经元置零,从而对原有知识进行压缩,再对置零的空闲神经元在新的专业领域数据上进行预训练更新,进行领域协同继续预训练,在保持模型大小不变的情况下,增加模型中所包含的领域知识,且不同领域知识之间可以协同工作,达到知识迁移的效果。
-
-
-
-
-
-
-
-
-