-
公开(公告)号:CN113204649A
公开(公告)日:2021-08-03
申请号:CN202110513432.2
申请日:2021-05-11
Applicant: 西安交通大学
IPC: G06F16/36 , G06F40/211 , G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种基于实体关系联合抽取的法律知识图谱构建方法及设备,构建方法包括:三元组数据集的构建;模型架构的设计和模型的训练;模型架构包括模型编码层、头实体抽取层以及关系‑尾实体抽取层;文本句间关系判断;以及三元组复合与图谱可视化;本发明模型架构的设计采用了中文bert预训练模型作为编码器,对中文的文本编码效果好。实体抽取部分采用两个BiLSTM二分类器来判别实体的起始位置和结束位置,可以有效地抽取出文本中短语形式的实体。本发明先抽取头实体,再由抽取到的头实体抽取对应实体关系的尾实体,抽取实体关系和尾实体时不仅用到了句子的编码信息,还融入了头实体的编码信息。本发明能够得到准确率较高的法律知识图谱。
-
公开(公告)号:CN117390186A
公开(公告)日:2024-01-12
申请号:CN202311313792.3
申请日:2023-10-11
Applicant: 西安交通大学
IPC: G06F16/35 , G06F16/36 , G06F18/2415 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 一种文本隐式篇章关系识别方法、系统、设备及存储介质,方法包括将论元拼接作为输入,使用RoBERTa模型编码,在外部知识融合时使用K‑BERT模型引入知识图谱信息辅助理解论元内实体,之后对两个论元的语义向量进行拆分,使用Bi‑LSTM模型获取包含更多序列信息的各论元整体表示,得到融合了外部信息的论元;仿照人类理解论元关系的过程,对论元间词汇两两配对计算细粒度线索分数,构建得到细粒度多角度线索矩阵;结合整体语义与对当前关系有用的线索特征联合判断关系类别,通过将线索特征与整句语义综合,获取到综合表征,输出关系类别。本发明发掘更深层次的论元交互表征结果,更好地对含义复杂的论元进行判别,提升识别效果。
-