-
公开(公告)号:CN118536505B
公开(公告)日:2024-09-20
申请号:CN202411005222.2
申请日:2024-07-25
Applicant: 人民法院信息技术服务中心 , 上海交通大学
IPC: G06F40/284 , G06F40/211 , G06F40/126 , G06F18/22 , G06F18/25 , G06N3/045 , G06N3/084 , G06N3/086 , G06N3/006
Abstract: 本公开涉及自然语言处理技术领域,提供了一种基于融合关系与二维注意力的实体关系抽取方法及装置。该方法包括:获取待识别文本,以预处理得到目标文本;分别对目标文本进行句拆分、词拆分及字符分割,以构建句编码;将句编码输入至实体识别模型,识别实体、实体类别及实体在句子中的位置,并建立对应的文本关系编码;根据文本关系编码以及词集合对应的词向量编码融合,确定融合关系编码;以句子级实体关系为抽取维度,根据融合关系编码,利用二维词级注意力及句子级注意力计算得到二维双重注意力向量矩阵,并根据双向神经网络对二维双重注意力向量矩阵进行解码得到实体关系抽取结果。通过本公开实施例,可提高复杂场景下文书的实体关系抽取精度。
-
公开(公告)号:CN118536505A
公开(公告)日:2024-08-23
申请号:CN202411005222.2
申请日:2024-07-25
Applicant: 人民法院信息技术服务中心 , 上海交通大学
IPC: G06F40/284 , G06F40/211 , G06F40/126 , G06F18/22 , G06F18/25 , G06N3/045 , G06N3/084 , G06N3/086 , G06N3/006
Abstract: 本公开涉及自然语言处理技术领域,提供了一种基于融合关系与二维注意力的实体关系抽取方法及装置。该方法包括:获取待识别文本,以预处理得到目标文本;分别对目标文本进行句拆分、词拆分及字符分割,以构建句编码;将句编码输入至实体识别模型,识别实体、实体类别及实体在句子中的位置,并建立对应的文本关系编码;根据文本关系编码以及词集合对应的词向量编码融合,确定融合关系编码;以句子级实体关系为抽取维度,根据融合关系编码,利用二维词级注意力及句子级注意力计算得到二维双重注意力向量矩阵,并根据双向神经网络对二维双重注意力向量矩阵进行解码得到实体关系抽取结果。通过本公开实施例,可提高复杂场景下文书的实体关系抽取精度。
-
公开(公告)号:CN119720951A
公开(公告)日:2025-03-28
申请号:CN202510228228.4
申请日:2025-02-27
Applicant: 人民法院信息技术服务中心 , 上海交通大学
IPC: G06F40/126 , G06F40/284 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本说明书实施例涉及文本处理技术领域,尤其涉及一种中文文本的事件因果关系识别方法、装置及设备。本方案通过获取待识别的中文文本进行逐字识别并标注,通过采用新的编码方式对中文文本中每个词进行编码,生成文本编码,然后通过卷积神经网络和双向长短期记忆网络,提高模型对长文本中局部特征和上下文特征的捕捉能力,将局部特征和上下文特征向量融合,构建代表中文文本的全文综合特征,最后通过条件随机场根据所述的全文综合特征生成因果关系标注序列,进行因果关系预测。加强了特定因果关系识别权重,提升模型对因果关系的识别能力,大幅提升模型对因果特征提取的完整性和精度。
-
公开(公告)号:CN119903822A
公开(公告)日:2025-04-29
申请号:CN202510397412.1
申请日:2025-03-31
Applicant: 人民法院信息技术服务中心
IPC: G06F40/169 , G06F18/23
Abstract: 本说明书涉及文本数据技术领域,提供了一种司法文本评价系统优化、司法文本评价方法、装置及系统,该优化方法包括:确定司法文本评价系统的评价参数初始的权重;识别第一司法文本数据集中的第一少数样本类;对所述第一少数样本类进行多维合成少数类过采样处理,以填充所述第一少数样本类的样本数量,形成第二司法文本数据集;识别所述第二司法文本数据集中的第二少数样本类;确定所述评价参数中受所述第二少数样本类影响的权重的影响概率值;对大于概率阈值的影响概率值对应的权重进行调整。本说明书实施例可以提高司法文本评价的准确性。
-
-
-