-
公开(公告)号:CN118445621A
公开(公告)日:2024-08-06
申请号:CN202410618464.2
申请日:2024-05-17
Applicant: 华中科技大学
IPC: G06F18/214 , G06F18/213 , G06Q50/18 , G06F40/30 , G06F18/22 , G06N3/045 , G06N3/084 , G06N3/094 , G06F40/284
Abstract: 本发明公开了一种基于双原型源的法律事件检测模型构建方法与应用,属于人工智能技术领域;针对样本少,同种事件类型表述各异,相似事件类型难以区分的情况,利用事件标签信息和事件提及作为双原型源,在两个分支同时训练,通过最小化输入法律文本与对应法律事件类型标签下的模板提示文本的特征向量之间的距离,以及法律事件类型标签相同的法律文本之间的特征向量之间的距离,充分利用了有限的训练样本,使模型学习到不同事件类型的一般特征和语言表达上的丰富多样性,提高了在小样本场景下法律事件检测的准确性。
-
公开(公告)号:CN118410400A
公开(公告)日:2024-07-30
申请号:CN202410618433.7
申请日:2024-05-17
Applicant: 华中科技大学
IPC: G06F18/241 , G06F18/214 , G06F40/284 , G06F40/30 , G06F18/213 , G06N3/045 , G06N3/084 , G06N3/094 , G06Q50/18
Abstract: 本发明公开了一种基于任务导向预训练的法律事件检测模型构建方法与应用,属于人工智能技术领域;所构建的法律事件检测模型包括:级联的token化层、训练好的文本特征提取模块和分类模块;在对文本特征提取模块进行训练的过程中,将法律领域文本语料数据集中的法律判决文书事实部分文本对应的token序列中表征法律事件语义特征的token进行掩码后,再输入至文本特征提取模块中进行MLM预训练;通过基于法律事件特征的选择性掩码策略实现了事件检测任务导向的领域预训练,从而将文本特征提取模块中预训练语言模型的训练与法律事件检测任务相关联,对法律事件关键要素具备良好的感知理解与特征提取能力,提高了法律事件检测的准确性。
-