发明公开
- 专利标题: 一种基于Prompt多模板融合的零样本关系抽取方法
-
申请号: CN202211082703.4申请日: 2022-09-06
-
公开(公告)号: CN115687609A公开(公告)日: 2023-02-03
- 发明人: 张春 , 张宁 , 许亮
- 申请人: 北京交通大学
- 申请人地址: 北京市海淀区西直门外上园村3号
- 专利权人: 北京交通大学
- 当前专利权人: 北京交通大学
- 当前专利权人地址: 北京市海淀区西直门外上园村3号
- 代理机构: 北京市商泰律师事务所
- 代理商 黄晓军
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/289 ; G06F40/30 ; G06F18/2415 ; G06F18/25 ; G06N3/045 ; G06N3/08
摘要:
本发明提供了一种基于Prompt多模板融合的零样本关系抽取方法。该方法包括:将需要抽取关系的文本数据与预先定义的Prompt模板进行组合后,输入到预训练语言模型中,输出完形填空任务的结果,将这个结果的词嵌入输出转换成关系表示;将需要抽取关系的文本数据按照重复操作输入到不同类型的预训练语言模型中,得到多种关系表示,根据关系描述文本中的词性与不同Prompt模板之间的关系权重,对多种关系表示进行融合;将融合后的多种关系表示与关系描述文本生成的词嵌入进行欧式距离的比较,将距离转化为对应关系的概率,输出最大概率的所述需要抽取关系的文本数据的零样本关系类别。本发明方法优化了模型生成表示的能力,提高了零样本关系抽取任务的F1值。