- 专利标题: 用于增强文本数据的方法、装置、存储介质及电子设备
-
申请号: CN202410889480.5申请日: 2024-07-03
-
公开(公告)号: CN118428333A公开(公告)日: 2024-08-02
- 发明人: 姜冠宇 , 张华杰 , 翁海琴 , 刘焱
- 申请人: 蚂蚁科技集团股份有限公司
- 申请人地址: 浙江省杭州市西湖区西溪路543号-569号(单号连续)1幢2号楼5层517室
- 专利权人: 蚂蚁科技集团股份有限公司
- 当前专利权人: 蚂蚁科技集团股份有限公司
- 当前专利权人地址: 浙江省杭州市西湖区西溪路543号-569号(单号连续)1幢2号楼5层517室
- 代理机构: 上海东信专利商标事务所
- 代理商 李丹; 杨丹莉
- 主分类号: G06F40/166
- IPC分类号: G06F40/166 ; G06F40/216
摘要:
本说明书实施例公开了一种用于增强文本数据的方法、装置、存储介质及电子设备,根据第一文本数据及待增强模型的模型标识信息构建第一提示词,根据第一提示词及第一预测结果构建第一标签信息;根据第一提示词及第一标签信息对编辑模型进行训练,获得训练后的编辑模型;对第一文本数据进行文本单元遮掩,获得遮掩后的第二文本数据,根据第二文本数据、第二预测结果及模型标识信息构建第二提示词;将第二提示词输入训练后的编辑模型,使得训练后的编辑模型对被遮掩的文本单元进行补全生成第三文本数据,并基于第三文本数据获得对应的输出结果;判断所述输出结果中是否存在目标第三文本数据,若不存在,将已生成的第三文本数据作为增强数据。
公开/授权文献
- CN118428333B 用于增强文本数据的方法、装置、存储介质及电子设备 公开/授权日:2024-11-05