发明公开
- 专利标题: 一种基于自监督学习的大模型初中英语完形填空生成方法
-
申请号: CN202410854577.2申请日: 2024-06-28
-
公开(公告)号: CN118673911A公开(公告)日: 2024-09-20
- 发明人: 毛太辉
- 申请人: 北京光年无限科技有限公司
- 申请人地址: 北京市石景山区石景山路3号玉泉大厦四层常青藤青年创业工作室193号
- 专利权人: 北京光年无限科技有限公司
- 当前专利权人: 北京光年无限科技有限公司
- 当前专利权人地址: 北京市石景山区石景山路3号玉泉大厦四层常青藤青年创业工作室193号
- 代理机构: 江苏昌禾律师事务所
- 代理商 潘天志
- 主分类号: G06F40/284
- IPC分类号: G06F40/284 ; G06F40/30 ; G06F40/194 ; G06N3/0895
摘要:
本发明公开了一种基于自监督学习的大模型初中英语完形填空生成方法,包括S1、收集英语文本数据作为训练数据集及各省市10年内中考完形填空真题作为文本改编学习数据集;S2、形成出题词汇表;S3、并对训练数据集进行预处理;S4、使用自监督学习方法构建大规模自然语言处理模型;S5、根据训练数据集及文本改编学习数据集对大规模自然语言处理模型进行任务微调;S6、基于训练好的大规模自然语言处理模型及改编后的文本自动生成初中英语完形填空题目;S7、对生成的完形填空题目进行自动校验和人工审核;S8、将生成的完形填空题目存储在题库中。本发明利用自监督学习和大规模自然语言处理模型,高效地生成大量完形填空题目,极大地节省了人力和时间成本。