发明公开
- 专利标题: 一种基于机器学习实现自然语言处理的文字生成系统
-
申请号: CN202111169748.0申请日: 2021-10-08
-
公开(公告)号: CN113935291A公开(公告)日: 2022-01-14
- 发明人: 王家伟 , 杜亚飞 , 鲍海波 , 邹颂扬 , 王正前 , 李颖
- 申请人: 合肥安达创展科技股份有限公司
- 申请人地址: 安徽省合肥市包河区河北路18号
- 专利权人: 合肥安达创展科技股份有限公司
- 当前专利权人: 合肥安达创展科技股份有限公司
- 当前专利权人地址: 安徽省合肥市包河区河北路18号
- 代理机构: 安徽深蓝律师事务所
- 代理商 张仙强
- 主分类号: G06F40/166
- IPC分类号: G06F40/166 ; G06F40/189 ; G06F16/35 ; G06N20/00
摘要:
本发明公开了一种基于机器学习实现自然语言处理的文字生成系统,包括语料采集模块,所述语料采集模块用于对机器学习框架中的训练资料进行读取,并且从资料中获取符合资源需求的语料,预处理模块,所述预处理模块用于在训练前的准备阶段时对大量的语料进行提前处理、分类、对齐以及筛选。本发明通过将古诗词的字转化为语料向量,获取并存储符合资源需求的语料,预处理模块将资料进行分类,训练模块完成模型的建立和训练,生成模块最终生成符合平仄和对仗要求的诗词,并且律诗都能保证一定的平仄和对仗工整,同时保证一定的随机性,每次生成的结果都完全不同,该文字生成系统使机器学习的模型融入诗词平仄对仗等韵律的特性,提高了输出诗词质量。