-
公开(公告)号:CN109948152B
公开(公告)日:2020-07-17
申请号:CN201910168386.X
申请日:2019-03-06
Applicant: 北京工商大学
IPC: G06F40/232 , G06F40/253 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于LSTM的中文文本语法纠错模型的方法,首先收集大量的中文文本语料用以计算5‑gram语言模型,保存的语言模型将会用作数据处理过程和模型输出的结果选择,然后收集语法纠错平行语料数据,语法纠错平行语料数据用作训练LSTM神经网络模型,实现模型对错误句子到正确句子的序列翻译过程;其次用保存好的5‑gram语言模型对平行语料数据进行预处理,修改掉明显的错误,最后构建LSTM神经网络并用预处理后的数据进行训练,训练结束保存网络参数,并用已训练好的网络,输出语法正确的文本序列。本发明数据容易获取,过程简单有效,LSTM神经网络自动抽取抽象特征,完成语法纠错任务,算法效率和准确度都相对较高,应用于中文学习过程和语音识别后端处理。
-
公开(公告)号:CN109948152A
公开(公告)日:2019-06-28
申请号:CN201910168386.X
申请日:2019-03-06
Applicant: 北京工商大学
Abstract: 本发明公开了一种基于LSTM的中文文本语法纠错模型的方法,首先收集大量的中文文本语料用以计算5-gram语言模型,保存的语言模型将会用作数据处理过程和模型输出的结果选择,然后收集语法纠错平行语料数据,语法纠错平行语料数据用作训练LSTM神经网络模型,实现模型对错误句子到正确句子的序列翻译过程;其次用保存好的5-gram语言模型对平行语料数据进行预处理,修改掉明显的错误,最后构建LSTM神经网络并用预处理后的数据进行训练,训练结束保存网络参数,并用已训练好的网络,输出语法正确的文本序列。本发明数据容易获取,过程简单有效,LSTM神经网络自动抽取抽象特征,完成语法纠错任务,算法效率和准确度都相对较高,应用于中文学习过程和语音识别后端处理。
-
公开(公告)号:CN108923922B
公开(公告)日:2021-04-23
申请号:CN201810833603.8
申请日:2018-07-26
Applicant: 北京工商大学
Abstract: 本发明公开了一种基于生成对抗网络的文本隐写方法,该模型将文本隐写看作是一个文本序列生成过程,通过密钥映射表将秘密文本有效地隐写于生成文本中,同时保证了生成文本有较高的质量,在对抗训练中使用策略梯度优化生成器,最后使得生成模型可以生成高质量隐写文本,相比于传统的训练方法,对抗学习过程可以让模型更好地拟合整个语料库的分布,生成更为合理的短语搭配和长文本。
-
公开(公告)号:CN108923922A
公开(公告)日:2018-11-30
申请号:CN201810833603.8
申请日:2018-07-26
Applicant: 北京工商大学
Abstract: 本发明公开了一种基于生成对抗网络的文本隐写方法,该模型将文本隐写看作是一个文本序列生成过程,通过密钥映射表将秘密文本有效地隐写于生成文本中,同时保证了生成文本有较高的质量,在对抗训练中使用策略梯度优化生成器,最后使得生成模型可以生成高质量隐写文本,相比于传统的训练方法,对抗学习过程可以让模型更好地拟合整个语料库的分布,生成更为合理的短语搭配和长文本。
-
公开(公告)号:CN108009402A
公开(公告)日:2018-05-08
申请号:CN201710609781.8
申请日:2017-07-25
Applicant: 北京工商大学
IPC: G06F19/24
Abstract: 本发明一种基于动态卷积网络的微生物基因序列分类模型的方法:步骤一:获取已有分类结果的微生物基因序列数据;步骤二:数据预处理;步骤三:构建动态卷积网络结构框架;步骤四:把准备好的数据输入步骤三建立的动态卷积网络,用反向传播,随机梯度下降法迭代100次,训练动态卷积网络;以多分类交叉熵为代价函数,最终得到分类算法模型;步骤五:将需要分类的分词序列输入到步骤四已训练好的动态卷积网络模型,得到分类结果。本发明方法不用人工处理数据和抽取特征,模型自动抽取抽象特征完成分类任务,算法效率和准确度高,可有效应用于生物信息分析与处理。
-
-
-
-