-
公开(公告)号:CN118153558A
公开(公告)日:2024-06-07
申请号:CN202211552527.6
申请日:2022-12-05
Applicant: 核动力运行研究所
IPC: G06F40/232 , G06F40/205 , G06F40/289 , G06F40/242 , G06F40/211 , G06F40/247 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种核电厂文档文本纠错计算系统,其特征在于,包括:语料准备模块:用于建立词库、核电文本语料库,并得到相似语料库、错误语料库;模型训练模块:根据核电文本语料库和词库,训练得到n‑gram模型、双向lstm模型;请求接收模块:用于对用户发送的数据进行分析和处理;文档解析模块:用于对用户发送的文档数据信息进行解析;语料处理模块:用于形成候补文本集;文本纠对模块:用于将用户发送的文档数据信息的原始文本与候补文本集输入至双向lstm神经网络模型,计算出各语句向量,取与原始文本向量最相近的候补集作为纠错后的语句。本发明提高核电文档形成过程中的效率,降低核电文档形成过程中,文档出现错别字、语义不同等错误。