-
公开(公告)号:CN118152508A
公开(公告)日:2024-06-07
申请号:CN202211552251.1
申请日:2022-12-05
Applicant: 核动力运行研究所
IPC: G06F16/33 , G06F16/34 , G06F16/338 , G06F40/205 , G06F40/216 , G06F40/284 , G06F40/289 , G06F40/30 , G06Q50/06
Abstract: 本发明提供了一种核电厂长文本检索系统,其特征在于,包括:模型构建模块:用于构建TFIDF模型、Seq2Seq模型;请求接收模块:用于对用户发送的数据进行分析;文档解析模块:用于对用户发送的文档数据信息进行解析,并将不同文件类型中含带的文本信息解析成长文本格式数据;文本摘要生成模块:用于将长文本格式数据进行数据清洗,得到摘要文本;文本比对模块:用于将摘要文本与建立的词库的TFIDF模型进行文本向量化,并根据相似性得分,排序得到候选文档集。本发明还提供一种核电厂长文本检索方法。本发明结合了生成式神经网络算法及关键词匹配计算方法,提高了核电长文本检索的匹配效率。
-
公开(公告)号:CN118155232A
公开(公告)日:2024-06-07
申请号:CN202211552258.3
申请日:2022-12-05
Applicant: 核动力运行研究所
IPC: G06V30/413 , G06V30/162 , G06V30/146 , G06V30/164 , G06V30/168 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种核电厂文档光学字符识别系统,包括:请求接收模块:用于对用户通过终端发送的数据进行分析;数据解析模块:用于对用户发送的图片数据信息进行解析;核电文档图像预处理模块:用于对图像格式的数据进行预处理;字符识别模块:用于对进行预处理后的核电文档图像进行字符识别。本发明还提供一种核电厂文档光学字符识别方法。本发明针对现有GRU神经网络在图像处理方面存在的不足进行改进,引入了CTC解码机制,能对图像进行有效特征提取,大幅提升了GRU电路在核电厂光学字符识别方面的准确率。
-