一种核电厂长文本检索系统和方法

    公开(公告)号:CN118152508A

    公开(公告)日:2024-06-07

    申请号:CN202211552251.1

    申请日:2022-12-05

    Abstract: 本发明提供了一种核电厂长文本检索系统,其特征在于,包括:模型构建模块:用于构建TFIDF模型、Seq2Seq模型;请求接收模块:用于对用户发送的数据进行分析;文档解析模块:用于对用户发送的文档数据信息进行解析,并将不同文件类型中含带的文本信息解析成长文本格式数据;文本摘要生成模块:用于将长文本格式数据进行数据清洗,得到摘要文本;文本比对模块:用于将摘要文本与建立的词库的TFIDF模型进行文本向量化,并根据相似性得分,排序得到候选文档集。本发明还提供一种核电厂长文本检索方法。本发明结合了生成式神经网络算法及关键词匹配计算方法,提高了核电长文本检索的匹配效率。

Patent Agency Ranking