一种电力文本智能纠错方法及系统

    公开(公告)号:CN119808763A

    公开(公告)日:2025-04-11

    申请号:CN202411868447.0

    申请日:2024-12-18

    Abstract: 本发明涉及一种电力文本智能纠错方法,包括以下步骤:步骤1:收集与电力相关的文本数据,包括电力行业的报告、技术文档、操作手册、用户手册;步骤2:建立数据标签系统,根据来源、类型、主题等,为每条数据打上合适的标签,支持多维度数据检索,并使用自然语言处理工具对文本进行语言检测和分词处理;步骤3:对检测和分词处理后的文本数据进行错误检测,构建训练数据集;步骤4:基于序列到序列seq2seq模型构建电力文本智能纠错模型,用于生成纠正后的文本,训练数据通过加入错误/正确的文本对来增强;步骤5:根据训练后的电力文本智能纠错模型进行文本智能纠错。本发明能够有效地识别错误文本,并生成高质量的正确文本。

Patent Agency Ranking