一种基于全词掩码和依存掩码的中文文本的纠错方法

    公开(公告)号:CN118194854B

    公开(公告)日:2024-07-23

    申请号:CN202410623262.7

    申请日:2024-05-20

    Abstract: 本发明公开了一种基于全词掩码和依存掩码的中文文本的纠错方法,包括以下步骤:步骤S1:采集并构建数据集;步骤S2:构建文本纠错模型,文本纠错模型包括拼写纠错模型和语法纠错模型;步骤S3:将错误句子导入到步骤S2中的拼写纠错模型中,获取拼写纠错后的句子,同时对拼写纠错模型进行训练;步骤S4:将拼写纠错后的句子导入到步骤S2中的语法纠错模型的检测网络中,获得拼写纠错后的句子的语法错误类型,对语法纠错模型进行训练;步骤S5:语法错误类型的句子导入到语法纠错模型中的纠错网络,对获得语法错误类型的句子进行语法纠错,获得语法纠错后的句子。本发明通过引入依存句法分析,从而实现对语句更为精准的纠错。

    一种基于全词掩码和依存掩码的中文文本的纠错方法

    公开(公告)号:CN118194854A

    公开(公告)日:2024-06-14

    申请号:CN202410623262.7

    申请日:2024-05-20

    Abstract: 本发明公开了一种基于全词掩码和依存掩码的中文文本的纠错方法,包括以下步骤:步骤S1:采集并构建数据集;步骤S2:构建文本纠错模型,文本纠错模型包括拼写纠错模型和语法纠错模型;步骤S3:将错误句子导入到步骤S2中的拼写纠错模型中,获取拼写纠错后的句子,同时对拼写纠错模型进行训练;步骤S4:将拼写纠错后的句子导入到步骤S2中的语法纠错模型的检测网络中,获得拼写纠错后的句子的语法错误类型,对语法纠错模型进行训练;步骤S5:语法错误类型的句子导入到语法纠错模型中的纠错网络,对获得语法错误类型的句子进行语法纠错,获得语法纠错后的句子。本发明通过引入依存句法分析,从而实现对语句更为精准的纠错。

Patent Agency Ranking