一种拼写数据的生成方法

    公开(公告)号:CN112328737A

    公开(公告)日:2021-02-05

    申请号:CN201910647316.2

    申请日:2019-07-17

    Abstract: 本发明公开了一种拼写数据的生成方法,包括以下步骤:基于输入法构建拼音语料库、语音语料库以及手写语料库;通过输入法输入不同形式的错误句子或词组;通过拼音语料库、语音语料库以及手写语料库对不同形式的错误句子或词组进行匹配检索;当检索出对应的错误时,通过拼音语料库、语音语料库以及手写语料库替换为正确的句子或词组。本发明用于中文拼写检查的标记语料库的获取变得更加简单可行,克服了以往通过人工收集费事费力且难以大量获取的弊端,使用不同的方法为不同的输入法构建对应的标记语料库,可以获得更加接近真实情况的语料数据。

    一种动力电池剩余寿命预测方法及系统

    公开(公告)号:CN112130086A

    公开(公告)日:2020-12-25

    申请号:CN202010475847.0

    申请日:2020-05-29

    Abstract: 本发明涉及一种动力电池剩余寿命预测方法及系统,包括:获取原始充放电数据集;将原始充放电数据集去噪,得到训练集;对XGBoost模型进行训练获取待预测集并输入至训练后的XGBoost模型,得到下一个充放电循环的电池容量百分比数据,并设得到的预测值对应的充放电循环次数为q;判断第q次充放电循环的电池容量百分比是否小于等于80,若是,执行下一步,若否,将第q次充放电循环的电池容量百分比添加至待预测集的末尾构造新的待预测集,使q=q+1;将q与k作差,得到待预测动力电池的剩余寿命。本发明的上述方法,避免了原始数据中噪声对预测结果的影响,简单易实现,预测速度快、预测精度高。

    一种动力电池剩余寿命预测方法及系统

    公开(公告)号:CN112130086B

    公开(公告)日:2023-10-31

    申请号:CN202010475847.0

    申请日:2020-05-29

    Abstract: 本发明涉及一种动力电池剩余寿命预测方法及系统,包括:获取原始充放电数据集;将原始充放电数据集去噪,得到训练集;对XGBoost模型进行训练获取待预测集并输入至训练后的XGBoost模型,得到下一个充放电循环的电池容量百分比数据,并设得到的预测值对应的充放电循环次数为q;判断第q次充放电循环的电池容量百分比是否小于等于80,若是,执行下一步,若否,将第q次充放电循环的电池容量百分比添加至待预测集的末尾构造新的待预测集,使q=q+1;将q与k作差,得到待预测动力电池的剩余寿命。本发明的上述方法,避免了原始数据中噪声对预测结果的影响,简单易实现,预测速度快、预测精度高。

    一种中文拼写的检查方法

    公开(公告)号:CN112329446B

    公开(公告)日:2023-05-23

    申请号:CN201910646536.3

    申请日:2019-07-17

    Abstract: 本发明公开了一种中文拼写的检查方法,包括以下步骤:建立中文拼写检查模型;将中文拼写错误检查设置为序列标注任务;添加动态词语和拼音对模型进行训练;向训练后的模型中分别输入字符、词语和拼音;通过序列标注任务对模型中输入的字符、词语和拼音进行匹配。本发明能够有效融合字、词、拼音三者特征,能够不用分词且实现端到端的查错解决方案,避免繁琐的流程,并且融合字、词、拼音三种特征,无需进行分词,比传统查错方法更具有普遍性,更具有领域适应性。

    一种拼写数据的生成方法

    公开(公告)号:CN112328737B

    公开(公告)日:2023-05-05

    申请号:CN201910647316.2

    申请日:2019-07-17

    Abstract: 本发明公开了一种拼写数据的生成方法,包括以下步骤:基于输入法构建拼音语料库、语音语料库以及手写语料库;通过输入法输入不同形式的错误句子或词组;通过拼音语料库、语音语料库以及手写语料库对不同形式的错误句子或词组进行匹配检索;当检索出对应的错误时,通过拼音语料库、语音语料库以及手写语料库替换为正确的句子或词组。本发明用于中文拼写检查的标记语料库的获取变得更加简单可行,克服了以往通过人工收集费事费力且难以大量获取的弊端,使用不同的方法为不同的输入法构建对应的标记语料库,可以获得更加接近真实情况的语料数据。

    一种中文拼写的检查方法

    公开(公告)号:CN112329446A

    公开(公告)日:2021-02-05

    申请号:CN201910646536.3

    申请日:2019-07-17

    Abstract: 本发明公开了一种中文拼写的检查方法,包括以下步骤:建立中文拼写检查模型;将中文拼写错误检查设置为序列标注任务;添加动态词语和拼音对模型进行训练;向训练后的模型中分别输入字符、词语和拼音;通过序列标注任务对模型中输入的字符、词语和拼音进行匹配。本发明能够有效融合字、词、拼音三者特征,能够不用分词且实现端到端的查错解决方案,避免繁琐的流程,并且融合字、词、拼音三种特征,无需进行分词,比传统查错方法更具有普遍性,更具有领域适应性。

Patent Agency Ranking