-
公开(公告)号:CN112328737A
公开(公告)日:2021-02-05
申请号:CN201910647316.2
申请日:2019-07-17
Applicant: 北方工业大学
IPC: G06F16/33 , G06F40/232 , G06F40/289 , G06F40/205 , G06K9/62
Abstract: 本发明公开了一种拼写数据的生成方法,包括以下步骤:基于输入法构建拼音语料库、语音语料库以及手写语料库;通过输入法输入不同形式的错误句子或词组;通过拼音语料库、语音语料库以及手写语料库对不同形式的错误句子或词组进行匹配检索;当检索出对应的错误时,通过拼音语料库、语音语料库以及手写语料库替换为正确的句子或词组。本发明用于中文拼写检查的标记语料库的获取变得更加简单可行,克服了以往通过人工收集费事费力且难以大量获取的弊端,使用不同的方法为不同的输入法构建对应的标记语料库,可以获得更加接近真实情况的语料数据。
-
公开(公告)号:CN112130086A
公开(公告)日:2020-12-25
申请号:CN202010475847.0
申请日:2020-05-29
Applicant: 国家电网有限公司 , 国网综合能源服务集团有限公司 , 北方工业大学
IPC: G01R31/392 , G01R31/367 , B60L58/16
Abstract: 本发明涉及一种动力电池剩余寿命预测方法及系统,包括:获取原始充放电数据集;将原始充放电数据集去噪,得到训练集;对XGBoost模型进行训练获取待预测集并输入至训练后的XGBoost模型,得到下一个充放电循环的电池容量百分比数据,并设得到的预测值对应的充放电循环次数为q;判断第q次充放电循环的电池容量百分比是否小于等于80,若是,执行下一步,若否,将第q次充放电循环的电池容量百分比添加至待预测集的末尾构造新的待预测集,使q=q+1;将q与k作差,得到待预测动力电池的剩余寿命。本发明的上述方法,避免了原始数据中噪声对预测结果的影响,简单易实现,预测速度快、预测精度高。
-
公开(公告)号:CN112130086B
公开(公告)日:2023-10-31
申请号:CN202010475847.0
申请日:2020-05-29
Applicant: 国家电网有限公司 , 国网综合能源服务集团有限公司 , 北方工业大学
IPC: G01R31/392 , G01R31/367 , B60L58/16
Abstract: 本发明涉及一种动力电池剩余寿命预测方法及系统,包括:获取原始充放电数据集;将原始充放电数据集去噪,得到训练集;对XGBoost模型进行训练获取待预测集并输入至训练后的XGBoost模型,得到下一个充放电循环的电池容量百分比数据,并设得到的预测值对应的充放电循环次数为q;判断第q次充放电循环的电池容量百分比是否小于等于80,若是,执行下一步,若否,将第q次充放电循环的电池容量百分比添加至待预测集的末尾构造新的待预测集,使q=q+1;将q与k作差,得到待预测动力电池的剩余寿命。本发明的上述方法,避免了原始数据中噪声对预测结果的影响,简单易实现,预测速度快、预测精度高。
-
公开(公告)号:CN112329446B
公开(公告)日:2023-05-23
申请号:CN201910646536.3
申请日:2019-07-17
Applicant: 北方工业大学
IPC: G06F40/232
Abstract: 本发明公开了一种中文拼写的检查方法,包括以下步骤:建立中文拼写检查模型;将中文拼写错误检查设置为序列标注任务;添加动态词语和拼音对模型进行训练;向训练后的模型中分别输入字符、词语和拼音;通过序列标注任务对模型中输入的字符、词语和拼音进行匹配。本发明能够有效融合字、词、拼音三者特征,能够不用分词且实现端到端的查错解决方案,避免繁琐的流程,并且融合字、词、拼音三种特征,无需进行分词,比传统查错方法更具有普遍性,更具有领域适应性。
-
公开(公告)号:CN112328737B
公开(公告)日:2023-05-05
申请号:CN201910647316.2
申请日:2019-07-17
Applicant: 北方工业大学
IPC: G06F16/33 , G06F40/232 , G06F40/289 , G06F40/205 , G06F18/20
Abstract: 本发明公开了一种拼写数据的生成方法,包括以下步骤:基于输入法构建拼音语料库、语音语料库以及手写语料库;通过输入法输入不同形式的错误句子或词组;通过拼音语料库、语音语料库以及手写语料库对不同形式的错误句子或词组进行匹配检索;当检索出对应的错误时,通过拼音语料库、语音语料库以及手写语料库替换为正确的句子或词组。本发明用于中文拼写检查的标记语料库的获取变得更加简单可行,克服了以往通过人工收集费事费力且难以大量获取的弊端,使用不同的方法为不同的输入法构建对应的标记语料库,可以获得更加接近真实情况的语料数据。
-
公开(公告)号:CN112329446A
公开(公告)日:2021-02-05
申请号:CN201910646536.3
申请日:2019-07-17
Applicant: 北方工业大学
IPC: G06F40/232
Abstract: 本发明公开了一种中文拼写的检查方法,包括以下步骤:建立中文拼写检查模型;将中文拼写错误检查设置为序列标注任务;添加动态词语和拼音对模型进行训练;向训练后的模型中分别输入字符、词语和拼音;通过序列标注任务对模型中输入的字符、词语和拼音进行匹配。本发明能够有效融合字、词、拼音三者特征,能够不用分词且实现端到端的查错解决方案,避免繁琐的流程,并且融合字、词、拼音三种特征,无需进行分词,比传统查错方法更具有普遍性,更具有领域适应性。
-
公开(公告)号:CN111641220A
公开(公告)日:2020-09-08
申请号:CN202010446239.7
申请日:2020-05-25
Applicant: 国家电网有限公司 , 国网综合能源服务集团有限公司 , 北方工业大学
Abstract: 本发明属于电网规划技术领域,具体涉及一种基于改进模拟退火算法的电网侧储能系统容量配置方法。方法包括如下过程:测度储能系统延缓输电网升级改造的收益y1,测度提升风电消纳收益y2,测度储能系统调峰减少的环境成本y3,测度储能系统全寿命周期每年成本yin,以如下目标函数来确定电网侧储能系统,选址配置的最优结果max f=y1+y2+y3-yin;本发明提出一种基于改进模拟退火算法的电网侧储能系统容量配置方法,本专利所述方法既降低了陷入局部最优的可能性,又加快了收敛速度。本发明设计合理,结合了天牛须算法和模拟退火算法的优点,解决了电网中储能系统规划问题,提高了储能系统运行的经济性。
-
-
-
-
-
-