用于电力信息系统的故障分类模型的训练方法及分类方法

    公开(公告)号:CN111651601B

    公开(公告)日:2023-04-18

    申请号:CN202010490481.4

    申请日:2020-06-02

    Abstract: 本发明涉及故障分类技术领域,具体涉及电力信息系统的故障分类模型的训练方法及分类方法。训练方法包括获取电力信息系统的故障文本训练集;故障文本训练集中的各个故障文本带有至少一个故障分类标签;对各个故障文本进行预处理;对预处理后的各个故障文本进行文本向量化,得到向量化的故障文本;将向量化的故障文本输入故障分类模型中得到各个故障文本对应的至少一个预测分类标签,并利用各个故障文本的故障分类标签与对应的至少一个预测分类标签,对故障分类模型中的参数进行优化。各个故障文本带有至少一个故障分类标签,故障分类模型对其进行分类可以得到至少一个预测分类标签,能够在保证故障分类准确率的前提下,提高故障文本分类的效率。

    一种语音转录文本的实体纠错方法及系统

    公开(公告)号:CN111611792A

    公开(公告)日:2020-09-01

    申请号:CN202010439068.5

    申请日:2020-05-21

    Abstract: 本发明提供了一种语音转录文本的实体纠错方法及系统,该方法包括:对从目标语音转录文本中提取的实体词汇进行拼音标注;利用标注的拼音及基于拼音相似度的编辑距离对实体词汇进行聚类,生成聚类结果;将聚类结果中在同一类别出现频率最高的实体词汇确定为标准实体词汇,并将该类别中其他实体词汇替换为标准实体词汇。通过利用基于拼音相似度的编辑距离对实体词汇进行聚类,从而将拼音相似度作为参考因素加入编辑距离算法中,加强了对同义词及音词的辨别能力,使得聚类结果更加符合语音转录文本的实际情况,根据该聚类结果用同一类别中出现频率最高的实体词汇替换其他实体词汇,实现了对语音转录文本的纠错,进而提高了最终语音转录文本的准确性。

Patent Agency Ranking