-
公开(公告)号:CN118503755A
公开(公告)日:2024-08-16
申请号:CN202410625084.1
申请日:2024-05-20
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
摘要: 本发明公开了一种数据分类模型训练方法及垂直领域大模型的训练方法,包括:获取待区分数据表示集,并根据预设的判别模型确定待区分数据表示集中各个待区分向量的对应类别;根据每个待区别向量的类别,获得不同类别的各个待区分向量之间的相似度,并根据所述相似度获取差异函数值;根据每个待区分向量属于每个类别和判别模型中的参数,获取判别模型中参数的设置和每个待区分向量的条件下,每个待区分向量对应类别正确的条件概率,并根据所有类别判别正确的条件概率之和,获得损失函数值;根据差异函数值和损失函数值,对判别模型中的参数进行更新。结合相似度和损失函数来对分类模型进行训练,对判别模型参数的更新来提高分类效果。
-
公开(公告)号:CN118335064A
公开(公告)日:2024-07-12
申请号:CN202410622232.4
申请日:2024-05-20
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
摘要: 本发明公开了一种粤汉跨方言语音识别方法、装置及介质,所述方法包括:获取目标语音数据;通过预设的粤汉跨方言语音识别模型对目标语音数据进行识别,得到识别结果;其中,粤汉跨方言语音识别模型是根据目标识别方向在统一音素集中对应的数据,对第一模型进行定向迁移而得到;第一模型是根据统一音素集,以语音识别任务作为主任务,以语音增强任务作为辅助任务,对预设的多方言模型进行训练而得到。本发明提出一种粤汉跨方言语音识别方法、装置及介质,通过使用粤汉跨方言语音识别模型对目标语音数据进行识别,即可得到识别结果,该识别方式能够大幅度减少数据处理时间,能够解决现有语音识别方法无法有效地理解和处理多种语言和口音的问题。
-
公开(公告)号:CN118262388A
公开(公告)日:2024-06-28
申请号:CN202410368732.X
申请日:2024-03-28
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06V40/12 , G06V10/54 , G06V10/774 , G06V10/82 , G06N3/0499
摘要: 本发明提供了一种指纹识别方法、装置、电子设备以及存储介质,一指纹识别模型对待识别指纹图像进行特征提取,并输出待识别指纹图像中待识别指纹的待识别特征向量,以及待识别指纹的纹理类型。以使在进行指纹匹配过程中,仅提取指纹库中与所述待识别指纹的纹理类型相同的指纹作为待选定指纹,根据待选定指纹的指纹特征向量与待识别特征向量之间的特征相似度来进行指纹匹配,避免了在指纹匹配过程中,需要对指纹库中所有指纹进行逐一匹配的繁琐过程,有效地提高了指纹识别的效率,进而能够满足指纹识别应用场景极高的实时性要求。
-
公开(公告)号:CN118503377A
公开(公告)日:2024-08-16
申请号:CN202410625094.5
申请日:2024-05-20
申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
IPC分类号: G06F16/332 , G06Q50/06 , G06F16/36 , G06F40/30 , G06F40/289 , G06N3/045 , G06F18/22 , G06F16/35
摘要: 本发明公开了一种电力坐席辅助方法及装置,通过对用户需求信息进行分词、实体和关系的匹配,以及计算相似度等方法,可以更准确地匹配用户需求信息和电力信息,确保所提供的电力信息和提示语句与用户需求更加匹配。且通过动态获取与用户需求信息匹配的电力信息,系统具有较好的可拓展性,可以随着知识图谱的更新和扩展,提供更多的电力信息和服务。进一步地,通过识别和替换待匹配信息中的实体,可以自动补全或纠正待匹配信息中错误和缺失的部分,提高文本连贯性,进一步提高数据的质量。对电力客服信息进行预训练和微调,提取其中的实体和关系,并建立相似度关系表征,可以提高分类准确率,提升工单处理效率,改善电力客服的效率和质量。
-
-
-