-
公开(公告)号:CN115905514A
公开(公告)日:2023-04-04
申请号:CN202110900701.0
申请日:2021-08-06
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F18/214
Abstract: 本公开涉及一种数据增强方法和装置、计算机装置和存储介质。该数据增强方法包括:基于序列到序列生成模型,进行文本生成;对生成数据进行过滤,过滤质量低于预定阈值的生成数据。本公开提出了一种过滤模型,可以针对生成的样本,进行分类过滤,由此可以去掉噪声很大、质量不够好的样本。
-
公开(公告)号:CN115905515A
公开(公告)日:2023-04-04
申请号:CN202110901104.X
申请日:2021-08-06
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F40/289 , G06F18/241 , G06N3/088
Abstract: 本公开涉及非监督重要性提取的长文本分类方法和装置,该方法包括:文本分类模型预训练步骤,对长文本进行数据预处理,并训练出预训练的文本分类模型;标记初始化步骤,对长文本进行分句,对各个分句用预训练模型进行分类以得到初始化标签并区分为相关/不相关分句;分句标记更新步骤,在相关分句组的长度小于模型的最大长度时,通过进行重要度打分来追加新的相关分句以进行随机拼接,直到达到最大长度,从而循环更新验证以训练模型;以及下游模型分类步骤,将整体分句组中的相关分句输入训练出的文本分类模型进行长文本分类,以输出最终分类标签。
-
公开(公告)号:CN113408735A
公开(公告)日:2021-09-17
申请号:CN202010180798.8
申请日:2020-03-16
Applicant: 中国电信股份有限公司
IPC: G06N20/00
Abstract: 本公开提供了一种用于模型优化的方法、装置以及存储介质,其中的方法包括:在模型运行环境中添加建立目标模型所需的第一机器学习算法组件;基于第一机器学习算法组件建立与目标模型相对应的第一模型流程图;利用预设的元学习算法获取用于与第一机器学习算法组件进行比对的至少一个第二机器学习算法组件;使用预设的比对规则,对第一机器学习算法组件与第二机器学习算法组件进行比对处理;基于比对结果对目标模型进行优化处理。本公开的方法、装置以及存储介质,能够基于元学习自动增加机器学习算法组件,进行机器学习算法对比实验,可以让开发人员在不进行编码的情况下进行机器学习的开发和训练,可以显著加快模型开发效率。
-
公开(公告)号:CN115221892B
公开(公告)日:2024-02-27
申请号:CN202210822511.6
申请日:2022-07-12
Applicant: 中国电信股份有限公司
Abstract: 本公开提供了一种工单数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:接收用户终端上报的故障处理请求;基于故障处理请求与用户终端进行故障描述问答,以生成故障描述工单数据;通过原因抽取模型对故障描述工单数据进行原因抽取,获得故障产生原因;其中,原因抽取模型是基于历史工单数据及其历史故障产生原因训练得到的;根据故障产生原因进行故障处理以获得处理结果,并将处理结果返回至用户终端。该方法一方面可以快速生成用于描述故障信息的工单数据,另一方面可以高效准确地从工单数据中抽取到故障产生原因以进行故障处理,提升了故障处理的整体效率,也使用户体验得到提升。
-
公开(公告)号:CN115878785A
公开(公告)日:2023-03-31
申请号:CN202111141892.3
申请日:2021-09-28
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/289 , G06F18/2415 , G06N3/0442 , G06N3/0455 , G06N3/047
Abstract: 本公开提供一种基于上下文建模的文本分类的方法、介质及装置的方法、介质及装置。提供了一种基于上下文建模的文本分类的方法,所述方法包括对每轮对话的请求文本进行处理:基于关键词表获取所述请求文本的浅层特征向量;利用BERT模型编码所述请求文本及LSTM模型中的历史状态信息;基于利用BERT模型编码得到的标志位来更新LSTM模型中的历史状态信息;以及将浅层特征向量与标志位进行连接,并基于连接得到的特征得到分类结果。
-
公开(公告)号:CN115269823A
公开(公告)日:2022-11-01
申请号:CN202110482053.1
申请日:2021-04-30
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F40/295
Abstract: 本公开涉及用于生成流式聚类实体的方法、系统及存储介质。根据本公开的一个实施例,提供了一种用于生成流式聚类实体的方法,包括:对从工单中获取的故障描述数据进行清洗以去除噪声数据;以标点符号为单位对清洗后的故障描述数据进行抽取以获得故障描述实体;规范化获得的故障描述实体;以及针对规范化后的故障描述实体进行流式聚类以自动得到类数并将具有相同描述的故障聚到一类中。
-
公开(公告)号:CN115221892A
公开(公告)日:2022-10-21
申请号:CN202210822511.6
申请日:2022-07-12
Applicant: 中国电信股份有限公司
Abstract: 本公开提供了一种工单数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:接收用户终端上报的故障处理请求;基于故障处理请求与用户终端进行故障描述问答,以生成故障描述工单数据;通过原因抽取模型对故障描述工单数据进行原因抽取,获得故障产生原因;其中,原因抽取模型是基于历史工单数据及其历史故障产生原因训练得到的;根据故障产生原因进行故障处理以获得处理结果,并将处理结果返回至用户终端。该方法一方面可以快速生成用于描述故障信息的工单数据,另一方面可以高效准确地从工单数据中抽取到故障产生原因以进行故障处理,提升了故障处理的整体效率,也使用户体验得到提升。
-
公开(公告)号:CN113255299A
公开(公告)日:2021-08-13
申请号:CN202010090568.2
申请日:2020-02-13
Applicant: 中国电信股份有限公司
IPC: G06F40/166 , G06F40/247 , G06F40/194 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种工单文本生成方法和装置、计算机可读存储介质。该工单文本生成方法包括:使用原始工单文本的全部数据训练序列生成对抗网络;结合工单专业词库和互联网近义词库,建立工单近义词库,其中所述工单近义词库可替换超出词表;将序列生成对抗网络与工单近义词库结合,生成当前工单文本。本公开可以使用工单专业词库和互联网近义词库来解决SeqGAN在文本生成过程中出现的OOV问题。
-
公开(公告)号:CN116719946A
公开(公告)日:2023-09-08
申请号:CN202311004362.3
申请日:2023-08-10
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F16/36 , G06N3/0455 , G06N3/0464 , G06N3/042 , G06F18/22 , G06F18/23213 , G06N20/20 , H04L41/0631 , H04L41/0677 , H04L41/0695
Abstract: 本公开涉及数据处理技术领域,具体涉及工单推荐方法及装置、计算机可读存储介质及电子设备。所述方法包括:针对待处理工单的第一目标字段,确定第一目标字段的实体特征与已有实体聚类簇的聚类中心特征之间的第一距离,根据第一距离确定第一目标字段的匹配实体聚类簇;基于匹配实体聚类簇中包括的实体所属的已处理工单,确定出第一目标字段的匹配工单列表;根据第一目标字段的匹配工单列表,确定出待处理工单的候选工单列表;计算待处理工单与候选工单列表中的候选工单之间的相似度,以从候选工单中确定出待处理工单的参考推荐工单;其中,已有实体聚类簇通过预先对已处理工单中的实体进行聚类得到。本公开能提高工单推荐的准确性和效率。
-
公开(公告)号:CN116542634A
公开(公告)日:2023-08-04
申请号:CN202310744556.0
申请日:2023-06-21
Applicant: 中国电信股份有限公司
IPC: G06Q10/10 , G06N5/02 , G06F18/22 , G06F40/295 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种工单处理方法、装置和计算机可读存储介质,涉及运维领域。工单处理方法包括:利用知识图谱,确定待处理工单的拓扑结构;根据拓扑结构,确定待处理工单与一个或多个已处理工单的相似度;根据相似度,从一个或多个已处理工单中选择工单,作为待处理工单的参考工单。本发明基于知识图谱构建待处理工单的拓扑结构,以通过标准化的方式表达工单涉及的关键信息。从而,能够利用该拓扑结构确定历史工单中的相似工单,为待处理工单的推进给出了参考信息,因此能够提高工单处理的效率。
-
-
-
-
-
-
-
-
-