一种非监督重要性提取的长文本分类方法和装置

    公开(公告)号:CN115905515A

    公开(公告)日:2023-04-04

    申请号:CN202110901104.X

    申请日:2021-08-06

    Abstract: 本公开涉及非监督重要性提取的长文本分类方法和装置,该方法包括:文本分类模型预训练步骤,对长文本进行数据预处理,并训练出预训练的文本分类模型;标记初始化步骤,对长文本进行分句,对各个分句用预训练模型进行分类以得到初始化标签并区分为相关/不相关分句;分句标记更新步骤,在相关分句组的长度小于模型的最大长度时,通过进行重要度打分来追加新的相关分句以进行随机拼接,直到达到最大长度,从而循环更新验证以训练模型;以及下游模型分类步骤,将整体分句组中的相关分句输入训练出的文本分类模型进行长文本分类,以输出最终分类标签。

    用于模型优化的方法、装置以及存储介质

    公开(公告)号:CN113408735A

    公开(公告)日:2021-09-17

    申请号:CN202010180798.8

    申请日:2020-03-16

    Abstract: 本公开提供了一种用于模型优化的方法、装置以及存储介质,其中的方法包括:在模型运行环境中添加建立目标模型所需的第一机器学习算法组件;基于第一机器学习算法组件建立与目标模型相对应的第一模型流程图;利用预设的元学习算法获取用于与第一机器学习算法组件进行比对的至少一个第二机器学习算法组件;使用预设的比对规则,对第一机器学习算法组件与第二机器学习算法组件进行比对处理;基于比对结果对目标模型进行优化处理。本公开的方法、装置以及存储介质,能够基于元学习自动增加机器学习算法组件,进行机器学习算法对比实验,可以让开发人员在不进行编码的情况下进行机器学习的开发和训练,可以显著加快模型开发效率。

    工单数据处理方法及装置、存储介质及电子设备

    公开(公告)号:CN115221892B

    公开(公告)日:2024-02-27

    申请号:CN202210822511.6

    申请日:2022-07-12

    Abstract: 本公开提供了一种工单数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:接收用户终端上报的故障处理请求;基于故障处理请求与用户终端进行故障描述问答,以生成故障描述工单数据;通过原因抽取模型对故障描述工单数据进行原因抽取,获得故障产生原因;其中,原因抽取模型是基于历史工单数据及其历史故障产生原因训练得到的;根据故障产生原因进行故障处理以获得处理结果,并将处理结果返回至用户终端。该方法一方面可以快速生成用于描述故障信息的工单数据,另一方面可以高效准确地从工单数据中抽取到故障产生原因以进行故障处理,提升了故障处理的整体效率,也使用户体验得到提升。

    用于生成流式聚类实体的方法、系统及存储介质

    公开(公告)号:CN115269823A

    公开(公告)日:2022-11-01

    申请号:CN202110482053.1

    申请日:2021-04-30

    Abstract: 本公开涉及用于生成流式聚类实体的方法、系统及存储介质。根据本公开的一个实施例,提供了一种用于生成流式聚类实体的方法,包括:对从工单中获取的故障描述数据进行清洗以去除噪声数据;以标点符号为单位对清洗后的故障描述数据进行抽取以获得故障描述实体;规范化获得的故障描述实体;以及针对规范化后的故障描述实体进行流式聚类以自动得到类数并将具有相同描述的故障聚到一类中。

    工单数据处理方法及装置、存储介质及电子设备

    公开(公告)号:CN115221892A

    公开(公告)日:2022-10-21

    申请号:CN202210822511.6

    申请日:2022-07-12

    Abstract: 本公开提供了一种工单数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:接收用户终端上报的故障处理请求;基于故障处理请求与用户终端进行故障描述问答,以生成故障描述工单数据;通过原因抽取模型对故障描述工单数据进行原因抽取,获得故障产生原因;其中,原因抽取模型是基于历史工单数据及其历史故障产生原因训练得到的;根据故障产生原因进行故障处理以获得处理结果,并将处理结果返回至用户终端。该方法一方面可以快速生成用于描述故障信息的工单数据,另一方面可以高效准确地从工单数据中抽取到故障产生原因以进行故障处理,提升了故障处理的整体效率,也使用户体验得到提升。

    工单推荐方法、工单推荐装置、存储介质及电子设备

    公开(公告)号:CN116719946A

    公开(公告)日:2023-09-08

    申请号:CN202311004362.3

    申请日:2023-08-10

    Abstract: 本公开涉及数据处理技术领域,具体涉及工单推荐方法及装置、计算机可读存储介质及电子设备。所述方法包括:针对待处理工单的第一目标字段,确定第一目标字段的实体特征与已有实体聚类簇的聚类中心特征之间的第一距离,根据第一距离确定第一目标字段的匹配实体聚类簇;基于匹配实体聚类簇中包括的实体所属的已处理工单,确定出第一目标字段的匹配工单列表;根据第一目标字段的匹配工单列表,确定出待处理工单的候选工单列表;计算待处理工单与候选工单列表中的候选工单之间的相似度,以从候选工单中确定出待处理工单的参考推荐工单;其中,已有实体聚类簇通过预先对已处理工单中的实体进行聚类得到。本公开能提高工单推荐的准确性和效率。

    工单处理方法、装置和计算机可读存储介质

    公开(公告)号:CN116542634A

    公开(公告)日:2023-08-04

    申请号:CN202310744556.0

    申请日:2023-06-21

    Abstract: 本发明公开了一种工单处理方法、装置和计算机可读存储介质,涉及运维领域。工单处理方法包括:利用知识图谱,确定待处理工单的拓扑结构;根据拓扑结构,确定待处理工单与一个或多个已处理工单的相似度;根据相似度,从一个或多个已处理工单中选择工单,作为待处理工单的参考工单。本发明基于知识图谱构建待处理工单的拓扑结构,以通过标准化的方式表达工单涉及的关键信息。从而,能够利用该拓扑结构确定历史工单中的相似工单,为待处理工单的推进给出了参考信息,因此能够提高工单处理的效率。

Patent Agency Ranking