基于邻域节点结构编码的图神经网络异常检测方法与装置

    公开(公告)号:CN115859143A

    公开(公告)日:2023-03-28

    申请号:CN202211424557.9

    申请日:2022-11-14

    Abstract: 本发明公开了基于邻域节点结构编码的图神经网络异常检测方法与装置,包括:将原始数据转换为图神经网络的输入数据,输入数据包括节点属性矩阵、邻接矩阵;从邻接矩阵抽取出结构特征并进行矩阵分解,得到节点角色特征与角色结构特征因子;将节点角色特征与其转置矩阵相乘,得到高阶邻接矩阵;将节点属性矩阵与邻接矩阵、节点属性矩阵与高阶邻接矩阵分别输入图神经网络,得到节点角色语义潜变量和节点角色语义潜变量;并进行动态加权,得到最终节点表示,将其输入至激活函数,训练图神经网络,直至图神经网络收敛,将激活函数的输出向量中概率最高的标签作为分类结果即异常类别,异常类别对应的节点即为检测到的异常目标。

    一种基于贪心算法的机器学习分类模型解释方法

    公开(公告)号:CN116050539A

    公开(公告)日:2023-05-02

    申请号:CN202211687370.8

    申请日:2022-12-27

    Abstract: 一种基于贪心算法的机器学习分类模型解释方法,该方法使用贪心算法组合特征箱体,分别以每个筛选后箱体为起点,获得特征箱体组合。将特征匹配学习的特征箱体组合,可以对目标的特征统计情况有更加全面的了解并以此对机器学习结果做出解释。本方法运用贪心策略,对特征进行了筛选与组合,为企业提供了一种更加直观的客户筛选方法,在实际应用中主要用于辅助解释黑匣模型预测结果,服务一线业务人员。

    基于贷款五级分类的滚动率分析方法、系统、电子设备、介质

    公开(公告)号:CN116012137A

    公开(公告)日:2023-04-25

    申请号:CN202211623333.0

    申请日:2022-12-16

    Abstract: 本发明公开了一种基于贷款五级分类的滚动率分析方法、系统、电子设备、介质,方法包括:自定义设置初始时间节点和结束时间节点,以确定贷款滚动率分析的时间窗口;获得贷款五级分类相关的原始状态变更数据;将获取的原始状态变更数据中的贷款初始评定五级分类状态的时间点限定在时间窗口内,得到目标状态变更数据;统计目标状态变更数据中状态变更的数量,得到贷款五级分类状态的滚动率;根据贷款五级分类状态的滚动率,分析贷款五级分类状态的比例分布,融合专家经验,确定正常贷款与违约贷款的切分阈值。本发明方法仅依赖少量的原始数据,泛化性强,实用性强;本发明方法同时支持融合专家逻辑,使得过程可追溯,结果可解释,易于推广。

    一种基于自学习的场景文本匹配方法及系统

    公开(公告)号:CN115759068A

    公开(公告)日:2023-03-07

    申请号:CN202211524896.4

    申请日:2022-11-30

    Abstract: 本发明公开了一种基于自学习的场景文本匹配方法及系统,选择预训练词向量数据集,将场景语料数据转化为预训练词向量数据集对应的场景词向量;自定义设置场景语料样本数量阈值,当场景语料数据小于场景语料样本数量阈值时,场景语料数据作为少量样本,将其输入到无监督学习模型中转化为对应的第一场景文本向量;在场景语料数据积累超过设置的场景语料样本数量阈值后,将其输入有监督学习模型转化为对应的第二场景文本向量;计算第一场景文本向量、第二场景文本向量与待匹配文本的文本相似度并排序,修正文本匹配结果,得到文本匹配对;依据文本匹配对优化无监督学习模型和有监督学习模型,修正文本相似度的计算方式。

    一种数据处理方法、装置及介质

    公开(公告)号:CN119621999B

    公开(公告)日:2025-05-02

    申请号:CN202510151574.7

    申请日:2025-02-11

    Abstract: 本申请公开了一种数据处理方法、装置及介质,该方法包括:获取指定领域的知识图谱;对知识图谱中的实体节点进行聚类,得到聚类结果;根据知识图谱和聚类结果,构建用于数据知识扩充的数据增强体;将数据增强体嵌入指定大语言模型的预设推理模板中,以通过指定大语言模型进行数据推理,得到目标合成数据;对目标合成数据进行可信度评估。由此,基于不同领域的知识图谱构建数据增强体,可以满足各个领域对数据知识准确性、可用性和多样性的要求。此外,通过该数据增强体对数据知识进行扩充,并利用大语言模型丰富的知识结构和强大的学习推理能力进行数据推理,得到目标合成数据,可以进一步提升合成数据的准确性。

    一种融合正则表达式的金融文本关系抽取与分类方法

    公开(公告)号:CN113722495A

    公开(公告)日:2021-11-30

    申请号:CN202111240263.6

    申请日:2021-10-25

    Abstract: 本发明公开了一种融合正则表达式的金融文本关系抽取与分类方法。该方法对金融文本编码后识别出文本中包含的关系实体对并进行标记;将金融文本依次和各项正则表达式进行匹配,将匹配结果转换为正则表达式标签,最后将该标签与标记结果融合,通过深度神经网络对实体对之间包含的关系进行抽取与分类。本发明实现了融合了正则表达式信息的金融文本端到端关系抽取与分类,逻辑结构清晰,层次分明,无需人工标注,节约了人力成本,提升了工作效率,准确率高,实用性强。

    一种数据处理方法、装置及介质

    公开(公告)号:CN119621999A

    公开(公告)日:2025-03-14

    申请号:CN202510151574.7

    申请日:2025-02-11

    Abstract: 本申请公开了一种数据处理方法、装置及介质,该方法包括:获取指定领域的知识图谱;对知识图谱中的实体节点进行聚类,得到聚类结果;根据知识图谱和聚类结果,构建用于数据知识扩充的数据增强体;将数据增强体嵌入指定大语言模型的预设推理模板中,以通过指定大语言模型进行数据推理,得到目标合成数据;对目标合成数据进行可信度评估。由此,基于不同领域的知识图谱构建数据增强体,可以满足各个领域对数据知识准确性、可用性和多样性的要求。此外,通过该数据增强体对数据知识进行扩充,并利用大语言模型丰富的知识结构和强大的学习推理能力进行数据推理,得到目标合成数据,可以进一步提升合成数据的准确性。

Patent Agency Ranking