-
公开(公告)号:CN116150700A
公开(公告)日:2023-05-23
申请号:CN202211556844.5
申请日:2022-12-06
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F18/25 , G06N3/08 , G06N3/0464
Abstract: 本公开提供了一种数据处理方法及装置、电子设备、计算机可读存储介质。该方法包括:基于目标对象的时间序列数据获取目标对象的隐藏特征向量;基于目标对象的文本数据获取目标对象的实体特征向量和全局特征向量;其中,实体特征向量用于表征文本数据中实体的特征,全局特征向量用于表征文本数据的特征;将实体特征向量融合隐藏特征向量,获得实体融合特征向量,以及,将隐藏特征向量融合实体特征向量,获得隐藏融合特征向量;基于隐藏融合特征向量、实体融合特征向量和全局特征向量确定目标对象的多模态融合特征;基于目标对象的多模态融合特征预测目标对象出现目标状态的概率。本公开的实施例能够提高预测的准确性。
-
公开(公告)号:CN110827265A
公开(公告)日:2020-02-21
申请号:CN201911079051.7
申请日:2019-11-07
Applicant: 南开大学
Abstract: 一种面向图片数据集的基于深度学习的图片异常检测方法。本发明方法是利用正常的图片类别数据作为输入数据,构建基于深度学习的图片异常检测模型,包含两个子模块,一个表示模块用于学习正常类别的图片数据集的特征,一个检测模块用于预测输入图片属于异常图片类别的概率,还使用置信度估计来提高预测准确率,两个模块采用对抗式训练方法,表示模块可以更好的学习到正常类别图片数据集的特征,检测模块则可以给出置信度更高更准确的预测结果。对于异常检测领域的四个常用数据集,本发明的方法克服了异常类别图片种类繁多难以收集的问题,只需要正常类别的图片作为训练数据,同时效果显著优于目前现有的其他面向图片数据集的异常检测方法。
-
公开(公告)号:CN110827265B
公开(公告)日:2023-04-07
申请号:CN201911079051.7
申请日:2019-11-07
Applicant: 南开大学
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/094
Abstract: 一种面向图片数据集的基于深度学习的图片异常检测方法。本发明方法是利用正常的图片类别数据作为输入数据,构建基于深度学习的图片异常检测模型,包含两个子模块,一个表示模块用于学习正常类别的图片数据集的特征,一个检测模块用于预测输入图片属于异常图片类别的概率,还使用置信度估计来提高预测准确率,两个模块采用对抗式训练方法,表示模块可以更好的学习到正常类别图片数据集的特征,检测模块则可以给出置信度更高更准确的预测结果。对于异常检测领域的四个常用数据集,本发明的方法克服了异常类别图片种类繁多难以收集的问题,只需要正常类别的图片作为训练数据,同时效果显著优于目前现有的其他面向图片数据集的异常检测方法。
-
公开(公告)号:CN116166770A
公开(公告)日:2023-05-26
申请号:CN202211233682.1
申请日:2022-10-10
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06F18/214 , G06F18/241 , G06N3/04
Abstract: 本公开提供了一种实体链接模型的训练方法及装置、实体链接方法及装置,该方法包括:对链接训练样本和链接训练样本对应的链接训练样本信息进行特征提取,获得链接训练样本的第一特征向量;链接训练样本是训练实体链接模型采用的样本;链接训练样本信息是与链接训练样本关联的信息;对链接训练样本的第一特征向量进行编码,获得链接训练样本的编码;基于链接训练样本的编码,获得链接训练样本的预测类型;预测类型是预测到的类型信息;基于链接训练样本的预测类型和链接训练样本的第一标准类型信息调整实体链接模型的参数。根据本公开的实施例能够提高实体链接模型的泛化能力,以及减少过拟合的情况。
-
公开(公告)号:CN116151254A
公开(公告)日:2023-05-23
申请号:CN202211556169.6
申请日:2022-12-06
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F40/295 , G06N3/0895 , G06N3/0499 , G06N3/0464 , G06N3/0442 , G06F18/25
Abstract: 本公开提供了一种数据处理方法及计算机可读存储介质,所述数据处理方法用于对命名实体识别模型进行训练,包括:获取有标签训练样本对和无标签训练样本对;对应每个训练样本对,得到相应训练样本对对应的潜在表示特征并融合,进而,通过进行命名实体预测,得到有标签训练样本对的第一预测结果,以及无标签训练样本对的第二预测结果;根据每个训练样本对的潜在表示特征得到相应训练样本对的重构特征;基于第一预测结果、第二预测结果、各样本对和各样本对的重构特征确定三个损失函数,根据三个损失函数对命名实体识别模型进行训练。本公开实施例采用半监督训练,能够在保证模型准确率的情况下降低训练成本。
-
公开(公告)号:CN112465150A
公开(公告)日:2021-03-09
申请号:CN202011402595.5
申请日:2020-12-02
Applicant: 南开大学
IPC: G06N20/00
Abstract: 本发明公开了一种基于真实数据增强的多元时序数据缺失值填充方法,通过编码器压缩真实数据为数据表征向量,之后通过生成器结合真实数据增强从数据表征向量从生成完整的数据向量,最后通过判别器分辨真实数据与生成数据。整个模型通过生成对抗式训练优化编码器、生成器与判别器的损失,从而使生成器生成的数据足够接近真实数据以迷惑判别器,最后用生成器的生成数据填充多元时序数据中的缺失值。该方法以带编码器的生成对抗网络为框架,在模型的编码器、生成器、判别器中都运用了真实数据,使模型生成的数据更加真实可靠,可有效用于缺失值的填充。
-
-
-
-
-