-
公开(公告)号:CN119886067A
公开(公告)日:2025-04-25
申请号:CN202510359312.X
申请日:2025-03-25
Applicant: 蚂蚁智信(杭州)信息技术有限公司
IPC: G06F40/16 , G06F18/214 , G06F40/18
Abstract: 本说明书实施例公开了一种用于训练表格模型的方法、装置、存储介质及电子设备,该方法先获得表格训练数据对应的掩码矩阵,然后根据所述表格训练数据及所述掩码矩阵,获得对应的掩码文本序列数据,再基于所述掩码文本序列数据进行预训练,获得通用表格模型,该方案通过先掩码然后预测,可利用掩码矩阵来捕捉表特征之间的复杂关系,且通过利用不同的掩码矩阵将不同表格任务整合到一个训练目标中,实现了一种全新的统一训练框架。
-
公开(公告)号:CN120011724A
公开(公告)日:2025-05-16
申请号:CN202510505926.4
申请日:2025-04-22
Applicant: 蚂蚁智信(杭州)信息技术有限公司
IPC: G06F18/10 , G06F18/2113
Abstract: 本说明书实施例公开了一种用于特征预处理的方法、装置、存储介质及电子设备,首先获取排序后的原始特征分布,根据所述原始特征分布及分位区间数量,确定有序的首尾相连的多个分位区间,之后对于所述多个原始特征数值中的每个原始特征数值,根据该原始特征数值、该原始特征数值所落入的目标分位区间的起始分位点和终止分位点、所述分位点数量、所述起始分位点或所述终止分位点在所述多个分位区间对应的多个分位点中的排序序号,将该原始特征数值映射为对应的目标特征数值,其中,映射得到的多个目标特征数值被用于训练神经网络模型,由此能够实现将原始特征分布映射到近似的均匀分布上,有助于提升神经网络的稳定性和泛化能力。
-
公开(公告)号:CN119513921A
公开(公告)日:2025-02-25
申请号:CN202510089651.0
申请日:2025-01-21
Applicant: 蚂蚁智信(杭州)信息技术有限公司
IPC: G06F21/62 , G06F18/213 , G06F18/241
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,方法包括:接收针对目标用户的风险检测请求;响应于所述风险检测请求,获取所述目标用户对应的待检测数据,所述待检测数据包含与所述目标用户的资源转移行为相关的多模态的特征数据;将所述待检测数据输入到预先训练的检测模型的第一模块进行特征提取处理,得到与每个所述特征数据对应的特征向量,其中,所述第一数据处理层之间的节点关联关系根据所述特征数据确定;通过所述预先训练的检测模型的第二模块,对多个所述特征向量之间的关系进行特征检测处理,并根据特征检测结果确定针对所述目标用户的风险检测结果。
-
-