-
公开(公告)号:CN112364945A
公开(公告)日:2021-02-12
申请号:CN202110037237.7
申请日:2021-01-12
Applicant: 之江实验室
Abstract: 本发明公开了一种基于域‑不变特征的元‑知识微调方法及平台,该方法学习同类任务不同数据集上高度可转移的共有知识,即域‑不变特征,微调网络集中学得同类任务不同数据集对应的不同域上的共同域特征,快速适应任何不同的域。本发明提升了同类任务通用语言模型的参数初始化能力和泛化能力,最终微调得到同类下游任务语言模型的通用压缩架构。在元‑知识微调网络中,本发明设计域‑不变特征的损失函数,学习与域无关的通用知识,即最小化一个域‑不变特征的学习目标来驱动语言模型具有域‑不变特征的编码能力。
-
公开(公告)号:CN111767711A
公开(公告)日:2020-10-13
申请号:CN202010910566.3
申请日:2020-09-02
Applicant: 之江实验室
IPC: G06F40/211 , G06F40/30 , G06K9/62 , G06N5/02 , G06N20/00
Abstract: 本发明公开了一种基于知识蒸馏的预训练语言模型的压缩方法及平台,该方法首先设计一种普适的特征迁移的知识蒸馏策略,在教师模型的知识蒸馏到学生模型的过程中,将学生模型每一层的特征映射逼近教师的特征,重点关注小样本在教师模型中间层特征表达能力,并利用这些特征指导学生模型;然后利用教师模型的自注意力分布具有检测词语之间语义和句法的能力构建一种基于自注意力交叉知识蒸馏方法;最后为了提升学习模型训练前期的学习质量和训练后期的泛化能力,设计了一种基于伯努利概率分布的线性迁移策略逐渐完成从教师到学生的特征映射和自注意分布的知识迁移。通过本发明,将面向多任务的预训练语言模型进行自动压缩,提高语言模型的压缩效率。
-
公开(公告)号:CN118211132B
公开(公告)日:2024-08-06
申请号:CN202410633939.5
申请日:2024-05-21
Applicant: 之江实验室
IPC: G06F18/2411 , G06F18/214
Abstract: 本说明书公开了一种基于点云的三维人体表面数据生成方法及装置,终端设备先获取人体的初始点云,而后确定出初始点云对应的初始特征分布,在提取初始点云对应的初始特征分布之后,通过特征向量提取模型更准确的提取初始特征分布所对应的初始特征向量,而后通过将初始特征向量输入预测模型,得到预测特征向量,将预测特征向量转化为预测特征信息,而后通过初始点云与预测特征分布得到初始点云中每个点云点对应的重构特征信息,并根据重构特征信息生成人体表面数据。通过特征向量提取模型更准确的提取初始特征分布所对应的初始特征向量,并通过预测模型对初始特征向量进行优化,提高了生成出的人体表面数据的精细度与真实度。
-
公开(公告)号:CN117994470B
公开(公告)日:2024-06-07
申请号:CN202410410295.3
申请日:2024-04-07
Applicant: 之江实验室
Abstract: 本说明书公开了一种多模态层次自适应的数字网格重建方法及装置,将待重建对象的目标模态的数据和目标文本输入特征增强模块,得到第一特征和第二特征,通过第一编码器和第二编码器以此得到第一目标特征和第二目标特征,进而,通过专家积模型将第一目标特征对应的第一正态分布和第二目标特征对应的第二正态分布融合,得到第三正态分布,根据第一正态分布、第二正态分布和第三正态分布,通过第一解码器和第二解码器得到第一数字网格属性和第二数字网格属性,进而以此重建得到待重建对象的三维数字网格。可见,通过上述方案,能够更好地利用不同模态的信息,增强整体的信息表征能力,从而提高三维网格重建任务的性能。
-
公开(公告)号:CN117874706B
公开(公告)日:2024-05-31
申请号:CN202410281158.4
申请日:2024-03-12
Applicant: 之江实验室
IPC: G06F18/25 , G06F18/213 , G06F40/30 , G06V10/40 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0499 , G06N3/0464 , G06N3/096
Abstract: 本说明书公开了一种多模态知识蒸馏学习方法及装置。采用本申请提供的多模态知识蒸馏学习方法,可通过本申请所设计的多模态模型中的语义学习子网和视觉学习子网,分别生成学习了图像信息的文本特征以及学习了文本信息的图像特征,并将二者对齐到同一语义空间中,最终通过输出子网融合生成同时包含语义和视觉信息的多模态特征。
-
公开(公告)号:CN117978937A
公开(公告)日:2024-05-03
申请号:CN202410369278.X
申请日:2024-03-28
Applicant: 之江实验室
IPC: H04N5/262 , G06V40/20 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08 , H04N13/106
Abstract: 本说明书公开了一种视频生成的方法、装置、存储介质及电子设备。其中,首先获取康复运动训练原始视频,并提取该康复运动训练原始视频中包含的每一帧图像的图像特征以及所述康复运动训练原始视频中包含的各个帧图像之间的康复运动的动作姿态的变化特征,进而根据提取到的图像特征,确定该康复运动训练原始视频中包含的每一帧图像对应的人体姿态信息,根据提取到的变化特征,确定该康复运动训练原始视频中包含的每一帧图像对应的人体姿态信息中所包含的各个关节点的权重信息,最后根据确定出的每帧图像对应的权重信息,确定出每帧图像对应的扩展人体姿态信息,并根据每帧图像对应的扩展人体姿态信息,生成扩展康复运动训练视频。
-
公开(公告)号:CN117726907B
公开(公告)日:2024-04-30
申请号:CN202410171192.6
申请日:2024-02-06
Applicant: 之江实验室
IPC: G06V10/774 , G06V40/10 , G06T17/00
Abstract: 本说明书提供的一种建模模型的训练方法、三维人体建模的方法以及装置,获取人体二维图像,并将人体二维图像的图像代理特征输入到第一编码层,得到顶点特征、关节点旋转特征、形状特征,并将采集人体二维图像的相机的相机参数输入到第一编码层中,得到相机特征。将图像代理特征、顶点特征、关节点旋转特征、形状特征以及相机特征输入到第二编码层,第二编码层可以将图像代理特征、顶点特征、关节点旋转特征、形状特征以及相机特征关联,得到编码特征,并根据编码特征,得到三维人体模型中包含顶点坐标集以及关节点坐标集,以最小化顶点坐标集与实际顶点坐标集之间的偏差,和最小化关节点坐标集与实际关节点坐标集之间的偏差,训练建模模型。
-
公开(公告)号:CN117876610A
公开(公告)日:2024-04-12
申请号:CN202410281172.4
申请日:2024-03-12
Applicant: 之江实验室
IPC: G06T17/00 , G06V10/74 , G06V10/774 , G06V10/40 , G06V10/80
Abstract: 本说明书公开了一种针对三维构建模型的模型训练方法、装置、存储介质,其中,首先获取人体视图集,人体视图集中包括目标人体的前视图和后视图;从人体视图集中确定第一视图以及第二视图,第一视图和第二视图所对应的采集视角不同;确定第一视图对应的采集视角,作为第一目标视角,并获取采集视角位于第一目标视角邻域范围内的针对目标人体所采集到的视图,作为第一参照视图,然后将各视图输入到待训练的三维构建模型中进行特征提取,最后以最小化第二视图对应的图像特征与第一参照视图对应的图像特征之间的相似度,以及最大化第一视图对应的图像特征与第一参照视图对应的图像特征之间的相似度为优化目标,对三维构建模型进行训练。
-
公开(公告)号:CN117392485B
公开(公告)日:2024-02-23
申请号:CN202311673947.4
申请日:2023-12-07
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/44
Abstract: 本说明书公开了图像生成模型训练方法、业务执行方法、装置及介质,专用设备通过将获取的原始图像进行加噪处理后输入到图像生成模型中以根据加噪后的图像被加噪的次数值对原始图像进行去噪,从而获取预测的还原图像,通过最小化还原图像中提取出的图像前景特征与原始图像中提取出的图像前景特征之间的偏差为训练目标,训练图像生成模型,以使训练出的图像生成模型可根据输入的加噪后的原始图像生成图像中的图像前景特征与原始图像中的图像前景特征相似的还原图像。还原图像与原始图像都可用于构建训练集,以在原始图像不足以训练出符合业务要求的预设的指定模型时,可通过扩充后的训练集训练出业务执行所需的预设的指定模型。
-
公开(公告)号:CN116150563B
公开(公告)日:2024-01-05
申请号:CN202310199501.6
申请日:2023-02-24
Applicant: 之江实验室
IPC: G06F17/16 , G06N3/0464
Abstract: 本说明书提供了一种业务执行方法、装置、存储介质及电子设备。在本说明书提供的业务执行方法中,响应于业务的执行请求,获取用于执行业务的目标模型,并确定目标模型中的目标网络层;根据目标网络层中用于执行矩阵乘法的特征矩阵的维度,确定目标网络层的候选计算方式,其中,不同候选计算方式对应的执行矩阵乘法运算时的循环次序不同;针对每个候选计算方式,根据特征矩阵的大小,确定目标网络层在该候选计算方式下执行矩阵乘法时,读取数据的总缓存复用率;根据各总缓存复用率,在各候选计算方式中确定目标计算方式;将目标计算方式更新为目标网络层的计算方式,并采用更新后的目标模型执行业务。
-
-
-
-
-
-
-
-
-