-
公开(公告)号:CN118397377A
公开(公告)日:2024-07-26
申请号:CN202410843483.5
申请日:2024-06-26
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/764 , G06V10/25 , G06V10/26 , G06V10/44 , G06V10/774 , G06V10/80 , G06T7/00
摘要: 本说明书实施例提供目标图像处理模型训练方法、图像处理方法,该目标图像处理模型训练方法包括,确定目标对象的初始图像、增强图像;将初始图像以及增强图像进行融合获得融合图像以及对初始图像进行掩码处理获得掩码图像;将融合图像输入参考图像处理模型,利用参考图像处理模型对融合图像进行编码解码处理,获得初始解码图像特征以及初始解码分类特征;将掩码图像输入目标图像处理模型,利用目标图像处理模型对掩码图像进行编码解码处理,获得目标解码图像特征以及目标解码分类特征;根据初始解码图像特征、初始解码分类特征、目标解码图像特征、目标解码分类特征,训练目标图像处理模型;提升利用初始图像对目标对象进行检测和分割的准确性。
-
公开(公告)号:CN118397377B
公开(公告)日:2024-09-13
申请号:CN202410843483.5
申请日:2024-06-26
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/764 , G06V10/25 , G06V10/26 , G06V10/44 , G06V10/774 , G06V10/80 , G06T7/00
摘要: 本说明书实施例提供目标图像处理模型训练方法、图像处理方法,该目标图像处理模型训练方法包括,确定目标对象的初始图像、增强图像;将初始图像以及增强图像进行融合获得融合图像以及对初始图像进行掩码处理获得掩码图像;将融合图像输入参考图像处理模型,利用参考图像处理模型对融合图像进行编码解码处理,获得初始解码图像特征以及初始解码分类特征;将掩码图像输入目标图像处理模型,利用目标图像处理模型对掩码图像进行编码解码处理,获得目标解码图像特征以及目标解码分类特征;根据初始解码图像特征、初始解码分类特征、目标解码图像特征、目标解码分类特征,训练目标图像处理模型;提升利用初始图像对目标对象进行检测和分割的准确性。
-
公开(公告)号:CN117853507B
公开(公告)日:2024-06-18
申请号:CN202410257252.6
申请日:2024-03-06
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06T7/11 , G06T7/194 , G06F3/04815 , G06F3/04845 , G06T7/90 , G06T7/73
摘要: 本发明实施例提供一种交互式图像分割方法、设备、存储介质和程序产品,该方法包括:在交互式图像分割的过程中,分割模型响应于用户触发的交互操作,可以获取目标图像对应的提示图像,此提示图像反映交互操作在目标图像中的发生位置。最终,分割模型可以利用将此提示图像作为提示信息对目标图像进行图像分割。其中,目标图像及其对应的提示图像均为三维图像。上述方法中,可以将表现为三维图像的提示图像作为提示信息对目标图像进行分割。由于提示图像中包含丰富的空间信息,该提示图像可以准确地描述交互操作在三维图像中的发生位置,因此,提示图像能够为分割模型提供更准确的提示信息,从而提高分割的准确性。
-
公开(公告)号:CN117853507A
公开(公告)日:2024-04-09
申请号:CN202410257252.6
申请日:2024-03-06
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06T7/11 , G06T7/194 , G06F3/04815 , G06F3/04845 , G06T7/90 , G06T7/73
摘要: 本发明实施例提供一种交互式图像分割方法、设备、存储介质和程序产品,该方法包括:在交互式图像分割的过程中,分割模型响应于用户触发的交互操作,可以获取目标图像对应的提示图像,此提示图像反映交互操作在目标图像中的发生位置。最终,分割模型可以利用将此提示图像作为提示信息对目标图像进行图像分割。其中,目标图像及其对应的提示图像均为三维图像。上述方法中,可以将表现为三维图像的提示图像作为提示信息对目标图像进行分割。由于提示图像中包含丰富的空间信息,该提示图像可以准确地描述交互操作在三维图像中的发生位置,因此,提示图像能够为分割模型提供更准确的提示信息,从而提高分割的准确性。
-
-
-