-
公开(公告)号:CN119026637A
公开(公告)日:2024-11-26
申请号:CN202411034590.X
申请日:2024-07-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/045 , G06N3/0985 , G06V10/764 , G06V10/82 , G06V20/10
Abstract: 本说明书提供一种网络模型的预训练方法、图像处理方法及系统。其中,预训练方法应用于预设网络,预设网络包括教师模型、完整学生模型、弹性学生模型。在不同次迭代训练中,弹性学生模型基于不同的超参数使之成为完整学生模型的子网络。在第n次迭代训练中:将第一视角图像输入至教师模型,获得第一预测结果,将第二视角图像输入至完整学生模型和弹性学生模型,获得完整学生模型输出的第二预测结果和弹性学生模型输出的第三预测结果,以最小化第一预测结果和第二预测结果的差异、第一预测结果和第三预测结果的差异、第二预测结果和第三预测结果的差异为训练目标更新预设网络参数。经本方法得到的教师模型用于提供与不同的超参数各自对应的模型。
-
公开(公告)号:CN118053073A
公开(公告)日:2024-05-17
申请号:CN202410269341.2
申请日:2024-03-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/10 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种遥感图像处理方法及装置,将遥感图像的时间特征和空间特征解耦,先提取空间特征,再拼接并嵌入时间特征,然后将时间特征和空间特征融合,再以聚类方式确定目标区域的各个位置点的目标分类结果。该实施方式通过级联的2D网络架构代替3D网络架构,从而不仅使得网络参数量大大减少,而且可以提升遥感解译效果。
-
公开(公告)号:CN117975070A
公开(公告)日:2024-05-03
申请号:CN202410303395.6
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/762 , G06V10/764 , G06V10/26 , G06V10/80 , G06V20/13 , G06V20/70 , G06N3/0499 , G06N3/08
Abstract: 本说明书实施例提供了一种遥感图像的预处理方法、表征确定方法及装置。在遥感模型的预训练阶段,可以将全局遥感图像划分成多个子图区域,通过特征提取模型确定子图区域中多个图点特征。然后,基于图点特征对图点进行聚类,进而得到子图区域中图点对应的聚类中心,该聚类中心可以作为该子图区域的表征。在遥感模型的微调阶段,在得到一个遥感图像时,可以将该遥感图像与全局遥感图像中在子图区域进行匹配,并从匹配的子图区域中找到对应的目标图点,将目标图点对应的聚类中心与遥感图像进行特征融合,从而得到遥感图像的表征,进而可以用于对遥感图像进行解译。遥感图像中包含隐私数据,在数据处理过程中需要进行隐私保护。
-
公开(公告)号:CN117473027A
公开(公告)日:2024-01-30
申请号:CN202311296373.3
申请日:2023-10-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/29 , G06V20/13 , G06V20/17 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 公开了一种用于处理地物图像的方法,包括:提取地物图像的特征;基于特征生成令牌特征和候选查询特征;基于令牌特征使用Transformer编码器生成编码器输出;基于候选查询特征和轨迹信息生成查询特征;以及将编码器输出和查询特征输入到Transformer解码器以生成地物图像的增强表示。还公开了相应的系统、装置和介质。
-
公开(公告)号:CN116681905A
公开(公告)日:2023-09-01
申请号:CN202310651456.3
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/62 , G06V10/26 , G06V10/762 , G06V10/82 , G06V20/10 , G06V20/40 , G06V20/70 , G06N3/045 , G06N3/08
Abstract: 公开了用于处理图像时间序列的方法,包括标识图像时间序列的查询帧的多个临近帧和一个参考帧;得到该查询帧的短程时间表示;得到该查询帧的长程时间表示;以及基于该查询帧的该短程时间表示和该长程时间表示得到该查询帧的增强表示。还公开了相应的系统、装置和计算机可读存储介质。
-
公开(公告)号:CN111814771A
公开(公告)日:2020-10-23
申请号:CN202010923823.7
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
公开(公告)号:CN114092804B
公开(公告)日:2025-02-21
申请号:CN202111309422.3
申请日:2021-11-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种遥感图像的识别方法和装置。该方法包括:获取对应于同一地块的至少两张遥感图像;该至少两张遥感图像是在至少两个不同时间上对该同一地块进行拍摄后得到的;对所述至少两张遥感图像分别进行特征提取,得到至少两张原始特征图;根据每一张原始特征图对应的遥感图像的拍摄时间,对所述至少两张原始特征图在时序上进行信息融合,得到融合特征图;利用该融合特征图,对遥感图像进行识别。本说明书能够更为准确地对遥感图像进行识别。
-
公开(公告)号:CN116521895A
公开(公告)日:2023-08-01
申请号:CN202310493492.1
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06V20/10 , G06V20/13 , G06V10/764 , G06V10/80 , G06V10/40 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N5/02
Abstract: 公开了一种用于生成遥感影像的场景图的方法,包括:生成遥感影像中的目标集合;基于遥感领域知识图谱选择多个存在潜在关系的目标对;以及对目标对执行关系预测以生成该遥感影像的场景图。还公开了用于生成遥感影像的场景图的系统、装置和介质。
-
公开(公告)号:CN116310638A
公开(公告)日:2023-06-23
申请号:CN202310184333.3
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06F16/36
Abstract: 公开了一种用于跨模态对齐模型的训练方法,包括:获取多个训练样本;以及使用该多个训练样本来训练所述跨模态对齐模型,其中所述跨模态对齐模型将每个样本的视觉特征和语义表示映射到隐层空间,且至少对齐同一场景的该视觉特征与该语义表示在隐层空间的分布。本申请还涉及用于分类器的训练方法、遥感影像场景分类的方法、装置和介质。
-
公开(公告)号:CN112633185B
公开(公告)日:2023-04-18
申请号:CN202011565601.9
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/10 , G06V20/70 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06T3/40
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
-
-
-
-
-
-
-
-