-
公开(公告)号:CN119380033B
公开(公告)日:2025-04-01
申请号:CN202411979530.5
申请日:2024-12-31
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/44 , G06V10/80 , G06V10/766 , G06V20/13 , G06V20/17 , G06N3/0455 , G06N3/084 , G06T7/10
Abstract: 本发明公开一种遥感图像指代分割方法和系统,包括:将图像和指代文本输入第一阶段的指代检测模型,文本编码模块将指代文本映射为文本序列,语义词性特征提取模块对文本序列进行注意力加权,得到融合文本词性特征的文本特征,图像编码模块对图像进行初步的图像特征提取,将文本特征和图像特征拼接后输入特征提取器输出检测框和输出特征,将输出特征输入加权点回归任务头,预测输出关键点;将初始图像作为输入,检测框和关键点作为双提示,输入第二阶段的双提示分割模型,第二阶段图像编码器将图像编码为图像嵌入,双提示编码器将双提示编码,掩码解码器将图像嵌入和双提示编码进行特征融合得到最终的分割结果。本发明可以遥感图像进行指代分割。
-
公开(公告)号:CN119380033A
公开(公告)日:2025-01-28
申请号:CN202411979530.5
申请日:2024-12-31
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/44 , G06V10/80 , G06V10/766 , G06V20/13 , G06V20/17 , G06N3/0455 , G06N3/084 , G06T7/10
Abstract: 本发明公开一种遥感图像指代分割方法和系统,包括:将图像和指代文本输入第一阶段的指代检测模型,文本编码模块将指代文本映射为文本序列,语义词性特征提取模块对文本序列进行注意力加权,得到融合文本词性特征的文本特征,图像编码模块对图像进行初步的图像特征提取,将文本特征和图像特征拼接后输入特征提取器输出检测框和输出特征,将输出特征输入加权点回归任务头,预测输出关键点;将初始图像作为输入,检测框和关键点作为双提示,输入第二阶段的双提示分割模型,第二阶段图像编码器将图像编码为图像嵌入,双提示编码器将双提示编码,掩码解码器将图像嵌入和双提示编码进行特征融合得到最终的分割结果。本发明可以遥感图像进行指代分割。
-
公开(公告)号:CN119579905A
公开(公告)日:2025-03-07
申请号:CN202510140742.2
申请日:2025-02-08
Applicant: 北京科技大学
Abstract: 本发明提供一种耳廓指代分割方法和系统,包括:将待分割人耳图像和文本描述输入耳廓指代分割模型,模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块;文本编码模块得到文本特征#imgabs0#;视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合,每个阶段的视觉编码器生成视觉特征#imgabs1#,跨模态感知模块对齐#imgabs2#与#imgabs3#得到多模态特征#imgabs4#,#imgabs5#中的每个元素由注意力门控模块进行加权获得加权多模态特征#imgabs6#,按元素与#imgabs7#相加产生增强视觉特征#imgabs8#,将#imgabs9#输入视觉解码模块逐步恢复图像的空间分辨率,进一步融合文本和视觉特征输出多尺度特征;角度变换模块对多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。
-
-