开放词汇图像语义分割方法、系统、设备及存储介质

    公开(公告)号:CN119723096A

    公开(公告)日:2025-03-28

    申请号:CN202510227653.1

    申请日:2025-02-27

    Abstract: 本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。

    生成式的视频片段检索方法、系统、设备及存储介质

    公开(公告)号:CN117093749A

    公开(公告)日:2023-11-21

    申请号:CN202311355829.9

    申请日:2023-10-19

    Abstract: 本发明公开了一种生成式的视频片段检索方法、系统、设备及存储介质,它们是一一对应的方案,方案中:通过学习查询文本和视频帧之间的相似关系(混合嵌入),并以查询文本和视频帧之间的相似关系为条件,来迭代细化随机片段为正确视频片段的时间边界框,无需依赖于特定于分布的视频提案,并且在训练和测试集的真实位置分布不一致时,依然表现出更多的泛化性和鲁棒性,能够获得更为准确的检索结果。

    开放词汇图像语义分割方法、系统、设备及存储介质

    公开(公告)号:CN119723096B

    公开(公告)日:2025-05-13

    申请号:CN202510227653.1

    申请日:2025-02-27

    Abstract: 本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。

    在线多量化图像检索方法

    公开(公告)号:CN110704655A

    公开(公告)日:2020-01-17

    申请号:CN201910993819.5

    申请日:2019-10-18

    Abstract: 本发明公开了一种在线多量化图像检索方法,将基于流数据相关性学习的多量化技术用于大规模在线图像检索,有效的提升搜索效果,并且,在学习过程中不更新二进制码,仅仅更新小规模的码本,可以减少重新计算流数据二进制码的负担,提升学习效率。

    基于指令条件压缩的视频理解方法、系统、设备及介质

    公开(公告)号:CN119784861A

    公开(公告)日:2025-04-08

    申请号:CN202510244373.1

    申请日:2025-03-03

    Abstract: 本发明公开了一种基于指令条件压缩的视频理解方法、系统、设备及介质,它们是一一对应的方案,方案中:从有条件压缩这一角度出发,引入指令内容作为条件,进行针对性的压缩,即在局部和全局混合的两个层次注入指令,在压缩过程中尽可能保留与指令相关联的视觉信息,允许无关信息损失,实现有条件压缩,压缩时能够很好的兼顾视觉特征的高压缩率与低信息损失,并且能够尽可能多的保留完成指令任务所需要的视觉细节,从而更好的完成视频理解任务,实现了在更高效压缩的同时取得优秀的视频理解能力。

Patent Agency Ranking