-
公开(公告)号:CN119723096A
公开(公告)日:2025-03-28
申请号:CN202510227653.1
申请日:2025-02-27
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。
-
公开(公告)号:CN117093749A
公开(公告)日:2023-11-21
申请号:CN202311355829.9
申请日:2023-10-19
Applicant: 中国科学技术大学
IPC: G06F16/783 , G06V10/30 , G06V10/74 , G06V10/25
Abstract: 本发明公开了一种生成式的视频片段检索方法、系统、设备及存储介质,它们是一一对应的方案,方案中:通过学习查询文本和视频帧之间的相似关系(混合嵌入),并以查询文本和视频帧之间的相似关系为条件,来迭代细化随机片段为正确视频片段的时间边界框,无需依赖于特定于分布的视频提案,并且在训练和测试集的真实位置分布不一致时,依然表现出更多的泛化性和鲁棒性,能够获得更为准确的检索结果。
-
公开(公告)号:CN119723096B
公开(公告)日:2025-05-13
申请号:CN202510227653.1
申请日:2025-02-27
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。
-
-
公开(公告)号:CN119784861A
公开(公告)日:2025-04-08
申请号:CN202510244373.1
申请日:2025-03-03
Applicant: 中国科学技术大学
IPC: G06T9/00 , H04N19/136 , G06N5/04 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于指令条件压缩的视频理解方法、系统、设备及介质,它们是一一对应的方案,方案中:从有条件压缩这一角度出发,引入指令内容作为条件,进行针对性的压缩,即在局部和全局混合的两个层次注入指令,在压缩过程中尽可能保留与指令相关联的视觉信息,允许无关信息损失,实现有条件压缩,压缩时能够很好的兼顾视觉特征的高压缩率与低信息损失,并且能够尽可能多的保留完成指令任务所需要的视觉细节,从而更好的完成视频理解任务,实现了在更高效压缩的同时取得优秀的视频理解能力。
-
公开(公告)号:CN119848298A
公开(公告)日:2025-04-18
申请号:CN202510326626.X
申请日:2025-03-19
Applicant: 中国科学技术大学
IPC: G06F16/783 , G06F16/78 , G06F16/75 , G06V20/40 , G06V10/82 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种长视频定位方法、系统、设备及存储介质,它们是一一对应的方案,方案中采用逐步定位的方式,首先,通过视频和文本引导来识别高光的视频帧,从而得到与查询文本对齐的视频片段,避免现有方法直接从长视频中提取片段,缺乏长视频对文本的整体感知的问题;在获得与查询文本对齐的视频片段的基础上进一步定位得到精准的时刻;逐步定位的方式中每一步定位进一步加强了视频与查询文本之间的联系,因而,可以获得更准确的定位结果。
-
公开(公告)号:CN110704655B
公开(公告)日:2022-05-13
申请号:CN201910993819.5
申请日:2019-10-18
Applicant: 中国科学技术大学
IPC: G06F16/532 , G06V10/28 , G06V10/74 , G06K9/62
Abstract: 本发明公开了一种在线多量化图像检索方法,将基于流数据相关性学习的多量化技术用于大规模在线图像检索,有效的提升搜索效果,并且,在学习过程中不更新二进制码,仅仅更新小规模的码本,可以减少重新计算流数据二进制码的负担,提升学习效率。
-
-
-
-
-
-