-
公开(公告)号:CN117974681A
公开(公告)日:2024-05-03
申请号:CN202410208889.6
申请日:2024-02-26
Applicant: 中国科学技术大学
IPC: G06T7/10 , G06N3/0455 , G06N3/0464 , G06N3/0895 , G06N3/084
Abstract: 本发明公开了一种基于动态伪标签细化的半监督图像分割方法,其步骤包括:1、准备图像数据集并预处理;2、构建双视图图像分割架构;3、对无标注数据进行分级伪标签生成和动态伪标签校正;4、利用训练好的模型进行预测,以实现与全监督分割水平相当的图像分割结果。本发明通过有效利用双视图的一致性和差异性,动态迭代生成和校正未标注数据的伪标签,从而能实现精确的图像分割。
-
公开(公告)号:CN116168450A
公开(公告)日:2023-05-26
申请号:CN202310209717.6
申请日:2023-03-01
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及以一种基于事件相机的孤立手语词识别方法,该方法包括:使用事件相机翻拍孤立手语词视频获得孤立手语词事件流,按固定时间窗长切片处理获得事件流切片,设计基于事件驱动的采样算法对事件流切片采样得到关键帧,以体素网格形式表征关键帧得到低速和高速关键帧张量,输入包含高低速运动信息融合模块和时序移位模块的卷积神经网络中分类实现对孤立手语词的识别。本发明结合事件相机的特点,充分提取孤立手语词事件流中的关键帧信息和高速运动信息,有效缓解了基于传统相机的识别方法其效果受限于视频信息冗余、运动模糊的问题,进而提升识别效率和准确率。
-
公开(公告)号:CN115797751A
公开(公告)日:2023-03-14
申请号:CN202310063063.0
申请日:2023-01-18
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于对比掩码图像建模的图像分析方法与系统,它们是一一对应的方案,方案中将对比学习和掩码图像建模结合,相比于现有的实例级的对比学习方法,本发明对图像的内部结构建模,以获得对细粒度任务友好的表示;相比现有的掩码图像建模方法,本发明在自注意力机制的引导下选择遮盖区域以及特征预测,而不是重建被随机遮盖的像素或小图像块,因此训练更加高效。因此,通过本发明提供的对比掩码图像建模方法进行网络训练后,能够有效的提取图像的表征,从而在图像分析任务中获得更好的效果;通过实验表明本发明在图像分类、目标检测、语义分割等图像分析任务中获得了优于各项现有技术的效果。
-
公开(公告)号:CN110880162B
公开(公告)日:2023-03-10
申请号:CN201911155395.1
申请日:2019-11-22
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于深度学习的快照光谱深度联合成像方法及系统,利用不同视角拍摄的低空间分辨率光谱图像和高空间分辨率RGB图像之间的互补性,在不牺牲时间分辨率的条件下,利用深度学习算法重建出场景的高空间分辨率光谱图像和深度图像。此外,获取光谱图像和深度图像,即获取了目标场景的反射特性和几何特性。由此特性可以建立场景的基本描述,进而可以对目标场景进行三维重建,光线渲染等操作。除此之外,本发明的成像系统体积紧凑,标定简单,为未来光谱深度成像在手机或无人机等小型设备上的应用提供了可行的解决思路。
-
公开(公告)号:CN113487719A
公开(公告)日:2021-10-08
申请号:CN202110642890.6
申请日:2021-06-09
Applicant: 中国科学技术大学
Abstract: 本发明提供了一种基于事件相机的高速结构光三维重建方法,所述三维重建方法包括:产生随机散斑,通过投影仪将所述随机散斑投影到目标物体表面经反射后触发事件,产生事件流;对于事件相机接收到的所述事件流,采用自适应事件帧提取算法,将事件流转化为图片帧的形式;将包含目标物体的数据提取的事件帧作为形变帧;将另一组不包含目标物体的数据提取的事件帧作为参考帧,计算所述参考帧和所述形变帧之间的像素偏移;通过偏移量结合事件相机和投影仪的空间位置进行三角化得到物体的三维点云,完成三维重建。
-
公开(公告)号:CN113473140A
公开(公告)日:2021-10-01
申请号:CN202110799286.4
申请日:2021-07-15
Applicant: 中国科学技术大学
IPC: H04N19/172 , H04N19/42 , H04N19/70
Abstract: 本发明公开了一种脑神经图像的有损压缩方法、系统、设备与存储介质,相关方案可以将脑神经图像压缩至上百倍,大大节省了脑神经图像的占用空间,且解压后的图像相比于原图像,没有损失过多视觉上的信息。同时,本发明相比于其他的有损压缩方式,具有更快的解压速度,更小的计算资源消耗,因此也适配较低性能的计算机。本发明将会方便生物医学领域的研究人员进行大规模脑神经图像的存储与管理。
-
公开(公告)号:CN113254416A
公开(公告)日:2021-08-13
申请号:CN202110581589.9
申请日:2021-05-26
Applicant: 中国科学技术大学
IPC: G06F16/182 , G06F16/54
Abstract: 本公开提供了一种全脑数据的存储方法,包括:获取原始数据集、标注数据集及标签数据集;将各数据集进行预处理,分别得到海量的原始图片数据、标注图片数据及标签图片数据;将海量的原始图片数据、标注图片数据及标签图片数据进行下采样分级处理,得到多个不同级别的海量原始图片数据、海量标注图片数据及海量标签图片数据;将多个不同级别的海量原始图片数据、海量标注图片数据及海量标签图片数据分别存储至分布式存储系统目录树中,包括:发起数据存储请求,并根据节点信息选取一主数据存储节点;将各图片数据依次存储至该主数据存储节点和其他数据存储节点,并将存储结果输出至客户端。本公开还提供了一种全脑数据的存储系统、电子设备及介质。
-
公开(公告)号:CN119850420A
公开(公告)日:2025-04-18
申请号:CN202510020067.X
申请日:2025-01-07
Applicant: 中国科学技术大学
IPC: G06T3/4053 , G06T3/4046 , G06T5/73 , G06T5/60 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/09 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了一种基于事件数据驱动的模糊视频超分辨率方法,其步骤包括:1、准备训练视频数据和对应的事件序列,并对事件序列进行表征;2、构建模糊视频超分辨率神经网络模型;3、对构建的模糊视频超分辨率神经网络模型进行离线训练;4、利用训练好的模型进行预测,以实现模糊视频超分辨率的目标。本发明通过利用事件数据驱动的方式,能提升模糊视频超分辨率的修复效果,从而能生成清晰的视频帧。
-
公开(公告)号:CN118279557A
公开(公告)日:2024-07-02
申请号:CN202410304579.4
申请日:2024-03-18
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于场景自适应稀疏的轻量化目标检测方法,其步骤包括:1数据收集,2基于词嵌入的数据转换,将数据转换成词符,3对词符进行场景自适应的稀疏化,4基于稀疏化结果对词符进行特征提取,4根据提取的特征进行检测,并进行网络训练,得到训练好的目标检测模型。本发明能根据场景的复杂程度自适应地调整自注意力运算的稀疏程度,从而显著降低目标检测模型的计算复杂度。
-
公开(公告)号:CN118172536A
公开(公告)日:2024-06-11
申请号:CN202410270342.9
申请日:2024-03-11
Applicant: 中国科学技术大学
IPC: G06V10/25 , G06V10/26 , G06V10/62 , G06V10/762
Abstract: 本发明公开了一种基于关键点和目标框联合跟踪的视频目标分割方法,包括:1、获取视频数据和参考帧的数据标注,并经过预处理得到目标的文本描述;2、设计关键点跟踪分支,通过目标的关键点提取和跟踪得到目标关键点的运动轨迹;3、设计目标框跟踪分支,依据文本提示生成大量关于目标的候选框,并设计基于记忆机制的目标框选择模块实现目标的跟踪;4、设计一个点框联合过滤器,依靠关键点和目标框的相对位置关系滤除不可靠的点和目标框;5、将保留的点和框输入到分割一切模型SAM,从而得到视频中每一帧的目标分割结果。本发明通过利用关键和目标框联合跟踪的方式,提升视频目标分割的效果,从而更好地分割感兴趣的目标。
-
-
-
-
-
-
-
-
-