-
公开(公告)号:CN113159034B
公开(公告)日:2024-11-15
申请号:CN202110442856.4
申请日:2021-04-23
Applicant: 杭州电子科技大学
IPC: G06V20/62 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F16/951
Abstract: 本发明公开了一种短视频自动生成字幕的方法及系统。通过3D卷积网络进行视频的特征提取,获得视频特征序列,使用DAPs模型对接收到的视频特征序列进行事件检测,得到预测的事件片段并且对每个片段打分。单独处理获得的每个事件片段,首先对事件片段进行视觉嵌入操作,然后将进行视觉嵌入操作后的事件片段输入Transformer模型中,通过获得预测的文本。本发明通过融合跨模态技术,前期处理包含事件检测,缩小了后续文本生成工作的范围,增加了生成的文本与事件的匹配度。文本生成部分发挥Transformer在特征编码、解码方面的出色表现。
-
公开(公告)号:CN113554566A
公开(公告)日:2021-10-26
申请号:CN202110863831.1
申请日:2021-07-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于可学习频域先验的去摩尔纹系统及方法。本发明使用一个统一的框架来执行摩尔纹消除和颜色恢复两个任务,通过学习频域先验从图像中分离出摩尔纹,再进行全局和局部的色调映射以实现精确的颜色恢复。通过在索贝尔滤波中引入膨胀率来构造三维索贝尔损失,可以在多个尺度上感知结构高频信息,并显著提高去摩尔纹的性能,改进后的索贝尔滤波器提供了2个45度的附加滤波器。可以使用任何块大小的通带来拟合莫尔条纹的频率先验。通过几个不同密集块大小的可学习滤波带通来拟合频率先验,带来了明显的性能增益,但几乎没有增加额外的计算负担。
-
公开(公告)号:CN113160178A
公开(公告)日:2021-07-23
申请号:CN202110442869.1
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于注意力模块的高动态范围去重影成像系统及方法,本发明将注意力网络应用于高动态范围去重影算法中,引导不同图像地融合,抑制图像地饱和与非对准区域;本发明创新性地提出了利用可学习的注意力网络来指导合并过程。利用注意力网络生成注意力映射,来评估不同图像区域对获得所需高动态范围图像的重要性,可以突出和参考图像互补的特征,来排除运动和严重饱和的区域,将具有注意力引导的低动态范围图像特征输入到融合网络中。利用空洞残差块来构造融合网络,有助于充分利用来自不同卷积层的信息,从而从输入的低动态范围图像中保留更多的细节,空洞卷积扩大了感受野,有助于恢复过饱和区域和运动造成的细节缺失。
-
公开(公告)号:CN113554567B
公开(公告)日:2024-04-02
申请号:CN202110865456.4
申请日:2021-07-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于小波变换的鲁棒去重影系统及方法。从低动态范围图像输入中提取多尺度特征图,并生成相应的空间注意图,以引导无参考图像识别未对准部分,从而减轻合并阶段的重影效应。在空间注意力映射的帮助下,融合模块融合LDR图像的特征映射,并最终从不同尺度重建高动态范围输出。本发明提出了一种新的跨变换域学习体系结构,由离散小波变换和离散余弦变换两种变换构成,即离散小波变换首先将特征分解为不同的频率分量,然后引入基于离散余弦变换的可学习带通滤波器生成与分解分量一致的局部特征。
-
公开(公告)号:CN113159034A
公开(公告)日:2021-07-23
申请号:CN202110442856.4
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种短视频自动生成字幕的方法及系统。通过3D卷积网络进行视频的特征提取,获得视频特征序列,使用DAPs模型对接收到的视频特征序列进行事件检测,得到预测的事件片段并且对每个片段打分。单独处理获得的每个事件片段,首先对事件片段进行视觉嵌入操作,然后将进行视觉嵌入操作后的事件片段输入Transformer模型中,通过获得预测的文本。本发明通过融合跨模态技术,前期处理包含事件检测,缩小了后续文本生成工作的范围,增加了生成的文本与事件的匹配度。文本生成部分发挥Transformer在特征编码、解码方面的出色表现。
-
公开(公告)号:CN113554566B
公开(公告)日:2024-04-02
申请号:CN202110863831.1
申请日:2021-07-29
Applicant: 杭州电子科技大学
IPC: G06T5/80 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/09
Abstract: 本发明公开了一种基于可学习频域先验的去摩尔纹系统及方法。本发明使用一个统一的框架来执行摩尔纹消除和颜色恢复两个任务,通过学习频域先验从图像中分离出摩尔纹,再进行全局和局部的色调映射以实现精确的颜色恢复。通过在索贝尔滤波中引入膨胀率来构造三维索贝尔损失,可以在多个尺度上感知结构高频信息,并显著提高去摩尔纹的性能,改进后的索贝尔滤波器提供了2个45度的附加滤波器。可以使用任何块大小的通带来拟合莫尔条纹的频率先验。通过几个不同密集块大小的可学习滤波带通来拟合频率先验,带来了明显的性能增益,但几乎没有增加额外的计算负担。
-
公开(公告)号:CN113554567A
公开(公告)日:2021-10-26
申请号:CN202110865456.4
申请日:2021-07-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于小波变换的鲁棒去重影系统及方法。从低动态范围图像输入中提取多尺度特征图,并生成相应的空间注意图,以引导无参考图像识别未对准部分,从而减轻合并阶段的重影效应。在空间注意力映射的帮助下,融合模块融合LDR图像的特征映射,并最终从不同尺度重建高动态范围输出。本发明提出了一种新的跨变换域学习体系结构,由离散小波变换和离散余弦变换两种变换构成,即离散小波变换首先将特征分解为不同的频率分量,然后引入基于离散余弦变换的可学习带通滤波器生成与分解分量一致的局部特征。
-
-
-
-
-
-