Patent search ap:("华侨大学") AND inv:"施一帆" Page 1

1.

发明公开
基于动态自适应和强化特征的多目标跟踪分割方法及系统有权

公开(公告)号：CN119444804A

公开(公告)日：2025-02-14

申请号：CN202510037837.1

申请日：2025-01-10

Applicant: 华侨大学

Inventor： 陈龙涛 , 廖国兴 , 曾焕强 , 朱建清 , 黄德天 , 黄诚惕 , 傅玉青 , 施一帆

IPC: G06T7/246 , G06T7/194 , G06V10/75 , G06V10/82 , G06V40/20

Abstract: 本发明涉及图像处理技术领域，提出了一种基于动态自适应和强化特征的多目标跟踪分割方法及系统，方法包括前处理步骤、外观代价计算步骤、预匹配步骤、运动代价计算步骤、正式匹配步骤、后处理步骤、重复步骤和可视化步骤。该方法通过具有动态自适应的数据关联对目标特征进行细化整合，以及利用基于掩码的注意力机制和基于四三角形变的掩码预测分别强化目标外观特征和运动信息，以能够在保持高跟踪精度的同时，实现快速运算和低成本运行，适用于更广泛的应用场景。

2.

发明授权
一种无人机森林火灾风险区块检测方法及系统有权

公开(公告)号：CN119027845B

公开(公告)日：2025-02-14

申请号：CN202411514321.3

申请日：2024-10-29

Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司

Inventor： 潘文杰 , 朱建清 , 陈宇涛 , 庄碧丹 , 曾焕强 , 陈婧 , 施一帆 , 蔡磊

IPC: G06V20/17 , G06V10/25 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/80

Abstract: 本发明涉及图像处理与人工智能技术领域，公开了一种无人机森林火灾风险区块检测方法及系统，方法包括：构建基于区块分类的目标检测模型并进行训练，利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测；所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征；利用多阶段采样网络对区块特征进行多种尺度的采样，并利用降维映射层进行尺度对齐，获得多尺度区块特征；通过哈达玛积融合多尺度区块特征，利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位，避免了现有技术因精确定位导致的庞大计算量，延长无人机可用时间。

3.

发明授权
基于分层时空感知的屏幕内容视频质量评价方法及装置有权

公开(公告)号：CN118865075B

公开(公告)日：2024-12-03

申请号：CN202411319739.9

申请日：2024-09-23

Applicant: 华侨大学

Inventor： 曾焕强 , 刘智鸿 , 陈婧 , 朱建清 , 施一帆 , 蔡磊 , 林琦 , 郑惠洁 , 龚鑫荣 , 侯军辉

IPC: G06V10/98 , G06N3/043 , G06N3/0464 , G06V10/776 , G06V10/82

Abstract: 本发明公开了一种基于分层时空感知的屏幕内容视频质量评价方法及装置，涉及视频评价领域，包括：提取屏幕内容视频中的若干个碎片化视频和若干个关键帧并输入经训练的屏幕内容视频质量评价模型，每个关键帧输入显著性计算模块筛选出若干个显著视频块，每个显著视频块输入双通道卷积神经网络，得到每个阶段的多层特征并输入块级质量评估模块，经过空间门特征增强模块，得到每个阶段的增强特征并输入块级质量聚合模块，得到每个视频块的块级质量分数；采用自适应加权策略计算得到空域感知质量分数；碎片化视频输入时域感知质量评估支路，得到时域感知质量分数，两者结合计算得到屏幕内容视频的质量分数，解决现有视频质量评价方法可靠性差的问题。

4.

发明授权
一种基于姿势对抗网络的人脸视频生成方法及系统有权

公开(公告)号：CN118379777B

公开(公告)日：2024-11-22

申请号：CN202410807403.0

申请日：2024-06-21

Applicant: 华侨大学

Inventor： 曾焕强 , 郑航杰 , 朱建清 , 陈婧 , 施一帆 , 蔡磊 , 林琦 , 夏至贤

IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10

Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统，涉及图像处理技术领域，方法包括：构建人脸视频生成模型，包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器，所述人脸视频生成模型接收人脸图像和语音音频，生成人脸说话视频；获取训练数据集并对人脸视频生成模型进行预训练；构建唇型同步判别器作为判别器，对预训练人脸视频生成模型进行生成对抗训练；利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模，并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度，同时兼顾视频的逼真度，使得其更加真实、自然，从而为各种应用场景提供了更多的灵活性。

5.

发明授权
一种基于联合特征的MIV沉浸式视频率失真优化方法有权

公开(公告)号：CN118381920B

公开(公告)日：2024-09-17

申请号：CN202410807401.1

申请日：2024-06-21

Applicant: 华侨大学

Inventor： 曾焕强 , 孔庆玮 , 朱建清 , 施一帆 , 陈婧 , 杨慰民 , 蔡磊 , 夏至贤

IPC: H04N19/147 , G06V10/80 , G06V10/44 , G06V10/54

Abstract: 本发明公开了一种基于联合特征的MIV沉浸式视频率失真优化方法，涉及视频编码领域，包括：计算像素的几何失真权重；将帧内划分为纹理区域与深度区域，提取纹理区域的纹理复杂度特征、纹理区域的边缘特征和深度区域的边缘特征，自适应融合纹理区域的边缘特征和深度区域的边缘特征以得到融合边缘特征；使用纹理复杂度特征与融合边缘特征组成的联合特征，计算得到纹理区域的失真度量缩放因子与深度区域的失真度量缩放因子；根据纹理区域的失真度量缩放因子、失真度量缩放因子和几何失真权重计算新拉格朗日乘子；基于新拉格朗日乘子实现沉浸式视频的率失真优化。本发明可以使得最终渲染的沉浸式视频具有更好的渲染质量与率失真性能。

6.

发明公开
一种基于强感知Transformer架构的缺损视频修复方法及系统有权

公开(公告)号：CN118469876A

公开(公告)日：2024-08-09

申请号：CN202410912771.1

申请日：2024-07-09

Applicant: 华侨大学

Inventor： 陈婧 , 左雨亭 , 曾焕强 , 朱建清 , 施一帆 , 林琦 , 郑惠洁

IPC: G06T5/77 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T5/60

Abstract: 本发明公开了一种基于强感知Transformer架构的缺损视频修复方法及系统，涉及视频处理技术领域，方法包括以下步骤：特征提取模块接收待修复的缺损视频帧序列，采用卷积神经网络对视频帧进行特征提取，输出第一特征；强感知Transformer模块接收第一特征，采用交叉堆叠的局部感知Transformer和全局感知Transformer结构对第一特征进行纹理信息建模和结构信息建模，输出第二特征；重构模块接收第二特征，采用反卷积层进行视频帧重建，输出修复后视频帧序列。本发明采用交叉堆叠的局部感知Transformer和全局感知Transformer进行纹理信息和结构信息建模，有效解决现阶段缺损视频修复方法中存在修复区域缺乏细节纹理、全局结构与局部纹理不匹配的问题，实现更好的修复效果。

7.

发明公开
一种基于联合特征的MIV沉浸式视频率失真优化方法有权

公开(公告)号：CN118381920A

公开(公告)日：2024-07-23

申请号：CN202410807401.1

申请日：2024-06-21

Applicant: 华侨大学

Inventor： 曾焕强 , 孔庆玮 , 朱建清 , 施一帆 , 陈婧 , 杨慰民 , 蔡磊 , 夏至贤

IPC: H04N19/147 , G06V10/80 , G06V10/44 , G06V10/54

Abstract: 本发明公开了一种基于联合特征的MIV沉浸式视频率失真优化方法，涉及视频编码领域，包括：计算像素的几何失真权重；将帧内划分为纹理区域与深度区域，提取纹理区域的纹理复杂度特征、纹理区域的边缘特征和深度区域的边缘特征，自适应融合纹理区域的边缘特征和深度区域的边缘特征以得到融合边缘特征；使用纹理复杂度特征与融合边缘特征组成的联合特征，计算得到纹理区域的失真度量缩放因子与深度区域的失真度量缩放因子；根据纹理区域的失真度量缩放因子、失真度量缩放因子和几何失真权重计算新拉格朗日乘子；基于新拉格朗日乘子实现沉浸式视频的率失真优化。本发明可以使得最终渲染的沉浸式视频具有更好的渲染质量与率失真性能。

8.

发明公开
一种基于姿势对抗网络的人脸视频生成方法及系统有权

公开(公告)号：CN118379777A

公开(公告)日：2024-07-23

申请号：CN202410807403.0

申请日：2024-06-21

Applicant: 华侨大学

Inventor： 曾焕强 , 郑航杰 , 朱建清 , 陈婧 , 施一帆 , 蔡磊 , 林琦 , 夏至贤

IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10

Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统，涉及图像处理技术领域，方法包括：构建人脸视频生成模型，包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器，所述人脸视频生成模型接收人脸图像和语音音频，生成人脸说话视频；获取训练数据集并对人脸视频生成模型进行预训练；构建唇型同步判别器作为判别器，对预训练人脸视频生成模型进行生成对抗训练；利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模，并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度，同时兼顾视频的逼真度，使得其更加真实、自然，从而为各种应用场景提供了更多的灵活性。

9.

发明公开
基于宽度学习的多视图的癌症基因数据聚类集成方法及装置审中-实审

公开(公告)号：CN118155731A

公开(公告)日：2024-06-07

申请号：CN202410311105.2

申请日：2024-03-19

Applicant: 华侨大学 , 厦门盈趣科技股份有限公司

Inventor： 施一帆 , 陈德鑫 , 朱建清 , 曾焕强 , 陈婧 , 陈建成 , 杨楷翔

IPC: G16B40/30 , G06F18/23 , G06N3/0455 , G06N3/08 , G06N7/02

Abstract: 本发明公开了一种基于宽度学习的多视图的癌症基因数据聚类集成方法及装置，包括：构建自编码器模型，确定经训练的子空间自表达结构的系数矩阵，基于该系数矩阵对自编码器模型进行训练，多视图的癌症基因数据输入经训练的自编码器模型，得到特征处理后的样本矩阵；对特征处理后的样本矩阵进行聚类，得到多个基础聚类结果并作为集成池中的集成成员，以构建模糊划分矩阵和置信度矩阵；构建基于第二宽度学习网络的聚类集成模型，对聚类集成模型进行训练，得到经训练的聚类集成模型，将模糊划分矩阵输入经训练的聚类集成模型，得到软集成结果，对软集成结果进行聚类，得到多视图的癌症基因数据的聚类结果，有效提升网络模型的鲁棒性和准确性。

10.

发明授权
基于三维几何失真的MIV沉浸式视频编码率失真优化方法有权

公开(公告)号：CN117440158B

公开(公告)日：2024-04-12

申请号：CN202311759886.3

申请日：2023-12-20

Applicant: 华侨大学

Inventor： 曾焕强 , 孔庆玮 , 陈婧 , 朱建清 , 施一帆 , 林琦 , 郑惠洁 , 夏至贤

IPC: H04N19/147 , H04N19/154

Abstract: 本发明公开了一种基于三维几何失真的MIV沉浸式视频编码率失真优化方法，涉及视频编码领域，包括：S1，基于MIV编码平台编码沉浸式视频序列，生成图集后，计算与深度映射范围系数；S2，使用支持MIV标准的二维视频编码器编码沉浸式视频几何图集时，构建三维几何失真与均方误差的关系模型；S3，根据三维几何失真与均方误差的关系模型，计算三维几何失真系数；S4，根据三维几何失真系数，计算率失真优化模型中新的拉格朗日乘子，基于调整后的率失真优化模型编码当前CTU，以改善沉浸式视频渲染质量的率失真性能。本发明最终渲染的沉浸式视频质量与码率的率失真性能更好。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification