-
公开(公告)号:CN119961457A
公开(公告)日:2025-05-09
申请号:CN202510443645.0
申请日:2025-04-10
Applicant: 厦门大学
IPC: G06F16/355 , G06F18/241 , G06N3/042 , G06N3/0895 , G06N3/0464
Abstract: 本发明公开了一种基于局部增强和去偏对比的论文分类方法及装置,涉及节点分类领域,包括:基于论文分类训练数据构建图数据集,为图数据集中的每个节点构建局部样本;利用每个节点的局部样本和增强策略,得到第一增强视图和第二增强视图并输入到权重共享的图编码器和线性投射层,得到对应的节点表示;根据对应的节点表示构建去偏对比损失函数,基于去偏对比损失函数对图编码器进行训练,得到经图对比学习的图编码器;获取待分类的论文集并构建得到对应的图数据集,将待分类的论文集对应的图数据集中的特征矩阵和邻接矩阵输入到经训练的论文分类模型,经过经图对比学习的图编码器和分类器,得到分类结果。本发明解决了采样偏差等问题。
-
公开(公告)号:CN119919768A
公开(公告)日:2025-05-02
申请号:CN202411947918.7
申请日:2024-12-27
Applicant: 厦门大学
Abstract: 本发明提供一种基于图信息传播的视觉令牌剪枝方法,包括对输入图像进行视觉提取得到视觉令牌;初始化视觉令牌的重要性评分;构建关于视觉令牌的图结构,将每一视觉令牌作为节点,计算邻接矩阵,用以构建视觉令牌间的连接,初始化图结构;通过预设的相似度阈值更新邻接矩阵,得到不同区域的视觉令牌子图结构;对邻接矩阵的每一行进行归一化处理,对节点信息进行迭代传播,计算每一视觉令牌的最终得分;根据视觉令牌的最终得分筛选出k个分值最高的视觉令牌进行投影;将投影得到的视觉令牌与文本令牌进行拼接,输入给大语言模型,得到输出结果。本发明方法可提高模型的计算效率,在保持视觉任务性能的同时显著降低计算成本。
-
公开(公告)号:CN119831873A
公开(公告)日:2025-04-15
申请号:CN202411825463.1
申请日:2024-12-12
Applicant: 厦门大学
IPC: G06T5/60 , G06T5/77 , G06N3/0475 , G06N3/084 , G06N3/045 , G06N3/0464
Abstract: 本发明公开一种基于动态轨迹扩散模型的一体化图像恢复方法,包括:1、在训练阶段,对于时间步t,一步扩散过程表示为#imgabs0##imgabs1#2、采用L1范数对时间步t的扩散图像It和预测图像#imgabs2#进行约束;3、反向传播训练神经网络;4、在推理阶段,根据输入图片信息自适应地分配对应的扩散残差调制器#imgabs3#和扩散分布调制器#imgabs4#并通过扩散模型推理输出图片,对应的反向推理过程表示为#imgabs5#本发明通过动态调整扩散轨迹,根据不同的图像退化类型自适应地选择最优恢复路径,从而提升图像恢复的整体性能,有效的减少了计算开销并提高了处理不同退化类型的灵活性。
-
公开(公告)号:CN119810442A
公开(公告)日:2025-04-11
申请号:CN202411868829.3
申请日:2024-12-18
Applicant: 厦门大学
IPC: G06V10/26 , G06V10/25 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895 , G06N3/096
Abstract: 本发明公开了一种伪标签质量解耦与修正的半监督实例分割方法及系统,方法包括以下步骤:教师模型处理未标注图像并生成预测结果;通过解耦的双阈值机制过滤预测结果,保留满足条件的预测结果作为实例伪标签;对实例伪标签进行动态实例类别修正,得到修正伪标签;结合预测结果和修正伪标签构建损失函数,训练用于进行实例分割的学生模型。本发明通过解耦的双阈值过滤机制、动态实例类别修正模块及像素级掩码不确定性感知机制,独立控制伪标签的类别与掩码质量,有效减少半监督实例分割任务中伪标签噪声带来的影响;本发明尤其适用于需要利用大规模未标注数据提升图像理解方面的有效性的半监督场景,其显著提升了半监督实例分割的性能。
-
公开(公告)号:CN119623513A
公开(公告)日:2025-03-14
申请号:CN202411786935.7
申请日:2024-12-06
Applicant: 厦门大学
IPC: G06N3/042 , G06N3/0464
Abstract: 本发明提供一种基于路径的K跳超图神经网络卷积方法,包括:步骤S1、创建用于图下游任务的超图神经网络模型,初始化模型;步骤S2、获取节点(超边)间不同距离的最短路径及其中心节点或超边;步骤S3、聚合节点直接连接的超边上的节点特征;超图经过对偶变换后,超边的聚合以相同方式进行;步骤S4、获取低阶聚合后更新的节点特征,作为路径特征,供高阶HyperGINE进行节点K跳邻域的聚合;在超图数据经过对偶变换后,获取相应的不同跳的聚合表示;步骤S5、将各自K跳邻域聚合的结果进行更新;步骤S6、通过堆叠由步骤S3、S4和S5形成的KHGNN层,完成超图特征的提取,并通过与下游任务相匹配的输出网络进行任务预测。本发明可实现下游任务的高效预测。
-
公开(公告)号:CN119516098A
公开(公告)日:2025-02-25
申请号:CN202411392309.X
申请日:2024-10-08
Applicant: 厦门大学
IPC: G06T17/00 , G06T15/00 , G06T5/50 , G06V20/58 , G06V20/64 , G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种自动驾驶场景自适应单物体三维重建以及图像点云合成方法,涉及自动驾驶场景数据生产技术领域。所述方法包括:将目标物体在三维空间中的box的每一个顶点分别投射到每一帧上,然后进行图像分割,将分割物体之外的部分的不透明度置为0后作为训练的输入,并且用不透明度对于物体进行监督;结合Scaffold‑GS的参数以及相机的自适应参数进行渲染,得到渲染图像,计算训练损失对高斯点云进行更新;将训练场景和目标场景的第一帧的相机位姿进行对齐,来确定目标物体摆放的位置,然后对目标物体进行渲染,得到多视角物体图像,能够直接与目标场景图像进行粘贴的处理。本发明生成无边缘模糊的单物体三维表示,实现在目标场景中对于该物体的渲染。
-
公开(公告)号:CN119515682A
公开(公告)日:2025-02-25
申请号:CN202411442828.2
申请日:2024-10-16
Applicant: 厦门大学
IPC: G06T3/4053 , G06V10/80 , G06V10/44 , G06N3/0464
Abstract: 本发明公开一种基于动态频谱混合网络的用于单图像超分辨率的双域学习方法、电子设备和存储介质,有效整合空间域和频率域特征,以改进图像超分辨率的质量和适用性,包括:步骤1、在分解阶段,对于给定的输入图像分别通过步长#imgabs0#为#imgabs1#、#imgabs2#的卷积层来提取低频特征、高频特征;步骤2、低频特征通过#imgabs3#个级联的残差密集块后获得空间特征,高频特征通过#imgabs4#个级联的复值块后获得频率特征;步骤3、空间特征、频率特征分别由特征增强和选择单元进行增强和融合;步骤4、由动态特征融合编码器对于空间特征和频率特征通过单独但互连的路径进行处理,最终输出动态特征融合编码器输出的超分辨率图像。
-
公开(公告)号:CN119416849A
公开(公告)日:2025-02-11
申请号:CN202411277413.4
申请日:2024-09-12
Applicant: 厦门大学
IPC: G06N3/082 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种用于高效N_M稀疏训练的块感知掩码进化方法,涉及神经网络压缩与加速技术领域。所述方法包括:对于N:M稀疏模式,将权重向量划分为固定大小M的权重块;对于每个权重块分别计算权重指标,然后根据权重指标适应得到相应的二进制掩码;对每组权重块计算稀疏架构差异得到块感知分数,然后选取高频掩码块;组合二进制掩码与高频掩码块实现联合优化,得到新掩码,通过新掩码更新原始掩码以及进行剪枝和恢复权重,降低训练损失。本发明提供的一种用于高效N_M稀疏训练的块感知掩码进化方法,在整个训练过程中执行稀疏的前向和后向传播,大大减轻了训练成本。
-
公开(公告)号:CN119180764A
公开(公告)日:2024-12-24
申请号:CN202411224381.1
申请日:2024-09-03
Applicant: 厦门大学
Abstract: 本发明提供一种免数据标注和网络训练的场景文本消除方法,所述方法包括:在预训练扩散去噪模型反演过程中进行层次化文本定位,通过从原图中获取第一文本区域的掩膜,对第一文本区域对应的原图进行裁剪与放大得到复数个子图,再从子图中获取得到第二文本区域的掩膜,对子图进行2‑均值聚类得到子图子区域并计算出第三文本区域的掩膜;在对反演得到的潜空间噪声进行重建之前,预先将其文本区域用随机高斯噪声进行破坏得到处理后的潜空间图;将处理后的潜空间图输入到预训练扩散去噪模型中对背景区域进行自动恢复得到文本消除后的图像。本发明方法可在无训练和数据集标注的前提下完成文本定位、文本破坏、背景恢复等流程,提高了图像处理效率。
-
公开(公告)号:CN119128049A
公开(公告)日:2024-12-13
申请号:CN202411047051.X
申请日:2024-08-01
Applicant: 厦门大学
Abstract: 本发明涉及一种基于文本注意力的跨模态表征模型构建方法及检索方法,其在在线模型中增加了两个极具创新性的模块:基于注意力引导的掩码建模模块和文本增强模块。其中,注意力引导的掩码建模模块以文本编码前向过程中的注意力为参考,对文本描述中的单词进行自适应掩盖,这样一来,掩码语言建模模块在预测掩盖词的过程中,能够捕获与掩盖词相关联的语义进行对齐,从而更高效地对齐跨模态表征。文本增强模块以一种轻量化的方式来对下游任务数据集中的文本描述进行了扩充,解决了数据集中文本描述用词单一且存在错误等问题,提高了检索准确率。
-
-
-
-
-
-
-
-
-