-
公开(公告)号:CN109784191A
公开(公告)日:2019-05-21
申请号:CN201811559959.3
申请日:2018-12-20
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于商图像的多任务人脸光照编辑方法,包含以下步骤:(1)预处理:对目标人脸与参考人脸进行人脸检测与人脸配准;(2)商图像特征提取:根据不同的人脸光照编辑任务提取相应的初始商图像特征;(3)商图像特征扩散:根据目标人脸把初始商图像特征扩散到整幅图像;(4)商图像融合:根据不同的人脸光照编辑任务把目标人脸与商图像进行融合,实现相应的光照迁移、光照归一化。本发明方法能在一个技术框架内同时实现人脸的光照迁移与光照归一化效果,提高人脸光照编辑系统的复用性、可扩展性,同时能自动地提取人脸的光照信息,并根据不同任务与人脸的特点自适应地进行光照调节,提高了人脸光照编辑的效率和易用性。
-
公开(公告)号:CN109784191B
公开(公告)日:2021-01-01
申请号:CN201811559959.3
申请日:2018-12-20
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于商图像的多任务人脸光照编辑方法,包含以下步骤:(1)预处理:对目标人脸与参考人脸进行人脸检测与人脸配准;(2)商图像特征提取:根据不同的人脸光照编辑任务提取相应的初始商图像特征;(3)商图像特征扩散:根据目标人脸把初始商图像特征扩散到整幅图像;(4)商图像融合:根据不同的人脸光照编辑任务把目标人脸与商图像进行融合,实现相应的光照迁移、光照归一化。本发明方法能在一个技术框架内同时实现人脸的光照迁移与光照归一化效果,提高人脸光照编辑系统的复用性、可扩展性,同时能自动地提取人脸的光照信息,并根据不同任务与人脸的特点自适应地进行光照调节,提高了人脸光照编辑的效率和易用性。
-
公开(公告)号:CN114757838B
公开(公告)日:2024-12-10
申请号:CN202210268828.X
申请日:2022-03-18
Applicant: 华南理工大学
Abstract: 本发明公开了一种无监督领域自适应图像非盲解卷积方法、装置及介质,其中方法包括:确定源域数据和目标域数据;构建非盲解卷积模型;采用源域数据对非盲解卷积模型进行有监督训练,获得预训练模型;将获得的预训练模型作用到目标域数据上,并采用无监督自适应损失对预训练模型进行训练,获得迁移模型;判断迁移模型的解卷积精度是否满足预设条件,若满足则停止训练,否则继续训练;将迁移训练后的迁移模型作用于目标域数据,输出测试图像的解卷积结果。本发明在不需要访问源域数据和目标域数据中的清晰图像的同时,对预训练模型进行迁移,提高模型在目标域的非盲解卷积性能。本发明可广泛应用于图像非盲解卷积领域。
-
公开(公告)号:CN114529461B
公开(公告)日:2024-08-06
申请号:CN202210024843.X
申请日:2022-01-11
Applicant: 华南理工大学
IPC: G06T5/73 , G06T9/00 , G06V10/52 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 本发明公开了一种深度学习单图像去反射方法、装置、电子设备和存储介质,该方法包括:构造训练集;利用网络中的编码器对训练集中带反射图像I进行特征提取,得到n个不同尺度的编码特征图;根据n个不同尺度的编码特征图,在网络的解码过程中,生成各尺度的解码特征图、传输层图像特征图和反射区域导向掩膜图,并得到最终预测的传输层图像;利用训练集中真实的传输层图像T对网络进行监督,指导网络预测的传输层图像更接近真实传输层图像,达到图像去反射的目的;同时对生成的掩膜图进行监督,限制掩膜图的取值范围,指导网络生成更精确掩膜图,引导网络准确预测传输层图像。本发明能够很好地对单张反射图像完成去反射任务。
-
公开(公告)号:CN117893657A
公开(公告)日:2024-04-16
申请号:CN202410012337.8
申请日:2024-01-02
Applicant: 华南理工大学
IPC: G06T15/00 , G06T9/00 , G06V40/16 , G06V10/77 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于语言引导三维模型的人脸图像属性控制方法及系统,该方法包括下述步骤:人脸图像经编码器得到原始潜在代码,原始潜在代码经生成器得到反演图像,反演图像经三维重建器得到原始的三维表示,原始的三维表示经渲染器得到三维渲染图像,三维渲染图像经图像编码器得到图像嵌入,语言属性描述经语言编码器得到语言嵌入,图像嵌入映射到属性嵌入空间中,受到语言嵌入指引的图像嵌入映射回图像空间,经映射网络得到目标三维表示,目标三维表示与原始的三维表示的残差与原始潜在代码一并输入到跨模态映射网络中,进而输出潜代码残差,潜代码残差与原始潜在代码相加后经生成器输出二维人脸图像。本发明实现了更加细粒度的面部属性控制。
-
公开(公告)号:CN117636372A
公开(公告)日:2024-03-01
申请号:CN202311477916.1
申请日:2023-11-07
Applicant: 华南理工大学
IPC: G06V30/22 , G06V30/19 , G06V30/148 , G06V10/82 , G06V30/18 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种手写汉字相似度度量方法、系统、装置及存储介质,其中方法包括:获取字帖图像;将字帖图像输入汉字分割模型,获得多个待评分的手写汉字图像;将手写汉字图像输入汉字分类模型,获得手写汉字的类别;根据手写汉字的类别,从标准库中获取对应的标准汉字,并一起输入汉字空间对齐模型,获得与标准汉字对齐后的手写汉字;将对齐后的手写汉字和其对应的标准汉字,输入笔画分割模型,得到二者的笔画分割结果;将笔画根据类似交并比的计算方式获得手写汉字与其对应标准汉字对比后的相似度。本发明对手写汉字和标准汉字二者分割出来的笔画进行相似度计算,为评价手写汉字或其他研究提供帮助,可广泛应用于图像模式识别技术领域。
-
公开(公告)号:CN117555915A
公开(公告)日:2024-02-13
申请号:CN202311344558.7
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06F16/242 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/0895
Abstract: 本发明公开了一种基于多模态预训练的SQL特征提取方法、装置及介质,其中方法包括:对获取的SQL查询语句和执行计划进行数据预处理;使用BERT模型生成SQL查询语句和执行计划的初始特征;通过把查询语句输入基于自注意力机制的编码器,获得SQL查询语句的语义和结构特征;通过把执行计划输入基于关系感知注意力机制的编码器,获得SQL执行计划的执行逻辑特征;将两种特征通过跨模态编码器进行融合,获得SQL的特征表示。本发明综合考虑SQL相关的语义、结构和执行逻辑特征,采用掩码任务和对比学习任务结合的方式进行预训练,模型提取的SQL特征具有良好的泛化能力,可应用于多种数据库相关领域的任务场景。
-
公开(公告)号:CN117173445A
公开(公告)日:2023-12-05
申请号:CN202310725542.4
申请日:2023-06-19
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/20 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/09 , G06N3/047
Abstract: 本发明公开了一种超图卷积网络和对比学习的多视图三维物体分类方法,包括:三维物体渲染,多视图特征提取,基于超图卷积神经网络的多视图特征交互,基于对比学习的特征优化,基于自适应权重的多视图特征融合模块和分类器。为了解决当前方法中视图间缺乏信息交互模块或传统方法中信息交互不充分,全局特征融合时带来的信息丢失问题和增加对高维特征表示空间的约束,本发明引进基于单视图特征的超图卷积神经网络和基于同批次中的正负例的对比学习参数调整机制,实现了视图间信息的有效交互,再通过自适应特征融合模块获取更加鲁棒性的全局特征。本发明的算法模型在大量的数据集上进行测试,取得了先进结果,进一步提高了对室内物体的识别性能。
-
公开(公告)号:CN116612478A
公开(公告)日:2023-08-18
申请号:CN202310317071.3
申请日:2023-03-28
Applicant: 华南理工大学 , 广州伟度计算机科技有限公司
IPC: G06V30/19 , G06V30/244 , G06V10/82 , G06N3/0464 , G06N3/088
Abstract: 本发明公开了一种脱机手写汉字的评分方法、装置及存储介质,其中方法包括:获取待评分的手写汉字图像;将手写汉字图像输入训练后的汉字评分模型,提取手写汉字的特征结构,将提取的特征结构与标准库中对应的汉字进行对比分析,获得手写汉字的综合评分;和/或,基于汉字像素点的分布规律,分析手写汉字图像中汉字像素点的二维分布,获得多种二维特征,根据获得的多种二维特征与标准库中对应的汉字进行对比分析,获得手写汉字不同维度上的评分。本发明通过模型对手写文字图像进行处理,或者根据汉字像素点对手写文字图像进行处理,能够对手写汉字进行整体评分,为书写者提供改进参考。本发明可广泛应用于图像模式识别技术领域。
-
公开(公告)号:CN116361540A
公开(公告)日:2023-06-30
申请号:CN202310001237.0
申请日:2023-01-03
Applicant: 华南理工大学
IPC: G06F16/9535 , G06F18/214 , G06N3/0464 , G06N3/048 , G06N3/088 , G06Q50/00 , G06Q30/0601
Abstract: 本发明公开了一种基于用户多意图的社会化推荐方法、装置及介质,其中方法包括:获取数据集,构建图结构数据;构建包含两部分图卷积网络的推荐模型,用于先后建模用户商品交互关系和用户社交关系;意图空间映射;交互意图解耦合学习;自适应去噪;用户社交多影响学习;无监督学习;结合得到的最终商品特征向量、最终用户特征向量和无监督学习对推荐模型进行训练学习;将推荐模型最终学习到的用户和商品特征向量进行打分预测,得到推荐商品顺序。本发明充分挖掘用户商品交互中的多意图影响,以及用户社交关系的多影响,学习更细粒度的用户表征和商品表征,获得更加准确的推荐结果。本发明可广泛应用于推荐系统技术领域。
-
-
-
-
-
-
-
-
-