-
公开(公告)号:CN118350992A
公开(公告)日:2024-07-16
申请号:CN202410516234.5
申请日:2024-04-28
申请人: 上海工程技术大学
IPC分类号: G06T3/4038 , G06T3/18 , G06T3/4046 , G06T5/50 , G06T5/60 , G06N3/045 , G06N3/0464 , G06N3/084
摘要: 本发明涉及一种基于ConvNeXt的拼接图像矩形化网络。该网络针对在训练过程中往往存在不同类型(输入样本及其掩膜图)的输入图像,从而导致训练效果不佳问题,提出了利用混合注意力机制使网络对输入样本中的空间域和通道域的特征呈现不同的关注度,提升了网络的特征学习能力。同时,为使得网络尽可能提取不同尺度目标的特征,利用了空洞空间金字塔池化模块,在扩大网络感受野的同时,对不同尺度的高维特征进行融合。与现有技术相比,本发明可以有效地提高矩形化效果,并且在面对复杂非线性语义信息的拼接图像时,拥有更好的语义内容保护能力。
-
公开(公告)号:CN112508772B
公开(公告)日:2024-07-12
申请号:CN202011255134.X
申请日:2020-11-11
申请人: 北京大米科技有限公司
摘要: 本申请公开了一种图像生成方法、装置及存储介质。该方法包括输出第一待处理图像至N个目标用户,并得到第一平均反馈数据;基于第一设定参数生成N个第一加权参数,并生成N个第二待处理图像;将N个第二待处理图像分别输出至N个目标用户,并根据N个目标用户的第二反馈数据及N个第一加权参数计算得到第二设定参数;第二设定参数用于更新第一待处理图像,并更新第一平均反馈数据得到第二平均反馈数据;基于第一平均反馈数据及第二平均反馈数据确定目标设定参数并生成目标图像。可基于不同老师的形象生成加权平均图像,并与给用户授课的老师形象相结合得到最能带给用户学习积极性的形象,给用户带来更丰富的学习体验。
-
公开(公告)号:CN118247136A
公开(公告)日:2024-06-25
申请号:CN202410211195.8
申请日:2024-02-27
申请人: 厦门美图之家科技有限公司
IPC分类号: G06T3/18 , G06T9/00 , G06N3/0475 , G06N3/08 , G06V40/16
摘要: 本发明提供了一种基于扩散模型的人像写真生成方法、系统、设备及存储介质,包括:采集用户人像图和风格训练图并分别进行预处理,获得用户人像数据和风格训练数据;将用户人像数据输入至用户LoRA模型中,获得用户特征信息,将风格训练数据输入至风格LoRA模型中,获得风格特征信息,其中,用户LoRA模型和风格LoRA模型通过参数自适应预算分配策略进行改进;采用图像编码器对用户人像图进行特征提取,获得人脸特征信息;根据使用场景调整用户LoRA模型和风格LoRA模型之间的权重比例,将用户特征信息、风格特征信息以及人脸特征信息输入至扩散模型中,最终获得人像写真图。本申请能够实现输出真实、自然、相似度与美观度兼具、风格可控的人像写真图。
-
公开(公告)号:CN118229838A
公开(公告)日:2024-06-21
申请号:CN202410358644.1
申请日:2024-03-27
申请人: 大连大学
IPC分类号: G06T11/60 , G06T3/18 , G06V10/80 , G06V10/44 , G06V10/82 , G06V10/774 , G06V10/62 , G06N3/045 , G06N3/048 , G06N3/0464
摘要: 本发明提供一种用于服装形变的融合双注意力机制的外观流估计方法,首先,使用两个特征编码器分别将目标服装、蒙版、目标姿势densepose图、服装语义无关图编码为多尺度特征图;然后,在多尺度特征图经过特征金字塔网络时,融合通道和空间注意力机制;最后,按照金字塔的结构自上向下进行外观流预测,考虑多重尺度的特征图,并最终输出精细化外观流用于服装变形。该方法是一种结合通道和空间注意机制的迭代外观流估计方法,该方法不依赖3D信息和事先高质量的人类解析,也无需其他模型辅助训练,既考虑了全局的形变合理性,也考虑了局部的细节特征,单卡在VITON‑HD数据集上即可完成训练。
-
公开(公告)号:CN118096507A
公开(公告)日:2024-05-28
申请号:CN202410494270.6
申请日:2024-04-24
申请人: 泉州正海科技有限公司
IPC分类号: G06T3/18 , G06T3/40 , G06T7/11 , G06T7/70 , G06V10/762
摘要: 本发明涉及图片处理技术领域,尤其是一种将标准码刀版图转换到一般尺码刀版图的优化方法,包括:若标准码刀版图通过数据库中的优化方法形成的最终优化刀版图与一般尺码刀版图排版和大小相同,输出该最终优化刀版图;否则建立新的优化方法,将一般尺码刀版图和标准码刀版图分割;对于待转换图像块An进行旋转和/或缩放形成一次变形图像块Zn;若一次变形图像块Zn与目标图像块Bn相同,设为优化刀版图Cn;否则,对一次变形图像块Zn进行双三次贝塞尔曲面算法变换后形成二次变形图像块Mn,设为优化刀版图Cn;将该优化方法加入数据库。通过本方法生成的最终优化刀版图与一般尺码刀版图的排版和大小相同,避免产生露白。
-
公开(公告)号:CN117974711A
公开(公告)日:2024-05-03
申请号:CN202410391903.0
申请日:2024-04-02
申请人: 荣耀终端有限公司
摘要: 本申请公开了视频插帧方法及相关设备,该方法包括:基于视频中第一图像对应的第一特征图和视频中第二图像对应的第二特征图,通过光流预测算法,得到二维向量场,二维向量场用于表示第一图像和第二图像中每个像素点的运动轨迹,第一图像和第二图像为视频中相邻的两帧图像;基于第一特征图和第二特征图,确定出第三图像对应的第一掩膜图,第一掩膜图用于指示第三图像中的静态部分和动态部分;基于二维向量场、第一掩膜图、第一图像和第二图像生成第三图像;将第三图像插入第一图像和第二图像之间。采用该方法可以准确地确定出静态部分,提高图像背景的清晰度。
-
公开(公告)号:CN113837118B
公开(公告)日:2024-04-26
申请号:CN202111141052.7
申请日:2021-09-28
申请人: 支付宝(杭州)信息技术有限公司
摘要: 本说明书实施例提供了一种文本变异关系的获取方法及装置以及真实文本的获取方法及装置。首先,得到变异文本字符;将该变异文本字符转换为第一图像;对转换出的第一图像进行图像变换处理,得到第二图像;对变换处理后得到的第二图像进行OCR识别,得到第二图像对应的OCR识别字符;将所述变异文本字符与所述第二图像对应的OCR识别字符的映射关系作为文本变异关系;根据文本变异关系得到待识别的第一文本字符串对应的第二文本字符串,根据第二文本字符串得到真实文本。本说明书实施例能够更为全面地得到文本变异关系并得到具有更加真实语义的真实文本。
-
公开(公告)号:CN117765046A
公开(公告)日:2024-03-26
申请号:CN202311871741.2
申请日:2023-12-29
申请人: 西北工业大学深圳研究院
摘要: 本发明一种基于深度学习的立体数字图像相关测量方法及系统,通过将立体矫正后的同一时刻的左右图像输入到散斑匹配模型中进行立体匹配,预测左右视图间视差,将不同时刻的左右图像输入到散斑匹配模型中进行时序匹配,得到物体表面的面内变形信息,然后基于双目立体视觉理论,根据得到的左右视图间视差重建出物体表面的三维位置,最后通过物体表面的三维位置和获取到的物体表面的面内变形信息,完成被测物体表面的三维变形测量,本发明提出了一种能同时适用于时序匹配和立体匹配的新的网络架构,在仿真实验和真实物理实验中均表现出较好的图像匹配效果,可用于物体表面的三维变形测量,具有较强的泛化能力。
-
公开(公告)号:CN117677967A
公开(公告)日:2024-03-08
申请号:CN202280044657.0
申请日:2022-06-01
申请人: 苹果公司
摘要: 一种电子设备可包括基于经处理图像数据来显示图像的电子显示器。该电子设备还可包括生成该经处理图像数据的图像处理电路。该图像处理电路可接收对应于第一视角中的图像的输入图像数据,并且将该输入图像数据从该第一视角翘曲到第二视角,从而生成经翘曲图像数据。另外,该图像处理电路可确定该第二视角中的一个或多个遮挡区域,并且确定对应于该遮挡区域的填充数据。可通过组合该经翘曲图像数据与该填充数据来生成该经处理图像数据。
-
公开(公告)号:CN112785490B
公开(公告)日:2024-03-05
申请号:CN202011630767.4
申请日:2020-12-30
申请人: 维沃移动通信有限公司
发明人: 段霞霖
摘要: 本申请公开了一种图像处理方法、装置及电子设备,属于通信技术领域。该方法主要包括接收对第一图像的第一输入,第一图像包括至少一个对象;响应于第一输入,在存储有与至少一个对象中的目标对象对应的目标人体特征模型的情况下,根据目标人体特征模型,对目标对象进行处理;显示第二图像,第二图像为对目标对象进行处理后的图像;其中,目标人体特征模型包括人体部位的特征数据,特征数据用于对第一图像中目标对象的目标人体部位进行处理。本申请实施例中提供的方法能够解决图像处理效率低的问题。
-
-
-
-
-
-
-
-
-