图像处理模型训练、处理方法、系统、设备及其介质

    公开(公告)号:CN116580263A

    公开(公告)日:2023-08-11

    申请号:CN202310562166.1

    申请日:2023-05-18

    Abstract: 本发明公开了一种图像处理模型训练、处理方法、系统、设备及其介质。该模型的训练方法包括:获取原始三维面部数据和若干样本音频数据;提取原始三维面部数据的样本面部特征;获取样本音频数据的样本音频特征;基于样本音频特征调整样本面部特征,以得到对应的样本三维面部数据;以每组的样本面部特征与样本音频特征作为输入,对应的样本三维面部数据作为输出,对预设网络进行训练,以得到图像处理模型。通过图卷积神经网络获取面部特征和多层次处理得到音频特征,通过卷积神经网络的训练,得到的图像处理模型具有更高的精度、泛用性和鲁棒性。计算融合特征的融合损失和样本三维面部数据的生成损失,提高模型训练的效率和准确性。

    一种声音信号转换方法、系统、装置和程序产品

    公开(公告)号:CN120018042A

    公开(公告)日:2025-05-16

    申请号:CN202510145075.7

    申请日:2025-02-10

    Abstract: 本发明提供一种声音信号转换方法、系统、装置和程序产品,涉及辅助听力技术领域。其中,声音信号转换方法包括:采用声音采集模块监听周围环境;使用声音识别与分类模块进行声音事件识别;使用信号转换模块将识别到的声音事件转换为感官信号指令;使用信号反馈模块执行感官信号指令,产生感官信号,并传递给用户。本发明提出了一种基于感官反馈的辅助听力解决方案,尤其是利用触觉这一更为直接的感官通道,采用便携装置,配合高灵敏度的声音采集模块和快速的声音识别算法,使聋人在不同的场景下都能迅速感知外接的声音信息,提高了信息反馈的实时性、准确性和可辨识度,可适用于各种场景。

    一种唇形合成模型设计方法、装置、存储介质和程序产品

    公开(公告)号:CN119888426A

    公开(公告)日:2025-04-25

    申请号:CN202411964767.6

    申请日:2024-12-27

    Abstract: 本发明提出一种唇形合成模型设计方法、装置、存储介质和程序产品,涉及计算机视觉技术领域。其中,唇形合成模型设计方法包括:数据收集及预处理,获得原面部图、原情绪标签及音频特征;使用生成器获得恢复面部图及恢复情绪标签;使用判别器对原面部图与恢复面部图进行对抗训练;使用图片重建损失函数、感知损失函数、对抗损失函数、情绪损失函数进行反向迭代;针对待生成视频进行模型微调训练。本发明提高了唇形合成图像生成的整体精确性和图像质量,避免了相关生成瑕疵和错误的出现。

    图像分割方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN118379490A

    公开(公告)日:2024-07-23

    申请号:CN202410317452.6

    申请日:2024-03-19

    Abstract: 一种图像分割方法及装置、计算机可读存储介质、终端,所述方法包括:获取待处理图像;对待处理图像进行预处理;将待处理图像输入至图像分割模型,图像分割模型用于根据预处理的结果对待处理图像进行分割,得到待处理图像的图像分割结果,图像分割结果包括至少一个区域,同一区域中的像素点的类别相同;其中,根据预处理的结果对待处理图像进行分割包括:在使用第一卷积核进行卷积之前执行第一补零操作,在使用第二卷积核进行卷积之前执行第二补零操作,其中,第一卷积核和第二卷积核为属于图像分割模型中的同一个卷积层的不同卷积核,第一补零操作的类型和第二补零操作的类型不同。本申请提供的方案有利于提高图像分割的准确性。

    抠图模型训练方法、图像抠图处理方法、装置及介质

    公开(公告)号:CN118379321A

    公开(公告)日:2024-07-23

    申请号:CN202410476312.3

    申请日:2024-04-19

    Abstract: 本公开提供了一种抠图模型训练方法、图像抠图处理方法、装置及介质,其中,抠图模型训练方法包括以下步骤:将样本图像分别输入人像抠图模型和物体抠图模型中,得到对应的第一图像和第二图像,所述第一图像为包含人像的抠图蒙版,所述第二图像为包含物体的抠图蒙版;对所述第一图像和所述第二图像执行与操作得到所述样本图像对应的标签,所述标签为同时包含人像和物体的抠图蒙版;利用所述样本图像以及所述样本图像对应的所述标签对目标抠图模型进行训练,通过样本图像和样本图像对应的标签构建同时包含人像和物体的多主体数据集对抠图模型进行训练,使抠图模型在面对人像和物体这种多主体抠图的场景下能够得到更加准确的抠图结果。

    图片生成方法及装置、存储介质、计算设备

    公开(公告)号:CN117036546B

    公开(公告)日:2024-05-03

    申请号:CN202310956306.3

    申请日:2023-07-31

    Abstract: 本申请提供了一种图片生成方法及装置、存储介质、计算设备,该图片生成方法包括:获取输入内容,输入内容包括人脸标识、服装标识、姿态信息以及背景图片;将输入内容输入至扩散模型,以生成目标图片,其中,扩散模型根据人脸标识调用其对应的第一LoRA模型生成目标图片中的人脸,扩散模型根据服装标识调用其对应的第二LoRA模型生成目标图片中的服装,目标图片还包括姿态信息中的姿态以及背景图片中的背景。本申请技术方案能够提升图片生成的效率和灵活性。

Patent Agency Ranking