三维人脸重建方法、装置、设备及可读存储介质

    公开(公告)号:CN117830491A

    公开(公告)日:2024-04-05

    申请号:CN202311872694.3

    申请日:2023-12-29

    Abstract: 本申请公开了一种三维人脸重建方法、装置、设备及可读存储介质,首先对图像采集设备阵列拍摄的人脸图片集合进行稠密点云重建,得到稠密点云数据;再基于预设的人脸关键点,将稠密点云数据与参数化三维人脸模型进行对齐,得到重建的参数化三维人脸模型,并对重建的参数化三维人脸模型的顶点位置进行调整,得到重建的三维人脸网格,避免了重建非参数化三维人脸模型的步骤,简化了处理流程,提升了重建速度,并且,生成人脸纹理贴图时,利用人脸图片集合以及图像采集设备阵列中各个图像采集设备的位姿,对重建的三维人脸网格的纹理进行迭代优化,提升了人脸纹理贴图的效果。

    个性化手写字体生成方法、模型训练方法及相关设备

    公开(公告)号:CN117787212A

    公开(公告)日:2024-03-29

    申请号:CN202311630251.3

    申请日:2023-11-29

    Abstract: 本申请公开了一种个性化手写字体生成方法、模型训练方法及相关设备,用户可以书写任意少量文字并拍摄得到文字图像,获取用户书写的每个文字的骨架结构图,从中选取设定数量个文字的骨架结构图,利用图像风格提取器对选取的文字的骨架结构图进行处理得到用户书写的风格特征,利用内容参考字特征提取器对指定的内容参考字进行处理得到内容结构特征,将风格特征和内容结构特征进行融合,利用融合特征生成具有用户书写风格的个性化字体。本申请方案仅需要用户书写少量的文字来提取风格特征,进而可以生成大量的具有用户书写风格的个性化字体,既能够保证与用户书写风格的统一,又可以保证生成的字体结构的正确性,相比现有技术节约成本,提升效率。

    开放式问答方法、装置及相关设备
    163.
    发明公开

    公开(公告)号:CN117725168A

    公开(公告)日:2024-03-19

    申请号:CN202311381504.8

    申请日:2023-10-23

    Abstract: 本申请公开了一种开放式问答方法、装置及相关设备,多模态大模型包括图像编码模块和大语言模型,在回答与目标图像相关的问题文本时,可以调用文本识别算法对目标图像进行文本识别,得到文本识别结果,可以通过大语言模型得到该文本识别结果的特征表示,进一步,大语言模型在解码答案文本时其输入除了包含传统的问题文本的特征表示及训练图像的特征表示之外,额外增加了对目标图像的文本识别结果的特征表示,使得大语言模型可以关注到目标图像中文本内容及其位置信息,如此可以使得多模态大模型具备文字空间感知能力,因而在回答与文字空间排布相关问题时能够基于掌握的对文字的空间感知能力准确给出正确回答。

    交互方法、装置及存储介质、电子设备

    公开(公告)号:CN117608407A

    公开(公告)日:2024-02-27

    申请号:CN202311649601.0

    申请日:2023-12-01

    Abstract: 本发明公开了一种交互方法、装置及存储介质、电子设备,该方法包括:获取手部图像;当检测到所述手部图像中存在多个交互手时,确定主交互手;识别所述主交互手的第一手指轨迹,并根据所述第一手指轨迹确定目标指令和目标对象;根据所述目标指令对所述目标对象进行控制。该方法在检测到手部图像中存在多个交互手时,通过确定主交互手,对主交互手的指尖轨迹进行追踪识别,确定目标指令和目标对象并根据目标指令对目标对象进行控制,实现主交互手的操作意图,具有识别准确,不易被干扰的优点。

    三维人脸构建方法、装置、设备及可读存储介质

    公开(公告)号:CN117496054A

    公开(公告)日:2024-02-02

    申请号:CN202311395911.4

    申请日:2023-10-24

    Abstract: 本申请公开了一种三维人脸构建方法、装置、设备及可读存储介质,本方案中,首先基于三维人脸数据集,以及,预设三维人脸模型模板训练得到三维人脸重建网络模型,在当前场景构建三维人脸时,先采用三维人脸重建网络模型,对人脸图像进行三维人脸重建,得到在预设三维人脸模型模板下的三维人脸;然后对其进行变形迁移处理,即可得到在场景三维人脸模型模板下的三维人脸。在本方案中,只需要训练一个三维人脸重建网络模型,各个场景下的三维人脸均可基于该三维人脸重建网络模型实现构建,无需再训练各个场景下的三维人脸重建网络模型,因此,能够提升在各个场景下的三维人脸构建效率。

    姿态估计方法、装置、电子设备及存储介质

    公开(公告)号:CN117333546A

    公开(公告)日:2024-01-02

    申请号:CN202311270052.6

    申请日:2023-09-27

    Abstract: 本发明提供一种姿态估计方法、装置、电子设备及存储介质,该方法包括:获取不同视角下针对目标对象的多张图像;提取各图像中目标对象的多个关键点和各关键点对应的特征信息;基于所有图像中各关键点对应的特征信息,确定目标三维体素热图;针对目标三维体素热图的各维度,确定目标三维体素热图在维度上的一维热图;一维热图的分辨率大于目标三维体素热图在一维热图对应维度上的分辨率;基于各一维热图对目标对象进行姿态估计。基于此,可通过少量运算确定出目标三维体素热图在各维度上的高分辨率一维热图,基于各一维热图进行姿态估计,能减小量化误差,提高估计的准确度,同时还兼顾了计算量控制,实现了准确度和计算复杂度的平衡。

    三维目标检测方法、装置和设备
    167.
    发明公开

    公开(公告)号:CN117333524A

    公开(公告)日:2024-01-02

    申请号:CN202311395636.6

    申请日:2023-10-24

    Abstract: 本发明提供一种三维目标检测方法、装置和设备,该方法包括:获取多个相机所拍摄的环视图像;根据第一环视图像和第二环视图像之间的代价矩阵,确定第一环视图像上的像素点和所匹配的第二环视图像上的像素点的视差;第一环视图像和第二环视图像为多个相机所拍摄的环视图像中存在重叠区域的任意两个环视图像;根据第一环视图像上的像素点和所匹配的第二环视图像上的像素点的视差,确定第一环视图像上的像素点和所匹配的第二环视图像上的像素点的深度信息;根据深度信息和目标检测模型,得到三维目标检测结果。本发明的方法通过充分利用多视角信息从而准确地确定出每个像素点的深度值,有效地提升了深度预测的准确性以及目标检测性能。

    手势识别方法、装置、电子设备及存储介质

    公开(公告)号:CN117275094A

    公开(公告)日:2023-12-22

    申请号:CN202311320396.3

    申请日:2023-10-11

    Abstract: 本发明提供一种手势识别方法、装置、电子设备及存储介质,该方法包括:将至少一帧图像输入手势识别模型的编码模块中,输出各图像对应的编码特征;各图像包括至少一个对象;将各图像对应的编码特征和至少一个查询特征输入手势识别模型中与图像对应的解码模块中,输出解码特征;至少一个查询特征与解码模块对应;对象和查询特征一一对应,解码特征包括通过查询特征从编码特征中查询的对应对象的手势特征;将解码特征输入手势识别模型中与图像对应的识别模块中,基于手势特征确定图像中各对象的手势类别;基于各图像中各对象的手势类别,确定各对象的手势。基于此,通过一个模型同时识别多个对象的手势,能提高手势识别的效率。

    目标检测方法、装置、设备及存储介质

    公开(公告)号:CN117237989A

    公开(公告)日:2023-12-15

    申请号:CN202311244839.5

    申请日:2023-09-25

    Abstract: 申请公开了一种目标检测方法、装置、设备及存储介质,本申请将待检测图像切分为若干个子图像;利用图像编码器提取每一子图像的图像特征,利用文本编码器提取类别集合中每一候选类别标签的语义特征,图像编码器和文本编码器以学习图像和文本之间的对齐关系为训练目标,基于文本‑图像对训练数据训练得到;将每一子图像的图像特征分别与各个候选类别标签的语义特征计算相似度,取相似度最高的目标候选类别标签作为子图像的类别标签,最终得到待检测图像的目标检测结果。本申请方案对新增类别目标进行检测时,只需要将新增类别标签添加到类别集合中即可,无需对新增类别目标额外获取标注数据及重新训练神经网络模型,降低了人力和时间开销。

    目标检测方法、装置、电子设备和存储介质

    公开(公告)号:CN117197433A

    公开(公告)日:2023-12-08

    申请号:CN202311157821.1

    申请日:2023-09-07

    Abstract: 本发明提供一种目标检测方法、装置、电子设备和存储介质,方法包括:获取视图图像,以及点云数据,视图图像和点云数据是针对同一空间采集得到的;基于点云数据,对视图图像进行深度预计和/或对空间下的鸟瞰图进行可见性分割,得到空间遮挡关系;基于空间遮挡关系,对视图图像和点云数据进行特征聚合,并基于聚合结果进行目标检测。本发明实施例提供的方法、装置,通过点云数据,对视图图像进行深度预计和/或对空间下的鸟瞰图进行可见性分割,得到空间遮挡关系,并应用空间遮挡关系指导视图图像和点云数据的特征聚合,从而避免聚合过程中反向投影的问题,避免在聚合过程中引入噪声,由此基于聚合结果进行目标检测,实现了准确可靠的目标检测。

Patent Agency Ranking