一种基于语义信息指导的非实体类对象抠图方法

    公开(公告)号:CN115512102A

    公开(公告)日:2022-12-23

    申请号:CN202211059450.9

    申请日:2022-08-31

    发明人: 马勇

    摘要: 本发明公开了一种基于语义信息指导的非实体类对象抠图方法,该方法属于计算机视觉领域。所述方法通过两个阶段的多任务网络架构以从复杂的背景中准确的提取出前景文本,第一个阶段包含两个任务流,分别为语义分割任务流和抠图回归任务流,两个任务流分别对预处理过后的图像进行任务处理后输出,并将两个输出融合后输入至第二阶段进行联合细化处理,从而更加精准的完成前景文本的提取。本发明公开的目的是为了解决传统方法中针对不同尺度的图像缺少统一的方法来获得高质量抠图结果的问题。本方法能够对图像中不同前景透明度的文本或logo进行有效提取,并获得高质量的抠图结果。

    一种基于语义感知损失的人脸标志点检测方法

    公开(公告)号:CN113111698B

    公开(公告)日:2022-04-01

    申请号:CN202011642933.2

    申请日:2020-12-30

    发明人: 马勇 肖汉雄

    摘要: 本发明公开了一种基于语义感知损失的人脸标志点检测方法,该方法属于人脸识别技术领域。所述方法通过在标记标签数据点,计算人脸特征点后采用采样的方法计算语义感知损失函数,以此来代替传统技术中对人脸上非显著特征点直接通过损失函数计算的方法。本发明公开的目的是为了解决传统技术中出现的人脸标记中由于存在语义歧义导致抠图精准度降低的问题。通过语义感知损失函数训练的模型在实际计算中能够减少语义歧义,增强网络模型的相关性,使抠图效果更加精准。

    一种利用多Agent实现拍摄合规检测的系统

    公开(公告)号:CN114565965A

    公开(公告)日:2022-05-31

    申请号:CN202210215520.9

    申请日:2022-03-04

    发明人: 马勇

    摘要: 本发明公开了一种利用多Agent实现拍摄合规检测的系统,该系统属于信息技术领域。所述系统包括了用户Agent、检测Agent和交互Agent,所述检测Agent部署在服务器端,由自动检测算法对检测行为提供支持,所述用户Agent和交互Agent部署在移动端,服务器端的Agent与移动端间的Agent采用http通信。本发明公开的目的是为了在传统的证件照检测Agent的基础上,通过增加交互Agent,对用户Agent发送语音指令,帮助用户在证件照拍摄过程中能够自主对证件照的合规性进行检测调整,提高成像水平,优化证件照的出图质量。

    一种三维模型水印加密方法
    4.
    发明公开

    公开(公告)号:CN115841412A

    公开(公告)日:2023-03-24

    申请号:CN202211552895.0

    申请日:2022-12-02

    发明人: 马勇

    IPC分类号: G06T1/00 G06T17/00 G06F21/60

    摘要: 本发明公开了一种三维模型水印加密方法,该方法属于信息安全领域。所述方法的主要步骤包括:获取三维模型的基本信息,通过坐标系信息构造矩阵F,将水印数据和变换函数储存到区块链,并将水印信息通过变换函数嵌入到三维模型中。本发明公开的目的是为了解决传统水印技术安全性差的问题。本发明可以高效生成水印信息,实现版权保护,并可以根据用户需求,通过调整变换函数的相对值,改变水印嵌入后对视觉观感的影响程度,并通过区块链技术,解决追溯和安全性问题。

    一种基于多人交互动作判断的人机交互判断方法及装置

    公开(公告)号:CN114598817B

    公开(公告)日:2024-06-18

    申请号:CN202210214053.8

    申请日:2022-03-04

    发明人: 马勇 李青

    摘要: 本发明公开了一种基于多人交互动作判断的人机交互判断方法及装置,涉及机器学习领域。所述方法及装置是通过摄像头实现对多人交互动作的动态追踪并执行该动作对应的触发行为,并将该行为与传统的人机交互方式进行融合,从而实现智能化拍摄。本发明公开的目的是为了解决现有技术中无法对多人交互方式进行动态识别并处理的问题。本发明公开的系统能实现多人交互与人机交互的双重交互模式,交互性更强,更加智能化。

    一种基于优化的图像卷积填充方法

    公开(公告)号:CN113077406B

    公开(公告)日:2022-06-14

    申请号:CN202011338846.8

    申请日:2020-11-25

    发明人: 马勇 肖汉雄

    IPC分类号: G06T5/50

    摘要: 本发明公开了一种基于优化的图像卷积填充方法,该方法属计算机视觉领域。所述方法是通过将待处理图像的外边缘经过多层填充之后利用一次卷积获得与图像本身像素值相关的填充值,并填充至边缘后进行二次卷积,从而实现卷积的相关性填充。本发明公开的目的是为了解决现有技术中,传统的填充方式在处理图像时获取的特征值较差从而出现的失真、分类正确率低、分割效果差等问题,本发明能够在卷积操作的本质上带来改进,增强了卷积操作中提取的特征的相关性,优化了处理结果。

    一种基于光流点匹配的人像矫正方法及电子设备

    公开(公告)号:CN116030518A

    公开(公告)日:2023-04-28

    申请号:CN202211741816.0

    申请日:2022-12-30

    发明人: 马勇

    IPC分类号: G06V40/16 G06V10/75 G06T3/00

    摘要: 本发明公开了一种基于光流点匹配的人像矫正方法及电子设备,该方法及电子设备属于图像处理领域。所述方法为通过对左右脸之间对称特征点之间的连线斜率计算人像中头部倾斜角度,根据多个左右脸关键点斜率信息计算整体矫正角度,对于人像身体角度的估计主要依靠左右肩膀连线中关键点之间的斜率,根据多个左右肩膀关键点斜率信息计算整体矫正角度,从而分别进行局部矫正。本发明公开的目的是为了解决传统的基于简单仿射变换的方法无法处理头部和身体倾斜角度不同的问题。本发明通过使用像素级的光流信息对身体和头部分别矫正,可以达到更加自然、稳定、实用的全局矫正效果。

    一种基于多人交互动作判断的人机交互判断方法及装置

    公开(公告)号:CN114598817A

    公开(公告)日:2022-06-07

    申请号:CN202210214053.8

    申请日:2022-03-04

    发明人: 马勇

    IPC分类号: H04N5/232 G06V40/20 G06V10/44

    摘要: 本发明公开了一种基于多人交互动作判断的人机交互判断方法及装置,涉及机器学习领域。所述方法及装置是通过摄像头实现对多人交互动作的动态追踪并执行该动作对应的触发行为,并将该行为与传统的人机交互方式进行融合,从而实现智能化拍摄。本发明公开的目的是为了解决现有技术中无法对多人交互方式进行动态识别并处理的问题。本发明公开的系统能实现多人交互与人机交互的双重交互模式,交互性更强,更加智能化。