一种免锚框的实例人像语义解析方法

    公开(公告)号:CN115331254A

    公开(公告)日:2022-11-11

    申请号:CN202210203916.1

    申请日:2022-03-03

    Abstract: 本发明公开了一种免锚框的实例人像语义解析方法。本发明利用训练集训练实例人像语义解析模型,所述实例人像语义解析模型包括特征提取模块、人物实例检测分支和人物实例细粒度感知分支;所述人物实例细粒度感知分支包括细节保持模块、人体部件上下文编码模块、人物实例解析模块和实例解析结果精炼模块;本发明采用了一个一阶段的基于中心点预测的免锚框检测器用于人物实例边界框位置预测和一个边缘引导的人物实例语义解析模块用于人像语义部件的识别,免锚框的人物检测器不仅继承了像素级设计的优势,且能够有效避免因产生候选边界框引起的超参数敏感性问题;边缘引导的人像语义解析模块能够有效区分不同的人物实例位置和相邻的人像语义类别。

    锚框无关角点回归的遥感图像任意方向物体检测方法及装置

    公开(公告)号:CN115240077A

    公开(公告)日:2022-10-25

    申请号:CN202210630115.3

    申请日:2022-06-06

    Abstract: 本发明公开了一种遥感图像任意方向物体的检测方法及装置,包括:提取输入图像的全局特征表达;在全局特征表达的基础上,重建物体水平候选框;基于全局特征表达,提取物体水平候选框的边界采样点的原始特征表达;利用边界采样点的语义邻接节点,增强原始特征表达;获取物体水平候选框的边界关键点,并根据增强特征表达抽取边界关键点的特征表达,以估计边界关键点与任意方向物体包围框的角点偏移;基于角点偏移与边界关键点,计算任意方向物体包围框的角点坐标;基于构建好的任意方向物体包围框进行检测。本发明使得角点的定位更为精确,可以形成更紧致的四边形包围框,对不同方向、不同尺度以及不同种类的物体均具有优秀的检测性能。

    一种全方位、多信息融合的短视频价值评估方法

    公开(公告)号:CN116704398A

    公开(公告)日:2023-09-05

    申请号:CN202310454011.6

    申请日:2023-04-25

    Abstract: 本发明公开了一种全方位、多信息融合的短视频价值评估方法。本发明利用训练集训练短视频价值评估模型,所述短视频价值评估模型包括多模态特征提取模块、多模态特征融合模块和短视频流量预测模块;本发明对短视频作者姓名、作者签名、视频标题、作者头像、视频封面、视频内容等多方面进行特征学习、表达融合,形成短视频的统一表达,并对短视频的点赞、转发、评论热度进行预估,实现对短视频的市场价值、内容价值等版权价值的有效预测,提升短视频平台的视频质量,增强短视频平台的流量热度,创造更高的经济价值。

    渐近回归边界的任意形状场景文字检测方法及装置

    公开(公告)号:CN113139539A

    公开(公告)日:2021-07-20

    申请号:CN202110280975.4

    申请日:2021-03-16

    Abstract: 本发明公开了一种渐近回归边界的任意形状场景文字检测方法及装置,包括:提取待检测图像的视觉特征,对视觉特征进行特征融合,获取特征表达;将特征表达输入水平建议框生成网络,生成水平文字候选框;将特征表达及水平文字候选框输入方向建议框生成网络,生成方向文字建议框;将特征表达及方向文字建议框输入任意形状文字边界生成网络,获取场景文字检测结果。本发明通过渐近回归能产生更精确及平滑的文字边界,利用边界采样点之间的几何拓扑关系以及语义关系获得更准确点的位置,模型具有更好的泛化性、更有效的执行速度和更强的检测能力。

    渐近回归边界的任意形状场景文字检测方法及装置

    公开(公告)号:CN113139539B

    公开(公告)日:2023-01-13

    申请号:CN202110280975.4

    申请日:2021-03-16

    Abstract: 本发明公开了一种渐近回归边界的任意形状场景文字检测方法及装置,包括:提取待检测图像的视觉特征,对视觉特征进行特征融合,获取特征表达;将特征表达输入水平建议框生成网络,生成水平文字候选框;将特征表达及水平文字候选框输入方向建议框生成网络,生成方向文字建议框;将特征表达及方向文字建议框输入任意形状文字边界生成网络,获取场景文字检测结果。本发明通过渐近回归能产生更精确及平滑的文字边界,利用边界采样点之间的几何拓扑关系以及语义关系获得更准确点的位置,模型具有更好的泛化性、更有效的执行速度和更强的检测能力。

    一种基于聚集激励上下文金字塔的人像语义解析方法

    公开(公告)号:CN112396063A

    公开(公告)日:2021-02-23

    申请号:CN202011415482.9

    申请日:2020-12-07

    Abstract: 本发明公开了一种聚集激励上下文金字塔的人像语义解析方法,该方法中采用由多个并行的不同空间幅度比率聚集激励单元组成聚集激励上下文金字塔模块对编码模块提取高级语义特征捕捉丰富的多尺度上下文信息。再将得到的高层语义上下文特征与编码模块中的输出特征相结合通过解码模块得到初步人像语义解析结果。最后,检测输入人像图片的边缘信息并与初步人像语义解析结果融合进一步改善得到最终的人像语义解析结果。同时引入深度辅助损失分支,辅助获取更佳的效果。本发明采用聚集激励上下文金字塔人像语义解析方法,相比于其他当前先进的人像语义解析算法,构建的模型是轻量的,但拥有很高的分割性能。

Patent Agency Ranking