一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN116451808A

    公开(公告)日:2023-07-18

    申请号:CN202310451948.8

    申请日:2023-04-23

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取图文对和翻译文本对,将图文对中的描述文本和翻译文本对包含的两种语言文本输入到预设的视觉语言模型中的文本特征提取层中,以通过文本特征提取层得到描述文本和两种语言文本的文本特征,并将图文对中的图像输入到视觉语言模型中的图像特征提取层中,以通过图像特征提取层得到图像的图像特征。根据图文对中图像的图像特征与描述文本的文本特征,以及翻译文本对中包含的两种语言文本的文本特征,确定目标损失;根据目标损失,对视觉语言模型进行训练。

    一种模型部署的方法、装置、存储介质及电子设备

    公开(公告)号:CN116028069A

    公开(公告)日:2023-04-28

    申请号:CN202310111355.7

    申请日:2023-02-07

    Abstract: 本说明书公开了一种模型部署的方法、装置、存储介质及电子设备。所述模型部署的方法包括:获取目标模型以及目标模型对应的配置文件,确定用于部署所述目标模型的目标设备,并在所述目标设备中创建用于部署所述目标模型的目标系统,根据所述配置文件,从指定的环境信息库中获取所述目标模型所需运行环境的数据包,基于所述数据包,在所述目标系统中创建所述目标模型所需的运行环境,根据所述目标系统中创建所述目标模型所需的运行环境,在所述目标系统中部署所述目标模型,以通过部署后的目标模型执行业务。

    一种多任务多目标关联追踪的方法及装置

    公开(公告)号:CN115311608B

    公开(公告)日:2023-03-21

    申请号:CN202211238639.4

    申请日:2022-10-11

    Abstract: 本发明公开一种多任务多目标关联追踪的方法及装置,该方法包括:步骤一,通过系统后台加载视频流地址或采用摄像头实时采集场景的视频流数据,并对视频进行编解码、抽帧、预处理操作;步骤二,利用目标检测模型对视频的图像数据进行实时推理,获取场景中人员和目标物体的检测结果数据;步骤三,通过人员目标追踪方法,对人员检测结果进行跟踪,获取人员进入场景和离开场景的时间,确定检测单位时间段;步骤四,判断人员停留在场景的时间段内,是否检测到目标物体,如果未检测到目标物体,将返回报警信息给平台端。本发明实现了在多人员和多目标的复杂场景,使用人工智能的方式进行智能检测,减少了人为因素的干扰,并且节约了人工成本。

Patent Agency Ranking