针对对抗通用补丁攻击的鲁棒视觉Transformer视觉感知方法及装置

    公开(公告)号:CN115879119A

    公开(公告)日:2023-03-31

    申请号:CN202310190344.2

    申请日:2023-03-02

    Abstract: 本发明公开了一种针对对抗通用补丁攻击的鲁棒视觉Transformer视觉感知方法及装置,涉及计算机视觉技术领域。包括:获取待分类的图像数据;将图像数据输入到构建好的视觉Transformer感知模型;其中,视觉Transformer感知模型包括限制令牌注意层;根据图像数据以及视觉Transformer感知模型,得到待分类的图像数据的分类结果。本发明所提出的视觉感知模型,通过对异常注意力的限制,结合高性能的视觉Transformer模型,构造了更鲁棒更高性能的视觉感知模型,在对抗精度方面明显优于以往的补丁防御方法,对干净样本的精度影响较小。

    基于图卷积神经网络和Transformer的时空短期风速预测方法及系统

    公开(公告)号:CN115392595B

    公开(公告)日:2022-12-27

    申请号:CN202211341900.3

    申请日:2022-10-31

    Abstract: 本发明公开了一种基于图卷积神经网络和Transformer的时空短期风速预测方法及系统,该方法包括:获取相邻多风场的气象数据,并对数据进行预处理;根据相邻多风场的历史风速测量值,构建复数邻接矩阵;将预处理后的气象数据输入风速预测模型,以复数邻接矩阵作为图卷积神经网络所需的邻接矩阵,使用两层图卷积神经网络对预处理后的相邻多风场的气象数据进行特征提取;然后将得到的时空特征输入到Transformer网络中,得到风速的预测值。本发明可以有效地提升预测的精确性,准确的预测结果能够有效提高风能资源的利用率,降低风功率波动对电网稳定性的影响,从而实现风电场的经济、高效运行。

    一种基于自注意力机制的个性化注视点检测方法及装置

    公开(公告)号:CN114898447B

    公开(公告)日:2022-10-11

    申请号:CN202210818407.X

    申请日:2022-07-13

    Abstract: 本发明公开了一种基于自注意力机制的个性化注视点检测方法及装置,该方法包括:获取受试者的待检测图片、校准图片及校准图片对应的校准点坐标;对待检测图片和校准图片分别进行预处理,得到待检测数据,包括:待检测图片中包含的眼部图片、脸部图片和人脸特征点信息、校准图片中包含的眼部图片、脸部图片和人脸特征点信息,以及校准图片对应的校准点坐标;将待检测数据输入预设的注视点检测网络模型,得到注视点检测结果。本发明将自注意力机制用于注视点检测,实现了个性化特征融合,可显著提高注视点检测效果。

    一种适用于长距离城市道路的自动驾驶决策方法及系统

    公开(公告)号:CN112991744B

    公开(公告)日:2021-08-13

    申请号:CN202110463384.0

    申请日:2021-04-28

    Abstract: 本发明公开了一种适用于长距离城市道路的自动驾驶决策方法及系统,该方法包括:获取被控车辆的前向图像、车辆位姿、车辆速度,地图信息以及当前场景的有向加权图信息;根据获取到的信息,将当前驾驶任务拆分成多个子驾驶任务,并根据地图信息、车辆位姿以及各子驾驶任务的目标位置,绘制出每一待执行的子驾驶任务的局部地图;获取前向图像特征编码、局部地图视觉特征编码和地图空间信息编码,并基于此生成控制信号,控制被控车辆执行当前待执行的子驾驶任务。本发明通过任务信息、地图信息、速度信息和前向图像信息,挖掘驾驶控制所需特征编码,从而实现了长距离的城市道路自动驾驶。

    一种基于提示的脑肿瘤交互式分割方法及系统

    公开(公告)号:CN120047471A

    公开(公告)日:2025-05-27

    申请号:CN202510498889.9

    申请日:2025-04-21

    Abstract: 本发明提供一种基于提示的脑肿瘤交互式分割方法及系统,涉及图像分割技术领域,方法包括:获取包含多张切片的脑部图像并进行肿瘤标注;筛选肿瘤像素最多的切片作为提示图像;对提示图像中的肿瘤区域进行亮度增强处理,并提取二维特征;使用三维卷积神经网络提取脑部图像的三维特征,将二维和三维特征进行拼接融合,通过上采样层得到切片精细分割特征;提取标注图像特征,并将增强提示图像的提示信息与标注图像特征进行平均掩码池化,构建第一原型特征;计算三维特征与第一原型特征的相似度,并通过池化融合构建第二原型特征;结合第一原型、第二原型和切片精细分割特征进行特征匹配,得到肿瘤和非肿瘤区域的最终分割结果。

    一种基于三维高斯泼溅的仿真方法及系统

    公开(公告)号:CN119941947A

    公开(公告)日:2025-05-06

    申请号:CN202411868093.X

    申请日:2024-12-18

    Abstract: 本发明提供一种基于三维高斯泼溅的仿真方法及系统,涉及计算机视觉技术领域,方法包括:构建三维场景;确定三维场景中的3D高斯点;将3D高斯点投影到二维图像平面上,确定二维高斯点;根据仿射变换矩阵,计算出各个高斯体的深度,形成高斯体排序列表;通过Alpha Blending混合透明度算法,合成计算最终颜色;根据最终颜色,对三维场景进行渲染,得到第一渲染图像;基于物理渲染方式或者基于分数蒸馏采样重建方式,对第一渲染图像进行优化,得到第二渲染图。本发明可以提高仿真图像的真实性,优化数据处理和渲染算法,提升实时性能,使得仿真平台能够进行更高效的实时仿真。

    一种非接触多生命体征监测方法及装置

    公开(公告)号:CN118452847B

    公开(公告)日:2025-03-14

    申请号:CN202410755157.9

    申请日:2024-06-12

    Abstract: 本发明涉及生理信号检测领域,特别是指一种非接触多生命体征监测方法及装置。所述方法包括:对视频数据进行人脸检测获取面部视频数据;将面部视频数据输入到训练好的非接触式生理信号检测模型进行推理获取脉搏波和血压数据;对脉搏波数据进行信号处理获取心率和心率变异性数据;根据脉搏波数据、血压数据、心率数据以及心率变异性数据得到非接触多生命体征监测结果。本发明可通过面部视频同时获取监测对象的脉搏波、心率、心率变异性、血压等重要的生命体征。相比于现有方法,本发明基于选择性结构状态空间模型,在保持线性复杂度的同时可以捕获长程依赖关系,更轻量化的同时在心率估计、血压估计等多个任务中都保持了较优的提取效果。

    基于多模态特征和层次特征融合的情绪识别方法及系统

    公开(公告)号:CN118709094A

    公开(公告)日:2024-09-27

    申请号:CN202411193418.9

    申请日:2024-08-28

    Inventor: 王荣全 马惠敏

    Abstract: 本发明提供一种基于多模态特征和层次特征融合的情绪识别方法及系统,涉及人工智能技术领域。所述方法包括:采集情绪视频,并转换为包含多个图像的图像序列;对图像序列中的人脸进行检测,并提取情绪视频中的音频和文本,获取视觉模态特征、音频模态特征和文本模态特征;其中,视觉模态特征包括:视觉人脸属性特征、视觉面部动作特征、时空人体姿态特征和场景情绪词关联特征,音频模态特征包括多源音频特征,文本模态特征包括基于CLIP的文本特征;基于层次特征融合策略得到多模态融合特征;将多模态融合特征输入多层感知机预测模型,得到情绪识别类别。本发明能够提高情绪识别系统的鲁棒性和泛化性。

    基于伪标签大小的无监督领域自适应目标检测方法及系统

    公开(公告)号:CN116630957B

    公开(公告)日:2024-06-04

    申请号:CN202310552336.8

    申请日:2023-05-16

    Abstract: 本发明公开了一种基于伪标签大小的无监督领域自适应目标检测方法及系统,该方法包括:S1,获取带标注的源域点云数据和无标注的目标域点云数据;利用源域点云数据进行训练,得到三维目标检测模型;S2,利用检测模型对目标域点云数据进行预测,得到伪标签;S3,计算伪标签中的尺寸统计大小;S4,利用伪标签中的尺寸统计大小对源域点云数据进行放缩增强操作;再利用增强后的源域点云数据再次训练模型;S5,迭代执行S2~S4,直至模型收敛;S6,利用最终检测模型对待测点云数据进行检测。本发明无需任何目标域的统计信息,可有效解决跨领域尺寸不匹配问题,并具有更好的性能和更广泛的适用性。

    可见光相机、红外相机与激光雷达的联合标定方法及系统

    公开(公告)号:CN117630892A

    公开(公告)日:2024-03-01

    申请号:CN202410106754.9

    申请日:2024-01-25

    Abstract: 本发明提供一种可见光相机、红外相机与激光雷达的联合标定方法及系统,涉及多传感器联合标定技术领域。所述方法包括:设置矩形标定板并冷藏;在标定板直立状态下,调整标定板与可见光相机、红外相机、以及激光雷达之间的距离,使标定板完整出现在各传感器的视场角内,并同步采集数据;调整标定板的朝向角和俯仰角,并在每个角度采集数据;取时间同步的一个角度的一帧数据,分别获取标定板的角点在可见光图像中的二维坐标、在红外图像中的二维坐标和在激光雷达点云数据中的三维坐标;基于上述二维坐标和三维坐标之间的对应关系,求解坐标系旋转平移矩阵,完成联合标定。本发明可实现简便、低成本、高精度的多模态传感器标定。

Patent Agency Ranking