Patent search ap:("华中科技大学") AND inv:"周子淇" Page 1

1.

发明公开
一种针对目标检测器的通用测评方法和系统审中-实审

公开(公告)号：CN119600273A

公开(公告)日：2025-03-11

申请号：CN202411745052.1

申请日：2024-12-02

Applicant: 华中科技大学

Inventor： 胡胜山 , 李博文 , 周子淇 , 李明慧 , 万伟

IPC: G06V10/25 , G06V10/764 , G06V10/766 , G06V10/776 , G06V10/52 , G06N3/094 , G06N3/084

Abstract: 本发明公开了一种针对目标检测器的通用测评方法，其从目标检测器的输出中为每个真实物体平均分配固定数量的候选框作为攻击目标，一方面在空域中通过候选框坐标归0攻击和前景‑背景分离攻击来改变预测框的位置、大小和标签；另一方面在频域中聚焦图像的高频信息，将噪声集中在代表语义的高频区域。在两个角度上提升攻击效果和对抗样本的隐蔽性，保证评测方法的准确性。本发明能够解决现有基于扰动的攻击方法和基于补丁的攻击方法无法评测所有的目标检测器的技术问题，以及现有基于扰动的攻击方法由于产生的是图像级全局扰动，通过对非关键对象进行攻击优化会产生不必要的计算成本、易于被人类所感知到的技术问题。

2.

发明公开
一种基于鲁棒特征的物理世界对抗样本的生成方法和系统审中-实审

公开(公告)号：CN119599089A

公开(公告)日：2025-03-11

申请号：CN202411745293.6

申请日：2024-12-02

Applicant: 华中科技大学

Inventor： 胡胜山 , 王乙臣 , 李明慧 , 周子淇 , 万伟

IPC: G06N3/094 , G06N3/0455 , G06V10/764 , G06N3/0464 , G06V10/82

Abstract: 本发明公开了一种基于鲁棒特征的物理世界对抗样本生成方法，包括：获取预训练后的自编码器、三个经过预训练后的图像分类任务模型、以及一个用于图像分类任务的数据集，设置攻击参数，并使用自编码器以及三个图像分类任务模型对用于图像分类任务的数据集中每个类别标签编号为t的图像进行迭代优化处理，以获取类别标签编号为t的图像的鲁棒特征编码Ftar，从用于图像分类任务的数据集中随机选取一张类别标签编号为c的图像xc，初始化权重矩阵m和α，并利用所选取的类别标签编号为v的图像和类别标签编号为t的图像的鲁棒特征编码Ftar分别对权重矩阵m和α进行优化，以分别得到优化后的权重矩阵m′和α′，根据优化后的权重矩阵m′和α′获取最终的对抗样本。

3.

发明公开
一种基于StyleGAN2与CLIP的限速交通标志伪装样本生成方法和系统审中-实审

公开(公告)号：CN119964122A

公开(公告)日：2025-05-09

申请号：CN202510045327.9

申请日：2025-01-13

Applicant: 华中科技大学

Inventor： 胡胜山 , 李明慧 , 严诗慧 , 章航滔 , 周子淇

IPC: G06V20/58 , G06V20/62 , G06V30/19 , G06N3/0464 , G06N3/084 , G06N3/094 , G06F21/55

Abstract: 本发明公开了一种基于StyleGAN2和CLIP的限速交通标志伪装样本生成方法，其结合StyleGAN2生成对抗网络和CLIP模型，通过引入多目标损失优化框架，实现对限速交通标志伪装样本的高效生成。StyleGAN2提供了强大的图像生成能力，可通过其潜变量空间生成高质量的限速交通标志样本；CLIP模型通过其语义理解能力提供指导，帮助StyleGAN2生成对抗网络优化图像生成过程，使生成的伪装样本在视觉上与限速交通标志的关键特征保持一致，同时符合目标语义描述文本s，从而确保生成的伪装样本的语义一致性；本发明提出的伪装样本生成方法包含语义约束、潜变量优化和多损失融合三个核心模块，语义约束模块利用CLIP模型定义生成的伪装样本与目标语义描述文本s的语义相似性。

4.

发明公开
一种基于多模态大视觉语言模型的智能机械臂操作方法和系统审中-实审

公开(公告)号：CN119567268A

公开(公告)日：2025-03-07

申请号：CN202510005797.2

申请日：2025-01-03

Applicant: 华中科技大学

Inventor： 胡胜山 , 潘鹤文 , 李明慧 , 万伟 , 周子淇 , 郭培金

IPC: B25J9/16

Abstract: 本发明公开了一种基于多模态大视觉语言模型的机械臂操作方法，首先通过视觉传感器采集机械臂操作场景的图像数据，并结合语音识别模块或文本输入模块获取用户指令，将自然语言指令与视觉场景数据输入至多模态大视觉语言模型进行多模态任务解析。模型对场景中目标物体的类别、位置及其属性进行识别，并结合输入指令生成具体的操作序列。随后，系统根据解析生成的操作序列，直接驱动机械臂执行相应任务，包括目标物体的抓取、移动、放置等具体动作，在任务执行过程中，机械臂根据预先生成的操作序列依次完成动作。本发明有效解决了现有技术中机械臂对复杂任务指令解析不准确、操作灵活性和适应性不足以及动态环境中实时响应能力较差的问题。

Patent Agency Ranking