Patent search ap:("杭州海康威视数字技术股份有限公司" OR "中国科学院自动化研究所") AND inv:"杨世才" Page 1

1.

发明公开
一种物体特征的确定方法、装置及设备审中-实审

公开(公告)号：CN116109973A

公开(公告)日：2023-05-12

申请号：CN202310029012.6

申请日：2023-01-09

Applicant: 杭州海康威视数字技术股份有限公司 , 中国科学院自动化研究所

Inventor： 高君宇 , 杨世才 , 王威 , 浦世亮 , 徐常胜

IPC: G06V20/40 , G06V20/62 , G06V10/80 , G06V30/19 , G06V10/74 , G06V10/82

Abstract: 本申请提供一种物体特征的确定方法、装置及设备，包括：获取样本视频中的关键帧对应的多个目标物体特征，获取样本文本对应的文本特征；基于文本特征和多个目标物体特征确定文本特征与关键帧之间的空间定位分数和时间定位分数；基于空间定位分数和时间定位分数确定第一损失值；从关键帧对应的多个目标物体特征中选取代表性物体特征，确定代表性物体特征对应的特征效应分数；从样本视频的多个关键帧中选取代表性关键帧，确定代表性关键帧对应的帧效应分数；基于特征效应分数和帧效应分数确定第二损失值；基于第一损失值和第二损失值确定目标损失值，基于目标损失值训练得到目标网络模型。通过本申请方案，目标网络模型的训练时间短，资源消耗小。

2.

发明公开
一种动作视频识别方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN116630836A

公开(公告)日：2023-08-22

申请号：CN202310240103.4

申请日：2023-03-07

Applicant: 杭州海康威视数字技术股份有限公司 , 中国科学院自动化研究所

Inventor： 高君宇 , 冯洋博 , 杨世才 , 浦世亮

IPC: G06V20/40 , G06V10/764 , G06V10/74 , G06N3/0499

Abstract: 本申请实施例提供了一种动作视频识别方法、装置、电子设备及存储介质，电子设备获取待识别视频；提取待识别视频的视频特征；根据视频特征以及预先训练的时空胶囊参数，构建时空胶囊；根据时空胶囊对应的时空部分胶囊与预先训练得到的各已知类别对应的类胶囊之间的关系，构建专用胶囊；基于专用胶囊和各已知类别对应的类胶囊之间的相似程度，确定待识别视频类别。由于时空胶囊可以表示待识别视频时间维度信息和空间维度信息，专用胶囊可以表示待识别视频局部时空维度特征与各已知类别对应的类胶囊构成的整体之间的关系，因此既考虑了待识别视频时间维度和空间维度，又考虑了待识别视频局部与整体之间的关系，可以提高动作视频识别的准确性。

3.

发明授权
一种无数据知识蒸馏的方法、装置和存储介质有权

公开(公告)号：CN117035052B

公开(公告)日：2024-01-26

申请号：CN202311300934.2

申请日：2023-10-10

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 禤韵怡 , 浦世亮 , 陈伟杰 , 杨世才 , 谢迪

IPC: G06N3/096 , G06N3/0895 , G06N3/094 , G06N3/0455 , G06N3/0475 , G06T11/00 , G06F40/284 , G06F18/25

Abstract: 本申请公开了一种无数据知识蒸馏的方法、装置和存储介质，包括：获取任务的各个目标类别的文本提示；对于每个目标类别的文本提示，将其输入文本‑图像生成模型，经过所述文本‑图像生成模型的处理生成与该文本提示语义相关的所述每个目标类别的训练图像；将视觉语言预训练模型作为教师模型，利用所有目标类别的训练图像蒸馏生成学生模型。应用本申请，能够蒸馏得到较强域泛化能力的学生模型。

4.

发明公开
一种数据增广策略选择方法、装置及系统审中-实审

公开(公告)号：CN114021634A

公开(公告)日：2022-02-08

申请号：CN202111275966.2

申请日：2021-10-29

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 李朝阳 , 浦世亮 , 赵龙 , 陈伟杰 , 杨世才 , 谢迪

IPC: G06K9/62 , G06V10/774

Abstract: 本申请实施例提供了一种数据增广策略选择方法、装置及系统。方案如下：获取多个数据增广策略各自对应的第一检测模型；针对每一数据增广策略，利用该数据增广策略对应的第一检测模型，对第三数据集中第三样本图像中的目标物进行检测，得到各检测框的置信度；根据该数据增广策略所对应的检测框的数量和/或检测框的置信度，计算该数据增广策略对应的目标物检测性能值；基于每一数据增广策略对应的目标物检测性能值，选择目标数据增广策略。通过本申请实施例提供的技术方案，提高了确定出的目标数据增广策略的泛化能力，使得数据增广技术适用于无监督学习场景的目标物检测过程。

5.

发明公开
一种模型训练方法及装置、目标检测方法及装置审中-实审

公开(公告)号：CN114881149A

公开(公告)日：2022-08-09

申请号：CN202210507932.X

申请日：2022-05-10

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈斌斌 , 陈伟杰 , 禤韵怡 , 杨世才

IPC: G06K9/62 , G06N3/08

Abstract: 本申请实施例提供了一种模型训练方法及装置、目标检测方法及装置，该方法包括：利用第一模型，对第一无标签数据进行预测，得到第一无标签数据的多个第一预测标签和每个第一预测标签的置信度；根据有标签数据的标签集中每种标签类别的分布情况，确定该标签类别的第一置信度阈值；利用第一模型，对第二无标签数据进行预测，得到第二无标签数据的多个第二预测标签和每个第二预测标签的置信度；在第二预测标签中，确定置信度大于所属标签类别的第一置信度阈值的第二预测标签，作为候选标签；利用有标签数据、第二无标签数据以及候选标签，对第二模型进行训练。应用本申请实施例提供的技术方案，能够降低模型训练所需耗费的人力资源。

6.

发明公开
训练智能模型的方法及装置有权

公开(公告)号：CN114118236A

公开(公告)日：2022-03-01

申请号：CN202111329061.9

申请日：2021-11-10

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 孟让 , 浦世亮 , 陈伟杰 , 杨世才 , 谢迪

IPC: G06K9/62

Abstract: 本申请是关于一种训练智能模型的方法及装置，属于计算机领域。所述方法包括：从第一神经网络中获取第一网络集合和第二网络集合；基于第一样本集合和第二样本集合，训练所述第一网络集合中的每个神经网络，得到第一模型集合；基于所述第一样本集合、所述第二样本集合和所述第一模型集合，训练所述第二网络集合中的每个神经网络，得到第二模型集合，所述第二模型集合包括训练所述m个第二神经网络得到的m个第二智能模型。

7.

发明公开
一种目标检测模型训练方法、目标检测方法和装置有权

公开(公告)号：CN112784691A

公开(公告)日：2021-05-11

申请号：CN202011625231.3

申请日：2020-12-31

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 杨世才 , 浦世亮 , 陈伟杰 , 过一路 , 谢迪

IPC: G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本申请实施例提供了一种目标检测模型训练方法、目标检测方法和装置，获取当前检测场景的未标注标签的第一样本图像；基于基线检测模型对第一样本图像进行检测，确定第一样本图像中置信度大于第一预设阈值的目标图像区域；基于第一样本图像中目标图像区域的图像特征，对第一样本图像中的目标图像区域进行聚类，得到多个图像区域集合；针对每一图像区域集合，基于该图像区域集合包含的目标图像区域的置信度，计算该图像区域集合的置信度，作为该图像区域集合包含的目标图像区域的软标签；针对第一样本图像中的每一目标图像区域，根据该目标图像区域的软标签，对基线检测模型进行模型训练，得到目标检测模型，能够降低检测的成本，提高检测的效率。

8.

发明公开
一种图像重建方法、系统及设备审中-实审

公开(公告)号：CN117830507A

公开(公告)日：2024-04-05

申请号：CN202211194368.7

申请日：2022-09-28

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 方书恺 , 许宝杯 , 杨世才 , 谢迪

IPC: G06T17/00 , G06V10/44 , G06V10/82 , G06T7/80 , G06T3/4007 , G06N3/09 , G06N3/0464

Abstract: 本申请提供一种图像重建方法、系统及设备，该方法包括：获取K个视角的原始二维图像，确定每个原始二维图像对应的目标二维特征；基于所有目标二维特征生成初始三维特征；从初始三维特征中提取出目标三维特征；基于目标三维特征和初始人体参数生成候选人体参数；判断是否满足重建条件，若否，则基于候选人体参数生成候选人体模型，从初始三维特征中选取候选人体模型中目标采样点对应的特征值，基于目标采样点对应的特征值生成目标三维特征，将候选人体参数替换为初始人体参数，返回执行基于所述目标三维特征和初始人体参数生成候选人体参数；若是，基于候选人体参数生成目标人体对应的三维重建图像。通过本申请技术方案，可以得到精确人体模型。

9.

发明授权
视觉语言模型的提示学习方法及电子设备有权

公开(公告)号：CN117057443B

公开(公告)日：2024-02-02

申请号：CN202311300751.0

申请日：2023-10-09

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈斌斌 , 陈伟杰 , 杨世才

IPC: G06N20/00 , G06F18/24 , G06F18/214 , G06F18/22 , G06V10/774 , G06V10/764 , G06V10/74

Abstract: 学习。本申请实施例提供一种视觉语言模型的提示学习方法及电子设备，电子设备可以将第一图像、第二图像、第一文本提示信息及第二文本提示信息输入模型，得到第一检测结果和第二检测结果；基于第一检测结果确定伪标签，基于伪标签与第二检测结果，计算预设损失函数；根据损失值，调整第一文本提示信息和第二文本提示信息，直到预设损失函数收敛，基于第一文本提示信息，确定模型的文本提示信息。由于第一检测结果表示第一图像中目标类别及位置，且第一图像和第二图像由同一图像做不同变换得到，包含目标相同，因此第一检测结果标识第二图像中目

10.

发明公开
一种对抗样本生成方法、装置及电子设备审中-实审

公开(公告)号：CN116563902A

公开(公告)日：2023-08-08

申请号：CN202210100862.6

申请日：2022-01-27

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈家旭 , 孙雷雨 , 杨世才 , 谢迪

IPC: G06V40/16 , G06V20/64 , G06V10/764

Abstract: 本申请实施例提供了一种对抗样本生成方法、装置及电子设备。其中，方法包括：获取样本对象的目标区域上设置有标定图像时拍摄所述样本对象得到的第一立体对象图像，所述标定图像包括多个标定点；确定所述第一立体对象图像中各个所述标定点的图像坐标与所述标定图像中各个所述标定点的图像坐标之间的坐标转换关系；根据所述坐标转换关系，生成针对目标对象的对抗补丁；获取所述样本对象的第二立体对象图像，作为对抗样本，所述第二立体对象图像中所述样本对象的目标区域上设置有所述对抗补丁。能够有效生成适用于基于三维图像进行识别的识别模型的对抗样本。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification